diff --git "a/log.txt" "b/log.txt"
new file mode 100644--- /dev/null
+++ "b/log.txt"
@@ -0,0 +1,6899 @@
+The following values were not passed to `accelerate launch` and had defaults used instead:
+	`--num_processes` was set to a value of `4`
+		More than one GPU was found, enabling multi-GPU training.
+		If this was unintended please pass in `--num_processes=1`.
+	`--num_machines` was set to a value of `1`
+	`--mixed_precision` was set to a value of `'no'`
+	`--dynamo_backend` was set to a value of `'no'`
+To avoid this warning pass in values for each of the problematic parameters or run `accelerate config`.
+gradient_accumulation_steps:  4
+gradient_accumulation_steps:  4
+Params using prompt template alpaca:
+base_model: baichuan-inc/Baichuan2-7B-Base
+data_path: ../../data/belle_dolphine/p14.jsonl
+output_dir: ../out/lora/p14
+batch_size: 32
+micro_batch_size: 2
+num_epochs: 1
+learning_rate: 0.0004
+cutoff_len: 4096
+val_set_size: 0
+lr_scheduler: cosine
+warmup_steps: 100
+lora_r: 16
+lora_alpha: 16
+lora_dropout: 0.05
+lora_target_modules: ['gate_proj', 'down_proj', 'up_proj']
+train_on_inputs: False
+add_eos_token: False
+group_by_length: False
+wandb_project: lora-moe
+wandb_run_name: belle_dolphine-p14
+wandb_watch: 
+wandb_log_model: 
+resume_from_checkpoint: False
+
+gradient_accumulation_steps:  4
+gradient_accumulation_steps:  4
+Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]Loading checkpoint shards:  50%|█████     | 1/2 [00:10<00:10, 10.64s/it]Loading checkpoint shards:  50%|█████     | 1/2 [00:11<00:11, 11.05s/it]Loading checkpoint shards:  50%|█████     | 1/2 [00:12<00:12, 12.51s/it]Loading checkpoint shards:  50%|█████     | 1/2 [00:12<00:12, 12.55s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:16<00:00,  7.58s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:16<00:00,  8.04s/it]
+Loading checkpoint shards: 100%|██████████| 2/2 [00:16<00:00,  7.73s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:16<00:00,  8.23s/it]
+pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
+pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
+Loading checkpoint shards: 100%|██████████| 2/2 [00:18<00:00,  8.57s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:18<00:00,  9.16s/it]
+Loading checkpoint shards: 100%|██████████| 2/2 [00:18<00:00,  8.65s/it]Loading checkpoint shards: 100%|██████████| 2/2 [00:18<00:00,  9.23s/it]
+trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183
+Map:   0%|          | 0/217273 [00:00<?, ? examples/s]Map:   0%|          | 83/217273 [00:00<04:25, 818.68 examples/s]trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183
+Map:   0%|          | 204/217273 [00:00<04:29, 804.76 examples/s]Map:   0%|          | 0/217273 [00:00<?, ? examples/s]Map:   0%|          | 296/217273 [00:00<04:16, 846.60 examples/s]Map:   0%|          | 87/217273 [00:00<04:15, 848.77 examples/s]Map:   0%|          | 386/217273 [00:00<04:11, 863.71 examples/s]Map:   0%|          | 181/217273 [00:00<04:01, 899.03 examples/s]pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
+Map:   0%|          | 477/217273 [00:00<04:06, 877.81 examples/s]Map:   0%|          | 279/217273 [00:00<03:53, 929.86 examples/s]Map:   0%|          | 568/217273 [00:00<04:04, 887.50 examples/s]Map:   0%|          | 375/217273 [00:00<03:50, 940.93 examples/s]pre-trained model's BOS EOS and PAD token id: 1 2 0  => It should be 1 2 None
+Map:   0%|          | 661/217273 [00:00<04:00, 899.15 examples/s]Map:   0%|          | 476/217273 [00:00<03:46, 956.82 examples/s]Map:   0%|          | 753/217273 [00:00<03:59, 903.09 examples/s]Map:   0%|          | 611/217273 [00:00<03:53, 926.64 examples/s]Map:   0%|          | 845/217273 [00:00<03:59, 904.79 examples/s]Map:   0%|          | 707/217273 [00:00<03:51, 934.70 examples/s]Map:   0%|          | 936/217273 [00:01<03:58, 905.97 examples/s]Map:   0%|          | 802/217273 [00:00<03:51, 933.82 examples/s]Map:   0%|          | 897/217273 [00:00<03:51, 936.60 examples/s]Map:   0%|          | 1052/217273 [00:01<04:40, 769.66 examples/s]Map:   1%|          | 1150/217273 [00:01<04:23, 820.10 examples/s]Map:   0%|          | 1000/217273 [00:01<04:47, 751.11 examples/s]Map:   1%|          | 1282/217273 [00:01<04:17, 838.23 examples/s]Map:   1%|          | 1097/217273 [00:01<04:28, 803.73 examples/s]Map:   1%|          | 1378/217273 [00:01<04:09, 865.36 examples/s]Map:   1%|          | 1197/217273 [00:01<04:13, 851.56 examples/s]Map:   1%|          | 1471/217273 [00:01<04:05, 878.26 examples/s]Map:   1%|          | 1294/217273 [00:01<04:05, 879.07 examples/s]Map:   1%|          | 1387/217273 [00:01<04:03, 885.78 examples/s]Map:   1%|          | 1603/217273 [00:01<04:06, 876.40 examples/s]trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183
+Map:   1%|          | 1481/217273 [00:01<04:00, 898.80 examples/s]Map:   1%|          | 1702/217273 [00:01<03:58, 904.13 examples/s]Map:   1%|          | 1575/217273 [00:01<03:57, 906.98 examples/s]trainable params: 23,199,744 || all params: 7,529,172,992 || trainable%: 0.30813137146205183
+Map:   0%|          | 0/217273 [00:00<?, ? examples/s]Map:   1%|          | 1843/217273 [00:02<03:55, 914.57 examples/s]Map:   1%|          | 1672/217273 [00:01<03:53, 921.49 examples/s]Map:   0%|          | 86/217273 [00:00<04:19, 836.83 examples/s]Map:   0%|          | 0/217273 [00:00<?, ? examples/s]Map:   1%|          | 1769/217273 [00:01<03:51, 932.44 examples/s]Map:   1%|          | 1986/217273 [00:02<03:53, 923.45 examples/s]Map:   0%|          | 68/217273 [00:00<05:22, 672.80 examples/s]Map:   0%|          | 217/217273 [00:00<04:13, 856.04 examples/s]Map:   1%|          | 1868/217273 [00:02<03:48, 944.51 examples/s]Map:   0%|          | 137/217273 [00:00<05:20, 676.73 examples/s]Map:   0%|          | 310/217273 [00:00<04:06, 880.90 examples/s]Map:   1%|          | 2095/217273 [00:02<04:30, 795.50 examples/s]Map:   0%|          | 234/217273 [00:00<04:28, 807.44 examples/s]Map:   1%|          | 2187/217273 [00:02<04:23, 815.86 examples/s]Map:   1%|          | 2000/217273 [00:02<04:32, 788.85 examples/s]Map:   0%|          | 449/217273 [00:00<04:02, 893.60 examples/s]Map:   0%|          | 337/217273 [00:00<04:02, 893.61 examples/s]Map:   1%|          | 2096/217273 [00:02<04:19, 828.34 examples/s]Map:   1%|          | 2279/217273 [00:02<04:16, 839.03 examples/s]Map:   0%|          | 548/217273 [00:00<03:55, 921.37 examples/s]Map:   0%|          | 438/217273 [00:00<03:52, 932.93 examples/s]Map:   1%|          | 2198/217273 [00:02<04:05, 875.83 examples/s]Map:   1%|          | 2379/217273 [00:02<04:04, 878.17 examples/s]Map:   0%|          | 536/217273 [00:00<03:49, 945.63 examples/s]Map:   0%|          | 678/217273 [00:00<04:01, 896.51 examples/s]Map:   1%|          | 2509/217273 [00:02<04:06, 870.64 examples/s]Map:   1%|          | 2327/217273 [00:02<04:08, 864.64 examples/s]Map:   0%|          | 769/217273 [00:00<04:01, 896.03 examples/s]Map:   0%|          | 677/217273 [00:00<03:49, 941.93 examples/s]Map:   1%|          | 2608/217273 [00:03<03:58, 899.51 examples/s]Map:   1%|          | 2425/217273 [00:02<04:01, 890.97 examples/s]Map:   0%|          | 871/217273 [00:00<03:53, 927.15 examples/s]Map:   0%|          | 821/217273 [00:00<03:49, 944.25 examples/s]Map:   1%|          | 2703/217273 [00:03<03:55, 910.07 examples/s]Map:   1%|          | 2519/217273 [00:02<03:57, 902.38 examples/s]Map:   0%|          | 971/217273 [00:01<03:49, 944.39 examples/s]Map:   0%|          | 923/217273 [00:01<03:45, 960.56 examples/s]Map:   1%|▏         | 2797/217273 [00:03<03:53, 917.13 examples/s]Map:   1%|          | 2613/217273 [00:02<03:56, 908.68 examples/s]Map:   1%|▏         | 2892/217273 [00:03<03:52, 923.05 examples/s]Map:   1%|          | 1095/217273 [00:01<04:31, 795.36 examples/s]Map:   1%|▏         | 2752/217273 [00:03<03:55, 909.63 examples/s]Map:   0%|          | 1044/217273 [00:01<04:29, 801.43 examples/s]Map:   1%|▏         | 2990/217273 [00:03<03:48, 936.67 examples/s]Map:   1%|          | 1199/217273 [00:01<04:13, 851.18 examples/s]Map:   1%|▏         | 2850/217273 [00:03<03:52, 923.73 examples/s]Map:   1%|          | 1148/217273 [00:01<04:13, 854.00 examples/s]Map:   1%|          | 1298/217273 [00:01<04:04, 883.48 examples/s]Map:   1%|▏         | 2949/217273 [00:03<03:48, 937.63 examples/s]Map:   1%|▏         | 3097/217273 [00:03<04:31, 788.21 examples/s]Map:   1%|          | 1242/217273 [00:01<04:07, 873.78 examples/s]Map:   1%|          | 1399/217273 [00:01<03:55, 915.77 examples/s]Map:   1%|▏         | 3194/217273 [00:03<04:17, 831.59 examples/s]Map:   1%|          | 1344/217273 [00:01<03:57, 910.42 examples/s]Map:   1%|          | 1535/217273 [00:01<03:57, 909.64 examples/s]Map:   1%|▏         | 3084/217273 [00:03<04:34, 780.71 examples/s]Map:   2%|▏         | 3289/217273 [00:03<04:08, 860.09 examples/s]Map:   1%|          | 1444/217273 [00:01<03:51, 931.44 examples/s]Map:   1%|          | 1631/217273 [00:01<03:54, 921.00 examples/s]Map:   1%|▏         | 3183/217273 [00:03<04:19, 826.08 examples/s]Map:   2%|▏         | 3389/217273 [00:03<03:59, 894.25 examples/s]Map:   1%|          | 1541/217273 [00:01<03:49, 940.36 examples/s]Map:   1%|          | 1730/217273 [00:01<03:49, 937.60 examples/s]Map:   2%|▏         | 3275/217273 [00:03<04:12, 846.73 examples/s]Map:   2%|▏         | 3485/217273 [00:03<03:55, 907.26 examples/s]Map:   1%|          | 1680/217273 [00:01<03:51, 929.65 examples/s]Map:   1%|          | 1828/217273 [00:02<03:47, 946.61 examples/s]Map:   2%|▏         | 3368/217273 [00:03<04:07, 864.45 examples/s]Map:   2%|▏         | 3591/217273 [00:04<03:45, 947.32 examples/s]Map:   1%|          | 1776/217273 [00:01<03:50, 935.44 examples/s]Map:   2%|▏         | 3462/217273 [00:03<04:02, 881.68 examples/s]Map:   1%|          | 1965/217273 [00:02<03:51, 930.47 examples/s]Map:   2%|▏         | 3730/217273 [00:04<03:48, 936.43 examples/s]Map:   1%|          | 1872/217273 [00:02<03:49, 938.98 examples/s]Map:   2%|▏         | 3557/217273 [00:04<03:58, 896.38 examples/s]Map:   2%|▏         | 3831/217273 [00:04<03:43, 954.55 examples/s]Map:   1%|          | 1977/217273 [00:02<03:43, 964.45 examples/s]Map:   2%|▏         | 3650/217273 [00:04<03:56, 902.21 examples/s]Map:   1%|          | 2099/217273 [00:02<04:29, 798.95 examples/s]Map:   2%|▏         | 3747/217273 [00:04<03:52, 918.58 examples/s]Map:   2%|▏         | 3962/217273 [00:04<03:51, 921.95 examples/s]Map:   1%|          | 2201/217273 [00:02<04:14, 845.15 examples/s]Map:   1%|          | 2099/217273 [00:02<04:23, 816.62 examples/s]Map:   2%|▏         | 3847/217273 [00:04<03:47, 939.07 examples/s]Map:   1%|          | 2300/217273 [00:02<04:05, 877.38 examples/s]Map:   1%|          | 2198/217273 [00:02<04:11, 856.14 examples/s]Map:   2%|▏         | 4091/217273 [00:04<04:28, 792.93 examples/s]Map:   1%|          | 2398/217273 [00:02<03:58, 902.31 examples/s]Map:   2%|▏         | 3981/217273 [00:04<03:52, 916.48 examples/s]Map:   1%|          | 2295/217273 [00:02<04:03, 883.27 examples/s]Map:   2%|▏         | 4188/217273 [00:04<04:16, 831.04 examples/s]Map:   1%|          | 2392/217273 [00:02<03:57, 904.69 examples/s]Map:   1%|          | 2533/217273 [00:02<03:59, 897.74 examples/s]Map:   2%|▏         | 4284/217273 [00:04<04:07, 859.82 examples/s]Map:   2%|▏         | 4098/217273 [00:04<04:29, 790.28 examples/s]Map:   1%|          | 2536/217273 [00:02<03:52, 921.90 examples/s]Map:   2%|▏         | 4387/217273 [00:05<03:56, 900.80 examples/s]Map:   2%|▏         | 4194/217273 [00:04<04:17, 829.02 examples/s]Map:   1%|          | 2668/217273 [00:02<03:59, 894.81 examples/s]Map:   2%|▏         | 4489/217273 [00:05<03:48, 929.74 examples/s]Map:   2%|▏         | 4287/217273 [00:04<04:10, 848.84 examples/s]Map:   1%|▏         | 2765/217273 [00:03<03:55, 911.53 examples/s]Map:   1%|          | 2671/217273 [00:02<03:55, 911.82 examples/s]Map:   2%|▏         | 4589/217273 [00:05<03:44, 946.48 examples/s]Map:   2%|▏         | 4383/217273 [00:04<04:03, 875.35 examples/s]Map:   1%|▏         | 2862/217273 [00:03<03:51, 926.09 examples/s]Map:   1%|▏         | 2765/217273 [00:03<03:54, 916.70 examples/s]Map:   2%|▏         | 4694/217273 [00:05<03:38, 974.36 examples/s]Map:   2%|▏         | 4478/217273 [00:05<03:58, 893.31 examples/s]Map:   1%|▏         | 2962/217273 [00:03<03:47, 942.57 examples/s]Map:   1%|▏         | 2869/217273 [00:03<03:46, 946.93 examples/s]Map:   2%|▏         | 4576/217273 [00:05<03:52, 913.53 examples/s]Map:   2%|▏         | 4838/217273 [00:05<03:40, 963.17 examples/s]Map:   2%|▏         | 4671/217273 [00:05<03:51, 918.67 examples/s]Map:   1%|▏         | 3097/217273 [00:03<04:28, 798.93 examples/s]Map:   1%|▏         | 3000/217273 [00:03<04:29, 795.58 examples/s]Map:   2%|▏         | 4978/217273 [00:05<03:43, 947.75 examples/s]Map:   1%|▏         | 3200/217273 [00:03<04:11, 849.56 examples/s]Map:   1%|▏         | 3100/217273 [00:03<04:14, 840.97 examples/s]Map:   2%|▏         | 4800/217273 [00:05<03:57, 894.18 examples/s]Map:   2%|▏         | 3301/217273 [00:03<04:01, 887.23 examples/s]Map:   1%|▏         | 3202/217273 [00:03<04:02, 882.22 examples/s]Map:   2%|▏         | 4894/217273 [00:05<03:54, 905.54 examples/s]Map:   2%|▏         | 5100/217273 [00:05<04:20, 814.40 examples/s]Map:   2%|▏         | 3401/217273 [00:03<03:53, 914.76 examples/s]Map:   2%|▏         | 3299/217273 [00:03<03:57, 901.47 examples/s]Map:   2%|▏         | 4995/217273 [00:05<03:47, 932.56 examples/s]Map:   2%|▏         | 5197/217273 [00:05<04:10, 847.53 examples/s]Map:   2%|▏         | 3506/217273 [00:03<03:45, 949.26 examples/s]Map:   2%|▏         | 3398/217273 [00:03<03:51, 922.84 examples/s]Map:   2%|▏         | 5291/217273 [00:06<04:04, 868.36 examples/s]Map:   2%|▏         | 5097/217273 [00:05<04:30, 785.76 examples/s]Map:   2%|▏         | 3502/217273 [00:03<03:44, 953.90 examples/s]Map:   2%|▏         | 5390/217273 [00:06<03:56, 896.02 examples/s]Map:   2%|▏         | 3656/217273 [00:04<03:41, 964.86 examples/s]Map:   2%|▏         | 5196/217273 [00:05<04:14, 834.29 examples/s]Map:   2%|▏         | 3601/217273 [00:03<03:42, 960.64 examples/s]Map:   3%|▎         | 5487/217273 [00:06<03:51, 913.60 examples/s]Map:   2%|▏         | 3762/217273 [00:04<03:36, 984.38 examples/s]Map:   2%|▏         | 5291/217273 [00:06<04:06, 859.59 examples/s]Map:   2%|▏         | 3701/217273 [00:04<03:42, 961.66 examples/s]Map:   3%|▎         | 5585/217273 [00:06<03:48, 928.39 examples/s]Map:   2%|▏         | 3862/217273 [00:04<03:37, 983.32 examples/s]Map:   2%|▏         | 5388/217273 [00:06<03:59, 884.02 examples/s]Map:   2%|▏         | 3843/217273 [00:04<03:44, 951.59 examples/s]Map:   3%|▎         | 5724/217273 [00:06<03:49, 921.28 examples/s]Map:   3%|▎         | 5489/217273 [00:06<03:51, 915.43 examples/s]Map:   2%|▏         | 4000/217273 [00:04<04:19, 821.91 examples/s]Map:   3%|▎         | 5819/217273 [00:06<03:48, 924.59 examples/s]Map:   3%|▎         | 5586/217273 [00:06<03:48, 927.49 examples/s]Map:   2%|▏         | 3988/217273 [00:04<03:43, 953.82 examples/s]Map:   2%|▏         | 4102/217273 [00:04<04:06, 864.77 examples/s]Map:   3%|▎         | 5917/217273 [00:06<03:45, 938.28 examples/s]Map:   3%|▎         | 5685/217273 [00:06<03:44, 941.75 examples/s]Map:   2%|▏         | 4200/217273 [00:04<03:58, 891.68 examples/s]Map:   2%|▏         | 4096/217273 [00:04<04:21, 816.64 examples/s]Map:   3%|▎         | 5781/217273 [00:06<03:43, 944.25 examples/s]Map:   2%|▏         | 4301/217273 [00:04<03:51, 920.52 examples/s]Map:   2%|▏         | 4197/217273 [00:04<04:07, 860.16 examples/s]Map:   3%|▎         | 6047/217273 [00:06<04:22, 805.91 examples/s]Map:   3%|▎         | 5883/217273 [00:06<03:39, 962.06 examples/s]Map:   2%|▏         | 4401/217273 [00:04<03:47, 936.79 examples/s]Map:   2%|▏         | 4291/217273 [00:04<04:02, 878.76 examples/s]Map:   3%|▎         | 6148/217273 [00:06<04:08, 851.01 examples/s]Map:   3%|▎         | 5980/217273 [00:06<03:39, 961.94 examples/s]Map:   2%|▏         | 4501/217273 [00:05<03:44, 949.46 examples/s]Map:   2%|▏         | 4382/217273 [00:04<04:00, 884.56 examples/s]Map:   3%|▎         | 6280/217273 [00:07<04:06, 857.60 examples/s]Map:   2%|▏         | 4482/217273 [00:04<03:53, 912.33 examples/s]Map:   3%|▎         | 6098/217273 [00:06<04:29, 782.62 examples/s]Map:   2%|▏         | 4647/217273 [00:05<03:42, 955.65 examples/s]Map:   3%|▎         | 6376/217273 [00:07<03:59, 879.10 examples/s]Map:   2%|▏         | 4580/217273 [00:05<03:49, 926.05 examples/s]Map:   3%|▎         | 6194/217273 [00:07<04:15, 824.62 examples/s]Map:   2%|▏         | 4745/217273 [00:05<03:41, 960.09 examples/s]Map:   3%|▎         | 6473/217273 [00:07<03:54, 899.70 examples/s]Map:   3%|▎         | 6287/217273 [00:07<04:08, 849.74 examples/s]Map:   2%|▏         | 4845/217273 [00:05<03:38, 970.05 examples/s]Map:   2%|▏         | 4713/217273 [00:05<03:54, 906.93 examples/s]Map:   3%|▎         | 6572/217273 [00:07<03:48, 921.89 examples/s]Map:   3%|▎         | 6382/217273 [00:07<04:01, 872.93 examples/s]Map:   2%|▏         | 4947/217273 [00:05<03:37, 978.27 examples/s]Map:   2%|▏         | 4814/217273 [00:05<03:48, 931.70 examples/s]Map:   3%|▎         | 6669/217273 [00:07<03:46, 931.25 examples/s]Map:   3%|▎         | 6476/217273 [00:07<03:56, 891.21 examples/s]Map:   2%|▏         | 4915/217273 [00:05<03:43, 948.91 examples/s]Map:   3%|▎         | 6769/217273 [00:07<03:42, 945.99 examples/s]Map:   2%|▏         | 5048/217273 [00:05<04:21, 810.39 examples/s]Map:   3%|▎         | 6570/217273 [00:07<03:53, 904.11 examples/s]Map:   3%|▎         | 6869/217273 [00:07<03:39, 960.48 examples/s]Map:   2%|▏         | 5143/217273 [00:05<04:11, 843.02 examples/s]Map:   3%|▎         | 6670/217273 [00:07<03:46, 929.61 examples/s]Map:   3%|▎         | 6970/217273 [00:07<03:36, 971.15 examples/s]Map:   2%|▏         | 5045/217273 [00:05<04:27, 794.01 examples/s]Map:   2%|▏         | 5238/217273 [00:05<04:03, 869.51 examples/s]Map:   3%|▎         | 6770/217273 [00:07<03:42, 947.02 examples/s]Map:   2%|▏         | 5144/217273 [00:05<04:13, 835.95 examples/s]Map:   2%|▏         | 5335/217273 [00:05<03:59, 883.86 examples/s]Map:   3%|▎         | 6867/217273 [00:07<03:41, 951.83 examples/s]Map:   3%|▎         | 7093/217273 [00:08<04:19, 808.61 examples/s]Map:   2%|▏         | 5243/217273 [00:05<04:02, 873.90 examples/s]Map:   3%|▎         | 5434/217273 [00:06<03:52, 911.95 examples/s]Map:   3%|▎         | 7195/217273 [00:08<04:04, 859.37 examples/s]Map:   2%|▏         | 5346/217273 [00:05<03:52, 912.07 examples/s]Map:   3%|▎         | 5537/217273 [00:06<03:44, 943.14 examples/s]Map:   3%|▎         | 7000/217273 [00:07<04:22, 802.16 examples/s]Map:   3%|▎         | 7290/217273 [00:08<03:58, 881.26 examples/s]Map:   3%|▎         | 5444/217273 [00:06<03:48, 927.09 examples/s]Map:   3%|▎         | 5639/217273 [00:06<03:40, 961.83 examples/s]Map:   3%|▎         | 7096/217273 [00:08<04:10, 838.38 examples/s]Map:   3%|▎         | 7388/217273 [00:08<03:51, 905.92 examples/s]Map:   3%|▎         | 5544/217273 [00:06<03:44, 944.01 examples/s]Map:   3%|▎         | 7194/217273 [00:08<04:00, 872.37 examples/s]Map:   3%|▎         | 7484/217273 [00:08<03:48, 918.40 examples/s]Map:   3%|▎         | 5782/217273 [00:06<03:41, 953.14 examples/s]Map:   3%|▎         | 5642/217273 [00:06<03:42, 949.69 examples/s]Map:   3%|▎         | 5880/217273 [00:06<03:40, 956.64 examples/s]Map:   3%|▎         | 7322/217273 [00:08<04:03, 862.86 examples/s]Map:   4%|▎         | 7614/217273 [00:08<03:53, 896.45 examples/s]Map:   3%|▎         | 5790/217273 [00:06<03:40, 959.82 examples/s]Map:   3%|▎         | 7453/217273 [00:08<04:03, 863.32 examples/s]Map:   4%|▎         | 7753/217273 [00:08<03:51, 904.62 examples/s]Map:   3%|▎         | 5929/217273 [00:06<03:43, 945.28 examples/s]Map:   3%|▎         | 6000/217273 [00:06<04:27, 788.61 examples/s]Map:   3%|▎         | 7550/217273 [00:08<03:56, 886.60 examples/s]Map:   4%|▎         | 7853/217273 [00:08<03:45, 926.84 examples/s]Map:   3%|▎         | 6095/217273 [00:06<04:16, 822.66 examples/s]Map:   4%|▎         | 7647/217273 [00:08<03:51, 905.14 examples/s]Map:   3%|▎         | 6047/217273 [00:06<04:19, 813.56 examples/s]Map:   4%|▎         | 7950/217273 [00:08<03:43, 935.40 examples/s]Map:   3%|▎         | 6199/217273 [00:06<04:01, 873.11 examples/s]Map:   3%|▎         | 6144/217273 [00:06<04:09, 847.42 examples/s]Map:   3%|▎         | 6302/217273 [00:07<03:51, 912.91 examples/s]Map:   4%|▎         | 7780/217273 [00:08<03:53, 897.39 examples/s]Map:   4%|▎         | 8049/217273 [00:09<04:22, 797.34 examples/s]Map:   3%|▎         | 6244/217273 [00:06<03:59, 880.12 examples/s]Map:   3%|▎         | 6443/217273 [00:07<03:49, 917.05 examples/s]Map:   4%|▍         | 8148/217273 [00:09<04:08, 842.13 examples/s]Map:   4%|▎         | 7920/217273 [00:08<03:50, 908.04 examples/s]Map:   3%|▎         | 6346/217273 [00:07<03:51, 912.45 examples/s]Map:   3%|▎         | 6549/217273 [00:07<03:41, 950.37 examples/s]Map:   4%|▍         | 8245/217273 [00:09<03:58, 874.91 examples/s]Map:   3%|▎         | 6446/217273 [00:07<03:46, 932.50 examples/s]Map:   3%|▎         | 6653/217273 [00:07<03:36, 972.74 examples/s]Map:   4%|▍         | 8346/217273 [00:09<03:49, 909.21 examples/s]Map:   4%|▎         | 8049/217273 [00:09<04:20, 802.93 examples/s]Map:   3%|▎         | 6542/217273 [00:07<03:44, 937.94 examples/s]Map:   4%|▍         | 8450/217273 [00:09<03:41, 943.01 examples/s]Map:   4%|▍         | 8148/217273 [00:09<04:08, 842.20 examples/s]Map:   3%|▎         | 6794/217273 [00:07<03:40, 955.24 examples/s]Map:   3%|▎         | 6685/217273 [00:07<03:43, 940.69 examples/s]Map:   4%|▍         | 8553/217273 [00:09<03:36, 965.42 examples/s]Map:   3%|▎         | 6893/217273 [00:07<03:38, 961.28 examples/s]Map:   4%|▍         | 8284/217273 [00:09<04:03, 859.41 examples/s]Map:   3%|▎         | 6783/217273 [00:07<03:42, 946.13 examples/s]Map:   4%|▍         | 8656/217273 [00:09<03:33, 978.66 examples/s]Map:   3%|▎         | 6992/217273 [00:07<03:37, 966.91 examples/s]Map:   4%|▍         | 8376/217273 [00:09<03:59, 871.85 examples/s]Map:   3%|▎         | 6880/217273 [00:07<03:42, 947.27 examples/s]Map:   4%|▍         | 8756/217273 [00:09<03:32, 982.92 examples/s]Map:   3%|▎         | 6977/217273 [00:07<03:40, 952.67 examples/s]Map:   4%|▍         | 8510/217273 [00:09<03:58, 875.77 examples/s]Map:   3%|▎         | 7096/217273 [00:07<04:24, 794.24 examples/s]Map:   4%|▍         | 8889/217273 [00:09<03:41, 939.44 examples/s]Map:   4%|▍         | 8601/217273 [00:09<03:57, 879.74 examples/s]Map:   3%|▎         | 7196/217273 [00:08<04:09, 840.48 examples/s]Map:   3%|▎         | 7098/217273 [00:07<04:20, 806.27 examples/s]Map:   4%|▍         | 8695/217273 [00:09<03:53, 894.09 examples/s]Map:   3%|▎         | 7299/217273 [00:08<03:57, 885.07 examples/s]Map:   4%|▍         | 9000/217273 [00:10<04:20, 798.55 examples/s]Map:   3%|▎         | 7196/217273 [00:08<04:09, 843.03 examples/s]Map:   3%|▎         | 7402/217273 [00:08<03:47, 920.93 examples/s]Map:   4%|▍         | 9096/217273 [00:10<04:09, 834.32 examples/s]Map:   4%|▍         | 8832/217273 [00:10<03:52, 897.75 examples/s]Map:   3%|▎         | 7292/217273 [00:08<04:00, 871.38 examples/s]Map:   3%|▎         | 7501/217273 [00:08<03:43, 936.98 examples/s]Map:   4%|▍         | 9193/217273 [00:10<04:00, 866.40 examples/s]Map:   4%|▍         | 8929/217273 [00:10<03:47, 915.10 examples/s]Map:   3%|▎         | 7394/217273 [00:08<03:51, 905.39 examples/s]Map:   3%|▎         | 7600/217273 [00:08<03:40, 949.00 examples/s]Map:   4%|▍         | 9286/217273 [00:10<03:56, 879.87 examples/s]Map:   3%|▎         | 7498/217273 [00:08<03:43, 940.67 examples/s]Map:   4%|▎         | 7699/217273 [00:08<03:38, 958.71 examples/s]Map:   4%|▍         | 9383/217273 [00:10<03:50, 902.72 examples/s]Map:   4%|▍         | 9041/217273 [00:10<04:29, 772.08 examples/s]Map:   4%|▎         | 7640/217273 [00:08<03:43, 936.62 examples/s]Map:   4%|▍         | 9481/217273 [00:10<03:45, 921.89 examples/s]Map:   4%|▍         | 9137/217273 [00:10<04:16, 812.87 examples/s]Map:   4%|▎         | 7845/217273 [00:08<03:38, 957.43 examples/s]Map:   4%|▎         | 7741/217273 [00:08<03:39, 952.88 examples/s]Map:   4%|▍         | 9579/217273 [00:10<03:42, 934.60 examples/s]Map:   4%|▍         | 9230/217273 [00:10<04:08, 838.69 examples/s]Map:   4%|▎         | 7840/217273 [00:08<03:37, 961.67 examples/s]Map:   4%|▎         | 7988/217273 [00:08<03:40, 950.79 examples/s]Map:   4%|▍         | 9679/217273 [00:10<03:38, 950.91 examples/s]Map:   4%|▍         | 9321/217273 [00:10<04:03, 854.42 examples/s]Map:   4%|▍         | 9413/217273 [00:10<03:58, 870.16 examples/s]Map:   4%|▎         | 7984/217273 [00:08<03:38, 958.37 examples/s]Map:   5%|▍         | 9827/217273 [00:11<03:35, 960.98 examples/s]Map:   4%|▎         | 8102/217273 [00:09<04:15, 818.00 examples/s]Map:   4%|▍         | 9508/217273 [00:10<03:53, 889.69 examples/s]Map:   5%|▍         | 9925/217273 [00:11<03:35, 963.23 examples/s]Map:   4%|▍         | 8201/217273 [00:09<04:04, 854.99 examples/s]Map:   4%|▍         | 9606/217273 [00:10<03:47, 911.46 examples/s]Map:   4%|▎         | 8105/217273 [00:09<04:12, 828.93 examples/s]Map:   4%|▍         | 8300/217273 [00:09<03:56, 884.89 examples/s]Map:   4%|▍         | 8204/217273 [00:09<04:01, 864.75 examples/s]Map:   5%|▍         | 10037/217273 [00:11<04:27, 774.19 examples/s]Map:   4%|▍         | 9742/217273 [00:11<03:49, 905.26 examples/s]Map:   4%|▍         | 8401/217273 [00:09<03:49, 910.02 examples/s]Map:   4%|▍         | 8299/217273 [00:09<03:56, 884.56 examples/s]Map:   5%|▍         | 10136/217273 [00:11<04:11, 823.95 examples/s]Map:   5%|▍         | 9840/217273 [00:11<03:44, 922.21 examples/s]Map:   4%|▍         | 8402/217273 [00:09<03:47, 917.67 examples/s]Map:   4%|▍         | 8539/217273 [00:09<03:48, 912.63 examples/s]Map:   5%|▍         | 10233/217273 [00:11<04:01, 857.06 examples/s]Map:   5%|▍         | 9936/217273 [00:11<03:43, 929.31 examples/s]Map:   4%|▍         | 8499/217273 [00:09<03:44, 930.68 examples/s]Map:   4%|▍         | 8644/217273 [00:09<03:40, 944.51 examples/s]Map:   5%|▍         | 10325/217273 [00:11<03:58, 869.24 examples/s]Map:   4%|▍         | 8599/217273 [00:09<03:40, 947.97 examples/s]Map:   5%|▍         | 10049/217273 [00:11<04:21, 792.00 examples/s]Map:   5%|▍         | 10429/217273 [00:11<03:46, 913.67 examples/s]Map:   4%|▍         | 8790/217273 [00:09<03:38, 952.71 examples/s]Map:   4%|▍         | 8706/217273 [00:09<03:33, 977.63 examples/s]Map:   5%|▍         | 10148/217273 [00:11<04:07, 837.39 examples/s]Map:   5%|▍         | 10534/217273 [00:11<03:38, 946.66 examples/s]Map:   4%|▍         | 8892/217273 [00:09<03:35, 968.94 examples/s]Map:   5%|▍         | 10250/217273 [00:11<03:54, 882.06 examples/s]Map:   5%|▍         | 10632/217273 [00:11<03:36, 953.49 examples/s]Map:   4%|▍         | 8853/217273 [00:09<03:34, 973.89 examples/s]Map:   5%|▍         | 10356/217273 [00:11<03:43, 926.86 examples/s]Map:   5%|▍         | 10731/217273 [00:12<03:34, 963.41 examples/s]Map:   4%|▍         | 9000/217273 [00:10<04:16, 812.92 examples/s]Map:   4%|▍         | 8954/217273 [00:09<03:32, 981.82 examples/s]Map:   5%|▍         | 10455/217273 [00:11<03:39, 942.88 examples/s]Map:   5%|▍         | 10832/217273 [00:12<03:32, 973.15 examples/s]Map:   4%|▍         | 9102/217273 [00:10<04:02, 859.41 examples/s]Map:   5%|▍         | 10555/217273 [00:11<03:37, 948.95 examples/s]Map:   5%|▌         | 10933/217273 [00:12<03:30, 981.33 examples/s]Map:   4%|▍         | 9207/217273 [00:10<03:49, 905.05 examples/s]Map:   4%|▍         | 9100/217273 [00:10<04:07, 839.74 examples/s]Map:   5%|▍         | 10654/217273 [00:12<03:35, 960.18 examples/s]Map:   4%|▍         | 9308/217273 [00:10<03:43, 931.81 examples/s]Map:   4%|▍         | 9207/217273 [00:10<03:53, 890.22 examples/s]Map:   5%|▌         | 11046/217273 [00:12<04:14, 809.26 examples/s]Map:   5%|▍         | 10758/217273 [00:12<03:30, 980.44 examples/s]Map:   4%|▍         | 9312/217273 [00:10<03:44, 925.54 examples/s]Map:   4%|▍         | 9450/217273 [00:10<03:42, 933.51 examples/s]Map:   5%|▌         | 11146/217273 [00:12<04:01, 854.18 examples/s]Map:   5%|▍         | 10858/217273 [00:12<03:29, 984.39 examples/s]Map:   4%|▍         | 9409/217273 [00:10<03:42, 934.46 examples/s]Map:   4%|▍         | 9555/217273 [00:10<03:36, 958.64 examples/s]Map:   5%|▌         | 11280/217273 [00:12<03:57, 865.88 examples/s]Map:   4%|▍         | 9507/217273 [00:10<03:39, 945.21 examples/s]Map:   4%|▍         | 9661/217273 [00:10<03:31, 983.27 examples/s]Map:   5%|▌         | 11000/217273 [00:12<04:11, 821.45 examples/s]Map:   5%|▌         | 11384/217273 [00:12<03:46, 907.56 examples/s]Map:   4%|▍         | 9610/217273 [00:10<03:35, 964.23 examples/s]Map:   5%|▍         | 9808/217273 [00:10<03:31, 980.14 examples/s]Map:   5%|▌         | 11094/217273 [00:12<04:03, 847.92 examples/s]Map:   5%|▌         | 11487/217273 [00:12<03:39, 936.70 examples/s]Map:   4%|▍         | 9709/217273 [00:10<03:34, 969.34 examples/s]Map:   5%|▌         | 11190/217273 [00:12<03:55, 875.16 examples/s]Map:   5%|▌         | 11587/217273 [00:12<03:36, 950.66 examples/s]Map:   5%|▍         | 9811/217273 [00:10<03:31, 979.71 examples/s]Map:   5%|▍         | 9952/217273 [00:10<03:33, 972.19 examples/s]Map:   5%|▌         | 11292/217273 [00:12<03:46, 910.46 examples/s]Map:   5%|▌         | 11691/217273 [00:13<03:31, 972.75 examples/s]Map:   5%|▍         | 9916/217273 [00:10<03:27, 997.12 examples/s]Map:   5%|▌         | 11397/217273 [00:12<03:37, 945.15 examples/s]Map:   5%|▍         | 10053/217273 [00:11<04:11, 824.20 examples/s]Map:   5%|▌         | 11837/217273 [00:13<03:31, 970.85 examples/s]Map:   5%|▌         | 11497/217273 [00:13<03:34, 959.93 examples/s]Map:   5%|▍         | 10150/217273 [00:11<04:02, 854.90 examples/s]Map:   5%|▍         | 10047/217273 [00:11<04:06, 840.10 examples/s]Map:   5%|▍         | 10252/217273 [00:11<03:51, 894.05 examples/s]Map:   6%|▌         | 11985/217273 [00:13<03:31, 972.06 examples/s]Map:   5%|▍         | 10146/217273 [00:11<03:57, 873.59 examples/s]Map:   5%|▌         | 11645/217273 [00:13<03:33, 963.57 examples/s]Map:   5%|▍         | 10354/217273 [00:11<03:43, 924.16 examples/s]Map:   5%|▍         | 10248/217273 [00:11<03:48, 907.33 examples/s]Map:   5%|▌         | 11750/217273 [00:13<03:29, 982.43 examples/s]Map:   6%|▌         | 12103/217273 [00:13<04:01, 849.05 examples/s]Map:   5%|▍         | 10459/217273 [00:11<03:36, 957.27 examples/s]Map:   5%|▍         | 10351/217273 [00:11<03:40, 936.56 examples/s]Map:   5%|▌         | 11853/217273 [00:13<03:26, 993.11 examples/s]Map:   6%|▌         | 12201/217273 [00:13<03:53, 877.68 examples/s]Map:   5%|▍         | 10561/217273 [00:11<03:32, 971.31 examples/s]Map:   5%|▍         | 10451/217273 [00:11<03:36, 953.33 examples/s]Map:   6%|▌         | 11996/217273 [00:13<03:30, 975.65 examples/s]Map:   6%|▌         | 12298/217273 [00:13<03:48, 897.49 examples/s]Map:   5%|▍         | 10664/217273 [00:11<03:29, 986.46 examples/s]Map:   5%|▍         | 10555/217273 [00:11<03:32, 974.90 examples/s]Map:   5%|▍         | 10770/217273 [00:11<03:25, 1004.26 examples/s]Map:   5%|▍         | 10657/217273 [00:11<03:29, 984.54 examples/s]Map:   6%|▌         | 12442/217273 [00:13<03:44, 913.66 examples/s]Map:   6%|▌         | 12142/217273 [00:13<04:06, 831.85 examples/s]Map:   5%|▌         | 10883/217273 [00:11<03:18, 1037.99 examples/s]Map:   6%|▌         | 12541/217273 [00:14<03:40, 929.61 examples/s]Map:   5%|▍         | 10806/217273 [00:11<03:29, 984.76 examples/s]Map:   6%|▌         | 12235/217273 [00:13<04:00, 851.75 examples/s]Map:   5%|▌         | 10989/217273 [00:12<03:18, 1039.82 examples/s]Map:   6%|▌         | 12644/217273 [00:14<03:34, 954.84 examples/s]Map:   5%|▌         | 10906/217273 [00:11<03:29, 986.85 examples/s]Map:   6%|▌         | 12332/217273 [00:13<03:53, 877.35 examples/s]Map:   6%|▌         | 12746/217273 [00:14<03:31, 967.86 examples/s]Map:   5%|▌         | 11099/217273 [00:12<04:01, 854.70 examples/s] Map:   6%|▌         | 12435/217273 [00:14<03:44, 914.28 examples/s]Map:   5%|▌         | 11052/217273 [00:12<04:03, 845.94 examples/s]Map:   5%|▌         | 11202/217273 [00:12<03:49, 896.99 examples/s]Map:   6%|▌         | 12893/217273 [00:14<03:31, 968.46 examples/s]Map:   6%|▌         | 12538/217273 [00:14<03:37, 940.55 examples/s]Map:   5%|▌         | 11154/217273 [00:12<03:53, 884.52 examples/s]Map:   5%|▌         | 11302/217273 [00:12<03:43, 920.22 examples/s]Map:   6%|▌         | 12995/217273 [00:14<03:28, 979.78 examples/s]Map:   6%|▌         | 12641/217273 [00:14<03:32, 962.27 examples/s]Map:   5%|▌         | 11252/217273 [00:12<03:46, 907.82 examples/s]Map:   5%|▌         | 11406/217273 [00:12<03:36, 950.96 examples/s]Map:   6%|▌         | 12787/217273 [00:14<03:32, 962.51 examples/s]Map:   6%|▌         | 13103/217273 [00:14<04:04, 836.55 examples/s]Map:   5%|▌         | 11354/217273 [00:12<03:40, 933.16 examples/s]Map:   5%|▌         | 11505/217273 [00:12<03:34, 959.01 examples/s]Map:   6%|▌         | 12890/217273 [00:14<03:29, 977.71 examples/s]Map:   6%|▌         | 13203/217273 [00:14<03:53, 875.41 examples/s]Map:   5%|▌         | 11457/217273 [00:12<03:35, 956.61 examples/s]Map:   5%|▌         | 11610/217273 [00:12<03:29, 982.10 examples/s]Map:   6%|▌         | 12993/217273 [00:14<03:26, 990.50 examples/s]Map:   6%|▌         | 13304/217273 [00:14<03:44, 907.77 examples/s]Map:   5%|▌         | 11711/217273 [00:12<03:28, 986.16 examples/s]Map:   5%|▌         | 11604/217273 [00:12<03:33, 963.59 examples/s]Map:   6%|▌         | 13402/217273 [00:14<03:41, 921.86 examples/s]Map:   5%|▌         | 11710/217273 [00:12<03:28, 985.17 examples/s]Map:   6%|▌         | 13100/217273 [00:14<04:06, 829.61 examples/s]Map:   5%|▌         | 11854/217273 [00:12<03:31, 969.60 examples/s]Map:   6%|▌         | 13499/217273 [00:15<03:38, 932.76 examples/s]Map:   6%|▌         | 13201/217273 [00:14<03:53, 873.14 examples/s]Map:   6%|▌         | 11954/217273 [00:13<03:30, 977.23 examples/s]Map:   5%|▌         | 11847/217273 [00:12<03:34, 955.78 examples/s]Map:   6%|▋         | 13638/217273 [00:15<03:40, 924.06 examples/s]Map:   5%|▌         | 11946/217273 [00:13<03:33, 961.99 examples/s]Map:   6%|▌         | 13327/217273 [00:15<03:58, 855.81 examples/s]Map:   6%|▌         | 12054/217273 [00:13<04:08, 826.53 examples/s]Map:   6%|▋         | 13736/217273 [00:15<03:37, 936.74 examples/s]Map:   6%|▌         | 13423/217273 [00:15<03:51, 879.50 examples/s]Map:   6%|▌         | 12150/217273 [00:13<03:58, 858.65 examples/s]Map:   6%|▋         | 13837/217273 [00:15<03:33, 953.96 examples/s]Map:   6%|▌         | 12047/217273 [00:13<04:15, 803.10 examples/s]Map:   6%|▌         | 13525/217273 [00:15<03:42, 913.94 examples/s]Map:   6%|▌         | 12246/217273 [00:13<03:51, 884.47 examples/s]Map:   6%|▋         | 13935/217273 [00:15<03:32, 958.20 examples/s]Map:   6%|▌         | 12149/217273 [00:13<04:00, 854.16 examples/s]Map:   6%|▋         | 13622/217273 [00:15<03:39, 926.51 examples/s]Map:   6%|▌         | 12350/217273 [00:13<03:41, 923.92 examples/s]Map:   6%|▌         | 12248/217273 [00:13<03:50, 887.58 examples/s]Map:   6%|▋         | 13721/217273 [00:15<03:36, 940.51 examples/s]Map:   6%|▌         | 12451/217273 [00:13<03:36, 946.38 examples/s]Map:   6%|▋         | 14049/217273 [00:15<04:09, 813.77 examples/s]Map:   6%|▌         | 12353/217273 [00:13<03:40, 927.49 examples/s]Map:   6%|▌         | 12554/217273 [00:13<03:31, 968.61 examples/s]Map:   7%|▋         | 14145/217273 [00:15<03:59, 848.51 examples/s]Map:   6%|▋         | 13856/217273 [00:15<03:40, 923.22 examples/s]Map:   6%|▌         | 12656/217273 [00:13<03:28, 979.88 examples/s]Map:   7%|▋         | 14249/217273 [00:15<03:46, 896.50 examples/s]Map:   6%|▌         | 12497/217273 [00:13<03:38, 937.53 examples/s]Map:   6%|▋         | 13956/217273 [00:15<03:35, 942.97 examples/s]Map:   7%|▋         | 14349/217273 [00:16<03:40, 922.07 examples/s]Map:   6%|▌         | 12599/217273 [00:13<03:34, 953.03 examples/s]Map:   6%|▌         | 12803/217273 [00:14<03:29, 976.48 examples/s]Map:   6%|▋         | 14052/217273 [00:15<04:16, 793.16 examples/s]Map:   7%|▋         | 14451/217273 [00:16<03:34, 945.30 examples/s]Map:   6%|▌         | 12902/217273 [00:14<03:29, 973.56 examples/s]Map:   6%|▌         | 12747/217273 [00:13<03:32, 961.15 examples/s]Map:   7%|▋         | 14147/217273 [00:15<04:04, 829.38 examples/s]Map:   7%|▋         | 14548/217273 [00:16<03:33, 949.85 examples/s]Map:   6%|▌         | 12846/217273 [00:14<03:31, 967.07 examples/s]Map:   7%|▋         | 14250/217273 [00:16<03:50, 879.42 examples/s]Map:   7%|▋         | 14650/217273 [00:16<03:30, 964.56 examples/s]Map:   6%|▌         | 13000/217273 [00:14<04:09, 818.12 examples/s]Map:   7%|▋         | 14352/217273 [00:16<03:42, 912.58 examples/s]Map:   7%|▋         | 14748/217273 [00:16<03:29, 965.72 examples/s]Map:   6%|▌         | 12992/217273 [00:14<03:31, 967.29 examples/s]Map:   6%|▌         | 13100/217273 [00:14<03:57, 860.90 examples/s]Map:   6%|▌         | 13200/217273 [00:14<03:48, 893.16 examples/s]Map:   7%|▋         | 14492/217273 [00:16<03:40, 918.08 examples/s]Map:   7%|▋         | 14885/217273 [00:16<03:35, 940.61 examples/s]Map:   6%|▌         | 13299/217273 [00:14<03:42, 916.25 examples/s]Map:   6%|▌         | 13140/217273 [00:14<04:11, 810.96 examples/s]Map:   7%|▋         | 14594/217273 [00:16<03:35, 940.81 examples/s]Map:   7%|▋         | 14982/217273 [00:16<03:33, 947.44 examples/s]Map:   6%|▌         | 13400/217273 [00:14<03:36, 940.46 examples/s]Map:   6%|▌         | 13240/217273 [00:14<04:00, 848.78 examples/s]Map:   7%|▋         | 14690/217273 [00:16<03:34, 944.91 examples/s]Map:   6%|▌         | 13502/217273 [00:14<03:32, 960.16 examples/s]Map:   7%|▋         | 15098/217273 [00:16<04:10, 806.48 examples/s]Map:   6%|▌         | 13344/217273 [00:14<03:48, 890.54 examples/s]Map:   7%|▋         | 14790/217273 [00:16<03:31, 957.52 examples/s]Map:   7%|▋         | 15197/217273 [00:16<03:57, 849.42 examples/s]Map:   6%|▌         | 13445/217273 [00:14<03:42, 917.52 examples/s]Map:   6%|▋         | 13646/217273 [00:14<03:33, 953.46 examples/s]Map:   7%|▋         | 14933/217273 [00:16<03:32, 951.90 examples/s]Map:   7%|▋         | 15294/217273 [00:17<03:50, 877.61 examples/s]Map:   6%|▌         | 13545/217273 [00:14<03:37, 937.41 examples/s]Map:   6%|▋         | 13747/217273 [00:15<03:30, 965.21 examples/s]Map:   7%|▋         | 15394/217273 [00:17<03:42, 908.06 examples/s]Map:   7%|▋         | 15047/217273 [00:16<04:07, 815.59 examples/s]Map:   6%|▋         | 13688/217273 [00:15<03:36, 940.83 examples/s]Map:   6%|▋         | 13894/217273 [00:15<03:30, 967.39 examples/s]Map:   7%|▋         | 15493/217273 [00:17<03:37, 929.00 examples/s]Map:   7%|▋         | 15149/217273 [00:17<03:54, 861.79 examples/s]Map:   6%|▋         | 13786/217273 [00:15<03:34, 949.24 examples/s]Map:   6%|▋         | 13992/217273 [00:15<03:29, 968.14 examples/s]Map:   7%|▋         | 15593/217273 [00:17<03:33, 942.60 examples/s]Map:   7%|▋         | 15247/217273 [00:17<03:47, 887.04 examples/s]Map:   6%|▋         | 13884/217273 [00:15<03:32, 956.12 examples/s]Map:   7%|▋         | 15690/217273 [00:17<03:32, 947.67 examples/s]Map:   7%|▋         | 15353/217273 [00:17<03:36, 931.01 examples/s]Map:   6%|▋         | 13987/217273 [00:15<03:30, 967.19 examples/s]Map:   6%|▋         | 14099/217273 [00:15<04:10, 811.54 examples/s]Map:   7%|▋         | 15790/217273 [00:17<03:29, 960.99 examples/s]Map:   7%|▋         | 14202/217273 [00:15<03:56, 860.08 examples/s]Map:   7%|▋         | 15501/217273 [00:17<03:32, 948.91 examples/s]Map:   6%|▋         | 14095/217273 [00:15<04:12, 806.24 examples/s]Map:   7%|▋         | 15937/217273 [00:17<03:30, 954.36 examples/s]Map:   7%|▋         | 14303/217273 [00:15<03:46, 894.98 examples/s]Map:   7%|▋         | 14198/217273 [00:15<03:57, 855.81 examples/s]Map:   7%|▋         | 15643/217273 [00:17<03:34, 941.92 examples/s]Map:   7%|▋         | 14402/217273 [00:15<03:41, 915.48 examples/s]Map:   7%|▋         | 16044/217273 [00:17<04:09, 805.06 examples/s]Map:   7%|▋         | 14290/217273 [00:15<03:53, 869.16 examples/s]Map:   7%|▋         | 15741/217273 [00:17<03:32, 946.92 examples/s]Map:   7%|▋         | 14501/217273 [00:15<03:37, 933.96 examples/s]Map:   7%|▋         | 16148/217273 [00:18<03:54, 858.19 examples/s]Map:   7%|▋         | 14384/217273 [00:15<03:48, 886.37 examples/s]Map:   7%|▋         | 15840/217273 [00:17<03:31, 954.65 examples/s]Map:   7%|▋         | 14647/217273 [00:16<03:35, 940.96 examples/s]Map:   7%|▋         | 16248/217273 [00:18<03:45, 891.75 examples/s]Map:   7%|▋         | 14488/217273 [00:15<03:39, 924.64 examples/s]Map:   7%|▋         | 15984/217273 [00:17<03:31, 951.23 examples/s]Map:   7%|▋         | 14744/217273 [00:16<03:34, 944.63 examples/s]Map:   8%|▊         | 16347/217273 [00:18<03:39, 915.94 examples/s]Map:   7%|▋         | 14583/217273 [00:16<03:37, 929.94 examples/s]Map:   8%|▊         | 16449/217273 [00:18<03:33, 941.96 examples/s]Map:   7%|▋         | 14684/217273 [00:16<03:33, 950.98 examples/s]Map:   7%|▋         | 14893/217273 [00:16<03:30, 960.67 examples/s]Map:   7%|▋         | 16100/217273 [00:18<04:04, 822.87 examples/s]Map:   8%|▊         | 16546/217273 [00:18<03:32, 946.66 examples/s]Map:   7%|▋         | 14785/217273 [00:16<03:29, 965.84 examples/s]Map:   7%|▋         | 14995/217273 [00:16<03:27, 972.94 examples/s]Map:   7%|▋         | 16198/217273 [00:18<03:55, 854.96 examples/s]Map:   8%|▊         | 16644/217273 [00:18<03:30, 954.21 examples/s]Map:   8%|▊         | 16298/217273 [00:18<03:45, 889.69 examples/s]Map:   7%|▋         | 14929/217273 [00:16<03:31, 958.36 examples/s]Map:   8%|▊         | 16741/217273 [00:18<03:29, 955.93 examples/s]Map:   7%|▋         | 15098/217273 [00:16<04:09, 811.08 examples/s]Map:   8%|▊         | 16400/217273 [00:18<03:38, 919.37 examples/s]Map:   8%|▊         | 16841/217273 [00:18<03:27, 965.03 examples/s]Map:   7%|▋         | 15196/217273 [00:16<03:58, 848.41 examples/s]Map:   7%|▋         | 15050/217273 [00:16<04:08, 812.72 examples/s]Map:   8%|▊         | 16498/217273 [00:18<03:35, 933.83 examples/s]Map:   8%|▊         | 16941/217273 [00:18<03:26, 970.84 examples/s]Map:   7%|▋         | 15299/217273 [00:16<03:46, 893.37 examples/s]Map:   7%|▋         | 15148/217273 [00:16<03:57, 850.54 examples/s]Map:   8%|▊         | 16595/217273 [00:18<03:33, 941.64 examples/s]Map:   7%|▋         | 15393/217273 [00:16<03:43, 903.62 examples/s]Map:   7%|▋         | 15248/217273 [00:16<03:48, 885.02 examples/s]Map:   8%|▊         | 16698/217273 [00:18<03:28, 962.45 examples/s]Map:   8%|▊         | 17046/217273 [00:18<04:04, 819.39 examples/s]Map:   7%|▋         | 15488/217273 [00:16<03:40, 913.47 examples/s]Map:   7%|▋         | 15343/217273 [00:16<03:44, 899.97 examples/s]Map:   8%|▊         | 16796/217273 [00:18<03:27, 966.68 examples/s]Map:   8%|▊         | 17139/217273 [00:19<03:56, 846.93 examples/s]Map:   7%|▋         | 15623/217273 [00:17<03:42, 905.22 examples/s]Map:   8%|▊         | 16923/217273 [00:18<03:38, 918.89 examples/s]Map:   7%|▋         | 15478/217273 [00:17<03:45, 895.93 examples/s]Map:   8%|▊         | 17273/217273 [00:19<03:52, 860.44 examples/s]Map:   7%|▋         | 15721/217273 [00:17<03:38, 924.04 examples/s]Map:   7%|▋         | 15573/217273 [00:17<03:42, 907.39 examples/s]Map:   8%|▊         | 17371/217273 [00:19<03:44, 888.66 examples/s]Map:   7%|▋         | 15821/217273 [00:17<03:33, 941.80 examples/s]Map:   7%|▋         | 15679/217273 [00:17<03:33, 943.76 examples/s]Map:   8%|▊         | 17046/217273 [00:19<04:16, 780.43 examples/s]Map:   8%|▊         | 17466/217273 [00:19<03:40, 904.11 examples/s]Map:   8%|▊         | 17149/217273 [00:19<04:00, 831.18 examples/s]Map:   7%|▋         | 15959/217273 [00:17<03:36, 928.13 examples/s]Map:   8%|▊         | 17560/217273 [00:19<03:38, 912.28 examples/s]Map:   7%|▋         | 15818/217273 [00:17<03:35, 934.53 examples/s]Map:   8%|▊         | 17243/217273 [00:19<03:53, 855.08 examples/s]Map:   8%|▊         | 17660/217273 [00:19<03:33, 934.94 examples/s]Map:   7%|▋         | 15960/217273 [00:17<03:35, 934.81 examples/s]Map:   8%|▊         | 17335/217273 [00:19<03:49, 870.64 examples/s]Map:   8%|▊         | 17758/217273 [00:19<03:30, 945.67 examples/s]Map:   7%|▋         | 16098/217273 [00:17<04:09, 806.99 examples/s]Map:   8%|▊         | 17432/217273 [00:19<03:43, 893.58 examples/s]Map:   8%|▊         | 17860/217273 [00:19<03:27, 959.95 examples/s]Map:   7%|▋         | 16192/217273 [00:17<04:01, 833.79 examples/s]Map:   8%|▊         | 17526/217273 [00:19<03:41, 902.06 examples/s]Map:   7%|▋         | 16101/217273 [00:17<04:04, 821.25 examples/s]Map:   8%|▊         | 17963/217273 [00:19<03:24, 973.49 examples/s]Map:   7%|▋         | 16288/217273 [00:17<03:53, 861.35 examples/s]Map:   8%|▊         | 17619/217273 [00:19<03:39, 908.21 examples/s]Map:   7%|▋         | 16192/217273 [00:17<03:59, 839.02 examples/s]Map:   8%|▊         | 16386/217273 [00:18<03:46, 886.85 examples/s]Map:   7%|▋         | 16289/217273 [00:17<03:51, 867.37 examples/s]Map:   8%|▊         | 16486/217273 [00:18<03:40, 910.19 examples/s]Map:   8%|▊         | 18096/217273 [00:20<04:03, 818.78 examples/s]Map:   8%|▊         | 17748/217273 [00:19<03:45, 886.30 examples/s]Map:   8%|▊         | 16387/217273 [00:18<03:44, 893.28 examples/s]Map:   8%|▊         | 16582/217273 [00:18<03:38, 919.44 examples/s]Map:   8%|▊         | 18195/217273 [00:20<03:52, 857.94 examples/s]Map:   8%|▊         | 17846/217273 [00:20<03:38, 910.73 examples/s]Map:   8%|▊         | 16482/217273 [00:18<03:41, 905.74 examples/s]Map:   8%|▊         | 18293/217273 [00:20<03:44, 887.08 examples/s]Map:   8%|▊         | 16724/217273 [00:18<03:36, 925.13 examples/s]Map:   8%|▊         | 17978/217273 [00:20<03:42, 893.96 examples/s]Map:   8%|▊         | 16578/217273 [00:18<03:38, 919.06 examples/s]Map:   8%|▊         | 18389/217273 [00:20<03:40, 903.42 examples/s]Map:   8%|▊         | 16672/217273 [00:18<03:37, 921.97 examples/s]Map:   9%|▊         | 18485/217273 [00:20<03:36, 917.26 examples/s]Map:   8%|▊         | 16863/217273 [00:18<03:37, 922.68 examples/s]Map:   8%|▊         | 18095/217273 [00:20<04:22, 759.25 examples/s]Map:   8%|▊         | 16769/217273 [00:18<03:34, 933.52 examples/s]Map:   9%|▊         | 18585/217273 [00:20<03:31, 937.41 examples/s]Map:   8%|▊         | 16965/217273 [00:18<03:32, 943.52 examples/s]Map:   8%|▊         | 16867/217273 [00:18<03:31, 945.52 examples/s]Map:   8%|▊         | 18192/217273 [00:20<04:07, 804.24 examples/s]Map:   9%|▊         | 18727/217273 [00:20<03:31, 938.11 examples/s]Map:   8%|▊         | 16966/217273 [00:18<03:29, 957.80 examples/s]Map:   8%|▊         | 18295/217273 [00:20<03:53, 853.36 examples/s]Map:   8%|▊         | 17103/217273 [00:18<04:02, 824.84 examples/s]Map:   9%|▊         | 18822/217273 [00:20<03:31, 940.15 examples/s]Map:   8%|▊         | 18395/217273 [00:20<03:44, 887.22 examples/s]Map:   8%|▊         | 17204/217273 [00:18<03:51, 865.16 examples/s]Map:   9%|▊         | 18494/217273 [00:20<03:38, 908.12 examples/s]Map:   8%|▊         | 17101/217273 [00:18<04:05, 815.69 examples/s]Map:   9%|▊         | 18967/217273 [00:21<03:29, 948.40 examples/s]Map:   8%|▊         | 17307/217273 [00:19<03:42, 899.44 examples/s]Map:   9%|▊         | 18593/217273 [00:20<03:34, 926.98 examples/s]Map:   8%|▊         | 17201/217273 [00:18<03:53, 858.17 examples/s]Map:   8%|▊         | 17410/217273 [00:19<03:35, 927.88 examples/s]Map:   9%|▊         | 18692/217273 [00:20<03:30, 942.98 examples/s]Map:   8%|▊         | 17512/217273 [00:19<03:29, 951.79 examples/s]Map:   9%|▉         | 19088/217273 [00:21<04:11, 787.86 examples/s]Map:   8%|▊         | 17337/217273 [00:19<03:50, 868.45 examples/s]Map:   9%|▊         | 18797/217273 [00:21<03:24, 972.08 examples/s]Map:   8%|▊         | 17612/217273 [00:19<03:27, 964.01 examples/s]Map:   9%|▉         | 19186/217273 [00:21<03:59, 828.72 examples/s]Map:   8%|▊         | 17429/217273 [00:19<03:47, 879.57 examples/s]Map:   9%|▊         | 18898/217273 [00:21<03:23, 974.59 examples/s]Map:   8%|▊         | 17717/217273 [00:19<03:22, 986.04 examples/s]Map:   9%|▉         | 19288/217273 [00:21<03:46, 872.82 examples/s]Map:   8%|▊         | 17528/217273 [00:19<03:40, 903.89 examples/s]Map:   8%|▊         | 17819/217273 [00:19<03:20, 994.11 examples/s]Map:   9%|▉         | 19389/217273 [00:21<03:38, 906.16 examples/s]Map:   8%|▊         | 17623/217273 [00:19<03:38, 914.26 examples/s]Map:   9%|▊         | 19000/217273 [00:21<04:00, 824.72 examples/s]Map:   9%|▉         | 19486/217273 [00:21<03:34, 921.25 examples/s]Map:   8%|▊         | 17722/217273 [00:19<03:33, 934.04 examples/s]Map:   9%|▉         | 19096/217273 [00:21<03:51, 855.76 examples/s]Map:   8%|▊         | 17964/217273 [00:19<03:23, 980.16 examples/s]Map:   9%|▉         | 19584/217273 [00:21<03:31, 934.39 examples/s]Map:   8%|▊         | 17819/217273 [00:19<03:31, 941.79 examples/s]Map:   9%|▉         | 19201/217273 [00:21<03:38, 905.67 examples/s]Map:   9%|▉         | 19683/217273 [00:21<03:28, 947.83 examples/s]Map:   8%|▊         | 17925/217273 [00:19<03:25, 970.91 examples/s]Map:   9%|▉         | 19301/217273 [00:21<03:32, 930.51 examples/s]Map:   8%|▊         | 18100/217273 [00:19<03:57, 839.46 examples/s]Map:   9%|▉         | 19782/217273 [00:21<03:26, 954.17 examples/s]Map:   9%|▉         | 19405/217273 [00:21<03:26, 958.11 examples/s]Map:   8%|▊         | 18202/217273 [00:19<03:46, 879.93 examples/s]Map:   9%|▉         | 19884/217273 [00:22<03:23, 969.58 examples/s]Map:   8%|▊         | 18048/217273 [00:19<04:07, 804.18 examples/s]Map:   9%|▉         | 19507/217273 [00:21<03:23, 973.17 examples/s]Map:   8%|▊         | 18299/217273 [00:20<03:41, 898.00 examples/s]Map:   9%|▉         | 19989/217273 [00:22<03:19, 990.05 examples/s]Map:   8%|▊         | 18150/217273 [00:20<03:53, 853.74 examples/s]Map:   8%|▊         | 18399/217273 [00:20<03:35, 920.83 examples/s]Map:   9%|▉         | 19645/217273 [00:22<03:28, 949.34 examples/s]Map:   8%|▊         | 18250/217273 [00:20<03:43, 890.42 examples/s]Map:   9%|▉         | 20104/217273 [00:22<03:55, 837.99 examples/s]Map:   9%|▉         | 19746/217273 [00:22<03:25, 963.11 examples/s]Map:   9%|▊         | 18546/217273 [00:20<03:31, 939.86 examples/s]Map:   8%|▊         | 18352/217273 [00:20<03:35, 922.03 examples/s]Map:   9%|▉         | 20198/217273 [00:22<03:49, 859.68 examples/s]Map:   9%|▉         | 19844/217273 [00:22<03:24, 964.07 examples/s]Map:   9%|▊         | 18647/217273 [00:20<03:28, 952.75 examples/s]Map:   8%|▊         | 18452/217273 [00:20<03:31, 941.84 examples/s]Map:   9%|▉         | 20300/217273 [00:22<03:38, 899.75 examples/s]Map:   9%|▊         | 18749/217273 [00:20<03:25, 968.19 examples/s]Map:   9%|▊         | 18549/217273 [00:20<03:30, 946.24 examples/s]Map:   9%|▉         | 19992/217273 [00:22<03:23, 968.40 examples/s]Map:   9%|▉         | 20399/217273 [00:22<03:33, 921.38 examples/s]Map:   9%|▊         | 18849/217273 [00:20<03:23, 974.71 examples/s]Map:   9%|▊         | 18687/217273 [00:20<03:32, 933.37 examples/s]Map:   9%|▉         | 20497/217273 [00:22<03:31, 932.12 examples/s]Map:   9%|▊         | 18953/217273 [00:20<03:20, 990.23 examples/s]Map:   9%|▉         | 20098/217273 [00:22<03:59, 824.56 examples/s]Map:   9%|▊         | 18811/217273 [00:20<03:42, 892.68 examples/s]Map:   9%|▉         | 20636/217273 [00:22<03:32, 924.18 examples/s]Map:   9%|▉         | 20231/217273 [00:22<03:54, 841.91 examples/s]Map:   9%|▊         | 18906/217273 [00:20<03:39, 904.54 examples/s]Map:   9%|▉         | 19101/217273 [00:20<04:03, 812.64 examples/s]Map:   9%|▉         | 20326/217273 [00:22<03:47, 865.75 examples/s]Map:  10%|▉         | 20778/217273 [00:23<03:31, 928.56 examples/s]Map:   9%|▊         | 18998/217273 [00:20<03:38, 905.79 examples/s]Map:   9%|▉         | 19201/217273 [00:21<03:52, 853.07 examples/s]Map:   9%|▉         | 20427/217273 [00:22<03:40, 893.65 examples/s]Map:  10%|▉         | 20872/217273 [00:23<03:31, 930.16 examples/s]Map:   9%|▉         | 19306/217273 [00:21<03:40, 896.79 examples/s]Map:   9%|▉         | 20522/217273 [00:23<03:36, 907.77 examples/s]Map:   9%|▉         | 19104/217273 [00:21<04:14, 778.37 examples/s]Map:   9%|▉         | 19406/217273 [00:21<03:34, 922.74 examples/s]Map:   9%|▉         | 20624/217273 [00:23<03:30, 934.46 examples/s]Map:  10%|▉         | 21000/217273 [00:23<04:06, 797.25 examples/s]Map:   9%|▉         | 19204/217273 [00:21<03:59, 828.47 examples/s]Map:   9%|▉         | 19512/217273 [00:21<03:26, 957.35 examples/s]Map:  10%|▉         | 20721/217273 [00:23<03:28, 943.92 examples/s]Map:  10%|▉         | 21097/217273 [00:23<03:55, 831.72 examples/s]Map:   9%|▉         | 19302/217273 [00:21<03:48, 865.16 examples/s]Map:   9%|▉         | 19616/217273 [00:21<03:22, 976.02 examples/s]Map:  10%|▉         | 20822/217273 [00:23<03:24, 960.31 examples/s]Map:  10%|▉         | 21192/217273 [00:23<03:48, 859.49 examples/s]Map:   9%|▉         | 19393/217273 [00:21<03:45, 876.72 examples/s]Map:   9%|▉         | 19719/217273 [00:21<03:20, 986.94 examples/s]Map:  10%|▉         | 20924/217273 [00:23<03:21, 975.14 examples/s]Map:  10%|▉         | 21292/217273 [00:23<03:39, 892.80 examples/s]Map:   9%|▉         | 19489/217273 [00:21<03:40, 896.98 examples/s]Map:  10%|▉         | 21385/217273 [00:23<03:37, 900.52 examples/s]Map:   9%|▉         | 19863/217273 [00:21<03:22, 974.64 examples/s]Map:   9%|▉         | 19584/217273 [00:21<03:37, 906.94 examples/s]Map:  10%|▉         | 21043/217273 [00:23<04:03, 807.51 examples/s]Map:  10%|▉         | 21483/217273 [00:23<03:32, 921.46 examples/s]Map:   9%|▉         | 19682/217273 [00:21<03:34, 921.40 examples/s]Map:  10%|▉         | 21141/217273 [00:23<03:51, 847.58 examples/s]Map:   9%|▉         | 20000/217273 [00:21<03:57, 831.66 examples/s]Map:   9%|▉         | 19780/217273 [00:21<03:31, 935.00 examples/s]Map:  10%|▉         | 21625/217273 [00:24<03:30, 927.61 examples/s]Map:  10%|▉         | 21245/217273 [00:23<03:39, 893.77 examples/s]Map:   9%|▉         | 20098/217273 [00:22<03:48, 862.34 examples/s]Map:   9%|▉         | 19879/217273 [00:21<03:28, 947.48 examples/s]Map:  10%|▉         | 21719/217273 [00:24<03:30, 927.23 examples/s]Map:  10%|▉         | 21380/217273 [00:23<03:40, 889.93 examples/s]Map:   9%|▉         | 20237/217273 [00:22<03:43, 880.17 examples/s]Map:  10%|█         | 21853/217273 [00:24<03:34, 911.54 examples/s]Map:  10%|▉         | 21475/217273 [00:24<03:36, 902.45 examples/s]Map:   9%|▉         | 20000/217273 [00:22<04:14, 774.31 examples/s]Map:   9%|▉         | 20343/217273 [00:22<03:34, 919.85 examples/s]Map:  10%|█         | 21948/217273 [00:24<03:32, 917.65 examples/s]Map:   9%|▉         | 20096/217273 [00:22<04:01, 816.65 examples/s]Map:  10%|▉         | 21581/217273 [00:24<03:28, 940.36 examples/s]Map:   9%|▉         | 20448/217273 [00:22<03:26, 951.77 examples/s]Map:   9%|▉         | 20190/217273 [00:22<03:53, 845.10 examples/s]Map:   9%|▉         | 20549/217273 [00:22<03:23, 965.62 examples/s]Map:  10%|█         | 22048/217273 [00:24<04:07, 788.27 examples/s]Map:  10%|▉         | 21727/217273 [00:24<03:26, 947.65 examples/s]Map:   9%|▉         | 20285/217273 [00:22<03:46, 870.81 examples/s]Map:  10%|▉         | 20659/217273 [00:22<03:16, 998.38 examples/s]Map:  10%|█         | 22140/217273 [00:24<03:58, 819.77 examples/s]Map:  10%|█         | 21827/217273 [00:24<03:23, 959.20 examples/s]Map:   9%|▉         | 20384/217273 [00:22<03:38, 900.86 examples/s]Map:  10%|█         | 22231/217273 [00:24<03:52, 837.75 examples/s]Map:  10%|█         | 21928/217273 [00:24<03:21, 969.84 examples/s]Map:  10%|▉         | 20803/217273 [00:22<03:20, 980.93 examples/s]Map:   9%|▉         | 20480/217273 [00:22<03:35, 915.12 examples/s]Map:  10%|█         | 22331/217273 [00:24<03:41, 880.06 examples/s]Map:  10%|▉         | 20905/217273 [00:22<03:18, 990.83 examples/s]Map:   9%|▉         | 20575/217273 [00:22<03:33, 922.89 examples/s]Map:  10%|█         | 22422/217273 [00:24<03:39, 886.02 examples/s]Map:  10%|█         | 22040/217273 [00:24<04:05, 796.58 examples/s]Map:  10%|▉         | 20674/217273 [00:22<03:28, 940.78 examples/s]Map:  10%|█         | 22515/217273 [00:25<03:37, 895.28 examples/s]Map:  10%|█         | 22142/217273 [00:24<03:50, 847.34 examples/s]Map:  10%|▉         | 21048/217273 [00:23<03:50, 849.53 examples/s]Map:  10%|█         | 22611/217273 [00:25<03:33, 912.58 examples/s]Map:  10%|█         | 22246/217273 [00:24<03:38, 893.58 examples/s]Map:  10%|▉         | 20815/217273 [00:23<03:29, 939.36 examples/s]Map:  10%|▉         | 21148/217273 [00:23<03:42, 880.95 examples/s]Map:  10%|█         | 22711/217273 [00:25<03:28, 935.29 examples/s]Map:  10%|█         | 22348/217273 [00:25<03:31, 922.44 examples/s]Map:  10%|▉         | 21248/217273 [00:23<03:36, 906.75 examples/s]Map:  10%|▉         | 20957/217273 [00:23<03:28, 939.91 examples/s]Map:  10%|█         | 22807/217273 [00:25<03:26, 940.50 examples/s]Map:  10%|█         | 22449/217273 [00:25<03:27, 939.36 examples/s]Map:  10%|▉         | 21347/217273 [00:23<03:32, 923.90 examples/s]Map:  10%|█         | 22547/217273 [00:25<03:25, 948.59 examples/s]Map:  11%|█         | 22949/217273 [00:25<03:26, 939.04 examples/s]Map:  10%|▉         | 21447/217273 [00:23<03:28, 941.08 examples/s]Map:  10%|▉         | 21099/217273 [00:23<04:00, 815.30 examples/s]Map:  10%|█         | 22654/217273 [00:25<03:18, 979.49 examples/s]Map:  10%|▉         | 21552/217273 [00:23<03:22, 967.80 examples/s]Map:  10%|▉         | 21196/217273 [00:23<03:51, 847.41 examples/s]Map:  10%|█         | 22755/217273 [00:25<03:17, 986.06 examples/s]Map:  11%|█         | 23046/217273 [00:25<04:06, 789.00 examples/s]Map:  10%|▉         | 21295/217273 [00:23<03:42, 879.66 examples/s]Map:  10%|▉         | 21703/217273 [00:23<03:19, 979.40 examples/s]Map:  11%|█         | 23147/217273 [00:25<03:51, 839.21 examples/s]Map:  11%|█         | 22905/217273 [00:25<03:18, 980.37 examples/s]Map:  10%|▉         | 21395/217273 [00:23<03:35, 907.96 examples/s]Map:  10%|█         | 21814/217273 [00:23<03:13, 1011.75 examples/s]Map:  11%|█         | 23244/217273 [00:25<03:42, 870.76 examples/s]Map:  10%|▉         | 21497/217273 [00:23<03:29, 933.29 examples/s]Map:  11%|█         | 23343/217273 [00:26<03:35, 901.21 examples/s]Map:  10%|█         | 21967/217273 [00:23<03:12, 1012.94 examples/s]Map:  11%|█         | 23048/217273 [00:25<03:51, 838.75 examples/s]Map:  11%|█         | 23447/217273 [00:26<03:26, 936.69 examples/s]Map:  10%|▉         | 21642/217273 [00:23<03:27, 942.96 examples/s]Map:  11%|█         | 23151/217273 [00:25<03:40, 879.40 examples/s]Map:  11%|█         | 23549/217273 [00:26<03:22, 954.85 examples/s]Map:  10%|█         | 21739/217273 [00:24<03:26, 947.63 examples/s]Map:  10%|█         | 22101/217273 [00:24<03:46, 861.80 examples/s] Map:  11%|█         | 23254/217273 [00:26<03:32, 915.00 examples/s]Map:  10%|█         | 21842/217273 [00:24<03:21, 968.87 examples/s]Map:  11%|█         | 23649/217273 [00:26<03:20, 963.77 examples/s]Map:  10%|█         | 22201/217273 [00:24<03:38, 891.91 examples/s]Map:  11%|█         | 23357/217273 [00:26<03:25, 942.70 examples/s]Map:  10%|█         | 21945/217273 [00:24<03:18, 984.76 examples/s]Map:  11%|█         | 23751/217273 [00:26<03:17, 978.76 examples/s]Map:  10%|█         | 22303/217273 [00:24<03:31, 919.95 examples/s]Map:  11%|█         | 23455/217273 [00:26<03:24, 948.57 examples/s]Map:  11%|█         | 23857/217273 [00:26<03:13, 998.64 examples/s]Map:  10%|█         | 22409/217273 [00:24<03:24, 954.51 examples/s]Map:  11%|█         | 23558/217273 [00:26<03:20, 967.13 examples/s]Map:  10%|█         | 22045/217273 [00:24<04:01, 809.92 examples/s]Map:  10%|█         | 22151/217273 [00:24<03:44, 869.81 examples/s]Map:  10%|█         | 22557/217273 [00:24<03:22, 962.17 examples/s]Map:  11%|█         | 23705/217273 [00:26<03:20, 966.04 examples/s]Map:  11%|█         | 24000/217273 [00:26<03:45, 855.48 examples/s]Map:  10%|█         | 22249/217273 [00:24<03:37, 898.20 examples/s]Map:  10%|█         | 22658/217273 [00:24<03:20, 972.89 examples/s]Map:  11%|█         | 23809/217273 [00:26<03:17, 981.82 examples/s]Map:  11%|█         | 24097/217273 [00:26<03:39, 881.09 examples/s]Map:  10%|█         | 22350/217273 [00:24<03:30, 924.78 examples/s]Map:  10%|█         | 22760/217273 [00:24<03:18, 981.68 examples/s]Map:  11%|█         | 24192/217273 [00:26<03:37, 887.93 examples/s]Map:  11%|█         | 23958/217273 [00:26<03:16, 983.72 examples/s]Map:  10%|█         | 22446/217273 [00:24<03:29, 931.57 examples/s]Map:  11%|█         | 22860/217273 [00:24<03:17, 984.06 examples/s]Map:  11%|█         | 24295/217273 [00:27<03:28, 923.61 examples/s]Map:  10%|█         | 22548/217273 [00:24<03:24, 953.79 examples/s]Map:  11%|█         | 22964/217273 [00:25<03:14, 996.49 examples/s]Map:  11%|█         | 24443/217273 [00:27<03:24, 943.10 examples/s]Map:  11%|█         | 24098/217273 [00:26<03:47, 850.35 examples/s]Map:  10%|█         | 22650/217273 [00:25<03:20, 969.56 examples/s]Map:  11%|█▏        | 24541/217273 [00:27<03:22, 949.91 examples/s]Map:  11%|█         | 24201/217273 [00:27<03:37, 889.10 examples/s]Map:  10%|█         | 22750/217273 [00:25<03:19, 976.16 examples/s]Map:  11%|█         | 23102/217273 [00:25<03:53, 830.54 examples/s]Map:  11%|█▏        | 24640/217273 [00:27<03:20, 960.11 examples/s]Map:  11%|█         | 24298/217273 [00:27<03:33, 904.91 examples/s]Map:  11%|█         | 22850/217273 [00:25<03:18, 979.68 examples/s]Map:  11%|█         | 23192/217273 [00:25<03:49, 845.73 examples/s]Map:  11%|█▏        | 24740/217273 [00:27<03:19, 966.40 examples/s]Map:  11%|█         | 24395/217273 [00:27<03:29, 920.03 examples/s]Map:  11%|█         | 22952/217273 [00:25<03:16, 988.38 examples/s]Map:  11%|█         | 23294/217273 [00:25<03:38, 887.35 examples/s]Map:  11%|█▏        | 24840/217273 [00:27<03:17, 972.25 examples/s]Map:  11%|█▏        | 24498/217273 [00:27<03:24, 944.43 examples/s]Map:  11%|█         | 23395/217273 [00:25<03:31, 917.57 examples/s]Map:  11%|█▏        | 24945/217273 [00:27<03:13, 992.27 examples/s]Map:  11%|█▏        | 24602/217273 [00:27<03:18, 968.53 examples/s]Map:  11%|█         | 23100/217273 [00:25<03:52, 836.23 examples/s]Map:  11%|█         | 23497/217273 [00:25<03:25, 942.39 examples/s]Map:  11%|█         | 23192/217273 [00:25<03:47, 853.09 examples/s]Map:  11%|█▏        | 24742/217273 [00:27<03:21, 953.34 examples/s]Map:  11%|█         | 23635/217273 [00:25<03:28, 929.61 examples/s]Map:  12%|█▏        | 25092/217273 [00:27<03:52, 826.51 examples/s]Map:  11%|█         | 23289/217273 [00:25<03:40, 881.13 examples/s]Map:  11%|█         | 23737/217273 [00:25<03:24, 947.43 examples/s]Map:  11%|█▏        | 24890/217273 [00:27<03:19, 962.47 examples/s]Map:  12%|█▏        | 25196/217273 [00:28<03:40, 872.20 examples/s]Map:  11%|█         | 23387/217273 [00:25<03:34, 904.99 examples/s]Map:  11%|█         | 23838/217273 [00:26<03:21, 960.22 examples/s]Map:  12%|█▏        | 24993/217273 [00:27<03:16, 978.08 examples/s]Map:  12%|█▏        | 25298/217273 [00:28<03:31, 906.86 examples/s]Map:  11%|█         | 23495/217273 [00:25<03:23, 949.97 examples/s]Map:  11%|█         | 23940/217273 [00:26<03:18, 974.17 examples/s]Map:  12%|█▏        | 25399/217273 [00:28<03:27, 925.84 examples/s]Map:  11%|█         | 23599/217273 [00:26<03:18, 973.93 examples/s]Map:  12%|█▏        | 25092/217273 [00:28<03:56, 811.75 examples/s]Map:  12%|█▏        | 25503/217273 [00:28<03:20, 954.49 examples/s]Map:  11%|█         | 23702/217273 [00:26<03:16, 987.12 examples/s]Map:  12%|█▏        | 25191/217273 [00:28<03:45, 852.55 examples/s]Map:  11%|█         | 24051/217273 [00:26<04:03, 792.21 examples/s]Map:  11%|█         | 23805/217273 [00:26<03:14, 996.56 examples/s]Map:  12%|█▏        | 25645/217273 [00:28<03:21, 948.71 examples/s]Map:  12%|█▏        | 25288/217273 [00:28<03:38, 877.98 examples/s]Map:  11%|█         | 24149/217273 [00:26<03:51, 835.54 examples/s]Map:  11%|█         | 23907/217273 [00:26<03:13, 997.99 examples/s]Map:  12%|█▏        | 25743/217273 [00:28<03:20, 955.33 examples/s]Map:  12%|█▏        | 25391/217273 [00:28<03:29, 914.17 examples/s]Map:  11%|█         | 24251/217273 [00:26<03:38, 881.41 examples/s]Map:  12%|█▏        | 25843/217273 [00:28<03:18, 964.97 examples/s]Map:  12%|█▏        | 25490/217273 [00:28<03:26, 929.96 examples/s]Map:  11%|█         | 24347/217273 [00:26<03:34, 897.94 examples/s]Map:  11%|█         | 24047/217273 [00:26<03:53, 826.93 examples/s]Map:  12%|█▏        | 25942/217273 [00:28<03:17, 969.05 examples/s]Map:  11%|█▏        | 24453/217273 [00:26<03:25, 940.23 examples/s]Map:  12%|█▏        | 25638/217273 [00:28<03:22, 947.04 examples/s]Map:  11%|█         | 24155/217273 [00:26<04:05, 787.40 examples/s]Map:  12%|█▏        | 25737/217273 [00:28<03:20, 954.46 examples/s]Map:  11%|█▏        | 24600/217273 [00:26<03:22, 950.79 examples/s]Map:  12%|█▏        | 26046/217273 [00:28<03:58, 803.33 examples/s]Map:  12%|█▏        | 25836/217273 [00:28<03:18, 963.06 examples/s]Map:  11%|█▏        | 24701/217273 [00:26<03:20, 962.71 examples/s]Map:  11%|█         | 24257/217273 [00:26<04:16, 751.65 examples/s]Map:  12%|█▏        | 26139/217273 [00:29<03:50, 830.74 examples/s]Map:  12%|█▏        | 25967/217273 [00:28<03:26, 924.91 examples/s]Map:  11%|█▏        | 24839/217273 [00:27<03:23, 943.38 examples/s]Map:  11%|█         | 24360/217273 [00:27<04:25, 727.24 examples/s]Map:  12%|█▏        | 26272/217273 [00:29<03:45, 846.79 examples/s]Map:  11%|█▏        | 24941/217273 [00:27<03:19, 961.79 examples/s]Map:  11%|█▏        | 24455/217273 [00:27<04:08, 775.83 examples/s]Map:  12%|█▏        | 26365/217273 [00:29<03:40, 866.87 examples/s]Map:  12%|█▏        | 26092/217273 [00:29<04:01, 792.71 examples/s]Map:  11%|█▏        | 24550/217273 [00:27<03:56, 816.00 examples/s]Map:  12%|█▏        | 26468/217273 [00:29<03:30, 905.82 examples/s]Map:  12%|█▏        | 25050/217273 [00:27<03:54, 818.19 examples/s]Map:  12%|█▏        | 26193/217273 [00:29<03:47, 839.84 examples/s]Map:  11%|█▏        | 24644/217273 [00:27<03:47, 845.49 examples/s]Map:  12%|█▏        | 26564/217273 [00:29<03:27, 917.50 examples/s]Map:  12%|█▏        | 25149/217273 [00:27<03:44, 856.38 examples/s]Map:  12%|█▏        | 26291/217273 [00:29<03:40, 866.07 examples/s]Map:  11%|█▏        | 24740/217273 [00:27<03:40, 873.43 examples/s]Map:  12%|█▏        | 26668/217273 [00:29<03:20, 949.80 examples/s]Map:  12%|█▏        | 25252/217273 [00:27<03:34, 893.47 examples/s]Map:  12%|█▏        | 26387/217273 [00:29<03:34, 888.64 examples/s]Map:  11%|█▏        | 24830/217273 [00:27<03:39, 878.34 examples/s]Map:  12%|█▏        | 26769/217273 [00:29<03:17, 963.62 examples/s]Map:  12%|█▏        | 25354/217273 [00:27<03:27, 923.72 examples/s]Map:  12%|█▏        | 26489/217273 [00:29<03:27, 920.36 examples/s]Map:  11%|█▏        | 24928/217273 [00:27<03:32, 904.53 examples/s]Map:  12%|█▏        | 26876/217273 [00:29<03:12, 990.88 examples/s]Map:  12%|█▏        | 26591/217273 [00:29<03:21, 945.51 examples/s]Map:  12%|█▏        | 25502/217273 [00:27<03:23, 943.83 examples/s]Map:  12%|█▏        | 26695/217273 [00:29<03:16, 970.30 examples/s]Map:  12%|█▏        | 25049/217273 [00:27<04:09, 770.93 examples/s]Map:  12%|█▏        | 27000/217273 [00:30<03:53, 815.86 examples/s]Map:  12%|█▏        | 25607/217273 [00:27<03:18, 967.16 examples/s]Map:  12%|█▏        | 25150/217273 [00:27<03:52, 826.55 examples/s]Map:  12%|█▏        | 27099/217273 [00:30<03:42, 854.24 examples/s]Map:  12%|█▏        | 26838/217273 [00:29<03:17, 962.41 examples/s]Map:  12%|█▏        | 25748/217273 [00:28<03:20, 954.69 examples/s]Map:  12%|█▏        | 25248/217273 [00:28<03:42, 864.49 examples/s]Map:  13%|█▎        | 27197/217273 [00:30<03:34, 885.57 examples/s]Map:  12%|█▏        | 26939/217273 [00:29<03:15, 972.49 examples/s]Map:  12%|█▏        | 25847/217273 [00:28<03:19, 960.51 examples/s]Map:  12%|█▏        | 25346/217273 [00:28<03:35, 892.51 examples/s]Map:  13%|█▎        | 27330/217273 [00:30<03:35, 880.77 examples/s]Map:  12%|█▏        | 25983/217273 [00:28<03:24, 935.13 examples/s]Map:  12%|█▏        | 27039/217273 [00:30<04:00, 790.03 examples/s]Map:  12%|█▏        | 25482/217273 [00:28<03:34, 894.51 examples/s]Map:  13%|█▎        | 27470/217273 [00:30<03:32, 892.49 examples/s]Map:  12%|█▏        | 27140/217273 [00:30<03:46, 840.74 examples/s]Map:  12%|█▏        | 25579/217273 [00:28<03:30, 911.25 examples/s]Map:  12%|█▏        | 26099/217273 [00:28<03:57, 804.84 examples/s]Map:  13%|█▎        | 27568/217273 [00:30<03:28, 911.68 examples/s]Map:  13%|█▎        | 27245/217273 [00:30<03:32, 892.35 examples/s]Map:  12%|█▏        | 25674/217273 [00:28<03:28, 920.20 examples/s]Map:  12%|█▏        | 26203/217273 [00:28<03:43, 855.48 examples/s]Map:  13%|█▎        | 27667/217273 [00:30<03:24, 928.54 examples/s]Map:  13%|█▎        | 27344/217273 [00:30<03:27, 913.57 examples/s]Map:  12%|█▏        | 25816/217273 [00:28<03:26, 926.43 examples/s]Map:  12%|█▏        | 26306/217273 [00:28<03:33, 893.74 examples/s]Map:  13%|█▎        | 27766/217273 [00:30<03:21, 942.72 examples/s]Map:  13%|█▎        | 27439/217273 [00:30<03:26, 918.72 examples/s]Map:  12%|█▏        | 25915/217273 [00:28<03:23, 941.27 examples/s]Map:  12%|█▏        | 26408/217273 [00:28<03:26, 923.84 examples/s]Map:  13%|█▎        | 27862/217273 [00:30<03:20, 945.88 examples/s]Map:  13%|█▎        | 27541/217273 [00:30<03:21, 942.81 examples/s]Map:  12%|█▏        | 26510/217273 [00:28<03:21, 946.97 examples/s]Map:  13%|█▎        | 27642/217273 [00:30<03:17, 958.95 examples/s]Map:  12%|█▏        | 26609/217273 [00:29<03:19, 956.83 examples/s]Map:  12%|█▏        | 26049/217273 [00:28<03:59, 796.81 examples/s]Map:  13%|█▎        | 27750/217273 [00:30<03:11, 990.63 examples/s]Map:  13%|█▎        | 28000/217273 [00:31<03:58, 795.24 examples/s]Map:  12%|█▏        | 26711/217273 [00:29<03:16, 971.79 examples/s]Map:  12%|█▏        | 26141/217273 [00:29<03:52, 822.17 examples/s]Map:  13%|█▎        | 28095/217273 [00:31<03:48, 828.78 examples/s]Map:  13%|█▎        | 27896/217273 [00:31<03:13, 979.31 examples/s]Map:  12%|█▏        | 26810/217273 [00:29<03:15, 972.52 examples/s]Map:  12%|█▏        | 26240/217273 [00:29<03:42, 859.35 examples/s]Map:  13%|█▎        | 28191/217273 [00:31<03:40, 858.47 examples/s]Map:  12%|█▏        | 26910/217273 [00:29<03:14, 976.81 examples/s]Map:  12%|█▏        | 26330/217273 [00:29<03:39, 868.51 examples/s]Map:  13%|█▎        | 28000/217273 [00:31<03:50, 821.06 examples/s]Map:  13%|█▎        | 28328/217273 [00:31<03:36, 874.57 examples/s]Map:  12%|█▏        | 26428/217273 [00:29<03:32, 896.30 examples/s]Map:  13%|█▎        | 28091/217273 [00:31<03:45, 840.33 examples/s]Map:  13%|█▎        | 28421/217273 [00:31<03:33, 884.80 examples/s]Map:  12%|█▏        | 26527/217273 [00:29<03:26, 921.75 examples/s]Map:  12%|█▏        | 27040/217273 [00:29<03:56, 805.65 examples/s]Map:  13%|█▎        | 28189/217273 [00:31<03:36, 872.10 examples/s]Map:  13%|█▎        | 28520/217273 [00:31<03:27, 909.65 examples/s]Map:  12%|█▏        | 26623/217273 [00:29<03:25, 929.49 examples/s]Map:  12%|█▏        | 27134/217273 [00:29<03:47, 836.36 examples/s]Map:  13%|█▎        | 28293/217273 [00:31<03:26, 913.26 examples/s]Map:  13%|█▎        | 28617/217273 [00:31<03:24, 921.90 examples/s]Map:  12%|█▏        | 26719/217273 [00:29<03:23, 935.92 examples/s]Map:  13%|█▎        | 27236/217273 [00:29<03:35, 881.26 examples/s]Map:  13%|█▎        | 28391/217273 [00:31<03:23, 928.70 examples/s]Map:  13%|█▎        | 28718/217273 [00:31<03:19, 944.19 examples/s]Map:  12%|█▏        | 26816/217273 [00:29<03:21, 943.37 examples/s]Map:  13%|█▎        | 27330/217273 [00:29<03:32, 893.18 examples/s]Map:  13%|█▎        | 28497/217273 [00:31<03:16, 963.05 examples/s]Map:  13%|█▎        | 28818/217273 [00:32<03:17, 955.58 examples/s]Map:  12%|█▏        | 26913/217273 [00:29<03:20, 949.14 examples/s]Map:  13%|█▎        | 27428/217273 [00:30<03:27, 912.92 examples/s]Map:  13%|█▎        | 28597/217273 [00:31<03:13, 972.62 examples/s]Map:  13%|█▎        | 28916/217273 [00:32<03:15, 961.47 examples/s]Map:  13%|█▎        | 27528/217273 [00:30<03:22, 934.96 examples/s]Map:  13%|█▎        | 28699/217273 [00:31<03:11, 985.10 examples/s]Map:  13%|█▎        | 27628/217273 [00:30<03:19, 949.71 examples/s]Map:  12%|█▏        | 27044/217273 [00:30<03:57, 799.64 examples/s]Map:  13%|█▎        | 29047/217273 [00:32<03:53, 806.59 examples/s]Map:  13%|█▎        | 28851/217273 [00:32<03:09, 993.23 examples/s]Map:  12%|█▏        | 27140/217273 [00:30<03:47, 837.28 examples/s]Map:  13%|█▎        | 27739/217273 [00:30<03:11, 991.50 examples/s]Map:  13%|█▎        | 29151/217273 [00:32<03:38, 860.59 examples/s]Map:  13%|█▎        | 27240/217273 [00:30<03:37, 875.21 examples/s]Map:  13%|█▎        | 27843/217273 [00:30<03:09, 1001.76 examples/s]Map:  13%|█▎        | 27337/217273 [00:30<03:31, 899.79 examples/s]Map:  13%|█▎        | 29000/217273 [00:32<03:42, 848.02 examples/s]Map:  13%|█▎        | 29285/217273 [00:32<03:36, 867.15 examples/s]Map:  13%|█▎        | 27990/217273 [00:30<03:11, 988.96 examples/s] Map:  13%|█▎        | 27431/217273 [00:30<03:28, 908.53 examples/s]Map:  13%|█▎        | 29098/217273 [00:32<03:35, 875.03 examples/s]Map:  14%|█▎        | 29382/217273 [00:32<03:31, 889.67 examples/s]Map:  13%|█▎        | 27525/217273 [00:30<03:27, 913.14 examples/s]Map:  13%|█▎        | 29201/217273 [00:32<03:27, 908.27 examples/s]Map:  14%|█▎        | 29482/217273 [00:32<03:25, 916.02 examples/s]Map:  13%|█▎        | 28098/217273 [00:30<03:50, 821.32 examples/s]Map:  13%|█▎        | 28188/217273 [00:30<03:45, 837.37 examples/s]Map:  13%|█▎        | 27660/217273 [00:30<03:29, 904.65 examples/s]Map:  14%|█▎        | 29334/217273 [00:32<03:29, 897.73 examples/s]Map:  14%|█▎        | 29615/217273 [00:32<03:28, 901.08 examples/s]Map:  13%|█▎        | 28284/217273 [00:30<03:38, 866.35 examples/s]Map:  13%|█▎        | 27753/217273 [00:30<03:27, 911.27 examples/s]Map:  14%|█▎        | 29434/217273 [00:32<03:23, 921.20 examples/s]Map:  14%|█▎        | 29712/217273 [00:33<03:24, 915.81 examples/s]Map:  13%|█▎        | 28381/217273 [00:31<03:31, 891.62 examples/s]Map:  13%|█▎        | 27851/217273 [00:30<03:24, 927.46 examples/s]Map:  14%|█▎        | 29531/217273 [00:32<03:21, 932.23 examples/s]Map:  14%|█▎        | 29851/217273 [00:33<03:24, 914.29 examples/s]Map:  13%|█▎        | 28481/217273 [00:31<03:25, 919.90 examples/s]Map:  13%|█▎        | 27950/217273 [00:31<03:21, 940.47 examples/s]Map:  14%|█▎        | 29675/217273 [00:33<03:19, 941.07 examples/s]Map:  14%|█▍        | 29950/217273 [00:33<03:21, 931.22 examples/s]Map:  13%|█▎        | 28585/217273 [00:31<03:18, 952.97 examples/s]Map:  14%|█▎        | 29774/217273 [00:33<03:17, 949.82 examples/s]Map:  13%|█▎        | 28051/217273 [00:31<04:02, 780.50 examples/s]Map:  13%|█▎        | 28687/217273 [00:31<03:14, 968.51 examples/s]Map:  14%|█▍        | 30045/217273 [00:33<04:00, 779.12 examples/s]Map:  14%|█▍        | 29878/217273 [00:33<03:13, 970.66 examples/s]Map:  13%|█▎        | 28149/217273 [00:31<03:48, 828.54 examples/s]Map:  13%|█▎        | 28786/217273 [00:31<03:14, 971.24 examples/s]Map:  14%|█▍        | 30138/217273 [00:33<03:49, 813.82 examples/s]Map:  14%|█▍        | 29978/217273 [00:33<03:12, 975.33 examples/s]Map:  13%|█▎        | 28244/217273 [00:31<03:40, 857.54 examples/s]Map:  13%|█▎        | 28890/217273 [00:31<03:10, 988.24 examples/s]Map:  14%|█▍        | 30240/217273 [00:33<03:36, 863.53 examples/s]Map:  13%|█▎        | 28344/217273 [00:31<03:31, 894.49 examples/s]Map:  13%|█▎        | 28994/217273 [00:31<03:08, 1001.24 examples/s]Map:  14%|█▍        | 30093/217273 [00:33<03:50, 813.19 examples/s]Map:  14%|█▍        | 30333/217273 [00:33<03:32, 878.07 examples/s]Map:  13%|█▎        | 28442/217273 [00:31<03:26, 916.53 examples/s]Map:  14%|█▍        | 30192/217273 [00:33<03:38, 854.83 examples/s]Map:  14%|█▍        | 30427/217273 [00:33<03:29, 891.38 examples/s]Map:  13%|█▎        | 29105/217273 [00:31<03:44, 836.31 examples/s] Map:  13%|█▎        | 28580/217273 [00:31<03:25, 916.61 examples/s]Map:  14%|█▍        | 30290/217273 [00:33<03:32, 880.19 examples/s]Map:  14%|█▍        | 30524/217273 [00:33<03:25, 910.45 examples/s]Map:  13%|█▎        | 29204/217273 [00:31<03:35, 872.44 examples/s]Map:  13%|█▎        | 28678/217273 [00:31<03:22, 932.43 examples/s]Map:  14%|█▍        | 30391/217273 [00:33<03:25, 911.13 examples/s]Map:  13%|█▎        | 29302/217273 [00:32<03:29, 898.38 examples/s]Map:  14%|█▍        | 30651/217273 [00:34<03:31, 883.18 examples/s]Map:  13%|█▎        | 28809/217273 [00:32<03:27, 906.56 examples/s]Map:  14%|█▍        | 30521/217273 [00:33<03:29, 891.40 examples/s]Map:  14%|█▎        | 29436/217273 [00:32<03:30, 893.13 examples/s]Map:  14%|█▍        | 30775/217273 [00:34<03:37, 859.35 examples/s]Map:  13%|█▎        | 28904/217273 [00:32<03:25, 916.00 examples/s]Map:  14%|█▍        | 30622/217273 [00:34<03:22, 920.30 examples/s]Map:  14%|█▎        | 29538/217273 [00:32<03:23, 922.76 examples/s]Map:  14%|█▍        | 30723/217273 [00:34<03:17, 942.21 examples/s]Map:  14%|█▍        | 30907/217273 [00:34<03:36, 862.70 examples/s]Map:  14%|█▎        | 29635/217273 [00:32<03:21, 933.08 examples/s]Map:  13%|█▎        | 29000/217273 [00:32<03:57, 792.40 examples/s]Map:  14%|█▍        | 30822/217273 [00:34<03:15, 954.58 examples/s]Map:  14%|█▎        | 29737/217273 [00:32<03:16, 955.03 examples/s]Map:  13%|█▎        | 29100/217273 [00:32<03:43, 842.21 examples/s]Map:  14%|█▍        | 31000/217273 [00:34<04:11, 740.13 examples/s]Map:  14%|█▍        | 30924/217273 [00:34<03:11, 970.79 examples/s]Map:  14%|█▎        | 29837/217273 [00:32<03:14, 962.39 examples/s]Map:  13%|█▎        | 29204/217273 [00:32<03:30, 891.55 examples/s]Map:  14%|█▍        | 31087/217273 [00:34<04:02, 767.31 examples/s]Map:  14%|█▍        | 29938/217273 [00:32<03:12, 972.97 examples/s]Map:  13%|█▎        | 29303/217273 [00:32<03:25, 915.81 examples/s]Map:  14%|█▍        | 31181/217273 [00:34<03:50, 808.89 examples/s]Map:  14%|█▍        | 31048/217273 [00:34<03:45, 824.26 examples/s]Map:  14%|█▎        | 29397/217273 [00:32<03:24, 919.52 examples/s]Map:  14%|█▍        | 31279/217273 [00:34<03:38, 851.07 examples/s]Map:  14%|█▍        | 31149/217273 [00:34<03:34, 866.65 examples/s]Map:  14%|█▍        | 30043/217273 [00:32<03:53, 800.15 examples/s]Map:  14%|█▎        | 29498/217273 [00:32<03:18, 943.93 examples/s]Map:  14%|█▍        | 31377/217273 [00:35<03:30, 882.69 examples/s]Map:  14%|█▍        | 31246/217273 [00:34<03:28, 891.28 examples/s]Map:  14%|█▍        | 30143/217273 [00:32<03:40, 848.26 examples/s]Map:  14%|█▎        | 29598/217273 [00:32<03:15, 958.17 examples/s]Map:  14%|█▍        | 31478/217273 [00:35<03:23, 913.82 examples/s]Map:  14%|█▍        | 31345/217273 [00:34<03:23, 915.45 examples/s]Map:  14%|█▍        | 30240/217273 [00:33<03:32, 878.29 examples/s]Map:  14%|█▎        | 29701/217273 [00:32<03:12, 974.65 examples/s]Map:  15%|█▍        | 31578/217273 [00:35<03:18, 934.53 examples/s]Map:  14%|█▍        | 31447/217273 [00:34<03:17, 942.34 examples/s]Map:  14%|█▍        | 30341/217273 [00:33<03:25, 911.31 examples/s]Map:  15%|█▍        | 31675/217273 [00:35<03:17, 937.88 examples/s]Map:  15%|█▍        | 31548/217273 [00:35<03:13, 960.04 examples/s]Map:  14%|█▎        | 29842/217273 [00:33<03:16, 953.21 examples/s]Map:  14%|█▍        | 30439/217273 [00:33<03:20, 929.59 examples/s]Map:  15%|█▍        | 31775/217273 [00:35<03:14, 952.87 examples/s]Map:  14%|█▍        | 29939/217273 [00:33<03:15, 956.57 examples/s]Map:  14%|█▍        | 30543/217273 [00:33<03:15, 956.76 examples/s]Map:  15%|█▍        | 31696/217273 [00:35<03:11, 967.38 examples/s]Map:  15%|█▍        | 31881/217273 [00:35<03:08, 981.77 examples/s]Map:  14%|█▍        | 30644/217273 [00:33<03:13, 966.90 examples/s]Map:  15%|█▍        | 31796/217273 [00:35<03:10, 972.02 examples/s]Map:  15%|█▍        | 31983/217273 [00:35<03:07, 989.76 examples/s]Map:  14%|█▍        | 30048/217273 [00:33<03:58, 784.87 examples/s]Map:  15%|█▍        | 31899/217273 [00:35<03:08, 985.60 examples/s]Map:  14%|█▍        | 30793/217273 [00:33<03:11, 973.64 examples/s]Map:  14%|█▍        | 30143/217273 [00:33<03:47, 822.29 examples/s]Map:  14%|█▍        | 30895/217273 [00:33<03:09, 984.48 examples/s]Map:  15%|█▍        | 32097/217273 [00:35<03:43, 828.24 examples/s]Map:  15%|█▍        | 32000/217273 [00:35<03:42, 830.94 examples/s]Map:  14%|█▍        | 30280/217273 [00:33<03:40, 847.78 examples/s]Map:  15%|█▍        | 32194/217273 [00:35<03:35, 860.44 examples/s]Map:  15%|█▍        | 32094/217273 [00:35<03:36, 856.54 examples/s]Map:  14%|█▍        | 31000/217273 [00:33<03:42, 837.02 examples/s]Map:  14%|█▍        | 30380/217273 [00:33<03:31, 883.40 examples/s]Map:  15%|█▍        | 32285/217273 [00:36<03:32, 871.01 examples/s]Map:  15%|█▍        | 32193/217273 [00:35<03:28, 888.51 examples/s]Map:  14%|█▍        | 31100/217273 [00:34<03:32, 874.16 examples/s]Map:  14%|█▍        | 30476/217273 [00:33<03:27, 900.75 examples/s]Map:  15%|█▍        | 32381/217273 [00:36<03:27, 893.18 examples/s]Map:  15%|█▍        | 32287/217273 [00:35<03:25, 901.33 examples/s]Map:  14%|█▍        | 31206/217273 [00:34<03:22, 917.09 examples/s]Map:  14%|█▍        | 30574/217273 [00:33<03:22, 920.66 examples/s]Map:  15%|█▍        | 32475/217273 [00:36<03:25, 900.99 examples/s]Map:  15%|█▍        | 32388/217273 [00:35<03:19, 927.17 examples/s]Map:  14%|█▍        | 31310/217273 [00:34<03:15, 948.91 examples/s]Map:  14%|█▍        | 30671/217273 [00:34<03:20, 932.78 examples/s]Map:  15%|█▍        | 32572/217273 [00:36<03:22, 913.70 examples/s]Map:  15%|█▍        | 32493/217273 [00:36<03:12, 958.96 examples/s]Map:  14%|█▍        | 31410/217273 [00:34<03:13, 959.38 examples/s]Map:  14%|█▍        | 30770/217273 [00:34<03:16, 948.22 examples/s]Map:  15%|█▌        | 32676/217273 [00:36<03:15, 944.14 examples/s]Map:  15%|█▌        | 32597/217273 [00:36<03:08, 980.59 examples/s]Map:  15%|█▍        | 31514/217273 [00:34<03:09, 980.25 examples/s]Map:  14%|█▍        | 30871/217273 [00:34<03:13, 964.37 examples/s]Map:  15%|█▌        | 32699/217273 [00:36<03:06, 988.53 examples/s]Map:  15%|█▌        | 32816/217273 [00:36<03:17, 935.70 examples/s]Map:  15%|█▍        | 31618/217273 [00:34<03:06, 993.77 examples/s]Map:  14%|█▍        | 30971/217273 [00:34<03:11, 970.67 examples/s]Map:  15%|█▌        | 32851/217273 [00:36<03:05, 993.82 examples/s]Map:  15%|█▌        | 32958/217273 [00:36<03:17, 935.34 examples/s]Map:  15%|█▍        | 31767/217273 [00:34<03:07, 988.98 examples/s]Map:  14%|█▍        | 31101/217273 [00:34<03:46, 820.86 examples/s]Map:  15%|█▌        | 32951/217273 [00:36<03:05, 992.09 examples/s]Map:  15%|█▍        | 31867/217273 [00:34<03:07, 990.07 examples/s]Map:  14%|█▍        | 31204/217273 [00:34<03:34, 869.27 examples/s]Map:  15%|█▍        | 31968/217273 [00:34<03:06, 991.50 examples/s]Map:  15%|█▌        | 33098/217273 [00:36<03:46, 813.57 examples/s]Map:  14%|█▍        | 31308/217273 [00:34<03:23, 911.96 examples/s]Map:  15%|█▌        | 33093/217273 [00:36<03:41, 830.24 examples/s]Map:  15%|█▌        | 33199/217273 [00:37<03:35, 855.15 examples/s]Map:  14%|█▍        | 31411/217273 [00:34<03:17, 941.14 examples/s]Map:  15%|█▍        | 32099/217273 [00:35<03:40, 838.01 examples/s]Map:  15%|█▌        | 33198/217273 [00:36<03:29, 878.34 examples/s]Map:  15%|█▌        | 33301/217273 [00:37<03:25, 893.48 examples/s]Map:  15%|█▍        | 31509/217273 [00:35<03:16, 947.65 examples/s]Map:  15%|█▍        | 32196/217273 [00:35<03:33, 868.89 examples/s]Map:  15%|█▌        | 33305/217273 [00:36<03:19, 922.57 examples/s]Map:  15%|█▌        | 33397/217273 [00:37<03:22, 907.09 examples/s]Map:  15%|█▍        | 32297/217273 [00:35<03:24, 903.50 examples/s]Map:  15%|█▌        | 33409/217273 [00:37<03:13, 948.88 examples/s]Map:  15%|█▍        | 31655/217273 [00:35<03:14, 952.23 examples/s]Map:  15%|█▌        | 33529/217273 [00:37<03:26, 889.90 examples/s]Map:  15%|█▍        | 32394/217273 [00:35<03:21, 917.91 examples/s]Map:  15%|█▍        | 31755/217273 [00:35<03:13, 960.82 examples/s]Map:  15%|█▌        | 33558/217273 [00:37<03:11, 961.44 examples/s]Map:  15%|█▌        | 33622/217273 [00:37<03:25, 895.41 examples/s]Map:  15%|█▍        | 32496/217273 [00:35<03:15, 945.68 examples/s]Map:  15%|█▍        | 31857/217273 [00:35<03:10, 975.14 examples/s]Map:  15%|█▌        | 33662/217273 [00:37<03:07, 979.44 examples/s]Map:  16%|█▌        | 33717/217273 [00:37<03:22, 907.77 examples/s]Map:  15%|█▌        | 32595/217273 [00:35<03:13, 956.43 examples/s]Map:  15%|█▍        | 31956/217273 [00:35<03:09, 977.38 examples/s]Map:  15%|█▌        | 32694/217273 [00:35<03:11, 962.61 examples/s]Map:  16%|█▌        | 33814/217273 [00:37<03:05, 990.04 examples/s]Map:  16%|█▌        | 33855/217273 [00:37<03:21, 910.75 examples/s]Map:  16%|█▌        | 33948/217273 [00:37<03:20, 912.43 examples/s]Map:  15%|█▍        | 32090/217273 [00:35<03:47, 814.99 examples/s]Map:  15%|█▌        | 32832/217273 [00:35<03:16, 939.69 examples/s]Map:  16%|█▌        | 33955/217273 [00:37<03:09, 969.07 examples/s]Map:  15%|█▍        | 32187/217273 [00:35<03:38, 847.35 examples/s]Map:  16%|█▌        | 34049/217273 [00:38<04:00, 761.24 examples/s]Map:  15%|█▌        | 32978/217273 [00:35<03:14, 948.22 examples/s]Map:  15%|█▍        | 32286/217273 [00:35<03:29, 880.92 examples/s]Map:  16%|█▌        | 34097/217273 [00:37<03:37, 842.22 examples/s]Map:  16%|█▌        | 34152/217273 [00:38<03:42, 821.37 examples/s]Map:  15%|█▍        | 32387/217273 [00:35<03:22, 912.75 examples/s]Map:  16%|█▌        | 34196/217273 [00:37<03:29, 872.80 examples/s]Map:  16%|█▌        | 34250/217273 [00:38<03:33, 859.05 examples/s]Map:  15%|█▌        | 33101/217273 [00:36<03:45, 816.40 examples/s]Map:  15%|█▍        | 32485/217273 [00:36<03:18, 928.61 examples/s]Map:  16%|█▌        | 34294/217273 [00:38<03:24, 895.45 examples/s]Map:  16%|█▌        | 34352/217273 [00:38<03:23, 898.70 examples/s]Map:  15%|█▌        | 33199/217273 [00:36<03:36, 851.48 examples/s]Map:  15%|█▍        | 32583/217273 [00:36<03:16, 939.82 examples/s]Map:  16%|█▌        | 34394/217273 [00:38<03:19, 918.06 examples/s]Map:  16%|█▌        | 34451/217273 [00:38<03:18, 919.15 examples/s]Map:  15%|█▌        | 33300/217273 [00:36<03:27, 887.37 examples/s]Map:  15%|█▌        | 32681/217273 [00:36<03:14, 948.86 examples/s]Map:  16%|█▌        | 34497/217273 [00:38<03:14, 942.00 examples/s]Map:  16%|█▌        | 34552/217273 [00:38<03:14, 940.56 examples/s]Map:  15%|█▌        | 33405/217273 [00:36<03:18, 925.32 examples/s]Map:  15%|█▌        | 32780/217273 [00:36<03:12, 957.65 examples/s]Map:  16%|█▌        | 34599/217273 [00:38<03:10, 957.91 examples/s]Map:  16%|█▌        | 34650/217273 [00:38<03:13, 945.48 examples/s]Map:  15%|█▌        | 33509/217273 [00:36<03:12, 954.09 examples/s]Map:  15%|█▌        | 32882/217273 [00:36<03:09, 971.02 examples/s]Map:  16%|█▌        | 34700/217273 [00:38<03:07, 971.75 examples/s]Map:  16%|█▌        | 34752/217273 [00:38<03:09, 963.43 examples/s]Map:  15%|█▌        | 33608/217273 [00:36<03:11, 961.59 examples/s]Map:  15%|█▌        | 32981/217273 [00:36<03:09, 973.39 examples/s]Map:  16%|█▌        | 34801/217273 [00:38<03:05, 981.07 examples/s]Map:  16%|█▌        | 34857/217273 [00:38<03:04, 986.29 examples/s]Map:  16%|█▌        | 33711/217273 [00:36<03:07, 980.18 examples/s]Map:  16%|█▌        | 34949/217273 [00:38<03:06, 977.89 examples/s]Map:  15%|█▌        | 33097/217273 [00:36<03:50, 799.63 examples/s]Map:  16%|█▌        | 33859/217273 [00:36<03:07, 978.72 examples/s]Map:  16%|█▌        | 35000/217273 [00:39<03:37, 837.60 examples/s]Map:  15%|█▌        | 33188/217273 [00:36<03:43, 824.82 examples/s]Map:  16%|█▌        | 33960/217273 [00:37<03:06, 983.73 examples/s]Map:  15%|█▌        | 33278/217273 [00:36<03:38, 841.64 examples/s]Map:  16%|█▌        | 35080/217273 [00:38<03:45, 808.33 examples/s]Map:  16%|█▌        | 35132/217273 [00:39<03:34, 847.73 examples/s]Map:  15%|█▌        | 33381/217273 [00:37<03:26, 891.04 examples/s]Map:  16%|█▌        | 35178/217273 [00:39<03:35, 844.07 examples/s]Map:  16%|█▌        | 35226/217273 [00:39<03:29, 868.96 examples/s]Map:  16%|█▌        | 34102/217273 [00:37<03:42, 824.43 examples/s]Map:  15%|█▌        | 33480/217273 [00:37<03:21, 914.27 examples/s]Map:  16%|█▌        | 35275/217273 [00:39<03:28, 873.27 examples/s]Map:  16%|█▋        | 35323/217273 [00:39<03:24, 890.42 examples/s]Map:  16%|█▌        | 34204/217273 [00:37<03:31, 865.29 examples/s]Map:  15%|█▌        | 33580/217273 [00:37<03:16, 932.93 examples/s]Map:  16%|█▋        | 35375/217273 [00:39<03:22, 899.22 examples/s]Map:  16%|█▋        | 35417/217273 [00:39<03:22, 899.08 examples/s]Map:  16%|█▌        | 34300/217273 [00:37<03:26, 886.59 examples/s]Map:  16%|█▌        | 33681/217273 [00:37<03:12, 954.12 examples/s]Map:  16%|█▋        | 35478/217273 [00:39<03:15, 931.91 examples/s]Map:  16%|█▋        | 35512/217273 [00:39<03:19, 910.87 examples/s]Map:  16%|█▌        | 34403/217273 [00:37<03:19, 918.89 examples/s]Map:  16%|█▌        | 33781/217273 [00:37<03:10, 964.65 examples/s]Map:  16%|█▋        | 35576/217273 [00:39<03:12, 942.34 examples/s]Map:  16%|█▋        | 35610/217273 [00:39<03:16, 926.06 examples/s]Map:  16%|█▌        | 34508/217273 [00:37<03:12, 950.51 examples/s]Map:  16%|█▌        | 33881/217273 [00:37<03:08, 972.18 examples/s]Map:  16%|█▋        | 35704/217273 [00:39<03:16, 925.82 examples/s]Map:  16%|█▌        | 34609/217273 [00:37<03:09, 966.16 examples/s]Map:  16%|█▋        | 35719/217273 [00:39<03:12, 944.68 examples/s]Map:  16%|█▌        | 33981/217273 [00:37<03:07, 977.69 examples/s]Map:  16%|█▋        | 35798/217273 [00:39<03:15, 927.30 examples/s]Map:  16%|█▋        | 35818/217273 [00:39<03:10, 953.34 examples/s]Map:  16%|█▌        | 34723/217273 [00:37<03:26, 884.53 examples/s]Map:  17%|█▋        | 35920/217273 [00:39<03:07, 968.21 examples/s]Map:  17%|█▋        | 35936/217273 [00:40<03:16, 920.68 examples/s]Map:  16%|█▌        | 34104/217273 [00:37<03:42, 824.73 examples/s]Map:  16%|█▌        | 34820/217273 [00:38<03:21, 905.35 examples/s]Map:  16%|█▌        | 34207/217273 [00:37<03:29, 873.96 examples/s]Map:  16%|█▌        | 34916/217273 [00:38<03:18, 918.35 examples/s]Map:  17%|█▋        | 36048/217273 [00:39<03:43, 811.96 examples/s]Map:  17%|█▋        | 36048/217273 [00:40<03:49, 789.55 examples/s]Map:  16%|█▌        | 34306/217273 [00:38<03:23, 897.50 examples/s]Map:  17%|█▋        | 36147/217273 [00:40<03:32, 850.48 examples/s]Map:  17%|█▋        | 36142/217273 [00:40<03:40, 823.10 examples/s]Map:  16%|█▌        | 35046/217273 [00:38<03:55, 773.47 examples/s]Map:  16%|█▌        | 34446/217273 [00:38<03:21, 906.58 examples/s]Map:  17%|█▋        | 36244/217273 [00:40<03:28, 870.11 examples/s]Map:  16%|█▌        | 35151/217273 [00:38<03:37, 836.13 examples/s]Map:  17%|█▋        | 36290/217273 [00:40<03:25, 882.23 examples/s]Map:  16%|█▌        | 34549/217273 [00:38<03:15, 935.38 examples/s]Map:  17%|█▋        | 36344/217273 [00:40<03:20, 901.67 examples/s]Map:  16%|█▌        | 35252/217273 [00:38<03:28, 874.71 examples/s]Map:  17%|█▋        | 36389/217273 [00:40<03:19, 907.11 examples/s]Map:  16%|█▌        | 34652/217273 [00:38<03:10, 957.11 examples/s]Map:  17%|█▋        | 36440/217273 [00:40<03:17, 916.48 examples/s]Map:  16%|█▋        | 35354/217273 [00:38<03:20, 909.45 examples/s]Map:  17%|█▋        | 36493/217273 [00:40<03:12, 938.25 examples/s]Map:  16%|█▌        | 34754/217273 [00:38<03:07, 971.16 examples/s]Map:  17%|█▋        | 36541/217273 [00:40<03:12, 940.81 examples/s]Map:  16%|█▋        | 35449/217273 [00:38<03:18, 917.14 examples/s]Map:  17%|█▋        | 36596/217273 [00:40<03:08, 959.10 examples/s]Map:  17%|█▋        | 36637/217273 [00:40<03:11, 944.77 examples/s]Map:  16%|█▌        | 34901/217273 [00:38<03:07, 971.71 examples/s]Map:  16%|█▋        | 35544/217273 [00:38<03:16, 924.11 examples/s]Map:  17%|█▋        | 36698/217273 [00:40<03:05, 973.18 examples/s]Map:  17%|█▋        | 36739/217273 [00:40<03:07, 961.84 examples/s]Map:  16%|█▋        | 35639/217273 [00:38<03:15, 929.77 examples/s]Map:  16%|█▌        | 35000/217273 [00:38<03:40, 825.75 examples/s]Map:  17%|█▋        | 36843/217273 [00:40<03:07, 964.39 examples/s]Map:  17%|█▋        | 36841/217273 [00:41<03:04, 975.32 examples/s]Map:  16%|█▋        | 35737/217273 [00:39<03:12, 941.53 examples/s]Map:  16%|█▌        | 35103/217273 [00:38<03:28, 873.50 examples/s]Map:  16%|█▋        | 35836/217273 [00:39<03:10, 953.71 examples/s]Map:  17%|█▋        | 36989/217273 [00:40<03:06, 965.37 examples/s]Map:  17%|█▋        | 36977/217273 [00:41<03:10, 946.78 examples/s]Map:  16%|█▌        | 35204/217273 [00:39<03:20, 907.39 examples/s]Map:  17%|█▋        | 35934/217273 [00:39<03:09, 958.30 examples/s]Map:  16%|█▋        | 35307/217273 [00:39<03:14, 935.17 examples/s]Map:  17%|█▋        | 37095/217273 [00:41<03:38, 825.27 examples/s]Map:  17%|█▋        | 37095/217273 [00:41<03:43, 807.30 examples/s]Map:  16%|█▋        | 35415/217273 [00:39<03:07, 970.95 examples/s]Map:  17%|█▋        | 36052/217273 [00:39<03:44, 806.87 examples/s]Map:  17%|█▋        | 37185/217273 [00:41<03:34, 838.40 examples/s]Map:  17%|█▋        | 37192/217273 [00:41<03:33, 843.89 examples/s]Map:  16%|█▋        | 35516/217273 [00:39<03:05, 979.60 examples/s]Map:  17%|█▋        | 36148/217273 [00:39<03:35, 841.18 examples/s]Map:  17%|█▋        | 37290/217273 [00:41<03:25, 877.31 examples/s]Map:  17%|█▋        | 37295/217273 [00:41<03:45, 798.98 examples/s]Map:  16%|█▋        | 35660/217273 [00:39<03:07, 967.39 examples/s]Map:  17%|█▋        | 36284/217273 [00:39<03:30, 861.28 examples/s]Map:  17%|█▋        | 37383/217273 [00:41<03:40, 815.75 examples/s]Map:  17%|█▋        | 37430/217273 [00:41<03:21, 892.39 examples/s]Map:  16%|█▋        | 35762/217273 [00:39<03:05, 978.05 examples/s]Map:  17%|█▋        | 36380/217273 [00:39<03:24, 883.69 examples/s]Map:  17%|█▋        | 37485/217273 [00:41<03:28, 862.10 examples/s]Map:  17%|█▋        | 37539/217273 [00:41<03:11, 939.36 examples/s]Map:  17%|█▋        | 35869/217273 [00:39<03:01, 999.75 examples/s]Map:  17%|█▋        | 36476/217273 [00:39<03:20, 901.00 examples/s]Map:  17%|█▋        | 37583/217273 [00:41<03:22, 888.32 examples/s]Map:  17%|█▋        | 37685/217273 [00:42<03:09, 949.77 examples/s]Map:  17%|█▋        | 35972/217273 [00:39<03:00, 1004.65 examples/s]Map:  17%|█▋        | 36579/217273 [00:39<03:13, 933.60 examples/s]Map:  17%|█▋        | 37686/217273 [00:41<03:14, 924.97 examples/s]Map:  17%|█▋        | 37783/217273 [00:42<03:08, 954.67 examples/s]Map:  17%|█▋        | 36683/217273 [00:40<03:07, 961.21 examples/s]Map:  17%|█▋        | 37782/217273 [00:41<03:12, 931.75 examples/s]Map:  17%|█▋        | 36100/217273 [00:40<03:33, 849.12 examples/s] Map:  17%|█▋        | 37883/217273 [00:42<03:06, 963.48 examples/s]Map:  17%|█▋        | 36781/217273 [00:40<03:07, 962.88 examples/s]Map:  17%|█▋        | 37879/217273 [00:41<03:11, 936.58 examples/s]Map:  17%|█▋        | 36203/217273 [00:40<03:23, 890.43 examples/s]Map:  17%|█▋        | 37981/217273 [00:42<03:06, 962.69 examples/s]Map:  17%|█▋        | 36882/217273 [00:40<03:05, 971.81 examples/s]Map:  17%|█▋        | 37977/217273 [00:42<03:09, 944.62 examples/s]Map:  17%|█▋        | 36309/217273 [00:40<03:14, 930.05 examples/s]Map:  17%|█▋        | 36980/217273 [00:40<03:05, 971.80 examples/s]Map:  18%|█▊        | 38097/217273 [00:42<03:39, 815.06 examples/s]Map:  18%|█▊        | 38099/217273 [00:42<03:41, 809.46 examples/s]Map:  17%|█▋        | 36452/217273 [00:40<03:13, 936.16 examples/s]Map:  18%|█▊        | 38201/217273 [00:42<03:27, 864.40 examples/s]Map:  17%|█▋        | 37099/217273 [00:40<03:42, 810.77 examples/s]Map:  18%|█▊        | 38193/217273 [00:42<03:32, 841.38 examples/s]Map:  17%|█▋        | 36557/217273 [00:40<03:07, 961.61 examples/s]Map:  18%|█▊        | 38303/217273 [00:42<03:18, 902.88 examples/s]Map:  17%|█▋        | 37201/217273 [00:40<03:29, 861.32 examples/s]Map:  18%|█▊        | 38285/217273 [00:42<03:27, 861.15 examples/s]Map:  17%|█▋        | 36661/217273 [00:40<03:04, 981.36 examples/s]Map:  18%|█▊        | 38407/217273 [00:42<03:11, 934.95 examples/s]Map:  18%|█▊        | 38380/217273 [00:42<03:22, 882.67 examples/s]Map:  17%|█▋        | 37301/217273 [00:40<03:21, 893.18 examples/s]Map:  17%|█▋        | 36764/217273 [00:40<03:02, 989.64 examples/s]Map:  18%|█▊        | 38542/217273 [00:42<03:15, 916.56 examples/s]Map:  17%|█▋        | 37436/217273 [00:40<03:21, 892.67 examples/s]Map:  18%|█▊        | 38520/217273 [00:42<03:19, 896.23 examples/s]Map:  17%|█▋        | 36902/217273 [00:40<03:10, 947.89 examples/s]Map:  18%|█▊        | 38640/217273 [00:43<03:11, 932.42 examples/s]Map:  17%|█▋        | 37535/217273 [00:41<03:16, 915.77 examples/s]Map:  18%|█▊        | 38650/217273 [00:42<03:22, 883.42 examples/s]Map:  17%|█▋        | 37000/217273 [00:41<03:41, 815.09 examples/s]Map:  17%|█▋        | 37637/217273 [00:41<03:10, 941.41 examples/s]Map:  18%|█▊        | 38782/217273 [00:43<03:10, 936.01 examples/s]Map:  18%|█▊        | 38750/217273 [00:42<03:16, 908.47 examples/s]Map:  17%|█▋        | 37099/217273 [00:41<03:30, 855.65 examples/s]Map:  17%|█▋        | 37742/217273 [00:41<03:05, 969.04 examples/s]Map:  18%|█▊        | 38883/217273 [00:43<03:07, 952.03 examples/s]Map:  17%|█▋        | 37201/217273 [00:41<03:21, 893.53 examples/s]Map:  17%|█▋        | 37846/217273 [00:41<03:01, 987.75 examples/s]Map:  18%|█▊        | 38889/217273 [00:43<03:16, 907.51 examples/s]Map:  18%|█▊        | 38984/217273 [00:43<03:04, 965.26 examples/s]Map:  17%|█▋        | 37300/217273 [00:41<03:16, 916.10 examples/s]Map:  17%|█▋        | 37948/217273 [00:41<03:00, 993.85 examples/s]Map:  18%|█▊        | 38987/217273 [00:43<03:13, 922.87 examples/s]Map:  17%|█▋        | 37400/217273 [00:41<03:12, 934.11 examples/s]Map:  18%|█▊        | 39099/217273 [00:43<03:36, 821.82 examples/s]Map:  18%|█▊        | 39094/217273 [00:43<03:46, 788.25 examples/s]Map:  17%|█▋        | 37499/217273 [00:41<03:10, 945.69 examples/s]Map:  18%|█▊        | 39194/217273 [00:43<03:29, 851.46 examples/s]Map:  18%|█▊        | 38097/217273 [00:41<03:34, 834.65 examples/s]Map:  18%|█▊        | 39193/217273 [00:43<03:33, 832.77 examples/s]Map:  17%|█▋        | 37607/217273 [00:41<03:03, 981.65 examples/s]Map:  18%|█▊        | 39296/217273 [00:43<03:19, 893.27 examples/s]Map:  18%|█▊        | 38201/217273 [00:41<03:23, 879.43 examples/s]Map:  18%|█▊        | 39290/217273 [00:43<03:25, 864.44 examples/s]Map:  18%|█▊        | 39397/217273 [00:43<03:12, 922.31 examples/s]Map:  18%|█▊        | 38295/217273 [00:41<03:20, 892.26 examples/s]Map:  17%|█▋        | 37752/217273 [00:41<03:05, 969.83 examples/s]Map:  18%|█▊        | 39396/217273 [00:43<03:14, 913.00 examples/s]Map:  18%|█▊        | 39494/217273 [00:44<03:10, 933.89 examples/s]Map:  17%|█▋        | 37851/217273 [00:41<03:04, 971.75 examples/s]Map:  18%|█▊        | 38439/217273 [00:42<03:15, 915.13 examples/s]Map:  18%|█▊        | 39500/217273 [00:43<03:07, 946.56 examples/s]Map:  18%|█▊        | 39591/217273 [00:44<03:09, 939.03 examples/s]Map:  17%|█▋        | 37954/217273 [00:41<03:01, 986.94 examples/s]Map:  18%|█▊        | 38534/217273 [00:42<03:14, 921.29 examples/s]Map:  18%|█▊        | 39603/217273 [00:43<03:03, 967.45 examples/s]Map:  18%|█▊        | 39736/217273 [00:44<03:07, 945.74 examples/s]Map:  18%|█▊        | 38629/217273 [00:42<03:12, 927.03 examples/s]Map:  18%|█▊        | 39703/217273 [00:44<03:02, 974.66 examples/s]Map:  18%|█▊        | 38088/217273 [00:42<03:44, 799.43 examples/s]Map:  18%|█▊        | 39869/217273 [00:44<03:12, 920.61 examples/s]Map:  18%|█▊        | 38763/217273 [00:42<03:15, 912.05 examples/s]Map:  18%|█▊        | 39843/217273 [00:44<03:06, 952.97 examples/s]Map:  18%|█▊        | 38180/217273 [00:42<03:37, 825.15 examples/s]Map:  18%|█▊        | 38858/217273 [00:42<03:13, 921.14 examples/s]Map:  18%|█▊        | 38285/217273 [00:42<03:23, 879.25 examples/s]Map:  18%|█▊        | 39983/217273 [00:44<03:08, 941.30 examples/s]Map:  18%|█▊        | 40000/217273 [00:44<03:44, 790.25 examples/s]Map:  18%|█▊        | 38953/217273 [00:42<03:12, 927.23 examples/s]Map:  18%|█▊        | 38381/217273 [00:42<03:18, 899.04 examples/s]Map:  18%|█▊        | 40096/217273 [00:44<03:34, 825.18 examples/s]Map:  18%|█▊        | 38484/217273 [00:42<03:11, 933.00 examples/s]Map:  18%|█▊        | 40098/217273 [00:44<03:37, 816.44 examples/s]Map:  18%|█▊        | 39048/217273 [00:42<03:48, 779.18 examples/s]Map:  19%|█▊        | 40196/217273 [00:44<03:24, 865.85 examples/s]Map:  19%|█▊        | 40203/217273 [00:44<03:24, 866.31 examples/s]Map:  18%|█▊        | 39145/217273 [00:42<03:36, 823.82 examples/s]Map:  19%|█▊        | 40292/217273 [00:44<03:19, 888.25 examples/s]Map:  18%|█▊        | 38626/217273 [00:42<03:11, 934.82 examples/s]Map:  19%|█▊        | 40301/217273 [00:44<03:18, 891.63 examples/s]Map:  18%|█▊        | 39238/217273 [00:42<03:29, 849.39 examples/s]Map:  19%|█▊        | 40390/217273 [00:45<03:14, 908.37 examples/s]Map:  18%|█▊        | 38724/217273 [00:42<03:09, 944.38 examples/s]Map:  19%|█▊        | 40401/217273 [00:44<03:12, 917.71 examples/s]Map:  18%|█▊        | 39342/217273 [00:43<03:17, 899.21 examples/s]Map:  19%|█▊        | 40489/217273 [00:45<03:10, 927.71 examples/s]Map:  18%|█▊        | 38855/217273 [00:43<03:15, 912.27 examples/s]Map:  19%|█▊        | 40501/217273 [00:44<03:08, 937.99 examples/s]Map:  18%|█▊        | 39444/217273 [00:43<03:10, 931.56 examples/s]Map:  19%|█▊        | 40591/217273 [00:45<03:05, 951.13 examples/s]Map:  18%|█▊        | 38956/217273 [00:43<03:11, 931.20 examples/s]Map:  19%|█▊        | 40605/217273 [00:45<03:03, 961.62 examples/s]Map:  18%|█▊        | 39544/217273 [00:43<03:07, 949.78 examples/s]Map:  19%|█▊        | 40690/217273 [00:45<03:04, 957.79 examples/s]Map:  19%|█▊        | 40706/217273 [00:45<03:01, 972.42 examples/s]Map:  18%|█▊        | 39647/217273 [00:43<03:02, 971.43 examples/s]Map:  19%|█▉        | 40789/217273 [00:45<03:04, 957.91 examples/s]Map:  19%|█▉        | 40807/217273 [00:45<03:00, 979.75 examples/s]Map:  18%|█▊        | 39101/217273 [00:43<03:40, 807.58 examples/s]Map:  18%|█▊        | 39752/217273 [00:43<02:59, 990.21 examples/s]Map:  19%|█▉        | 40890/217273 [00:45<03:01, 969.80 examples/s]Map:  19%|█▉        | 40909/217273 [00:45<02:58, 986.33 examples/s]Map:  18%|█▊        | 39203/217273 [00:43<03:28, 853.36 examples/s]Map:  18%|█▊        | 39854/217273 [00:43<02:58, 993.12 examples/s]Map:  19%|█▉        | 41000/217273 [00:45<03:45, 782.26 examples/s]Map:  18%|█▊        | 39340/217273 [00:43<03:24, 869.48 examples/s]Map:  18%|█▊        | 39977/217273 [00:43<03:11, 924.09 examples/s]Map:  19%|█▉        | 41047/217273 [00:45<03:35, 816.32 examples/s]Map:  19%|█▉        | 41095/217273 [00:45<03:34, 820.05 examples/s]Map:  18%|█▊        | 39442/217273 [00:43<03:17, 902.33 examples/s]Map:  19%|█▉        | 41150/217273 [00:45<03:23, 864.56 examples/s]Map:  19%|█▉        | 41195/217273 [00:45<03:23, 863.77 examples/s]Map:  18%|█▊        | 40099/217273 [00:43<03:43, 794.38 examples/s]Map:  18%|█▊        | 39538/217273 [00:43<03:14, 914.97 examples/s]Map:  19%|█▉        | 41251/217273 [00:45<03:16, 897.76 examples/s]Map:  19%|█▉        | 41288/217273 [00:46<03:19, 880.18 examples/s]Map:  19%|█▊        | 40197/217273 [00:44<03:31, 836.01 examples/s]Map:  18%|█▊        | 39633/217273 [00:43<03:13, 920.23 examples/s]Map:  19%|█▉        | 41353/217273 [00:45<03:09, 928.38 examples/s]Map:  19%|█▉        | 41387/217273 [00:46<03:13, 907.27 examples/s]Map:  19%|█▊        | 40297/217273 [00:44<03:22, 875.65 examples/s]Map:  18%|█▊        | 39736/217273 [00:43<03:07, 946.26 examples/s]Map:  19%|█▉        | 41454/217273 [00:45<03:05, 949.81 examples/s]Map:  19%|█▉        | 41489/217273 [00:46<03:07, 936.94 examples/s]Map:  19%|█▊        | 40404/217273 [00:44<03:11, 923.36 examples/s]Map:  18%|█▊        | 39838/217273 [00:44<03:04, 964.25 examples/s]Map:  19%|█▉        | 41554/217273 [00:46<03:02, 960.76 examples/s]Map:  19%|█▊        | 40509/217273 [00:44<03:04, 956.62 examples/s]Map:  19%|█▉        | 41633/217273 [00:46<03:06, 942.78 examples/s]Map:  18%|█▊        | 39984/217273 [00:44<03:05, 957.57 examples/s]Map:  19%|█▊        | 40616/217273 [00:44<02:59, 985.60 examples/s]Map:  19%|█▉        | 41678/217273 [00:46<03:14, 901.17 examples/s]Map:  19%|█▉        | 41736/217273 [00:46<03:02, 962.61 examples/s]Map:  19%|█▊        | 40718/217273 [00:44<02:58, 990.81 examples/s]Map:  18%|█▊        | 40094/217273 [00:44<03:38, 809.72 examples/s]Map:  19%|█▉        | 41782/217273 [00:46<03:32, 825.65 examples/s]Map:  19%|█▉        | 41840/217273 [00:46<03:28, 843.19 examples/s]Map:  19%|█▉        | 40819/217273 [00:44<02:57, 994.37 examples/s]Map:  18%|█▊        | 40192/217273 [00:44<03:29, 846.17 examples/s]Map:  19%|█▉        | 41884/217273 [00:46<03:20, 872.90 examples/s]Map:  19%|█▉        | 41971/217273 [00:46<03:26, 850.54 examples/s]Map:  19%|█▊        | 40286/217273 [00:44<03:24, 867.10 examples/s]Map:  19%|█▉        | 40970/217273 [00:44<02:57, 992.04 examples/s]Map:  19%|█▉        | 41980/217273 [00:46<03:16, 892.88 examples/s]Map:  19%|█▊        | 40386/217273 [00:44<03:16, 899.90 examples/s]Map:  19%|█▉        | 42098/217273 [00:47<03:48, 766.58 examples/s]Map:  19%|█▊        | 40486/217273 [00:44<03:11, 922.42 examples/s]Map:  19%|█▉        | 42097/217273 [00:46<03:44, 780.92 examples/s]Map:  19%|█▉        | 41093/217273 [00:44<03:33, 823.97 examples/s]Map:  19%|█▉        | 42183/217273 [00:47<03:43, 782.69 examples/s]Map:  19%|█▉        | 42195/217273 [00:46<03:32, 824.20 examples/s]Map:  19%|█▉        | 41181/217273 [00:45<03:30, 836.12 examples/s]Map:  19%|█▊        | 40625/217273 [00:44<03:12, 918.13 examples/s]Map:  19%|█▉        | 42280/217273 [00:47<03:32, 825.01 examples/s]Map:  19%|█▉        | 42295/217273 [00:46<03:21, 866.64 examples/s]Map:  19%|█▉        | 41282/217273 [00:45<03:20, 876.48 examples/s]Map:  19%|█▊        | 40726/217273 [00:45<03:07, 940.58 examples/s]Map:  20%|█▉        | 42374/217273 [00:47<03:25, 851.32 examples/s]Map:  20%|█▉        | 42388/217273 [00:47<03:18, 880.79 examples/s]Map:  19%|█▉        | 41383/217273 [00:45<03:13, 908.23 examples/s]Map:  19%|█▉        | 40823/217273 [00:45<03:06, 946.64 examples/s]Map:  20%|█▉        | 42472/217273 [00:47<03:17, 883.83 examples/s]Map:  20%|█▉        | 42488/217273 [00:47<03:11, 910.73 examples/s]Map:  19%|█▉        | 41492/217273 [00:45<03:03, 955.74 examples/s]Map:  19%|█▉        | 40928/217273 [00:45<03:01, 972.44 examples/s]Map:  20%|█▉        | 42571/217273 [00:47<03:12, 909.71 examples/s]Map:  20%|█▉        | 42591/217273 [00:47<03:05, 941.59 examples/s]Map:  19%|█▉        | 41602/217273 [00:45<02:57, 990.27 examples/s]Map:  20%|█▉        | 42665/217273 [00:47<03:11, 913.86 examples/s]Map:  20%|█▉        | 42694/217273 [00:47<03:00, 965.37 examples/s]Map:  19%|█▉        | 41704/217273 [00:45<02:56, 995.57 examples/s]Map:  19%|█▉        | 41053/217273 [00:45<03:34, 823.06 examples/s]Map:  20%|█▉        | 42760/217273 [00:47<03:09, 919.20 examples/s]Map:  19%|█▉        | 41808/217273 [00:45<02:54, 1006.99 examples/s]Map:  19%|█▉        | 41151/217273 [00:45<03:24, 859.68 examples/s]Map:  20%|█▉        | 42836/217273 [00:47<03:02, 956.58 examples/s]Map:  20%|█▉        | 42856/217273 [00:47<03:07, 928.67 examples/s]Map:  19%|█▉        | 41912/217273 [00:45<02:53, 1013.44 examples/s]Map:  19%|█▉        | 41254/217273 [00:45<03:15, 900.64 examples/s]Map:  20%|█▉        | 42933/217273 [00:47<03:01, 958.46 examples/s]Map:  20%|█▉        | 42958/217273 [00:47<03:03, 947.45 examples/s]Map:  19%|█▉        | 41356/217273 [00:45<03:08, 930.79 examples/s]Map:  19%|█▉        | 42051/217273 [00:45<03:24, 858.89 examples/s] Map:  20%|█▉        | 43048/217273 [00:47<03:32, 820.05 examples/s]Map:  19%|█▉        | 41507/217273 [00:45<03:03, 956.64 examples/s]Map:  20%|█▉        | 43095/217273 [00:48<03:37, 800.08 examples/s]Map:  19%|█▉        | 42151/217273 [00:46<03:16, 890.19 examples/s]Map:  20%|█▉        | 43143/217273 [00:47<03:24, 849.73 examples/s]Map:  20%|█▉        | 43198/217273 [00:48<03:24, 851.96 examples/s]Map:  19%|█▉        | 42253/217273 [00:46<03:10, 920.28 examples/s]Map:  20%|█▉        | 43242/217273 [00:48<03:17, 882.32 examples/s]Map:  19%|█▉        | 41654/217273 [00:46<03:02, 962.97 examples/s]Map:  20%|█▉        | 43297/217273 [00:48<03:16, 885.17 examples/s]Map:  19%|█▉        | 42350/217273 [00:46<03:07, 932.18 examples/s]Map:  20%|█▉        | 43339/217273 [00:48<03:12, 903.38 examples/s]Map:  19%|█▉        | 41756/217273 [00:46<03:00, 974.66 examples/s]Map:  20%|█▉        | 43398/217273 [00:48<03:09, 915.67 examples/s]Map:  20%|█▉        | 42448/217273 [00:46<03:05, 942.16 examples/s]Map:  20%|█▉        | 43436/217273 [00:48<03:09, 917.98 examples/s]Map:  19%|█▉        | 41902/217273 [00:46<03:00, 969.16 examples/s]Map:  20%|██        | 43503/217273 [00:48<03:02, 950.06 examples/s]Map:  20%|█▉        | 42549/217273 [00:46<03:02, 958.80 examples/s]Map:  20%|██        | 43538/217273 [00:48<03:04, 942.42 examples/s]Map:  20%|██        | 43601/217273 [00:48<03:01, 956.03 examples/s]Map:  20%|█▉        | 42650/217273 [00:46<03:00, 969.32 examples/s]Map:  20%|██        | 43642/217273 [00:48<02:59, 969.89 examples/s]Map:  19%|█▉        | 42000/217273 [00:46<03:34, 817.13 examples/s]Map:  20%|██        | 43701/217273 [00:48<02:59, 966.12 examples/s]Map:  20%|█▉        | 42749/217273 [00:46<02:59, 973.17 examples/s]Map:  19%|█▉        | 42101/217273 [00:46<03:23, 860.14 examples/s]Map:  20%|██        | 43788/217273 [00:48<02:59, 965.26 examples/s]Map:  20%|██        | 43801/217273 [00:48<02:58, 973.36 examples/s]Map:  20%|█▉        | 42853/217273 [00:46<02:55, 992.41 examples/s]Map:  19%|█▉        | 42200/217273 [00:46<03:16, 888.77 examples/s]Map:  20%|██        | 43890/217273 [00:48<02:57, 975.75 examples/s]Map:  20%|█▉        | 42956/217273 [00:46<02:54, 1001.33 examples/s]Map:  20%|██        | 43943/217273 [00:48<03:00, 961.24 examples/s]Map:  19%|█▉        | 42301/217273 [00:46<03:10, 917.73 examples/s]Map:  20%|██        | 43995/217273 [00:48<02:55, 990.12 examples/s]Map:  20%|█▉        | 42397/217273 [00:46<03:08, 927.67 examples/s]Map:  20%|██        | 44042/217273 [00:49<03:36, 800.29 examples/s]Map:  20%|█▉        | 43101/217273 [00:47<03:27, 837.57 examples/s] Map:  20%|██        | 44104/217273 [00:48<03:26, 837.05 examples/s]Map:  20%|█▉        | 42498/217273 [00:47<03:04, 947.49 examples/s]Map:  20%|██        | 44140/217273 [00:49<03:26, 836.81 examples/s]Map:  20%|█▉        | 43203/217273 [00:47<03:18, 878.48 examples/s]Map:  20%|██        | 44204/217273 [00:49<03:18, 874.05 examples/s]Map:  20%|█▉        | 42597/217273 [00:47<03:02, 956.03 examples/s]Map:  20%|██        | 44236/217273 [00:49<03:19, 867.10 examples/s]Map:  20%|█▉        | 43303/217273 [00:47<03:12, 905.01 examples/s]Map:  20%|██        | 44302/217273 [00:49<03:11, 901.01 examples/s]Map:  20%|█▉        | 42696/217273 [00:47<03:01, 962.38 examples/s]Map:  20%|██        | 44332/217273 [00:49<03:14, 889.76 examples/s]Map:  20%|█▉        | 43410/217273 [00:47<03:04, 944.89 examples/s]Map:  20%|██        | 44403/217273 [00:49<03:06, 927.94 examples/s]Map:  20%|█▉        | 42842/217273 [00:47<03:00, 963.84 examples/s]Map:  20%|██        | 43509/217273 [00:47<03:02, 953.84 examples/s]Map:  20%|██        | 44499/217273 [00:49<03:05, 933.46 examples/s]Map:  20%|██        | 44463/217273 [00:49<03:16, 881.57 examples/s]Map:  21%|██        | 44598/217273 [00:49<03:02, 946.74 examples/s]Map:  20%|█▉        | 42986/217273 [00:47<03:01, 960.69 examples/s]Map:  21%|██        | 44556/217273 [00:49<03:13, 891.45 examples/s]Map:  20%|██        | 43654/217273 [00:47<03:01, 954.72 examples/s]Map:  21%|██        | 44697/217273 [00:49<03:00, 953.49 examples/s]Map:  21%|██        | 44651/217273 [00:49<03:10, 904.10 examples/s]Map:  20%|██        | 43754/217273 [00:47<03:00, 962.42 examples/s]Map:  20%|█▉        | 43103/217273 [00:47<03:28, 835.35 examples/s]Map:  21%|██        | 44797/217273 [00:49<02:58, 964.49 examples/s]Map:  21%|██        | 44746/217273 [00:49<03:08, 912.85 examples/s]Map:  20%|██        | 43855/217273 [00:47<02:58, 970.89 examples/s]Map:  20%|█▉        | 43203/217273 [00:47<03:19, 871.08 examples/s]Map:  21%|██        | 44895/217273 [00:49<02:58, 965.69 examples/s]Map:  21%|██        | 44846/217273 [00:50<03:04, 933.90 examples/s]Map:  20%|██        | 43961/217273 [00:47<02:54, 993.34 examples/s]Map:  20%|█▉        | 43305/217273 [00:47<03:12, 905.75 examples/s]Map:  21%|██        | 44985/217273 [00:50<03:05, 928.25 examples/s]Map:  21%|██        | 45000/217273 [00:49<03:34, 802.38 examples/s]Map:  20%|█▉        | 43407/217273 [00:48<03:07, 929.63 examples/s]Map:  20%|██        | 44102/217273 [00:48<03:23, 849.20 examples/s]Map:  21%|██        | 45090/217273 [00:50<03:28, 825.51 examples/s]Map:  20%|██        | 43505/217273 [00:48<03:04, 941.63 examples/s]Map:  20%|██        | 44199/217273 [00:48<03:17, 876.72 examples/s]Map:  21%|██        | 45096/217273 [00:50<03:36, 793.58 examples/s]Map:  21%|██        | 45190/217273 [00:50<03:18, 867.77 examples/s]Map:  20%|██        | 43609/217273 [00:48<03:00, 963.39 examples/s]Map:  20%|██        | 44301/217273 [00:48<03:09, 912.32 examples/s]Map:  21%|██        | 45194/217273 [00:50<03:25, 835.93 examples/s]Map:  21%|██        | 45285/217273 [00:50<03:14, 886.51 examples/s]Map:  20%|██        | 43714/217273 [00:48<02:56, 984.24 examples/s]Map:  20%|██        | 44400/217273 [00:48<03:06, 925.73 examples/s]Map:  21%|██        | 45290/217273 [00:50<03:18, 865.59 examples/s]Map:  21%|██        | 45388/217273 [00:50<03:06, 921.97 examples/s]Map:  20%|██        | 43819/217273 [00:48<02:53, 997.80 examples/s]Map:  20%|██        | 44502/217273 [00:48<03:01, 949.92 examples/s]Map:  21%|██        | 45386/217273 [00:50<03:13, 889.87 examples/s]Map:  21%|██        | 45483/217273 [00:50<03:05, 926.50 examples/s]Map:  21%|██        | 44602/217273 [00:48<02:59, 962.48 examples/s]Map:  20%|██        | 43968/217273 [00:48<02:54, 992.36 examples/s]Map:  21%|██        | 45582/217273 [00:50<03:02, 939.05 examples/s]Map:  21%|██        | 45526/217273 [00:50<03:10, 901.39 examples/s]Map:  21%|██        | 44733/217273 [00:48<03:06, 925.77 examples/s]Map:  21%|██        | 45714/217273 [00:50<03:08, 908.46 examples/s]Map:  20%|██        | 44087/217273 [00:48<03:33, 810.90 examples/s]Map:  21%|██        | 45651/217273 [00:50<03:16, 872.78 examples/s]Map:  21%|██        | 44878/217273 [00:48<03:04, 936.29 examples/s]Map:  21%|██        | 45813/217273 [00:50<03:04, 927.86 examples/s]Map:  20%|██        | 44187/217273 [00:48<03:23, 852.20 examples/s]Map:  21%|██        | 45745/217273 [00:51<03:13, 888.20 examples/s]Map:  21%|██        | 44979/217273 [00:49<03:00, 952.82 examples/s]Map:  21%|██        | 45910/217273 [00:50<03:03, 936.23 examples/s]Map:  20%|██        | 44290/217273 [00:48<03:14, 890.48 examples/s]Map:  21%|██        | 45844/217273 [00:51<03:07, 912.19 examples/s]Map:  20%|██        | 44391/217273 [00:49<03:08, 919.58 examples/s]Map:  21%|██        | 45981/217273 [00:51<03:08, 909.92 examples/s]Map:  21%|██        | 45092/217273 [00:49<03:35, 799.15 examples/s]Map:  21%|██        | 46051/217273 [00:51<03:30, 813.14 examples/s]Map:  20%|██        | 44501/217273 [00:49<02:59, 964.55 examples/s]Map:  21%|██        | 45197/217273 [00:49<03:21, 855.14 examples/s]Map:  21%|██        | 46151/217273 [00:51<03:20, 854.63 examples/s]Map:  21%|██        | 44605/217273 [00:49<02:55, 983.56 examples/s]Map:  21%|██        | 46095/217273 [00:51<03:38, 783.94 examples/s]Map:  21%|██        | 45297/217273 [00:49<03:13, 888.86 examples/s]Map:  21%|██▏       | 46254/217273 [00:51<03:10, 897.15 examples/s]Map:  21%|██        | 44709/217273 [00:49<02:52, 999.14 examples/s]Map:  21%|██▏       | 46189/217273 [00:51<03:29, 815.50 examples/s]Map:  21%|██        | 45400/217273 [00:49<03:06, 923.77 examples/s]Map:  21%|██▏       | 46355/217273 [00:51<03:05, 923.80 examples/s]Map:  21%|██▏       | 46281/217273 [00:51<03:23, 838.40 examples/s]Map:  21%|██        | 44858/217273 [00:49<02:53, 992.53 examples/s]Map:  21%|██        | 45497/217273 [00:49<03:04, 932.77 examples/s]Map:  21%|██▏       | 46368/217273 [00:51<03:23, 841.85 examples/s]Map:  21%|██▏       | 46499/217273 [00:51<03:03, 930.66 examples/s]Map:  21%|██        | 45601/217273 [00:49<02:58, 961.29 examples/s]Map:  21%|██▏       | 46470/217273 [00:51<03:12, 886.20 examples/s]Map:  21%|██▏       | 46597/217273 [00:51<03:01, 939.49 examples/s]Map:  21%|██        | 45000/217273 [00:49<03:24, 844.26 examples/s]Map:  21%|██        | 45750/217273 [00:49<02:56, 969.73 examples/s]Map:  21%|██▏       | 46564/217273 [00:52<03:09, 900.75 examples/s]Map:  21%|██▏       | 46702/217273 [00:51<02:56, 966.42 examples/s]Map:  21%|██        | 45091/217273 [00:49<03:21, 855.66 examples/s]Map:  21%|██        | 45851/217273 [00:50<02:55, 978.24 examples/s]Map:  21%|██▏       | 46657/217273 [00:52<03:08, 907.52 examples/s]Map:  22%|██▏       | 46802/217273 [00:51<02:54, 974.55 examples/s]Map:  21%|██        | 45189/217273 [00:49<03:14, 883.00 examples/s]Map:  21%|██        | 45281/217273 [00:50<03:13, 890.29 examples/s]Map:  21%|██        | 45988/217273 [00:50<02:59, 952.50 examples/s]Map:  22%|██▏       | 46797/217273 [00:52<03:07, 911.60 examples/s]Map:  22%|██▏       | 46939/217273 [00:52<03:00, 944.77 examples/s]Map:  21%|██        | 45381/217273 [00:50<03:07, 916.00 examples/s]Map:  22%|██▏       | 46892/217273 [00:52<03:05, 919.90 examples/s]Map:  21%|██        | 46098/217273 [00:50<03:32, 805.97 examples/s]Map:  21%|██        | 45483/217273 [00:50<03:02, 942.15 examples/s]Map:  22%|██▏       | 47050/217273 [00:52<03:30, 810.48 examples/s]Map:  22%|██▏       | 46991/217273 [00:52<03:01, 937.34 examples/s]Map:  21%|██▏       | 46199/217273 [00:50<03:21, 850.09 examples/s]Map:  21%|██        | 45587/217273 [00:50<02:57, 967.70 examples/s]Map:  22%|██▏       | 47150/217273 [00:52<03:19, 853.28 examples/s]Map:  21%|██▏       | 46297/217273 [00:50<03:14, 879.37 examples/s]Map:  21%|██        | 45689/217273 [00:50<02:55, 979.93 examples/s]Map:  22%|██▏       | 47094/217273 [00:52<03:38, 779.39 examples/s]Map:  22%|██▏       | 47250/217273 [00:52<03:11, 888.40 examples/s]Map:  21%|██▏       | 46394/217273 [00:50<03:09, 901.67 examples/s]Map:  21%|██        | 45788/217273 [00:50<02:54, 980.46 examples/s]Map:  22%|██▏       | 47187/217273 [00:52<03:28, 815.18 examples/s]Map:  22%|██▏       | 47354/217273 [00:52<03:03, 925.23 examples/s]Map:  21%|██▏       | 46495/217273 [00:50<03:03, 928.77 examples/s]Map:  21%|██        | 45895/217273 [00:50<02:51, 1002.13 examples/s]Map:  22%|██▏       | 47283/217273 [00:52<03:20, 849.18 examples/s]Map:  22%|██▏       | 47451/217273 [00:52<03:01, 933.84 examples/s]Map:  21%|██▏       | 46593/217273 [00:50<03:01, 939.20 examples/s]Map:  21%|██        | 45999/217273 [00:50<02:50, 1005.09 examples/s]Map:  22%|██▏       | 47381/217273 [00:52<03:13, 878.18 examples/s]Map:  22%|██▏       | 47549/217273 [00:52<02:59, 943.09 examples/s]Map:  21%|██▏       | 46695/217273 [00:51<02:58, 954.81 examples/s]Map:  22%|██▏       | 47477/217273 [00:53<03:09, 898.15 examples/s]Map:  22%|██▏       | 47692/217273 [00:52<02:59, 943.17 examples/s]Map:  21%|██        | 46107/217273 [00:50<03:22, 843.94 examples/s] Map:  22%|██▏       | 46798/217273 [00:51<02:55, 969.15 examples/s]Map:  22%|██▏       | 47570/217273 [00:53<03:07, 906.36 examples/s]Map:  22%|██▏       | 47794/217273 [00:52<02:56, 962.82 examples/s]Map:  21%|██▏       | 46209/217273 [00:51<03:13, 885.03 examples/s]Map:  22%|██▏       | 47671/217273 [00:53<03:01, 932.28 examples/s]Map:  22%|██▏       | 46941/217273 [00:51<02:57, 961.46 examples/s]Map:  22%|██▏       | 47892/217273 [00:53<02:55, 964.36 examples/s]Map:  21%|██▏       | 46311/217273 [00:51<03:05, 920.51 examples/s]Map:  22%|██▏       | 47810/217273 [00:53<03:02, 926.15 examples/s]Map:  21%|██▏       | 46411/217273 [00:51<03:01, 940.31 examples/s]Map:  22%|██▏       | 47047/217273 [00:51<03:31, 806.51 examples/s]Map:  22%|██▏       | 48000/217273 [00:53<03:30, 804.94 examples/s]Map:  22%|██▏       | 47949/217273 [00:53<03:03, 923.47 examples/s]Map:  21%|██▏       | 46551/217273 [00:51<03:02, 934.41 examples/s]Map:  22%|██▏       | 47151/217273 [00:51<03:18, 856.51 examples/s]Map:  22%|██▏       | 48095/217273 [00:53<03:21, 838.48 examples/s]Map:  22%|██▏       | 47253/217273 [00:51<03:10, 894.81 examples/s]Map:  22%|██▏       | 48188/217273 [00:53<03:16, 861.70 examples/s]Map:  21%|██▏       | 46687/217273 [00:51<03:05, 921.20 examples/s]Map:  22%|██▏       | 48048/217273 [00:53<03:34, 787.39 examples/s]Map:  22%|██▏       | 47359/217273 [00:51<03:01, 934.39 examples/s]Map:  22%|██▏       | 48285/217273 [00:53<03:10, 888.57 examples/s]Map:  22%|██▏       | 46789/217273 [00:51<03:00, 944.27 examples/s]Map:  22%|██▏       | 48140/217273 [00:53<03:27, 816.65 examples/s]Map:  22%|██▏       | 47463/217273 [00:51<02:56, 960.55 examples/s]Map:  22%|██▏       | 48385/217273 [00:53<03:04, 915.43 examples/s]Map:  22%|██▏       | 46886/217273 [00:51<02:59, 949.14 examples/s]Map:  22%|██▏       | 48238/217273 [00:53<03:17, 855.69 examples/s]Map:  22%|██▏       | 47567/217273 [00:51<02:53, 978.60 examples/s]Map:  22%|██▏       | 48486/217273 [00:53<02:59, 940.93 examples/s]Map:  22%|██▏       | 46991/217273 [00:51<02:54, 974.87 examples/s]Map:  22%|██▏       | 48335/217273 [00:54<03:11, 883.45 examples/s]Map:  22%|██▏       | 47671/217273 [00:52<02:50, 994.52 examples/s]Map:  22%|██▏       | 48587/217273 [00:53<02:56, 955.85 examples/s]Map:  22%|██▏       | 48431/217273 [00:54<03:07, 902.63 examples/s]Map:  22%|██▏       | 47102/217273 [00:52<03:26, 825.46 examples/s]Map:  22%|██▏       | 47822/217273 [00:52<02:50, 992.76 examples/s]Map:  22%|██▏       | 48531/217273 [00:54<03:02, 925.57 examples/s]Map:  22%|██▏       | 48725/217273 [00:54<02:59, 937.58 examples/s]Map:  22%|██▏       | 47202/217273 [00:52<03:16, 863.97 examples/s]Map:  22%|██▏       | 48830/217273 [00:54<02:54, 964.15 examples/s]Map:  22%|██▏       | 47968/217273 [00:52<02:52, 979.38 examples/s]Map:  22%|██▏       | 48674/217273 [00:54<03:00, 933.13 examples/s]Map:  22%|██▏       | 47295/217273 [00:52<03:13, 877.53 examples/s]Map:  23%|██▎       | 48932/217273 [00:54<02:52, 976.06 examples/s]Map:  22%|██▏       | 48771/217273 [00:54<02:59, 936.54 examples/s]Map:  22%|██▏       | 47396/217273 [00:52<03:06, 911.54 examples/s]Map:  22%|██▏       | 48097/217273 [00:52<03:20, 845.70 examples/s]Map:  22%|██▏       | 48874/217273 [00:54<02:55, 960.84 examples/s]Map:  22%|██▏       | 47501/217273 [00:52<02:59, 946.82 examples/s]Map:  23%|██▎       | 49046/217273 [00:54<03:24, 824.35 examples/s]Map:  22%|██▏       | 48193/217273 [00:52<03:15, 866.98 examples/s]Map:  23%|██▎       | 49139/217273 [00:54<03:18, 847.96 examples/s]Map:  22%|██▏       | 47642/217273 [00:52<03:00, 938.49 examples/s]Map:  23%|██▎       | 49000/217273 [00:54<03:31, 795.27 examples/s]Map:  22%|██▏       | 48328/217273 [00:52<03:13, 874.52 examples/s]Map:  23%|██▎       | 49280/217273 [00:54<03:11, 877.04 examples/s]Map:  23%|██▎       | 49096/217273 [00:54<03:22, 831.37 examples/s]Map:  22%|██▏       | 47785/217273 [00:52<03:00, 940.71 examples/s]Map:  22%|██▏       | 48428/217273 [00:52<03:07, 899.17 examples/s]Map:  23%|██▎       | 49380/217273 [00:54<03:05, 903.43 examples/s]Map:  23%|██▎       | 49196/217273 [00:55<03:12, 871.28 examples/s]Map:  22%|██▏       | 47886/217273 [00:52<02:57, 955.59 examples/s]Map:  22%|██▏       | 48529/217273 [00:53<03:02, 922.79 examples/s]Map:  23%|██▎       | 49480/217273 [00:54<03:01, 924.63 examples/s]Map:  23%|██▎       | 49302/217273 [00:55<03:02, 918.50 examples/s]Map:  22%|██▏       | 47983/217273 [00:52<02:56, 957.09 examples/s]Map:  22%|██▏       | 48633/217273 [00:53<02:57, 950.38 examples/s]Map:  23%|██▎       | 49577/217273 [00:54<02:59, 933.95 examples/s]Map:  23%|██▎       | 49401/217273 [00:55<02:59, 937.39 examples/s]Map:  22%|██▏       | 48731/217273 [00:53<02:55, 958.02 examples/s]Map:  23%|██▎       | 49672/217273 [00:55<02:58, 936.54 examples/s]Map:  22%|██▏       | 48102/217273 [00:53<03:27, 815.41 examples/s]Map:  23%|██▎       | 49498/217273 [00:55<02:57, 943.29 examples/s]Map:  22%|██▏       | 48829/217273 [00:53<02:55, 959.15 examples/s]Map:  22%|██▏       | 48199/217273 [00:53<03:18, 849.82 examples/s]Map:  23%|██▎       | 49595/217273 [00:55<02:56, 949.11 examples/s]Map:  23%|██▎       | 48927/217273 [00:53<02:54, 964.04 examples/s]Map:  22%|██▏       | 48296/217273 [00:53<03:12, 877.37 examples/s]Map:  23%|██▎       | 49696/217273 [00:55<02:53, 963.72 examples/s]Map:  23%|██▎       | 49809/217273 [00:55<04:12, 663.28 examples/s]Map:  22%|██▏       | 48393/217273 [00:53<03:07, 899.18 examples/s]Map:  23%|██▎       | 49051/217273 [00:53<03:25, 817.53 examples/s]Map:  23%|██▎       | 49906/217273 [00:55<03:51, 723.44 examples/s]Map:  22%|██▏       | 48492/217273 [00:53<03:02, 922.99 examples/s]Map:  23%|██▎       | 49149/217273 [00:53<03:16, 855.74 examples/s]Map:  23%|██▎       | 49812/217273 [00:55<04:03, 688.50 examples/s]Map:  22%|██▏       | 48592/217273 [00:53<02:58, 943.86 examples/s]Map:  23%|██▎       | 49254/217273 [00:53<03:06, 902.30 examples/s]Map:  23%|██▎       | 50000/217273 [00:55<04:11, 665.99 examples/s]Map:  23%|██▎       | 49911/217273 [00:55<03:42, 751.26 examples/s]Map:  22%|██▏       | 48690/217273 [00:53<02:57, 949.77 examples/s]Map:  23%|██▎       | 49352/217273 [00:53<03:02, 920.51 examples/s]Map:  23%|██▎       | 50090/217273 [00:55<03:54, 713.71 examples/s]Map:  23%|██▎       | 50000/217273 [00:56<04:10, 668.34 examples/s]Map:  22%|██▏       | 48828/217273 [00:53<03:00, 933.46 examples/s]Map:  23%|██▎       | 50174/217273 [00:55<03:45, 740.84 examples/s]Map:  23%|██▎       | 49493/217273 [00:54<03:01, 923.29 examples/s]Map:  23%|██▎       | 50097/217273 [00:56<03:47, 733.90 examples/s]Map:  23%|██▎       | 48926/217273 [00:54<02:58, 943.62 examples/s]Map:  23%|██▎       | 50273/217273 [00:55<03:28, 801.07 examples/s]Map:  23%|██▎       | 49598/217273 [00:54<02:56, 949.12 examples/s]Map:  23%|██▎       | 50194/217273 [00:56<03:31, 790.27 examples/s]Map:  23%|██▎       | 50364/217273 [00:56<03:21, 828.07 examples/s]Map:  23%|██▎       | 49701/217273 [00:54<02:53, 967.44 examples/s]Map:  23%|██▎       | 50286/217273 [00:56<03:23, 821.73 examples/s]Map:  23%|██▎       | 49049/217273 [00:54<03:27, 810.20 examples/s]Map:  23%|██▎       | 50454/217273 [00:56<03:17, 846.53 examples/s]Map:  23%|██▎       | 50385/217273 [00:56<03:12, 865.02 examples/s]Map:  23%|██▎       | 49152/217273 [00:54<03:15, 860.86 examples/s]Map:  23%|██▎       | 50551/217273 [00:56<03:09, 878.42 examples/s]Map:  23%|██▎       | 50481/217273 [00:56<03:07, 888.53 examples/s]Map:  23%|██▎       | 49251/217273 [00:54<03:08, 891.68 examples/s]Map:  23%|██▎       | 50644/217273 [00:56<03:07, 889.67 examples/s]Map:  23%|██▎       | 49813/217273 [00:54<04:16, 653.16 examples/s]Map:  23%|██▎       | 50580/217273 [00:56<03:02, 914.28 examples/s]Map:  23%|██▎       | 49354/217273 [00:54<03:01, 926.00 examples/s]Map:  23%|██▎       | 49916/217273 [00:54<03:50, 726.95 examples/s]Map:  23%|██▎       | 50787/217273 [00:56<03:03, 908.71 examples/s]Map:  23%|██▎       | 50678/217273 [00:56<02:58, 932.43 examples/s]Map:  23%|██▎       | 49455/217273 [00:54<02:57, 946.74 examples/s]Map:  23%|██▎       | 50882/217273 [00:56<03:02, 911.45 examples/s]Map:  23%|██▎       | 50777/217273 [00:56<02:55, 947.21 examples/s]Map:  23%|██▎       | 49554/217273 [00:54<02:55, 957.07 examples/s]Map:  23%|██▎       | 50051/217273 [00:54<03:58, 700.66 examples/s]Map:  23%|██▎       | 50974/217273 [00:56<03:02, 911.52 examples/s]Map:  23%|██▎       | 50876/217273 [00:56<02:54, 956.15 examples/s]Map:  23%|██▎       | 49655/217273 [00:54<02:53, 966.60 examples/s]Map:  23%|██▎       | 50155/217273 [00:54<03:37, 768.04 examples/s]Map:  23%|██▎       | 50253/217273 [00:55<03:25, 813.58 examples/s]Map:  24%|██▎       | 51098/217273 [00:56<03:34, 775.35 examples/s]Map:  23%|██▎       | 51000/217273 [00:57<03:24, 811.95 examples/s]Map:  23%|██▎       | 50357/217273 [00:55<03:12, 866.61 examples/s]Map:  23%|██▎       | 49764/217273 [00:55<04:04, 686.42 examples/s]Map:  24%|██▎       | 51195/217273 [00:57<03:23, 816.35 examples/s]Map:  24%|██▎       | 51099/217273 [00:57<03:14, 855.06 examples/s]Map:  23%|██▎       | 50456/217273 [00:55<03:06, 895.09 examples/s]Map:  23%|██▎       | 49864/217273 [00:55<03:42, 753.39 examples/s]Map:  24%|██▎       | 51283/217273 [00:57<03:20, 829.70 examples/s]Map:  24%|██▎       | 51196/217273 [00:57<03:07, 883.42 examples/s]Map:  23%|██▎       | 50558/217273 [00:55<02:59, 926.64 examples/s]Map:  23%|██▎       | 49962/217273 [00:55<03:27, 807.14 examples/s]Map:  24%|██▎       | 51384/217273 [00:57<03:09, 873.89 examples/s]Map:  24%|██▎       | 51296/217273 [00:57<03:01, 912.24 examples/s]Map:  24%|██▎       | 51484/217273 [00:57<03:02, 906.46 examples/s]Map:  23%|██▎       | 50702/217273 [00:55<02:57, 935.81 examples/s]Map:  24%|██▎       | 51442/217273 [00:57<02:58, 931.19 examples/s]Map:  23%|██▎       | 50094/217273 [00:55<03:49, 729.43 examples/s]Map:  24%|██▎       | 51583/217273 [00:57<02:58, 926.56 examples/s]Map:  23%|██���       | 50804/217273 [00:55<02:54, 955.15 examples/s]Map:  24%|██▎       | 51544/217273 [00:57<02:54, 950.97 examples/s]Map:  23%|██▎       | 50200/217273 [00:55<03:29, 799.11 examples/s]Map:  24%|██▍       | 51686/217273 [00:57<02:53, 952.82 examples/s]Map:  23%|██▎       | 50903/217273 [00:55<02:53, 961.07 examples/s]Map:  24%|██▍       | 51647/217273 [00:57<02:51, 967.99 examples/s]Map:  23%|██▎       | 50298/217273 [00:55<03:18, 840.68 examples/s]Map:  24%|██▍       | 51788/217273 [00:57<02:50, 970.26 examples/s]Map:  24%|██▍       | 51749/217273 [00:57<02:48, 980.49 examples/s]Map:  23%|██▎       | 50395/217273 [00:55<03:11, 871.65 examples/s]Map:  24%|██▍       | 51887/217273 [00:57<02:50, 970.53 examples/s]Map:  23%|██▎       | 51047/217273 [00:55<03:22, 821.14 examples/s]Map:  24%|██▍       | 51851/217273 [00:58<02:47, 987.43 examples/s]Map:  24%|██▎       | 51149/217273 [00:56<03:11, 866.16 examples/s]Map:  23%|██▎       | 50533/217273 [00:55<03:07, 886.95 examples/s]Map:  24%|██▍       | 52000/217273 [00:57<03:24, 809.42 examples/s]Map:  24%|██▍       | 51993/217273 [00:58<02:50, 967.59 examples/s]Map:  24%|██▎       | 51249/217273 [00:56<03:05, 896.67 examples/s]Map:  23%|██▎       | 50634/217273 [00:56<03:01, 916.77 examples/s]Map:  24%|██▍       | 52088/217273 [00:58<03:20, 825.60 examples/s]Map:  24%|██▎       | 51357/217273 [00:56<02:56, 941.08 examples/s]Map:  23%|██▎       | 50729/217273 [00:56<03:00, 922.17 examples/s]Map:  24%|██▍       | 52093/217273 [00:58<03:24, 808.88 examples/s]Map:  24%|██▍       | 52188/217273 [00:58<03:09, 869.77 examples/s]Map:  24%|██▎       | 51461/217273 [00:56<02:52, 962.18 examples/s]Map:  23%|██▎       | 50831/217273 [00:56<02:55, 948.01 examples/s]Map:  24%|██▍       | 52192/217273 [00:58<03:14, 848.45 examples/s]Map:  24%|██▍       | 52291/217273 [00:58<03:00, 911.73 examples/s]Map:  24%|██▎       | 51600/217273 [00:56<02:55, 944.89 examples/s]Map:  23%|██▎       | 50965/217273 [00:56<03:00, 921.17 examples/s]Map:  24%|██▍       | 52323/217273 [00:58<03:13, 852.69 examples/s]Map:  24%|██▍       | 52428/217273 [00:58<03:02, 903.91 examples/s]Map:  24%|██▍       | 51740/217273 [00:56<02:56, 935.92 examples/s]Map:  24%|██▍       | 52417/217273 [00:58<03:09, 870.73 examples/s]Map:  24%|██▍       | 52531/217273 [00:58<02:56, 935.39 examples/s]Map:  24%|██▎       | 51093/217273 [00:56<03:35, 770.46 examples/s]Map:  24%|██▍       | 51838/217273 [00:56<02:55, 945.21 examples/s]Map:  24%|██▍       | 52516/217273 [00:58<03:03, 898.94 examples/s]Map:  24%|██▍       | 52676/217273 [00:58<02:54, 940.64 examples/s]Map:  24%|██▎       | 51189/217273 [00:56<03:25, 810.13 examples/s]Map:  24%|██▍       | 51934/217273 [00:56<02:55, 940.40 examples/s]Map:  24%|██▍       | 52658/217273 [00:58<03:00, 912.02 examples/s]Map:  24%|██▍       | 52775/217273 [00:58<02:53, 950.56 examples/s]Map:  24%|██▎       | 51282/217273 [00:56<03:18, 837.43 examples/s]Map:  24%|██▍       | 52753/217273 [00:59<02:58, 920.02 examples/s]Map:  24%|██▍       | 52879/217273 [00:58<02:48, 973.35 examples/s]Map:  24%|██▎       | 51378/217273 [00:56<03:11, 867.20 examples/s]Map:  24%|██▍       | 52044/217273 [00:57<03:28, 793.53 examples/s]Map:  24%|██▍       | 52857/217273 [00:59<02:53, 946.14 examples/s]Map:  24%|██▍       | 52983/217273 [00:58<02:45, 990.05 examples/s]Map:  24%|██▎       | 51478/217273 [00:57<03:04, 898.84 examples/s]Map:  24%|██▍       | 52146/217273 [00:57<03:15, 843.68 examples/s]Map:  24%|██▎       | 51581/217273 [00:57<02:57, 932.03 examples/s]Map:  24%|██▍       | 52244/217273 [00:57<03:08, 875.73 examples/s]Map:  24%|██▍       | 53091/217273 [00:59<03:20, 818.14 examples/s]Map:  24%|██▍       | 51683/217273 [00:57<02:53, 953.93 examples/s]Map:  24%|██▍       | 53000/217273 [00:59<03:22, 812.01 examples/s]Map:  24%|██▍       | 52347/217273 [00:57<03:00, 915.95 examples/s]Map:  24%|██▍       | 53191/217273 [00:59<03:10, 861.22 examples/s]Map:  24%|██▍       | 53098/217273 [00:59<03:13, 846.48 examples/s]Map:  24%|██▍       | 51781/217273 [00:57<02:53, 955.15 examples/s]Map:  24%|██▍       | 52451/217273 [00:57<02:54, 945.82 examples/s]Map:  25%|██▍       | 53287/217273 [00:59<03:05, 885.67 examples/s]Map:  24%|██▍       | 53196/217273 [00:59<03:07, 876.01 examples/s]Map:  24%|██▍       | 51881/217273 [00:57<02:51, 963.57 examples/s]Map:  24%|██▍       | 52552/217273 [00:57<02:51, 959.93 examples/s]Map:  25%|██▍       | 53384/217273 [00:59<03:00, 906.04 examples/s]Map:  25%|██▍       | 53296/217273 [00:59<03:01, 905.05 examples/s]Map:  24%|██▍       | 52655/217273 [00:57<02:48, 976.49 examples/s]Map:  25%|██▍       | 53488/217273 [00:59<02:54, 940.68 examples/s]Map:  24%|██▍       | 52000/217273 [00:57<03:28, 794.11 examples/s]Map:  25%|██▍       | 53395/217273 [00:59<02:57, 924.26 examples/s]Map:  24%|██▍       | 52759/217273 [00:57<02:46, 989.57 examples/s]Map:  25%|██▍       | 53623/217273 [00:59<02:57, 921.67 examples/s]Map:  24%|██▍       | 52126/217273 [00:57<03:25, 803.76 examples/s]Map:  25%|██▍       | 53521/217273 [00:59<03:04, 885.62 examples/s]Map:  24%|██▍       | 52894/217273 [00:57<02:53, 948.91 examples/s]Map:  25%|██▍       | 53618/217273 [01:00<03:00, 905.04 examples/s]Map:  25%|██▍       | 53764/217273 [00:59<02:57, 922.73 examples/s]Map:  24%|██▍       | 52260/217273 [00:57<03:19, 827.98 examples/s]Map:  24%|██▍       | 53000/217273 [00:58<03:24, 804.27 examples/s]Map:  25%|██▍       | 53862/217273 [00:59<02:54, 935.54 examples/s]Map:  24%|██▍       | 52360/217273 [00:58<03:10, 866.94 examples/s]Map:  25%|██▍       | 53763/217273 [01:00<02:56, 924.23 examples/s]Map:  24%|██▍       | 53102/217273 [00:58<03:12, 852.88 examples/s]Map:  25%|██▍       | 53959/217273 [01:00<02:53, 942.66 examples/s]Map:  24%|██▍       | 52452/217273 [00:58<03:07, 878.59 examples/s]Map:  24%|██▍       | 53203/217273 [00:58<03:04, 890.57 examples/s]Map:  25%|██▍       | 53902/217273 [01:00<02:57, 922.15 examples/s]Map:  24%|██▍       | 52555/217273 [00:58<02:59, 916.25 examples/s]Map:  25%|██▍       | 53300/217273 [00:58<03:00, 909.68 examples/s]Map:  25%|██▍       | 54101/217273 [01:00<03:19, 818.39 examples/s]Map:  24%|██▍       | 52654/217273 [00:58<02:56, 931.49 examples/s]Map:  25%|██▍       | 54000/217273 [01:00<03:24, 799.54 examples/s]Map:  25%|██▍       | 53404/217273 [00:58<02:53, 942.61 examples/s]Map:  25%|██▍       | 54190/217273 [01:00<03:16, 831.02 examples/s]Map:  24%|██▍       | 52754/217273 [00:58<02:53, 948.77 examples/s]Map:  25%|██▍       | 54098/217273 [01:00<03:14, 838.94 examples/s]Map:  25%|██▍       | 53502/217273 [00:58<02:52, 950.88 examples/s]Map:  25%|██▍       | 54287/217273 [01:00<03:08, 863.60 examples/s]Map:  25%|██▍       | 54200/217273 [01:00<03:05, 879.91 examples/s]Map:  25%|██▍       | 53607/217273 [00:58<02:47, 976.61 examples/s]Map:  24%|██▍       | 52899/217273 [00:58<02:52, 952.38 examples/s]Map:  25%|██▌       | 54382/217273 [01:00<03:04, 882.65 examples/s]Map:  25%|██▍       | 54296/217273 [01:00<03:01, 896.85 examples/s]Map:  25%|██▍       | 53712/217273 [00:58<02:44, 994.32 examples/s]Map:  24%|██▍       | 52999/217273 [00:58<02:50, 961.70 examples/s]Map:  25%|██▌       | 54478/217273 [01:00<03:00, 901.07 examples/s]Map:  25%|██▌       | 54391/217273 [01:00<02:58, 910.14 examples/s]Map:  25%|██▍       | 53857/217273 [00:58<02:46, 979.24 examples/s]Map:  24%|██▍       | 53096/217273 [00:58<03:26, 796.08 examples/s]Map:  25%|██▌       | 54593/217273 [01:00<03:12, 846.49 examples/s]Map:  25%|██▌       | 54529/217273 [01:01<02:58, 910.72 examples/s]Map:  25%|██▍       | 53959/217273 [00:59<02:45, 985.79 examples/s]Map:  24%|██▍       | 53185/217273 [00:58<03:20, 817.44 examples/s]Map:  25%|██▌       | 54622/217273 [01:01<02:58, 912.72 examples/s]Map:  25%|██▌       | 54706/217273 [01:00<03:20, 811.70 examples/s]Map:  25%|██▍       | 53285/217273 [00:59<03:10, 861.98 examples/s]Map:  25%|██▌       | 54718/217273 [01:01<02:56, 921.02 examples/s]Map:  25%|██▌       | 54796/217273 [01:01<03:15, 831.74 examples/s]Map:  25%|██▍       | 54085/217273 [00:59<03:21, 809.59 examples/s]Map:  25%|██▍       | 53415/217273 [00:59<03:11, 857.26 examples/s]Map:  25%|██▍       | 54174/217273 [00:59<03:17, 826.27 examples/s]Map:  25%|██▌       | 54857/217273 [01:01<02:56, 920.54 examples/s]Map:  25%|██▌       | 54919/217273 [01:01<03:16, 825.53 examples/s]Map:  25%|██▍       | 53517/217273 [00:59<03:02, 897.46 examples/s]Map:  25%|██▍       | 54276/217273 [00:59<03:06, 872.12 examples/s]Map:  25%|██▌       | 54956/217273 [01:01<02:53, 935.84 examples/s]Map:  25%|██▍       | 53612/217273 [00:59<03:00, 909.16 examples/s]Map:  25%|██▌       | 54374/217273 [00:59<03:01, 898.42 examples/s]Map:  25%|██▌       | 55041/217273 [01:01<03:46, 715.59 examples/s]Map:  25%|██▍       | 53709/217273 [00:59<02:57, 922.69 examples/s]Map:  25%|██▌       | 54475/217273 [00:59<02:55, 927.70 examples/s]Map:  25%|██▌       | 55090/217273 [01:01<03:25, 789.33 examples/s]Map:  25%|██▌       | 55118/217273 [01:01<03:43, 725.06 examples/s]Map:  25%|██▌       | 54579/217273 [00:59<02:50, 955.10 examples/s]Map:  25%|██▍       | 53846/217273 [00:59<02:58, 916.69 examples/s]Map:  25%|██▌       | 55188/217273 [01:01<03:15, 829.89 examples/s]Map:  25%|██▌       | 55205/217273 [01:01<03:33, 758.51 examples/s]Map:  25%|██▌       | 54677/217273 [00:59<02:49, 957.08 examples/s]Map:  25%|██▍       | 53944/217273 [00:59<02:55, 930.66 examples/s]Map:  25%|██▌       | 55285/217273 [01:01<03:08, 860.31 examples/s]Map:  25%|██▌       | 55298/217273 [01:01<03:22, 798.40 examples/s]Map:  25%|██▌       | 55381/217273 [01:02<03:03, 884.07 examples/s]Map:  25%|██▌       | 55386/217273 [01:01<03:18, 816.63 examples/s]Map:  25%|██▌       | 54826/217273 [01:00<02:48, 963.86 examples/s]Map:  25%|██▍       | 54048/217273 [00:59<03:28, 781.93 examples/s]Map:  26%|██▌       | 55477/217273 [01:02<02:59, 903.65 examples/s]Map:  26%|██▌       | 55510/217273 [01:01<03:18, 814.72 examples/s]Map:  25%|██▍       | 54148/217273 [01:00<03:15, 832.51 examples/s]Map:  25%|██▌       | 54972/217273 [01:00<02:48, 964.51 examples/s]Map:  26%|██▌       | 55572/217273 [01:02<02:57, 912.89 examples/s]Map:  26%|██▌       | 55605/217273 [01:02<03:11, 845.29 examples/s]Map:  25%|██▍       | 54248/217273 [01:00<03:06, 873.14 examples/s]Map:  26%|██▌       | 55708/217273 [01:02<02:58, 906.46 examples/s]Map:  26%|██▌       | 55696/217273 [01:02<03:07, 859.79 examples/s]Map:  25%|██▌       | 54349/217273 [01:00<02:59, 906.46 examples/s]Map:  25%|██▌       | 55099/217273 [01:00<03:16, 823.80 examples/s]Map:  26%|██▌       | 55806/217273 [01:02<02:55, 922.53 examples/s]Map:  25%|██▌       | 54449/217273 [01:00<02:55, 927.47 examples/s]Map:  25%|██▌       | 55205/217273 [01:00<03:05, 874.93 examples/s]Map:  26%|██▌       | 55823/217273 [01:02<03:09, 852.64 examples/s]Map:  26%|██▌       | 55937/217273 [01:02<02:59, 899.75 examples/s]Map:  26%|██▌       | 55917/217273 [01:02<03:05, 872.00 examples/s]Map:  25%|██▌       | 54591/217273 [01:00<02:54, 933.04 examples/s]Map:  25%|██▌       | 55339/217273 [01:00<03:04, 878.24 examples/s]Map:  25%|██▌       | 54696/217273 [01:00<02:49, 958.54 examples/s]Map:  26%|██▌       | 55437/217273 [01:00<02:59, 899.60 examples/s]Map:  26%|██▌       | 56046/217273 [01:02<03:27, 776.63 examples/s]Map:  26%|██▌       | 55537/217273 [01:00<02:55, 921.52 examples/s]Map:  26%|██▌       | 56043/217273 [01:02<03:38, 737.64 examples/s]Map:  25%|██▌       | 54844/217273 [01:00<02:48, 966.39 examples/s]Map:  26%|██▌       | 56140/217273 [01:02<03:18, 813.62 examples/s]Map:  26%|██▌       | 55642/217273 [01:00<02:49, 950.95 examples/s]Map:  26%|██▌       | 56133/217273 [01:02<03:28, 772.07 examples/s]Map:  26%|██▌       | 56233/217273 [01:03<03:11, 840.95 examples/s]Map:  25%|██▌       | 54991/217273 [01:00<02:47, 967.33 examples/s]Map:  26%|██▌       | 56221/217273 [01:02<03:21, 797.53 examples/s]Map:  26%|██▌       | 55745/217273 [01:01<02:47, 965.82 examples/s]Map:  26%|██▌       | 56328/217273 [01:03<03:05, 867.96 examples/s]Map:  26%|██▌       | 56319/217273 [01:02<03:10, 843.16 examples/s]Map:  26%|██▌       | 55894/217273 [01:01<02:46, 972.10 examples/s]Map:  26%|██▌       | 56427/217273 [01:03<02:59, 897.78 examples/s]Map:  25%|██▌       | 55100/217273 [01:01<03:16, 827.08 examples/s]Map:  26%|██▌       | 56412/217273 [01:03<03:06, 861.13 examples/s]Map:  26%|██▌       | 55994/217273 [01:01<02:45, 976.22 examples/s]Map:  26%|██▌       | 56527/217273 [01:03<02:53, 925.22 examples/s]Map:  25%|██▌       | 55197/217273 [01:01<03:10, 852.98 examples/s]Map:  26%|██▌       | 56505/217273 [01:03<03:03, 875.80 examples/s]Map:  26%|██▌       | 56624/217273 [01:03<02:52, 931.72 examples/s]Map:  25%|██▌       | 55295/217273 [01:01<03:03, 881.81 examples/s]Map:  26%|██▌       | 56106/217273 [01:01<03:14, 828.93 examples/s]Map:  26%|██▌       | 56644/217273 [01:03<03:00, 890.59 examples/s]Map:  26%|██▌       | 56723/217273 [01:03<02:49, 946.46 examples/s]Map:  25%|██▌       | 55392/217273 [01:01<02:59, 902.19 examples/s]Map:  26%|██▌       | 56206/217273 [01:01<03:05, 868.82 examples/s]Map:  26%|██▌       | 55491/217273 [01:01<02:55, 924.03 examples/s]Map:  26%|██▌       | 56782/217273 [01:03<02:59, 894.85 examples/s]Map:  26%|██▌       | 56864/217273 [01:03<02:50, 941.18 examples/s]Map:  26%|██▌       | 56310/217273 [01:01<02:56, 910.63 examples/s]Map:  26%|██▌       | 55589/217273 [01:01<02:52, 938.81 examples/s]Map:  26%|██▌       | 56881/217273 [01:03<02:54, 916.67 examples/s]Map:  26%|██▌       | 56962/217273 [01:03<02:49, 946.02 examples/s]Map:  26%|██▌       | 56411/217273 [01:01<02:52, 934.88 examples/s]Map:  26%|██▌       | 55693/217273 [01:01<02:47, 965.89 examples/s]Map:  26%|██▌       | 56980/217273 [01:03<02:51, 934.88 examples/s]Map:  26%|██▌       | 56516/217273 [01:01<02:47, 961.70 examples/s]Map:  26%|██▋       | 57097/217273 [01:04<03:17, 809.36 examples/s]Map:  26%|██▌       | 55839/217273 [01:01<02:47, 963.75 examples/s]Map:  26%|██▌       | 56621/217273 [01:01<02:43, 983.82 examples/s]Map:  26%|██▋       | 57094/217273 [01:03<03:22, 789.84 examples/s]Map:  26%|██▋       | 57194/217273 [01:04<03:09, 843.26 examples/s]Map:  26%|██▌       | 55940/217273 [01:01<02:46, 971.75 examples/s]Map:  26%|██▌       | 56770/217273 [01:02<02:43, 982.58 examples/s]Map:  26%|██▋       | 57194/217273 [01:03<03:11, 836.74 examples/s]Map:  26%|██▋       | 57294/217273 [01:04<03:01, 879.95 examples/s]Map:  26%|██▌       | 56871/217273 [01:02<02:42, 988.08 examples/s]Map:  26%|██▋       | 57285/217273 [01:04<03:07, 851.64 examples/s]Map:  26%|██▌       | 56047/217273 [01:02<03:18, 812.23 examples/s]Map:  26%|██▋       | 57392/217273 [01:04<02:56, 904.32 examples/s]Map:  26%|██▋       | 57382/217273 [01:04<03:02, 876.48 examples/s]Map:  26%|██▌       | 56154/217273 [01:02<03:04, 871.00 examples/s]Map:  26%|██▋       | 57490/217273 [01:04<02:53, 920.84 examples/s]Map:  26%|██▌       | 57000/217273 [01:02<03:12, 833.52 examples/s]Map:  26%|██▋       | 57480/217273 [01:04<02:57, 902.76 examples/s]Map:  26%|██▌       | 56257/217273 [01:02<02:56, 910.49 examples/s]Map:  27%|██▋       | 57585/217273 [01:04<02:52, 925.96 examples/s]Map:  26%|██▋       | 57096/217273 [01:02<03:06, 860.16 examples/s]Map:  27%|██▋       | 57586/217273 [01:04<02:49, 941.60 examples/s]Map:  26%|██▌       | 56353/217273 [01:02<02:54, 921.65 examples/s]Map:  27%|██▋       | 57683/217273 [01:04<02:50, 935.07 examples/s]Map:  26%|██▋       | 57194/217273 [01:02<03:00, 885.99 examples/s]Map:  27%|██▋       | 57689/217273 [01:04<02:45, 963.38 examples/s]Map:  26%|██▌       | 56455/217273 [01:02<02:49, 947.82 examples/s]Map:  27%|██▋       | 57782/217273 [01:04<02:48, 947.35 examples/s]Map:  26%|██▋       | 57298/217273 [01:02<02:53, 921.90 examples/s]Map:  27%|██▋       | 57787/217273 [01:04<02:45, 965.18 examples/s]Map:  26%|██▌       | 56562/217273 [01:02<02:44, 978.43 examples/s]Map:  27%|██▋       | 57879/217273 [01:04<02:47, 953.35 examples/s]Map:  26%|██▋       | 57396/217273 [01:02<02:51, 934.18 examples/s]Map:  27%|██▋       | 57887/217273 [01:04<02:43, 973.29 examples/s]Map:  26%|██▌       | 56662/217273 [01:02<02:43, 979.43 examples/s]Map:  26%|██▋       | 57505/217273 [01:02<02:43, 975.20 examples/s]Map:  27%|██▋       | 57993/217273 [01:04<02:40, 994.96 examples/s]Map:  27%|██▋       | 58000/217273 [01:05<03:21, 791.48 examples/s]Map:  26%|██▌       | 56803/217273 [01:02<02:47, 957.17 examples/s]Map:  27%|██▋       | 57605/217273 [01:03<02:43, 976.42 examples/s]Map:  27%|██▋       | 58092/217273 [01:05<03:14, 819.26 examples/s]Map:  27%|██▋       | 57706/217273 [01:03<02:41, 985.82 examples/s]Map:  26%|██▌       | 56949/217273 [01:03<02:47, 957.74 examples/s]Map:  27%|██▋       | 58137/217273 [01:04<03:13, 821.23 examples/s]Map:  27%|██▋       | 58193/217273 [01:05<03:03, 867.13 examples/s]Map:  27%|██▋       | 57809/217273 [01:03<02:40, 996.60 examples/s]Map:  27%|██▋       | 58241/217273 [01:05<03:02, 871.13 examples/s]Map:  27%|██▋       | 58291/217273 [01:05<02:57, 893.63 examples/s]Map:  26%|██▋       | 57053/217273 [01:03<03:12, 833.94 examples/s]Map:  27%|██▋       | 58342/217273 [01:05<02:55, 903.71 examples/s]Map:  27%|██▋       | 58388/217273 [01:05<02:54, 911.37 examples/s]Map:  27%|██▋       | 57964/217273 [01:03<02:38, 1005.68 examples/s]Map:  26%|██▋       | 57156/217273 [01:03<03:02, 876.88 examples/s]Map:  27%|██▋       | 58444/217273 [01:05<02:50, 933.31 examples/s]Map:  27%|██▋       | 58492/217273 [01:05<02:47, 945.60 examples/s]Map:  26%|██▋       | 57256/217273 [01:03<02:56, 906.13 examples/s]Map:  27%|██▋       | 58543/217273 [01:05<02:48, 943.36 examples/s]Map:  27%|██▋       | 58593/217273 [01:05<02:45, 957.62 examples/s]Map:  27%|██▋       | 58099/217273 [01:03<03:05, 858.23 examples/s] Map:  26%|██▋       | 57359/217273 [01:03<02:50, 937.04 examples/s]Map:  27%|██▋       | 58696/217273 [01:05<02:42, 974.94 examples/s]Map:  27%|██▋       | 58201/217273 [01:03<02:58, 892.57 examples/s]Map:  27%|██▋       | 58687/217273 [01:05<02:47, 944.33 examples/s]Map:  26%|██▋       | 57464/217273 [01:03<02:45, 965.71 examples/s]Map:  27%|██▋       | 58297/217273 [01:03<02:55, 906.99 examples/s]Map:  27%|██▋       | 58791/217273 [01:05<02:43, 967.42 examples/s]Map:  27%|██▋       | 58840/217273 [01:05<02:43, 967.26 examples/s]Map:  27%|██▋       | 57613/217273 [01:03<02:44, 971.77 examples/s]Map:  27%|██▋       | 58406/217273 [01:03<02:46, 951.65 examples/s]Map:  27%|██▋       | 58932/217273 [01:05<02:46, 952.11 examples/s]Map:  27%|██▋       | 58977/217273 [01:06<02:48, 939.66 examples/s]Map:  27%|██▋       | 57714/217273 [01:03<02:43, 975.73 examples/s]Map:  27%|██▋       | 58509/217273 [01:04<02:43, 969.08 examples/s]Map:  27%|██▋       | 57818/217273 [01:03<02:41, 987.70 examples/s]Map:  27%|██▋       | 58612/217273 [01:04<02:41, 982.02 examples/s]Map:  27%|██▋       | 59046/217273 [01:05<03:14, 813.55 examples/s]Map:  27%|██▋       | 59085/217273 [01:06<03:22, 780.51 examples/s]Map:  27%|██▋       | 57918/217273 [01:04<02:41, 987.51 examples/s]Map:  27%|██▋       | 58714/217273 [01:04<02:40, 989.16 examples/s]Map:  27%|██▋       | 59137/217273 [01:06<03:10, 831.27 examples/s]Map:  27%|██▋       | 59171/217273 [01:06<03:18, 795.97 examples/s]Map:  27%|██▋       | 58862/217273 [01:04<02:41, 983.33 examples/s]Map:  27%|██▋       | 59226/217273 [01:06<03:07, 843.83 examples/s]Map:  27%|██▋       | 59262/217273 [01:06<03:12, 822.56 examples/s]Map:  27%|██▋       | 58049/217273 [01:04<03:16, 811.74 examples/s]Map:  27%|██▋       | 58963/217273 [01:04<02:40, 986.84 examples/s]Map:  27%|██▋       | 59319/217273 [01:06<03:02, 863.56 examples/s]Map:  27%|██▋       | 59350/217273 [01:06<03:09, 834.32 examples/s]Map:  27%|██▋       | 58153/217273 [01:04<03:05, 859.15 examples/s]Map:  27%|██▋       | 59414/217273 [01:06<02:58, 883.87 examples/s]Map:  27%|██▋       | 59446/217273 [01:06<03:02, 866.27 examples/s]Map:  27%|██▋       | 58258/217273 [01:04<02:55, 904.71 examples/s]Map:  27%|██▋       | 59097/217273 [01:04<03:11, 827.97 examples/s]Map:  27%|██▋       | 59537/217273 [01:06<03:00, 875.74 examples/s]Map:  27%|██▋       | 58362/217273 [01:04<02:49, 937.19 examples/s]Map:  27%|██▋       | 59550/217273 [01:06<02:57, 889.26 examples/s]Map:  27%|██▋       | 59197/217273 [01:04<03:02, 865.46 examples/s]Map:  27%|██▋       | 59627/217273 [01:06<02:59, 879.62 examples/s]Map:  27%|██▋       | 58468/217273 [01:04<02:44, 967.79 examples/s]Map:  27%|██▋       | 59648/217273 [01:06<02:53, 909.81 examples/s]Map:  27%|██▋       | 59295/217273 [01:04<02:57, 891.95 examples/s]Map:  27%|██▋       | 59718/217273 [01:06<02:58, 883.59 examples/s]Map:  27%|██▋       | 58573/217273 [01:04<02:40, 988.91 examples/s]Map:  27%|██▋       | 59742/217273 [01:06<02:52, 914.50 examples/s]Map:  27%|██▋       | 59399/217273 [01:04<02:50, 926.83 examples/s]Map:  28%|██▊       | 59813/217273 [01:07<02:54, 899.91 examples/s]Map:  28%|██▊       | 59839/217273 [01:06<02:49, 926.13 examples/s]Map:  27%|██▋       | 58718/217273 [01:04<02:42, 977.90 examples/s]Map:  27%|██▋       | 59502/217273 [01:05<02:45, 952.02 examples/s]Map:  28%|██▊       | 59944/217273 [01:07<02:57, 885.74 examples/s]Map:  27%|██▋       | 59603/217273 [01:05<02:43, 966.83 examples/s]Map:  28%|██▊       | 59974/217273 [01:06<02:52, 912.73 examples/s]Map:  27%|██▋       | 58868/217273 [01:05<02:41, 982.25 examples/s]Map:  27%|██▋       | 59707/217273 [01:05<02:40, 984.53 examples/s]Map:  27%|██▋       | 58968/217273 [01:05<02:41, 981.85 examples/s]Map:  28%|██▊       | 60044/217273 [01:07<03:33, 735.18 examples/s]Map:  28%|██▊       | 59807/217273 [01:05<02:39, 988.73 examples/s]Map:  28%|██▊       | 60086/217273 [01:07<03:24, 768.90 examples/s]Map:  28%|██▊       | 60134/217273 [01:07<03:23, 771.57 examples/s]Map:  28%|██▊       | 59908/217273 [01:05<02:38, 993.26 examples/s]Map:  28%|██▊       | 60181/217273 [01:07<03:14, 808.20 examples/s]Map:  27%|██▋       | 59099/217273 [01:05<03:07, 844.47 examples/s]Map:  28%|██▊       | 60220/217273 [01:07<03:18, 792.37 examples/s]Map:  27%|██▋       | 59191/217273 [01:05<03:04, 856.58 examples/s]Map:  28%|██▊       | 60312/217273 [01:07<03:09, 827.25 examples/s]Map:  28%|██▊       | 60343/217273 [01:07<03:16, 797.51 examples/s]Map:  28%|██▊       | 60048/217273 [01:05<03:15, 804.91 examples/s]Map:  27%|██▋       | 59287/217273 [01:05<02:59, 879.58 examples/s]Map:  28%|██▊       | 60402/217273 [01:07<03:06, 843.01 examples/s]Map:  28%|██▊       | 60437/217273 [01:07<03:08, 832.23 examples/s]Map:  28%|██▊       | 60146/217273 [01:05<03:06, 842.69 examples/s]Map:  27%|██▋       | 59392/217273 [01:05<02:51, 920.03 examples/s]Map:  28%|██▊       | 60493/217273 [01:07<03:02, 858.08 examples/s]Map:  28%|██▊       | 60528/217273 [01:07<03:04, 851.59 examples/s]Map:  28%|██▊       | 60244/217273 [01:05<02:59, 874.11 examples/s]Map:  27%|██▋       | 59497/217273 [01:05<02:46, 948.88 examples/s]Map:  28%|██▊       | 60590/217273 [01:07<02:56, 885.71 examples/s]Map:  28%|██▊       | 60620/217273 [01:08<03:00, 866.16 examples/s]Map:  28%|██▊       | 60348/217273 [01:06<02:51, 914.65 examples/s]Map:  27%|���█▋       | 59598/217273 [01:05<02:43, 962.53 examples/s]Map:  28%|██▊       | 60684/217273 [01:07<02:54, 898.48 examples/s]Map:  28%|██▊       | 60711/217273 [01:08<02:58, 875.80 examples/s]Map:  28%|██▊       | 60448/217273 [01:06<02:47, 935.39 examples/s]Map:  27%|██▋       | 59699/217273 [01:06<02:41, 973.46 examples/s]Map:  28%|██▊       | 60781/217273 [01:07<02:50, 916.65 examples/s]Map:  28%|██▊       | 60806/217273 [01:08<02:55, 893.50 examples/s]Map:  28%|██▊       | 60545/217273 [01:06<02:46, 941.15 examples/s]Map:  28%|██▊       | 60879/217273 [01:08<02:47, 931.17 examples/s]Map:  28%|██▊       | 59846/217273 [01:06<02:41, 974.90 examples/s]Map:  28%|██▊       | 60898/217273 [01:08<02:54, 897.34 examples/s]Map:  28%|██▊       | 60644/217273 [01:06<02:44, 951.40 examples/s]Map:  28%|██▊       | 60974/217273 [01:08<02:47, 934.09 examples/s]Map:  28%|██▊       | 60992/217273 [01:08<02:52, 907.39 examples/s]Map:  28%|██▊       | 60750/217273 [01:06<02:39, 980.41 examples/s]Map:  28%|██▊       | 59991/217273 [01:06<02:42, 970.27 examples/s]Map:  28%|██▊       | 60853/217273 [01:06<02:37, 992.74 examples/s]Map:  28%|██▊       | 61094/217273 [01:08<03:19, 781.24 examples/s]Map:  28%|██▊       | 61092/217273 [01:08<03:28, 750.22 examples/s]Map:  28%|██▊       | 60954/217273 [01:06<02:37, 994.62 examples/s]Map:  28%|██▊       | 60101/217273 [01:06<03:08, 832.01 examples/s]Map:  28%|██▊       | 61188/217273 [01:08<03:10, 818.68 examples/s]Map:  28%|██▊       | 61181/217273 [01:08<03:19, 782.77 examples/s]Map:  28%|██▊       | 60200/217273 [01:06<03:01, 865.33 examples/s]Map:  28%|██▊       | 61284/217273 [01:08<03:02, 853.11 examples/s]Map:  28%|██▊       | 61268/217273 [01:08<03:14, 803.60 examples/s]Map:  28%|██▊       | 61085/217273 [01:06<03:17, 792.32 examples/s]Map:  28%|██▊       | 60327/217273 [01:06<03:03, 854.83 examples/s]Map:  28%|██▊       | 61360/217273 [01:08<03:07, 832.26 examples/s]Map:  28%|██▊       | 61415/217273 [01:08<03:02, 854.59 examples/s]Map:  28%|██▊       | 61194/217273 [01:06<03:01, 859.33 examples/s]Map:  28%|██▊       | 60424/217273 [01:06<02:58, 878.41 examples/s]Map:  28%|██▊       | 61450/217273 [01:09<03:03, 849.34 examples/s]Map:  28%|██▊       | 61511/217273 [01:08<02:57, 879.77 examples/s]Map:  28%|██▊       | 61300/217273 [01:07<02:51, 906.96 examples/s]Map:  28%|██▊       | 60525/217273 [01:06<02:52, 908.76 examples/s]Map:  28%|██▊       | 61544/217273 [01:09<02:59, 865.61 examples/s]Map:  28%|██▊       | 61608/217273 [01:08<02:52, 902.45 examples/s]Map:  28%|██▊       | 61404/217273 [01:07<02:46, 937.52 examples/s]Map:  28%|██▊       | 60622/217273 [01:07<02:50, 920.51 examples/s]Map:  28%|██▊       | 61637/217273 [01:09<02:56, 882.74 examples/s]Map:  28%|██▊       | 61706/217273 [01:09<02:48, 921.66 examples/s]Map:  28%|██▊       | 61732/217273 [01:09<02:53, 898.44 examples/s]Map:  28%|██▊       | 61547/217273 [01:07<02:45, 940.30 examples/s]Map:  28%|██▊       | 60763/217273 [01:07<02:49, 925.25 examples/s]Map:  28%|██▊       | 61854/217273 [01:09<02:45, 937.79 examples/s]Map:  28%|██▊       | 61830/217273 [01:09<02:48, 920.74 examples/s]Map:  28%|██▊       | 61645/217273 [01:07<02:44, 946.29 examples/s]Map:  28%|██▊       | 60869/217273 [01:07<02:43, 954.87 examples/s]Map:  28%|██▊       | 61745/217273 [01:07<02:42, 959.21 examples/s]Map:  29%|██▊       | 61996/217273 [01:09<02:45, 936.26 examples/s]Map:  29%|██▊       | 61964/217273 [01:09<02:51, 905.16 examples/s]Map:  28%|██▊       | 61844/217273 [01:07<02:41, 965.04 examples/s]Map:  28%|██▊       | 61000/217273 [01:07<03:13, 808.16 examples/s]Map:  29%|██▊       | 62091/217273 [01:09<03:15, 793.98 examples/s]Map:  29%|██▊       | 61950/217273 [01:07<02:37, 988.44 examples/s]Map:  28%|██▊       | 61097/217273 [01:07<03:05, 840.82 examples/s]Map:  29%|██▊       | 62088/217273 [01:09<03:26, 753.20 examples/s]Map:  29%|██▊       | 62180/217273 [01:09<03:11, 811.94 examples/s]Map:  28%|██▊       | 61198/217273 [01:07<02:57, 879.44 examples/s]Map:  29%|██▊       | 62182/217273 [01:09<03:15, 792.19 examples/s]Map:  29%|██▊       | 62270/217273 [01:09<03:06, 829.98 examples/s]Map:  29%|██▊       | 62098/217273 [01:07<03:07, 826.71 examples/s]Map:  28%|██▊       | 61296/217273 [01:07<02:52, 903.55 examples/s]Map:  29%|██▊       | 62271/217273 [01:10<03:10, 814.91 examples/s]Map:  29%|██▊       | 62358/217273 [01:09<03:04, 840.31 examples/s]Map:  29%|██▊       | 62200/217273 [01:08<02:58, 868.59 examples/s]Map:  28%|██▊       | 61398/217273 [01:07<02:47, 931.96 examples/s]Map:  29%|██▊       | 62367/217273 [01:10<03:03, 846.43 examples/s]Map:  29%|██▊       | 62444/217273 [01:09<03:04, 840.94 examples/s]Map:  29%|██▊       | 62294/217273 [01:08<02:55, 883.70 examples/s]Map:  28%|██▊       | 61535/217273 [01:08<02:49, 921.46 examples/s]Map:  29%|██▉       | 62483/217273 [01:10<03:09, 817.28 examples/s]Map:  29%|██▊       | 62392/217273 [01:08<02:51, 905.49 examples/s]Map:  29%|██▉       | 62572/217273 [01:10<03:03, 842.49 examples/s]Map:  28%|██▊       | 61637/217273 [01:08<02:44, 943.88 examples/s]Map:  29%|██▉       | 62574/217273 [01:10<03:04, 839.17 examples/s]Map:  29%|██▉       | 62493/217273 [01:08<02:46, 929.53 examples/s]Map:  29%|██▉       | 62669/217273 [01:10<02:57, 871.00 examples/s]Map:  28%|██▊       | 61738/217273 [01:08<02:42, 959.05 examples/s]Map:  29%|██▉       | 62661/217273 [01:10<03:02, 845.23 examples/s]Map:  29%|██▉       | 62598/217273 [01:08<02:41, 959.09 examples/s]Map:  29%|██▉       | 62759/217273 [01:10<02:56, 876.46 examples/s]Map:  28%|██▊       | 61843/217273 [01:08<02:38, 979.30 examples/s]Map:  29%|██▉       | 62699/217273 [01:08<02:39, 970.76 examples/s]Map:  29%|██▉       | 62790/217273 [01:10<03:02, 846.92 examples/s]Map:  29%|██▉       | 62891/217273 [01:10<02:56, 872.26 examples/s]Map:  29%|██▊       | 61946/217273 [01:08<02:36, 990.69 examples/s]Map:  29%|██▉       | 62879/217273 [01:10<03:00, 855.29 examples/s]Map:  29%|██▉       | 62839/217273 [01:08<02:41, 954.13 examples/s]Map:  29%|██▉       | 62979/217273 [01:10<02:56, 873.61 examples/s]Map:  29%|██▊       | 62048/217273 [01:08<03:08, 823.26 examples/s]Map:  29%|██▉       | 62943/217273 [01:08<02:38, 974.28 examples/s]Map:  29%|██▉       | 62998/217273 [01:10<03:06, 827.62 examples/s]Map:  29%|██▊       | 62154/217273 [01:08<02:56, 881.14 examples/s]Map:  29%|██▉       | 63087/217273 [01:10<03:31, 728.40 examples/s]Map:  29%|██▉       | 63047/217273 [01:08<03:12, 802.57 examples/s]Map:  29%|██▊       | 62256/217273 [01:08<02:49, 916.23 examples/s]Map:  29%|██▉       | 63177/217273 [01:10<03:21, 763.97 examples/s]Map:  29%|██▉       | 63086/217273 [01:11<03:41, 696.89 examples/s]Map:  29%|██▉       | 63148/217273 [01:09<03:01, 849.38 examples/s]Map:  29%|██▊       | 62353/217273 [01:08<02:46, 930.45 examples/s]Map:  29%|██▉       | 63268/217273 [01:10<03:13, 797.39 examples/s]Map:  29%|██▉       | 63173/217273 [01:11<03:30, 733.39 examples/s]Map:  29%|██▊       | 62454/217273 [01:09<02:42, 950.19 examples/s]Map:  29%|██▉       | 63251/217273 [01:09<02:52, 892.01 examples/s]Map:  29%|██▉       | 63363/217273 [01:11<03:04, 833.79 examples/s]Map:  29%|██▉       | 63256/217273 [01:11<03:23, 755.94 examples/s]Map:  29%|██▉       | 62552/217273 [01:09<02:41, 956.37 examples/s]Map:  29%|██▉       | 63346/217273 [01:09<02:50, 904.00 examples/s]Map:  29%|██▉       | 63455/217273 [01:11<03:00, 851.69 examples/s]Map:  29%|██▉       | 63349/217273 [01:11<03:12, 798.22 examples/s]Map:  29%|██▉       | 62652/217273 [01:09<02:39, 967.15 examples/s]Map:  29%|██▉       | 63435/217273 [01:11<03:09, 811.03 examples/s]Map:  29%|██▉       | 63488/217273 [01:09<02:48, 913.84 examples/s]Map:  29%|██▉       | 63587/217273 [01:11<02:59, 856.52 examples/s]Map:  29%|██▉       | 62756/217273 [01:09<02:37, 979.86 examples/s]Map:  29%|██▉       | 63525/217273 [01:11<03:04, 832.00 examples/s]Map:  29%|██▉       | 63589/217273 [01:09<02:45, 930.56 examples/s]Map:  29%|██▉       | 63714/217273 [01:11<03:00, 848.46 examples/s]Map:  29%|██▉       | 62894/217273 [01:09<02:42, 950.75 examples/s]Map:  29%|██▉       | 63684/217273 [01:09<02:44, 932.81 examples/s]Map:  29%|██▉       | 63644/217273 [01:11<03:08, 813.19 examples/s]Map:  29%|██▉       | 63809/217273 [01:11<02:56, 870.61 examples/s]Map:  29%|██▉       | 63784/217273 [01:09<02:41, 948.59 examples/s]Map:  29%|██▉       | 63738/217273 [01:11<03:02, 842.44 examples/s]Map:  29%|██▉       | 63900/217273 [01:11<02:54, 879.39 examples/s]Map:  29%|██▉       | 63000/217273 [01:09<03:11, 805.54 examples/s]Map:  29%|██▉       | 63885/217273 [01:09<02:39, 963.12 examples/s]Map:  29%|██▉       | 63826/217273 [01:11<03:00, 849.56 examples/s]Map:  29%|██▉       | 63992/217273 [01:11<02:53, 883.59 examples/s]Map:  29%|██▉       | 63101/217273 [01:09<03:01, 849.22 examples/s]Map:  29%|██▉       | 63205/217273 [01:09<02:52, 894.42 examples/s]Map:  29%|██▉       | 63953/217273 [01:12<03:02, 842.21 examples/s]Map:  29%|██▉       | 64000/217273 [01:10<03:13, 790.14 examples/s]Map:  29%|██▉       | 64095/217273 [01:11<03:23, 751.47 examples/s]Map:  29%|██▉       | 63305/217273 [01:10<02:47, 920.91 examples/s]Map:  30%|██▉       | 64101/217273 [01:10<03:02, 840.52 examples/s]Map:  30%|██▉       | 64186/217273 [01:12<03:14, 787.78 examples/s]Map:  29%|██▉       | 64047/217273 [01:12<03:36, 708.74 examples/s]Map:  30%|██▉       | 64211/217273 [01:10<02:48, 906.19 examples/s]Map:  29%|██▉       | 63435/217273 [01:10<02:51, 898.76 examples/s]Map:  30%|██▉       | 64281/217273 [01:12<03:05, 826.68 examples/s]Map:  30%|██▉       | 64136/217273 [01:12<03:24, 747.88 examples/s]Map:  30%|██▉       | 64317/217273 [01:10<02:41, 945.81 examples/s]Map:  29%|██▉       | 63542/217273 [01:10<02:43, 939.38 examples/s]Map:  30%|██▉       | 64379/217273 [01:12<02:57, 863.40 examples/s]Map:  30%|██▉       | 64227/217273 [01:12<03:15, 784.51 examples/s]Map:  30%|██▉       | 64423/217273 [01:10<02:36, 973.62 examples/s]Map:  29%|██▉       | 63640/217273 [01:10<02:42, 947.38 examples/s]Map:  30%|██▉       | 64480/217273 [01:12<02:49, 900.97 examples/s]Map:  30%|██▉       | 64317/217273 [01:12<03:08, 812.92 examples/s]Map:  30%|██▉       | 64526/217273 [01:10<02:34, 987.99 examples/s]Map:  29%|██▉       | 63744/217273 [01:10<02:38, 970.59 examples/s]Map:  30%|██▉       | 64576/217273 [01:12<02:47, 910.79 examples/s]Map:  30%|██▉       | 64408/217273 [01:12<03:02, 837.32 examples/s]Map:  30%|██▉       | 64629/217273 [01:10<02:33, 995.44 examples/s]Map:  29%|██▉       | 63845/217273 [01:10<02:36, 977.79 examples/s]Map:  30%|██▉       | 64674/217273 [01:12<02:44, 926.39 examples/s]Map:  30%|██▉       | 64498/217273 [01:12<02:59, 850.45 examples/s]Map:  29%|██▉       | 63948/217273 [01:10<02:34, 990.31 examples/s]Map:  30%|██▉       | 64782/217273 [01:10<02:32, 1000.93 examples/s]Map:  30%|██▉       | 64774/217273 [01:12<02:42, 941.32 examples/s]Map:  30%|██▉       | 64590/217273 [01:12<02:56, 867.05 examples/s]Map:  30%|██▉       | 64873/217273 [01:12<02:39, 952.92 examples/s]Map:  30%|██▉       | 64680/217273 [01:13<02:54, 873.85 examples/s]Map:  30%|██▉       | 64928/217273 [01:10<02:34, 986.32 examples/s] Map:  29%|██▉       | 64087/217273 [01:10<03:08, 810.93 examples/s]Map:  30%|██▉       | 64774/217273 [01:13<02:51, 889.17 examples/s]Map:  30%|██▉       | 64194/217273 [01:10<02:56, 869.50 examples/s]Map:  30%|██▉       | 64872/217273 [01:13<02:46, 913.44 examples/s]Map:  30%|██▉       | 65000/217273 [01:12<03:17, 772.76 examples/s]Map:  30%|██▉       | 65051/217273 [01:11<03:02, 834.60 examples/s]Map:  30%|██▉       | 64297/217273 [01:11<02:48, 907.44 examples/s]Map:  30%|██▉       | 64965/217273 [01:13<02:46, 914.36 examples/s]Map:  30%|██▉       | 65096/217273 [01:13<03:06, 814.08 examples/s]Map:  30%|██▉       | 65148/217273 [01:11<02:56, 862.89 examples/s]Map:  30%|██▉       | 64400/217273 [01:11<02:43, 936.53 examples/s]Map:  30%|███       | 65193/217273 [01:13<02:58, 851.26 examples/s]Map:  30%|███       | 65246/217273 [01:11<02:51, 888.80 examples/s]Map:  30%|██▉       | 64499/217273 [01:11<02:41, 947.96 examples/s]Map:  30%|███       | 65291/217273 [01:13<02:52, 881.56 examples/s]Map:  30%|██▉       | 65093/217273 [01:13<03:17, 769.26 examples/s]Map:  30%|███       | 65349/217273 [01:11<02:44, 923.56 examples/s]Map:  30%|██▉       | 64604/217273 [01:11<02:36, 972.84 examples/s]Map:  30%|███       | 65390/217273 [01:13<02:47, 909.20 examples/s]Map:  30%|███       | 65185/217273 [01:13<03:09, 803.82 examples/s]Map:  30%|███       | 65452/217273 [01:11<02:40, 947.65 examples/s]Map:  30%|██▉       | 64709/217273 [01:11<02:34, 989.01 examples/s]Map:  30%|███       | 65488/217273 [01:13<02:43, 925.54 examples/s]Map:  30%|███       | 65280/217273 [01:13<03:01, 838.71 examples/s]Map:  30%|███       | 65556/217273 [01:11<02:36, 970.95 examples/s]Map:  30%|███       | 65383/217273 [01:13<02:51, 885.25 examples/s]Map:  30%|███       | 65665/217273 [01:11<02:31, 1002.67 examples/s]Map:  30%|██▉       | 64854/217273 [01:11<02:36, 974.50 examples/s]Map:  30%|███       | 65628/217273 [01:13<02:44, 922.34 examples/s]Map:  30%|███       | 65475/217273 [01:13<02:50, 891.86 examples/s]Map:  30%|███       | 65769/217273 [01:11<02:29, 1011.18 examples/s]Map:  30%|██▉       | 64955/217273 [01:11<02:34, 983.12 examples/s]Map:  30%|███       | 65724/217273 [01:13<02:43, 928.98 examples/s]Map:  30%|███       | 65876/217273 [01:11<02:27, 1023.94 examples/s]Map:  30%|███       | 65614/217273 [01:14<02:48, 898.23 examples/s]Map:  30%|███       | 65859/217273 [01:13<02:45, 914.21 examples/s]Map:  30%|██▉       | 65102/217273 [01:11<03:00, 845.24 examples/s]Map:  30%|███       | 65955/217273 [01:13<02:43, 923.04 examples/s]Map:  30%|███       | 65750/217273 [01:14<02:48, 896.59 examples/s]Map:  30%|███       | 66000/217273 [01:12<03:00, 838.27 examples/s] Map:  30%|███       | 65210/217273 [01:12<02:49, 895.10 examples/s]Map:  30%|███       | 65844/217273 [01:14<02:47, 905.26 examples/s]Map:  30%|███       | 66092/217273 [01:12<02:56, 857.04 examples/s]Map:  30%|███       | 65310/217273 [01:12<02:45, 917.23 examples/s]Map:  30%|███       | 66086/217273 [01:14<03:13, 782.74 examples/s]Map:  30%|███       | 66188/217273 [01:12<02:52, 875.82 examples/s]Map:  30%|███       | 65978/217273 [01:14<02:48, 899.31 examples/s]Map:  30%|███       | 65441/217273 [01:12<02:49, 897.28 examples/s]Map:  30%|███       | 66178/217273 [01:14<03:06, 810.15 examples/s]Map:  31%|███       | 66287/217273 [01:12<02:46, 905.00 examples/s]Map:  30%|███       | 65535/217273 [01:12<02:47, 904.84 examples/s]Map:  31%|███       | 66269/217273 [01:14<03:01, 832.59 examples/s]Map:  31%|███       | 66387/217273 [01:12<02:42, 927.40 examples/s]Map:  30%|███       | 66097/217273 [01:14<03:13, 779.35 examples/s]Map:  30%|███       | 65635/217273 [01:12<02:43, 927.22 examples/s]Map:  31%|███       | 66362/217273 [01:14<02:56, 856.29 examples/s]Map:  31%|███       | 66489/217273 [01:12<02:38, 953.07 examples/s]Map:  30%|███       | 66195/217273 [01:14<03:03, 821.85 examples/s]Map:  31%|███       | 66451/217273 [01:14<02:55, 861.77 examples/s]Map:  31%|███       | 66595/217273 [01:12<02:33, 983.12 examples/s]Map:  30%|███       | 65774/217273 [01:12<02:44, 921.62 examples/s]Map:  31%|███       | 66289/217273 [01:14<02:58, 847.39 examples/s]Map:  31%|███       | 66548/217273 [01:14<02:49, 890.56 examples/s]Map:  31%|███       | 66704/217273 [01:12<02:28, 1011.57 examples/s]Map:  30%|███       | 65879/217273 [01:12<02:43, 925.99 examples/s]Map:  31%|███       | 66382/217273 [01:14<02:54, 866.81 examples/s]Map:  31%|███       | 66645/217273 [01:14<02:45, 910.37 examples/s]Map:  31%|███       | 66477/217273 [01:15<02:49, 887.95 examples/s]Map:  30%|███       | 65975/217273 [01:12<02:42, 931.44 examples/s]Map:  31%|███       | 66863/217273 [01:13<02:26, 1027.09 examples/s]Map:  31%|███       | 66739/217273 [01:14<02:44, 914.92 examples/s]Map:  31%|███       | 66570/217273 [01:15<02:48, 896.09 examples/s]Map:  31%|███       | 66834/217273 [01:14<02:43, 922.93 examples/s]Map:  31%|███       | 66663/217273 [01:15<02:46, 903.66 examples/s]Map:  30%|███       | 66098/217273 [01:13<03:11, 790.76 examples/s]Map:  31%|███       | 67000/217273 [01:13<02:54, 860.73 examples/s] Map:  31%|███       | 66930/217273 [01:15<02:41, 930.27 examples/s]Map:  31%|███       | 66761/217273 [01:15<02:43, 918.23 examples/s]Map:  30%|███       | 66195/217273 [01:13<03:01, 830.15 examples/s]Map:  31%|███       | 67105/217273 [01:13<02:46, 900.70 examples/s]Map:  31%|███       | 66284/217273 [01:13<02:59, 841.74 examples/s]Map:  31%|███       | 66856/217273 [01:15<02:43, 920.91 examples/s]Map:  31%|███       | 67204/217273 [01:13<02:43, 919.72 examples/s]Map:  31%|███       | 67047/217273 [01:15<03:15, 766.67 examples/s]Map:  31%|███       | 66381/217273 [01:13<02:52, 873.66 examples/s]Map:  31%|███       | 66952/217273 [01:15<02:41, 930.76 examples/s]Map:  31%|███       | 67302/217273 [01:13<02:40, 933.57 examples/s]Map:  31%|███       | 67145/217273 [01:15<03:03, 816.19 examples/s]Map:  31%|███       | 66477/217273 [01:13<02:48, 896.21 examples/s]Map:  31%|███       | 67401/217273 [01:13<02:38, 947.37 examples/s]Map:  31%|███       | 67242/217273 [01:15<02:55, 852.50 examples/s]Map:  31%|███       | 66570/217273 [01:13<02:47, 902.11 examples/s]Map:  31%|███       | 67084/217273 [01:15<03:17, 759.72 examples/s]Map:  31%|███       | 67536/217273 [01:13<02:41, 927.20 examples/s]Map:  31%|███       | 67377/217273 [01:15<02:53, 864.45 examples/s]Map:  31%|███       | 67170/217273 [01:15<03:12, 780.66 examples/s]Map:  31%|███       | 66709/217273 [01:13<02:45, 908.21 examples/s]Map:  31%|███       | 67632/217273 [01:13<02:40, 933.37 examples/s]Map:  31%|███       | 67476/217273 [01:15<02:47, 894.26 examples/s]Map:  31%|███       | 67270/217273 [01:16<03:00, 830.12 examples/s]Map:  31%|███       | 66806/217273 [01:13<02:43, 920.97 examples/s]Map:  31%|███       | 67734/217273 [01:14<02:36, 952.66 examples/s]Map:  31%|███       | 67568/217273 [01:15<02:46, 899.81 examples/s]Map:  31%|███       | 67364/217273 [01:16<02:54, 857.50 examples/s]Map:  31%|███       | 66909/217273 [01:13<02:39, 944.23 examples/s]Map:  31%|███       | 67837/217273 [01:14<02:33, 970.78 examples/s]Map:  31%|███       | 67460/217273 [01:16<02:49, 883.16 examples/s]Map:  31%|███       | 67706/217273 [01:15<02:45, 905.88 examples/s]Map:  31%|███▏      | 67942/217273 [01:14<02:31, 988.31 examples/s]Map:  31%|███       | 67553/217273 [01:16<02:47, 895.16 examples/s]Map:  31%|███       | 67049/217273 [01:14<03:03, 818.99 examples/s]Map:  31%|███       | 67799/217273 [01:16<02:44, 908.57 examples/s]Map:  31%|███       | 67647/217273 [01:16<02:45, 905.63 examples/s]Map:  31%|███▏      | 68047/217273 [01:14<03:05, 804.91 examples/s]Map:  31%|███       | 67144/217273 [01:14<02:57, 847.44 examples/s]Map:  31%|███       | 67896/217273 [01:16<02:41, 923.39 examples/s]Map:  31%|███▏      | 68150/217273 [01:14<02:53, 858.09 examples/s]Map:  31%|███       | 67240/217273 [01:14<02:51, 873.45 examples/s]Map:  31%|███▏      | 67992/217273 [01:16<02:40, 931.86 examples/s]Map:  31%|███       | 67784/217273 [01:16<02:45, 905.13 examples/s]Map:  31%|███▏      | 68249/217273 [01:14<02:47, 890.76 examples/s]Map:  31%|███       | 67342/217273 [01:14<02:44, 908.86 examples/s]Map:  31%|███▏      | 67917/217273 [01:16<02:46, 895.05 examples/s]Map:  31%|███▏      | 68093/217273 [01:16<03:12, 775.88 examples/s]Map:  31%|███▏      | 68352/217273 [01:14<02:41, 923.30 examples/s]Map:  31%|███       | 67447/217273 [01:14<02:38, 943.12 examples/s]Map:  31%|███▏      | 68183/217273 [01:16<03:05, 804.16 examples/s]Map:  32%|███▏      | 68449/217273 [01:14<02:39, 934.08 examples/s]Map:  31%|███       | 67546/217273 [01:14<02:37, 953.06 examples/s]Map:  31%|███▏      | 68048/217273 [01:16<03:11, 777.68 examples/s]Map:  31%|███▏      | 68274/217273 [01:16<02:59, 828.69 examples/s]Map:  31%|███       | 67650/217273 [01:14<02:33, 975.92 examples/s]Map:  32%|███▏      | 68593/217273 [01:14<02:37, 941.56 examples/s]Map:  31%|███▏      | 68141/217273 [01:17<03:04, 809.06 examples/s]Map:  31%|███▏      | 68369/217273 [01:16<02:52, 861.20 examples/s]Map:  32%|███▏      | 68696/217273 [01:15<02:34, 962.32 examples/s]Map:  31%|███       | 67800/217273 [01:14<02:31, 984.24 examples/s]Map:  31%|███▏      | 68237/217273 [01:17<02:56, 843.74 examples/s]Map:  32%|███▏      | 68468/217273 [01:16<02:46, 895.50 examples/s]Map:  32%|███▏      | 68829/217273 [01:15<02:39, 931.77 examples/s]Map:  31%|███▏      | 67935/217273 [01:15<02:37, 950.58 examples/s]Map:  31%|███▏      | 68364/217273 [01:17<02:57, 841.12 examples/s]Map:  32%|███▏      | 68596/217273 [01:17<02:49, 874.77 examples/s]Map:  32%|███▏      | 68934/217273 [01:15<02:34, 960.67 examples/s]Map:  32%|███▏      | 68457/217273 [01:17<02:52, 860.47 examples/s]Map:  32%|███▏      | 68691/217273 [01:17<02:47, 889.69 examples/s]Map:  31%|███▏      | 68049/217273 [01:15<03:01, 822.81 examples/s]Map:  32%|███▏      | 68553/217273 [01:17<02:48, 883.39 examples/s]Map:  32%|███▏      | 68787/217273 [01:17<02:43, 906.25 examples/s]Map:  31%|███▏      | 68150/217273 [01:15<02:52, 863.66 examples/s]Map:  32%|███▏      | 69050/217273 [01:15<03:04, 805.22 examples/s]Map:  32%|███▏      | 68652/217273 [01:17<02:44, 905.44 examples/s]Map:  32%|███▏      | 68887/217273 [01:17<02:39, 929.18 examples/s]Map:  31%|███▏      | 68249/217273 [01:15<02:47, 891.72 examples/s]Map:  32%|███▏      | 69156/217273 [01:15<02:51, 861.75 examples/s]Map:  32%|███▏      | 68748/217273 [01:17<02:41, 917.44 examples/s]Map:  32%|███▏      | 68989/217273 [01:17<02:35, 952.39 examples/s]Map:  31%|███▏      | 68347/217273 [01:15<02:43, 913.24 examples/s]Map:  32%|███▏      | 69254/217273 [01:15<02:46, 888.30 examples/s]Map:  32%|███▏      | 68841/217273 [01:17<02:41, 918.40 examples/s]Map:  32%|███▏      | 68448/217273 [01:15<02:39, 934.78 examples/s]Map:  32%|███▏      | 69360/217273 [01:15<02:38, 932.14 examples/s]Map:  32%|███▏      | 69100/217273 [01:17<03:03, 805.86 examples/s]Map:  32%|███▏      | 68937/217273 [01:17<02:40, 925.57 examples/s]Map:  32%|███▏      | 68554/217273 [01:15<02:34, 963.90 examples/s]Map:  32%|███▏      | 69464/217273 [01:15<02:34, 958.58 examples/s]Map:  32%|███▏      | 69204/217273 [01:17<02:51, 861.69 examples/s]Map:  32%|███▏      | 68657/217273 [01:15<02:31, 980.83 examples/s]Map:  32%|███▏      | 69303/217273 [01:17<02:45, 892.87 examples/s]Map:  32%|███▏      | 69044/217273 [01:18<03:11, 774.00 examples/s]Map:  32%|███▏      | 69603/217273 [01:16<02:36, 943.98 examples/s]Map:  32%|███▏      | 69402/217273 [01:17<02:41, 918.29 examples/s]Map:  32%|███▏      | 69141/217273 [01:18<03:00, 822.08 examples/s]Map:  32%|███▏      | 68810/217273 [01:16<02:30, 986.73 examples/s]Map:  32%|███▏      | 69703/217273 [01:16<02:34, 954.78 examples/s]Map:  32%|███▏      | 69498/217273 [01:18<02:39, 926.20 examples/s]Map:  32%|███▏      | 69241/217273 [01:18<02:51, 864.68 examples/s]Map:  32%|███▏      | 68910/217273 [01:16<02:30, 988.82 examples/s]Map:  32%|███▏      | 69808/217273 [01:16<02:30, 977.27 examples/s]Map:  32%|███▏      | 69601/217273 [01:18<02:35, 951.97 examples/s]Map:  32%|███▏      | 69336/217273 [01:18<02:46, 887.27 examples/s]Map:  32%|███▏      | 69911/217273 [01:16<02:29, 988.86 examples/s]Map:  32%|███▏      | 69700/217273 [01:18<02:33, 959.64 examples/s]Map:  32%|███▏      | 69429/217273 [01:18<02:44, 896.78 examples/s]Map:  32%|███▏      | 69047/217273 [01:16<02:55, 842.70 examples/s]Map:  32%|███▏      | 69831/217273 [01:18<02:39, 923.14 examples/s]Map:  32%|███▏      | 69566/217273 [01:18<02:44, 898.20 examples/s]Map:  32%|███▏      | 70044/217273 [01:16<03:06, 787.54 examples/s]Map:  32%|███▏      | 69186/217273 [01:16<02:51, 865.62 examples/s]Map:  32%|███▏      | 69930/217273 [01:18<02:36, 940.16 examples/s]Map:  32%|███▏      | 69659/217273 [01:18<02:43, 903.89 examples/s]Map:  32%|███▏      | 70147/217273 [01:16<02:54, 841.25 examples/s]Map:  32%|███▏      | 69284/217273 [01:16<02:46, 891.28 examples/s]Map:  32%|███▏      | 70245/217273 [01:16<02:48, 873.78 examples/s]Map:  32%|███▏      | 69384/217273 [01:16<02:41, 916.54 examples/s]Map:  32%|███▏      | 69800/217273 [01:18<02:41, 912.77 examples/s]Map:  32%|███▏      | 70044/217273 [01:18<03:04, 796.76 examples/s]Map:  32%|███▏      | 70348/217273 [01:16<02:40, 913.09 examples/s]Map:  32%|███▏      | 69481/217273 [01:16<02:39, 926.93 examples/s]Map:  32%|███▏      | 69893/217273 [01:19<02:40, 916.50 examples/s]Map:  32%|███▏      | 70143/217273 [01:18<02:55, 839.66 examples/s]Map:  32%|███▏      | 70449/217273 [01:17<02:36, 938.10 examples/s]Map:  32%|███▏      | 69583/217273 [01:16<02:36, 946.60 examples/s]Map:  32%|███▏      | 69989/217273 [01:19<02:39, 924.66 examples/s]Map:  32%|███▏      | 70244/217273 [01:18<02:47, 879.96 examples/s]Map:  32%|███▏      | 70554/217273 [01:17<02:31, 965.74 examples/s]Map:  32%|███▏      | 69689/217273 [01:16<02:31, 975.82 examples/s]Map:  32%|███▏      | 70344/217273 [01:18<02:41, 908.08 examples/s]Map:  32%|███▏      | 69790/217273 [01:17<02:29, 983.75 examples/s]Map:  32%|███▏      | 70095/217273 [01:19<03:08, 779.88 examples/s]Map:  33%|███▎      | 70700/217273 [01:17<02:31, 967.07 examples/s]Map:  32%|███▏      | 70447/217273 [01:19<02:36, 938.88 examples/s]Map:  32%|███▏      | 69891/217273 [01:17<02:29, 986.82 examples/s]Map:  32%|███▏      | 70185/217273 [01:19<03:02, 807.84 examples/s]Map:  32%|███▏      | 70548/217273 [01:19<02:33, 953.50 examples/s]Map:  33%|███▎      | 70848/217273 [01:17<02:30, 970.05 examples/s]Map:  32%|███▏      | 69996/217273 [01:17<02:26, 1002.04 examples/s]Map:  32%|███▏      | 70284/217273 [01:19<02:52, 852.51 examples/s]Map:  33%|███▎      | 70647/217273 [01:19<02:32, 962.44 examples/s]Map:  33%|███▎      | 70948/217273 [01:17<02:29, 975.54 examples/s]Map:  32%|███▏      | 70382/217273 [01:19<02:45, 885.12 examples/s]Map:  33%|███▎      | 70745/217273 [01:19<02:31, 965.41 examples/s]Map:  32%|███▏      | 70100/217273 [01:17<02:58, 826.43 examples/s] Map:  32%|███▏      | 70483/217273 [01:19<02:40, 915.78 examples/s]Map:  33%|███▎      | 70848/217273 [01:19<02:30, 973.89 examples/s]Map:  32%|███▏      | 70205/217273 [01:17<02:46, 881.56 examples/s]Map:  33%|███▎      | 71084/217273 [01:17<03:04, 793.32 examples/s]Map:  33%|███▎      | 70623/217273 [01:19<02:39, 919.78 examples/s]Map:  32%|███▏      | 70301/217273 [01:17<02:43, 900.98 examples/s]Map:  33%|███▎      | 71180/217273 [01:17<02:56, 829.07 examples/s]Map:  33%|███▎      | 70986/217273 [01:19<02:34, 949.22 examples/s]Map:  32%|███▏      | 70404/217273 [01:17<02:37, 931.06 examples/s]Map:  33%|███▎      | 70763/217273 [01:19<02:39, 920.81 examples/s]Map:  33%|███▎      | 71279/217273 [01:17<02:48, 866.18 examples/s]Map:  32%|███▏      | 70503/217273 [01:17<02:35, 945.31 examples/s]Map:  33%|███▎      | 71100/217273 [01:19<02:59, 815.04 examples/s]Map:  33%|███▎      | 70864/217273 [01:20<02:35, 941.63 examples/s]Map:  33%|███▎      | 71374/217273 [01:18<02:45, 882.20 examples/s]Map:  33%|███▎      | 71199/217273 [01:19<02:50, 854.53 examples/s]Map:  33%|███▎      | 70964/217273 [01:20<02:33, 953.43 examples/s]Map:  33%|███▎      | 71471/217273 [01:18<02:41, 900.59 examples/s]Map:  33%|███▎      | 70648/217273 [01:18<02:34, 949.56 examples/s]Map:  33%|███▎      | 71300/217273 [01:20<02:44, 890.04 examples/s]Map:  33%|███▎      | 71569/217273 [01:18<02:38, 918.67 examples/s]Map:  33%|███▎      | 70747/217273 [01:18<02:32, 958.21 examples/s]Map:  33%|███▎      | 71405/217273 [01:20<02:36, 930.96 examples/s]Map:  33%|███▎      | 71097/217273 [01:20<02:59, 816.62 examples/s]Map:  33%|███▎      | 71666/217273 [01:18<02:36, 929.79 examples/s]Map:  33%|███▎      | 70847/217273 [01:18<02:31, 967.58 examples/s]Map:  33%|███▎      | 71504/217273 [01:20<02:34, 944.50 examples/s]Map:  33%|███▎      | 71195/217273 [01:20<02:51, 852.72 examples/s]Map:  33%|███▎      | 71766/217273 [01:18<02:33, 945.13 examples/s]Map:  33%|███▎      | 70945/217273 [01:18<02:30, 970.30 examples/s]Map:  33%|███▎      | 71606/217273 [01:20<02:31, 963.88 examples/s]Map:  33%|███▎      | 71295/217273 [01:20<02:44, 885.99 examples/s]Map:  33%|███▎      | 71869/217273 [01:18<02:30, 966.80 examples/s]Map:  33%|███▎      | 71055/217273 [01:18<02:59, 815.57 examples/s]Map:  33%|███▎      | 71394/217273 [01:20<02:39, 911.86 examples/s]Map:  33%|███▎      | 71968/217273 [01:18<02:29, 970.07 examples/s]Map:  33%|███▎      | 71756/217273 [01:20<02:29, 972.12 examples/s]Map:  33%|███▎      | 71157/217273 [01:18<02:48, 865.93 examples/s]Map:  33%|███▎      | 71499/217273 [01:20<02:33, 946.64 examples/s]Map:  33%|███▎      | 71855/217273 [01:20<02:29, 974.13 examples/s]Map:  33%|███▎      | 71255/217273 [01:18<02:43, 892.26 examples/s]Map:  33%|███▎      | 72103/217273 [01:18<02:58, 812.45 examples/s]Map:  33%|███▎      | 71955/217273 [01:20<02:28, 978.74 examples/s]Map:  33%|███▎      | 71645/217273 [01:20<02:32, 952.02 examples/s]Map:  33%|███▎      | 71358/217273 [01:18<02:37, 927.95 examples/s]Map:  33%|███▎      | 72200/217273 [01:18<02:50, 850.05 examples/s]Map:  33%|███▎      | 71455/217273 [01:18<02:35, 935.28 examples/s]Map:  33%|███▎      | 71787/217273 [01:21<02:34, 943.88 examples/s]Map:  33%|███▎      | 72301/217273 [01:19<02:43, 888.50 examples/s]Map:  33%|███▎      | 72096/217273 [01:20<02:58, 811.30 examples/s]Map:  33%|███▎      | 71558/217273 [01:19<02:31, 959.21 examples/s]Map:  33%|███▎      | 71887/217273 [01:21<02:32, 954.83 examples/s]Map:  33%|███▎      | 72399/217273 [01:19<02:39, 909.06 examples/s]Map:  33%|███▎      | 72193/217273 [01:21<02:51, 845.97 examples/s]Map:  33%|███▎      | 71664/217273 [01:19<02:28, 979.64 examples/s]Map:  33%|███▎      | 72293/217273 [01:21<02:44, 882.98 examples/s]Map:  33%|███▎      | 72544/217273 [01:19<02:36, 925.27 examples/s]Map:  33%|███▎      | 72000/217273 [01:21<02:59, 809.83 examples/s]Map:  33%|███▎      | 71806/217273 [01:19<02:31, 963.21 examples/s]Map:  33%|███▎      | 72394/217273 [01:21<02:38, 913.69 examples/s]Map:  33%|███▎      | 72641/217273 [01:19<02:34, 935.03 examples/s]Map:  33%|███▎      | 72096/217273 [01:21<02:52, 843.70 examples/s]Map:  33%|███▎      | 72503/217273 [01:21<02:31, 956.57 examples/s]Map:  33%|███▎      | 72737/217273 [01:19<02:33, 938.97 examples/s]Map:  33%|███▎      | 72197/217273 [01:21<02:44, 882.12 examples/s]Map:  33%|███▎      | 71952/217273 [01:19<02:30, 963.67 examples/s]Map:  33%|███▎      | 72609/217273 [01:21<02:26, 984.41 examples/s]Map:  34%|███▎      | 72846/217273 [01:19<02:27, 976.07 examples/s]Map:  33%|███▎      | 72298/217273 [01:21<02:39, 911.66 examples/s]Map:  33%|███▎      | 72398/217273 [01:21<02:35, 934.47 examples/s]Map:  33%|███▎      | 72756/217273 [01:21<02:28, 975.33 examples/s]Map:  33%|███▎      | 72100/217273 [01:19<02:52, 840.16 examples/s]Map:  34%|███▎      | 72995/217273 [01:19<02:27, 979.39 examples/s]Map:  33%|███▎      | 72497/217273 [01:21<02:32, 948.36 examples/s]Map:  33%|███▎      | 72201/217273 [01:19<02:45, 875.97 examples/s]Map:  34%|███▎      | 72909/217273 [01:21<02:26, 987.76 examples/s]Map:  33%|███▎      | 72595/217273 [01:22<02:32, 950.80 examples/s]Map:  34%|███▎      | 73103/217273 [01:19<02:55, 820.86 examples/s]Map:  33%|███▎      | 72299/217273 [01:19<02:41, 898.69 examples/s]Map:  34%|███▎      | 73198/217273 [01:20<02:49, 849.83 examples/s]Map:  33%|███▎      | 72402/217273 [01:19<02:35, 929.65 examples/s]Map:  33%|███▎      | 72741/217273 [01:22<02:31, 955.83 examples/s]Map:  34%|███▎      | 73048/217273 [01:21<02:47, 862.11 examples/s]Map:  34%|███▎      | 73293/217273 [01:20<02:44, 873.01 examples/s]Map:  33%|███▎      | 72499/217273 [01:20<02:34, 937.52 examples/s]Map:  34%|███▎      | 73146/217273 [01:22<02:42, 885.42 examples/s]Map:  34%|███▎      | 72881/217273 [01:22<02:32, 946.46 examples/s]Map:  34%|███▍      | 73395/217273 [01:20<02:38, 906.97 examples/s]Map:  33%|███▎      | 72601/217273 [01:20<02:31, 955.36 examples/s]Map:  34%|��██▎      | 73244/217273 [01:22<02:39, 904.71 examples/s]Map:  34%|███▍      | 73490/217273 [01:20<02:37, 915.27 examples/s]Map:  33%|███▎      | 72699/217273 [01:20<02:30, 957.95 examples/s]Map:  34%|███▍      | 73346/217273 [01:22<02:34, 930.82 examples/s]Map:  34%|███▎      | 73000/217273 [01:22<02:59, 804.89 examples/s]Map:  34%|███▎      | 72799/217273 [01:20<02:29, 967.21 examples/s]Map:  34%|███▍      | 73631/217273 [01:20<02:35, 920.90 examples/s]Map:  34%|███▍      | 73453/217273 [01:22<02:29, 964.48 examples/s]Map:  34%|███▎      | 73095/217273 [01:22<02:52, 834.91 examples/s]Map:  34%|███▎      | 72902/217273 [01:20<02:27, 978.14 examples/s]Map:  34%|███▍      | 73735/217273 [01:20<02:31, 947.89 examples/s]Map:  34%|███▍      | 73552/217273 [01:22<02:28, 969.81 examples/s]Map:  34%|███▎      | 73198/217273 [01:22<02:43, 880.11 examples/s]Map:  34%|███▍      | 73840/217273 [01:20<02:28, 968.63 examples/s]Map:  34%|███▎      | 73299/217273 [01:22<02:38, 911.19 examples/s]Map:  34%|███▍      | 73693/217273 [01:22<02:30, 952.21 examples/s]Map:  34%|███▎      | 73050/217273 [01:20<02:53, 830.46 examples/s]Map:  34%|███▍      | 73394/217273 [01:22<02:36, 917.35 examples/s]Map:  34%|███▍      | 73983/217273 [01:20<02:28, 962.30 examples/s]Map:  34%|███▍      | 73793/217273 [01:22<02:29, 961.80 examples/s]Map:  34%|███▎      | 73151/217273 [01:20<02:45, 869.32 examples/s]Map:  34%|███▍      | 73495/217273 [01:23<02:33, 939.06 examples/s]Map:  34%|███▎      | 73244/217273 [01:20<02:43, 882.51 examples/s]Map:  34%|███▍      | 73934/217273 [01:22<02:30, 952.03 examples/s]Map:  34%|███▍      | 74099/217273 [01:21<02:57, 805.93 examples/s]Map:  34%|███▍      | 73350/217273 [01:20<02:35, 927.26 examples/s]Map:  34%|███▍      | 73641/217273 [01:23<02:31, 946.95 examples/s]Map:  34%|███▍      | 74199/217273 [01:21<02:48, 847.94 examples/s]Map:  34%|███▍      | 73450/217273 [01:21<02:32, 944.59 examples/s]Map:  34%|███▍      | 73738/217273 [01:23<02:31, 950.38 examples/s]Map:  34%|███▍      | 74047/217273 [01:23<02:55, 813.88 examples/s]Map:  34%|███▍      | 74300/217273 [01:21<02:41, 885.55 examples/s]Map:  34%|███▍      | 73551/217273 [01:21<02:29, 958.56 examples/s]Map:  34%|███▍      | 73838/217273 [01:23<02:29, 959.75 examples/s]Map:  34%|███▍      | 74143/217273 [01:23<02:49, 845.02 examples/s]Map:  34%|███▍      | 74431/217273 [01:21<02:42, 878.41 examples/s]Map:  34%|███▍      | 73689/217273 [01:21<02:32, 939.71 examples/s]Map:  34%|███▍      | 73976/217273 [01:23<02:32, 939.37 examples/s]Map:  34%|███▍      | 74265/217273 [01:23<02:52, 830.63 examples/s]Map:  34%|███▍      | 74526/217273 [01:21<02:39, 892.58 examples/s]Map:  34%|███▍      | 73787/217273 [01:21<02:31, 949.41 examples/s]Map:  34%|███▍      | 74357/217273 [01:23<02:48, 848.79 examples/s]Map:  34%|███▍      | 74625/217273 [01:21<02:35, 915.61 examples/s]Map:  34%|███▍      | 74087/217273 [01:23<02:59, 798.17 examples/s]Map:  34%|███▍      | 73887/217273 [01:21<02:29, 960.09 examples/s]Map:  34%|███▍      | 74447/217273 [01:23<02:46, 859.66 examples/s]Map:  34%|███▍      | 74724/217273 [01:21<02:32, 933.61 examples/s]Map:  34%|███▍      | 74191/217273 [01:23<02:48, 849.98 examples/s]Map:  34%|███▍      | 73987/217273 [01:21<02:28, 967.50 examples/s]Map:  34%|███▍      | 74542/217273 [01:23<02:41, 881.62 examples/s]Map:  34%|███▍      | 74293/217273 [01:23<02:40, 890.42 examples/s]Map:  34%|███▍      | 74852/217273 [01:21<02:38, 899.56 examples/s]Map:  34%|███▍      | 74637/217273 [01:23<02:38, 897.99 examples/s]Map:  34%|███▍      | 74104/217273 [01:21<02:53, 824.93 examples/s]Map:  34%|███▍      | 74395/217273 [01:24<02:35, 920.06 examples/s]Map:  34%|███▍      | 74950/217273 [01:21<02:34, 919.52 examples/s]Map:  34%|███▍      | 74731/217273 [01:23<02:37, 907.02 examples/s]Map:  34%|███▍      | 74204/217273 [01:21<02:45, 864.06 examples/s]Map:  34%|███▍      | 74492/217273 [01:24<02:33, 931.66 examples/s]Map:  34%|███▍      | 74827/217273 [01:23<02:35, 918.88 examples/s]Map:  34%|███▍      | 74302/217273 [01:22<02:40, 890.74 examples/s]Map:  34%|███▍      | 74591/217273 [01:24<02:30, 946.29 examples/s]Map:  35%|███▍      | 75050/217273 [01:22<03:05, 768.41 examples/s]Map:  34%|███▍      | 74958/217273 [01:24<02:38, 899.06 examples/s]Map:  34%|███▍      | 74398/217273 [01:22<02:37, 907.75 examples/s]Map:  35%|███▍      | 75142/217273 [01:22<02:56, 803.99 examples/s]Map:  34%|███▍      | 74695/217273 [01:24<02:27, 969.12 examples/s]Map:  34%|███▍      | 74497/217273 [01:22<02:33, 927.49 examples/s]Map:  35%|███▍      | 75243/217273 [01:22<02:46, 853.33 examples/s]Map:  34%|███▍      | 74795/217273 [01:24<02:26, 974.87 examples/s]Map:  35%|███▍      | 75094/217273 [01:24<03:02, 777.59 examples/s]Map:  34%|███▍      | 74594/217273 [01:22<02:32, 935.59 examples/s]Map:  35%|███▍      | 75340/217273 [01:22<02:40, 881.88 examples/s]Map:  34%|███▍      | 74942/217273 [01:24<02:26, 972.76 examples/s]Map:  35%|███▍      | 75189/217273 [01:24<02:54, 815.24 examples/s]Map:  34%|███▍      | 74696/217273 [01:22<02:28, 957.93 examples/s]Map:  35%|███▍      | 75435/217273 [01:22<02:37, 898.20 examples/s]Map:  35%|███▍      | 75285/217273 [01:24<02:47, 848.55 examples/s]Map:  34%|███▍      | 74796/217273 [01:22<02:27, 965.68 examples/s]Map:  35%|███▍      | 75536/217273 [01:22<02:33, 925.79 examples/s]Map:  35%|███▍      | 75047/217273 [01:24<02:52, 825.01 examples/s]Map:  35%|███▍      | 75134/217273 [01:24<02:50, 833.65 examples/s]Map:  35%|███▍      | 75416/217273 [01:24<02:46, 852.92 examples/s]Map:  34%|███▍      | 74930/217273 [01:22<02:32, 935.07 examples/s]Map:  35%|███▍      | 75671/217273 [01:22<02:35, 913.35 examples/s]Map:  35%|███▍      | 75230/217273 [01:24<02:44, 862.69 examples/s]Map:  35%|███▍      | 75521/217273 [01:24<02:38, 894.63 examples/s]Map:  35%|███▍      | 75767/217273 [01:22<02:33, 924.78 examples/s]Map:  35%|███▍      | 75329/217273 [01:25<02:38, 895.11 examples/s]Map:  35%|███▍      | 75047/217273 [01:22<02:58, 798.24 examples/s]Map:  35%|███▍      | 75871/217273 [01:23<02:28, 955.13 examples/s]Map:  35%|███▍      | 75662/217273 [01:24<02:35, 908.72 examples/s]Map:  35%|███▍      | 75430/217273 [01:25<02:33, 923.73 examples/s]Map:  35%|███▍      | 75147/217273 [01:22<02:48, 843.20 examples/s]Map:  35%|███▍      | 75763/217273 [01:24<02:32, 929.81 examples/s]Map:  35%|███▍      | 75529/217273 [01:25<02:31, 937.15 examples/s]Map:  35%|███▍      | 75246/217273 [01:23<02:41, 878.89 examples/s]Map:  35%|███▍      | 76000/217273 [01:23<02:58, 790.67 examples/s]Map:  35%|███▍      | 75864/217273 [01:25<02:29, 948.89 examples/s]Map:  35%|███▍      | 75627/217273 [01:25<02:29, 945.84 examples/s]Map:  35%|███▍      | 75345/217273 [01:23<02:38, 895.72 examples/s]Map:  35%|███▌      | 76129/217273 [01:23<02:53, 811.73 examples/s]Map:  35%|███▍      | 75730/217273 [01:25<02:26, 967.80 examples/s]Map:  35%|███▍      | 75448/217273 [01:23<02:32, 931.68 examples/s]Map:  35%|███▍      | 76000/217273 [01:25<02:54, 811.60 examples/s]Map:  35%|███▌      | 76225/217273 [01:23<02:47, 844.30 examples/s]Map:  35%|███▍      | 75832/217273 [01:25<02:24, 979.93 examples/s]Map:  35%|███▍      | 75548/217273 [01:23<02:29, 948.70 examples/s]Map:  35%|███▌      | 76098/217273 [01:25<02:46, 849.45 examples/s]Map:  35%|███▌      | 76327/217273 [01:23<02:39, 885.65 examples/s]Map:  35%|███▍      | 75646/217273 [01:23<02:28, 954.78 examples/s]Map:  35%|███▍      | 75966/217273 [01:25<02:30, 941.37 examples/s]Map:  35%|███▌      | 76206/217273 [01:25<02:36, 904.13 examples/s]Map:  35%|███▌      | 76430/217273 [01:23<02:33, 919.25 examples/s]Map:  35%|███▍      | 75749/217273 [01:23<02:25, 974.43 examples/s]Map:  35%|███▌      | 76304/217273 [01:25<02:32, 922.13 examples/s]Map:  35%|███▌      | 76531/217273 [01:23<02:29, 940.80 examples/s]Map:  35%|███▍      | 75851/217273 [01:23<02:23, 983.76 examples/s]Map:  35%|███▌      | 76093/217273 [01:25<02:56, 801.06 examples/s]Map:  35%|███▌      | 76400/217273 [01:25<02:31, 929.17 examples/s]Map:  35%|███▌      | 76636/217273 [01:23<02:25, 967.99 examples/s]Map:  35%|███▌      | 76192/217273 [01:26<02:47, 843.40 examples/s]Map:  35%|███▍      | 75992/217273 [01:23<02:26, 963.12 examples/s]Map:  35%|███▌      | 76499/217273 [01:25<02:29, 942.49 examples/s]Map:  35%|███▌      | 76772/217273 [01:24<02:30, 936.61 examples/s]Map:  35%|███▌      | 76316/217273 [01:26<02:48, 835.64 examples/s]Map:  35%|███▌      | 76625/217273 [01:25<02:36, 901.24 examples/s]Map:  35%|███▌      | 76911/217273 [01:24<02:30, 930.32 examples/s]Map:  35%|███▌      | 76407/217273 [01:26<02:45, 850.41 examples/s]Map:  35%|███▌      | 76133/217273 [01:24<03:02, 773.41 examples/s]Map:  35%|███▌      | 76720/217273 [01:26<02:34, 910.09 examples/s]Map:  35%|███▌      | 76507/217273 [01:26<02:38, 887.22 examples/s]Map:  35%|███▌      | 76234/217273 [01:24<02:51, 823.08 examples/s]Map:  35%|███▌      | 76825/217273 [01:26<02:28, 944.71 examples/s]Map:  35%|███▌      | 77045/217273 [01:24<02:54, 804.17 examples/s]Map:  35%|███▌      | 76603/217273 [01:26<02:35, 904.89 examples/s]Map:  35%|███▌      | 76331/217273 [01:24<02:44, 854.71 examples/s]Map:  35%|███▌      | 76924/217273 [01:26<02:27, 951.68 examples/s]Map:  36%|███▌      | 77139/217273 [01:24<02:48, 830.97 examples/s]Map:  35%|███▌      | 76702/217273 [01:26<02:31, 925.77 examples/s]Map:  35%|███▌      | 76430/217273 [01:24<02:39, 885.37 examples/s]Map:  36%|███▌      | 77235/217273 [01:24<02:43, 858.43 examples/s]Map:  35%|███▌      | 76804/217273 [01:26<02:28, 947.12 examples/s]Map:  35%|███▌      | 76528/217273 [01:24<02:35, 908.01 examples/s]Map:  35%|███▌      | 77048/217273 [01:26<02:53, 810.00 examples/s]Map:  36%|███▌      | 77331/217273 [01:24<02:38, 880.80 examples/s]Map:  35%|███▌      | 76904/217273 [01:26<02:26, 960.17 examples/s]Map:  35%|███▌      | 76626/217273 [01:24<02:32, 924.44 examples/s]Map:  36%|███▌      | 77156/217273 [01:26<02:40, 871.67 examples/s]Map:  36%|███▌      | 77423/217273 [01:24<02:37, 888.47 examples/s]Map:  36%|███▌      | 77257/217273 [01:26<02:35, 902.88 examples/s]Map:  35%|███▌      | 76766/217273 [01:24<02:31, 926.13 examples/s]Map:  36%|███▌      | 77524/217273 [01:24<02:31, 920.93 examples/s]Map:  36%|███▌      | 77360/217273 [01:26<02:29, 933.91 examples/s]Map:  35%|███▌      | 77047/217273 [01:27<02:52, 812.30 examples/s]Map:  36%|███▌      | 77623/217273 [01:25<02:28, 939.97 examples/s]Map:  35%|███▌      | 76908/217273 [01:24<02:31, 929.17 examples/s]Map:  36%|███▌      | 77458/217273 [01:26<02:27, 944.86 examples/s]Map:  36%|███▌      | 77144/217273 [01:27<02:45, 847.34 examples/s]Map:  36%|███▌      | 77720/217273 [01:25<02:27, 943.10 examples/s]Map:  36%|███▌      | 77565/217273 [01:26<02:22, 977.22 examples/s]Map:  36%|███▌      | 77240/217273 [01:27<02:41, 869.00 examples/s]Map:  36%|███▌      | 77820/217273 [01:25<02:25, 956.48 examples/s]Map:  35%|███▌      | 77046/217273 [01:25<02:54, 804.92 examples/s]Map:  36%|███▌      | 77335/217273 [01:27<02:37, 887.00 examples/s]Map:  36%|███▌      | 77717/217273 [01:27<02:21, 988.53 examples/s]Map:  36%|███▌      | 77147/217273 [01:25<02:45, 847.00 examples/s]Map:  36%|███▌      | 77428/217273 [01:27<02:36, 893.96 examples/s]Map:  36%|███▌      | 77959/217273 [01:25<02:28, 940.30 examples/s]Map:  36%|███▌      | 77867/217273 [01:27<02:20, 989.52 examples/s]Map:  36%|███▌      | 77238/217273 [01:25<02:42, 859.71 examples/s]Map:  36%|███▌      | 77527/217273 [01:27<02:32, 918.61 examples/s]Map:  36%|███▌      | 77340/217273 [01:25<02:36, 896.85 examples/s]Map:  36%|███▌      | 77629/217273 [01:27<02:28, 940.99 examples/s]Map:  36%|███▌      | 78095/217273 [01:25<02:52, 805.51 examples/s]Map:  36%|███▌      | 78000/217273 [01:27<02:45, 841.22 examples/s]Map:  36%|███▌      | 78186/217273 [01:25<02:48, 827.15 examples/s]Map:  36%|███▌      | 77472/217273 [01:25<02:37, 888.55 examples/s]Map:  36%|███▌      | 77770/217273 [01:27<02:28, 936.48 examples/s]Map:  36%|███▌      | 78094/217273 [01:27<02:41, 861.07 examples/s]Map:  36%|███▌      | 77573/217273 [01:25<02:32, 915.22 examples/s]Map:  36%|███▌      | 77869/217273 [01:27<02:28, 941.76 examples/s]Map:  36%|███▌      | 78319/217273 [01:25<02:44, 843.51 examples/s]Map:  36%|███▌      | 78194/217273 [01:27<02:35, 891.71 examples/s]Map:  36%|███▌      | 77671/217273 [01:25<02:30, 927.76 examples/s]Map:  36%|███▌      | 78408/217273 [01:25<02:42, 852.67 examples/s]Map:  36%|███▌      | 78292/217273 [01:27<02:32, 910.20 examples/s]Map:  36%|███▌      | 78000/217273 [01:28<02:54, 796.01 examples/s]Map:  36%|███▌      | 78501/217273 [01:26<02:39, 871.32 examples/s]Map:  36%|███▌      | 77813/217273 [01:25<02:30, 929.20 examples/s]Map:  36%|███▌      | 78397/217273 [01:27<02:27, 942.19 examples/s]Map:  36%|███▌      | 78099/217273 [01:28<02:46, 834.59 examples/s]Map:  36%|███▌      | 78600/217273 [01:26<02:34, 899.69 examples/s]Map:  36%|███▌      | 77956/217273 [01:26<02:29, 933.93 examples/s]Map:  36%|███▌      | 78543/217273 [01:28<02:26, 950.00 examples/s]Map:  36%|███▌      | 78204/217273 [01:28<02:37, 884.97 examples/s]Map:  36%|███▌      | 78737/217273 [01:26<02:34, 899.41 examples/s]Map:  36%|███▌      | 78646/217273 [01:28<02:23, 968.22 examples/s]Map:  36%|███▌      | 78302/217273 [01:28<02:33, 906.95 examples/s]Map:  36%|███▋      | 78835/217273 [01:26<02:31, 916.07 examples/s]Map:  36%|███▌      | 78747/217273 [01:28<02:21, 976.77 examples/s]Map:  36%|███▌      | 78096/217273 [01:26<02:52, 805.84 examples/s]Map:  36%|███���      | 78397/217273 [01:28<02:32, 910.83 examples/s]Map:  36%|███▋      | 78930/217273 [01:26<02:29, 924.00 examples/s]Map:  36%|███▋      | 78846/217273 [01:28<02:21, 978.74 examples/s]Map:  36%|███▌      | 78193/217273 [01:26<02:45, 838.36 examples/s]Map:  36%|███▌      | 78492/217273 [01:28<02:31, 918.99 examples/s]Map:  36%|███▋      | 78948/217273 [01:28<02:19, 989.19 examples/s]Map:  36%|███▌      | 78285/217273 [01:26<02:42, 855.16 examples/s]Map:  36%|███▌      | 78587/217273 [01:28<02:29, 924.59 examples/s]Map:  36%|███▋      | 79044/217273 [01:26<03:02, 757.35 examples/s]Map:  36%|███▌      | 78379/217273 [01:26<02:38, 875.32 examples/s]Map:  36%|███▌      | 78691/217273 [01:28<02:25, 954.09 examples/s]Map:  36%|███▋      | 79049/217273 [01:28<02:46, 830.94 examples/s]Map:  36%|███▋      | 79140/217273 [01:26<02:52, 802.11 examples/s]Map:  36%|███▌      | 78477/217273 [01:26<02:34, 900.28 examples/s]Map:  36%|███▋      | 78831/217273 [01:28<02:27, 941.33 examples/s]Map:  36%|███▋      | 79146/217273 [01:28<02:39, 864.38 examples/s]Map:  36%|███▋      | 79234/217273 [01:26<02:45, 835.17 examples/s]Map:  36%|███▌      | 78570/217273 [01:26<02:32, 907.27 examples/s]Map:  36%|███▋      | 79242/217273 [01:28<02:35, 887.43 examples/s]Map:  36%|███▋      | 78933/217273 [01:29<02:24, 956.28 examples/s]Map:  37%|███▋      | 79332/217273 [01:27<02:38, 870.06 examples/s]Map:  36%|███▌      | 78670/217273 [01:26<02:29, 928.56 examples/s]Map:  37%|███▋      | 79348/217273 [01:28<02:27, 931.94 examples/s]Map:  37%|███▋      | 79427/217273 [01:27<02:34, 890.06 examples/s]Map:  36%|███▋      | 78770/217273 [01:27<02:26, 947.45 examples/s]Map:  36%|███▋      | 79045/217273 [01:29<02:51, 804.13 examples/s]Map:  37%|███▋      | 79449/217273 [01:28<02:24, 952.19 examples/s]Map:  37%|███▋      | 79526/217273 [01:27<02:30, 914.60 examples/s]Map:  36%|███▋      | 78872/217273 [01:27<02:23, 964.61 examples/s]Map:  36%|███▋      | 79148/217273 [01:29<02:41, 854.09 examples/s]Map:  37%|███▋      | 79622/217273 [01:27<02:28, 924.69 examples/s]Map:  37%|███▋      | 79594/217273 [01:29<02:24, 954.00 examples/s]Map:  36%|███▋      | 79249/217273 [01:29<02:35, 887.15 examples/s]Map:  37%|███▋      | 79723/217273 [01:27<02:25, 945.19 examples/s]Map:  37%|███▋      | 79696/217273 [01:29<02:21, 969.58 examples/s]Map:  36%|███▋      | 79000/217273 [01:27<02:51, 804.29 examples/s]Map:  37%|███▋      | 79354/217273 [01:29<02:28, 928.06 examples/s]Map:  37%|███▋      | 79824/217273 [01:27<02:22, 961.69 examples/s]Map:  37%|███▋      | 79802/217273 [01:29<02:18, 990.64 examples/s]Map:  36%|███▋      | 79099/217273 [01:27<02:43, 846.56 examples/s]Map:  37%|███▋      | 79454/217273 [01:29<02:26, 942.17 examples/s]Map:  37%|███▋      | 79924/217273 [01:27<02:21, 969.66 examples/s]Map:  36%|███▋      | 79201/217273 [01:27<02:35, 887.21 examples/s]Map:  37%|███▋      | 79551/217273 [01:29<02:25, 945.92 examples/s]Map:  37%|███▋      | 79948/217273 [01:29<02:19, 981.92 examples/s]Map:  36%|███▋      | 79302/217273 [01:27<02:30, 917.14 examples/s]Map:  37%|███▋      | 79654/217273 [01:29<02:22, 963.39 examples/s]Map:  37%|███▋      | 80048/217273 [01:27<02:48, 812.85 examples/s]Map:  37%|███▋      | 79401/217273 [01:27<02:27, 936.47 examples/s]Map:  37%|███▋      | 80049/217273 [01:29<02:45, 828.08 examples/s]Map:  37%|███▋      | 79758/217273 [01:29<02:20, 982.03 examples/s]Map:  37%|███▋      | 80148/217273 [01:27<02:40, 856.73 examples/s]Map:  37%|███▋      | 79500/217273 [01:27<02:25, 949.88 examples/s]Map:  37%|███▋      | 80155/217273 [01:29<02:36, 878.92 examples/s]Map:  37%|███▋      | 79858/217273 [01:30<02:19, 986.35 examples/s]Map:  37%|███▋      | 80248/217273 [01:28<02:33, 893.61 examples/s]Map:  37%|███▋      | 79601/217273 [01:27<02:22, 963.18 examples/s]Map:  37%|███▋      | 80248/217273 [01:29<02:33, 890.02 examples/s]Map:  37%|███▋      | 80350/217273 [01:28<02:28, 924.48 examples/s]Map:  37%|███▋      | 79999/217273 [01:30<02:22, 965.75 examples/s]Map:  37%|███▋      | 79737/217273 [01:28<02:26, 938.28 examples/s]Map:  37%|███▋      | 80387/217273 [01:30<02:31, 901.16 examples/s]Map:  37%|███▋      | 80497/217273 [01:28<02:25, 938.65 examples/s]Map:  37%|███▋      | 79835/217273 [01:28<02:25, 946.32 examples/s]Map:  37%|███▋      | 80488/217273 [01:30<02:27, 925.96 examples/s]Map:  37%|███▋      | 80137/217273 [01:30<02:48, 812.58 examples/s]Map:  37%|███▋      | 80600/217273 [01:28<02:22, 959.22 examples/s]Map:  37%|███▋      | 79936/217273 [01:28<02:22, 960.74 examples/s]Map:  37%|███▋      | 80588/217273 [01:30<02:24, 944.67 examples/s]Map:  37%|███▋      | 80229/217273 [01:30<02:44, 835.01 examples/s]Map:  37%|███▋      | 80703/217273 [01:28<02:19, 976.09 examples/s]Map:  37%|███▋      | 80695/217273 [01:30<02:20, 975.02 examples/s]Map:  37%|███▋      | 80327/217273 [01:30<02:37, 868.71 examples/s]Map:  37%|███▋      | 80805/217273 [01:28<02:18, 986.12 examples/s]Map:  37%|███▋      | 80046/217273 [01:28<02:49, 808.77 examples/s]Map:  37%|███▋      | 80431/217273 [01:30<02:30, 906.78 examples/s]Map:  37%|███▋      | 80837/217273 [01:30<02:21, 962.05 examples/s]Map:  37%|███▋      | 80150/217273 [01:28<02:38, 863.90 examples/s]Map:  37%|███▋      | 80955/217273 [01:28<02:17, 987.92 examples/s]Map:  37%|███▋      | 80528/217273 [01:30<02:28, 921.19 examples/s]Map:  37%|███▋      | 80937/217273 [01:30<02:20, 967.58 examples/s]Map:  37%|███▋      | 80252/217273 [01:28<02:31, 901.54 examples/s]Map:  37%|███▋      | 80623/217273 [01:30<02:27, 926.46 examples/s]Map:  37%|███▋      | 80354/217273 [01:28<02:26, 932.28 examples/s]Map:  37%|███▋      | 81096/217273 [01:28<02:43, 832.44 examples/s]Map:  37%|███▋      | 81047/217273 [01:30<02:47, 814.51 examples/s]Map:  37%|███▋      | 80760/217273 [01:31<02:29, 911.27 examples/s]Map:  37%|███▋      | 80496/217273 [01:28<02:26, 933.51 examples/s]Map:  37%|███▋      | 81200/217273 [01:29<02:35, 876.28 examples/s]Map:  37%|███▋      | 81142/217273 [01:30<02:41, 844.38 examples/s]Map:  37%|███▋      | 80861/217273 [01:31<02:26, 932.28 examples/s]Map:  37%|███▋      | 80597/217273 [01:29<02:24, 948.61 examples/s]Map:  37%|███▋      | 81302/217273 [01:29<02:29, 906.67 examples/s]Map:  37%|███▋      | 81237/217273 [01:30<02:36, 870.06 examples/s]Map:  37%|███▋      | 80960/217273 [01:31<02:24, 943.96 examples/s]Map:  37%|███▋      | 80695/217273 [01:29<02:23, 953.55 examples/s]Map:  37%|███▋      | 81409/217273 [01:29<02:23, 946.02 examples/s]Map:  37%|███▋      | 81333/217273 [01:31<02:32, 891.99 examples/s]Map:  38%|███▊      | 81514/217273 [01:29<02:19, 972.87 examples/s]Map:  37%|███▋      | 81429/217273 [01:31<02:29, 907.82 examples/s]Map:  37%|███▋      | 80842/217273 [01:29<02:22, 959.48 examples/s]Map:  37%|███▋      | 81095/217273 [01:31<02:49, 805.09 examples/s]Map:  38%|███▊      | 81525/217273 [01:31<02:27, 921.27 examples/s]Map:  38%|███▊      | 81658/217273 [01:29<02:20, 963.53 examples/s]Map:  37%|███▋      | 81183/217273 [01:31<02:45, 821.09 examples/s]Map:  37%|███▋      | 80979/217273 [01:29<02:24, 940.29 examples/s]Map:  38%|███▊      | 81758/217273 [01:29<02:19, 970.23 examples/s]Map:  38%|███▊      | 81669/217273 [01:31<02:25, 931.79 examples/s]Map:  37%|███▋      | 81283/217273 [01:31<02:38, 858.94 examples/s]Map:  38%|███▊      | 81861/217273 [01:29<02:17, 985.67 examples/s]Map:  38%|███▊      | 81768/217273 [01:31<02:23, 943.45 examples/s]Map:  37%|███▋      | 81102/217273 [01:29<02:45, 821.17 examples/s]Map:  37%|███▋      | 81384/217273 [01:31<02:31, 895.47 examples/s]Map:  38%|███▊      | 81961/217273 [01:29<02:16, 989.05 examples/s]Map:  38%|███▊      | 81872/217273 [01:31<02:20, 965.88 examples/s]Map:  37%|███▋      | 81201/217273 [01:29<02:38, 858.07 examples/s]Map:  38%|███▊      | 81480/217273 [01:31<02:28, 912.01 examples/s]Map:  38%|███▊      | 81981/217273 [01:31<02:15, 997.48 examples/s]Map:  37%|███▋      | 81298/217273 [01:29<02:34, 882.82 examples/s]Map:  38%|███▊      | 81581/217273 [01:32<02:25, 935.05 examples/s]Map:  38%|███▊      | 82106/217273 [01:30<02:37, 858.36 examples/s]Map:  37%|███▋      | 81398/217273 [01:29<02:29, 911.02 examples/s]Map:  38%|███▊      | 81677/217273 [01:32<02:24, 936.90 examples/s]Map:  38%|███▊      | 82207/217273 [01:30<02:31, 892.08 examples/s]Map:  38%|███▊      | 82098/217273 [01:31<02:42, 831.89 examples/s]Map:  38%|███▊      | 81500/217273 [01:30<02:24, 936.77 examples/s]Map:  38%|███▊      | 81820/217273 [01:32<02:24, 939.43 examples/s]Map:  38%|███▊      | 82306/217273 [01:30<02:27, 915.10 examples/s]Map:  38%|███▊      | 82199/217273 [01:32<02:34, 874.15 examples/s]Map:  38%|███▊      | 81607/217273 [01:30<02:19, 969.27 examples/s]Map:  38%|███▊      | 81917/217273 [01:32<02:23, 945.68 examples/s]Map:  38%|███▊      | 82410/217273 [01:30<02:22, 947.48 examples/s]Map:  38%|███▊      | 82297/217273 [01:32<02:29, 900.96 examples/s]Map:  38%|███▊      | 81709/217273 [01:30<02:18, 978.58 examples/s]Map:  38%|███▊      | 82399/217273 [01:32<02:24, 930.47 examples/s]Map:  38%|███▊      | 81809/217273 [01:30<02:17, 982.37 examples/s]Map:  38%|███▊      | 82557/217273 [01:30<02:20, 956.66 examples/s]Map:  38%|███▊      | 82038/217273 [01:32<02:53, 780.74 examples/s]Map:  38%|███▊      | 82496/217273 [01:32<02:23, 938.22 examples/s]Map:  38%|███▊      | 81912/217273 [01:30<02:16, 993.99 examples/s]Map:  38%|███▊      | 82663/217273 [01:30<02:17, 980.19 examples/s]Map:  38%|███▊      | 82126/217273 [01:32<02:49, 798.78 examples/s]Map:  38%|███▊      | 82596/217273 [01:32<02:22, 948.07 examples/s]Map:  38%|███▊      | 82766/217273 [01:30<02:16, 988.91 examples/s]Map:  38%|███▊      | 82217/217273 [01:32<02:43, 825.39 examples/s]Map:  38%|███▊      | 82732/217273 [01:32<02:24, 928.77 examples/s]Map:  38%|███▊      | 82044/217273 [01:30<02:48, 803.29 examples/s]Map:  38%|███▊      | 82310/217273 [01:32<02:38, 850.33 examples/s]Map:  38%|███▊      | 82911/217273 [01:30<02:17, 977.05 examples/s]Map:  38%|███▊      | 82835/217273 [01:32<02:21, 950.56 examples/s]Map:  38%|███▊      | 82142/217273 [01:30<02:40, 843.43 examples/s]Map:  38%|███▊      | 82405/217273 [01:32<02:33, 876.06 examples/s]Map:  38%|███▊      | 82936/217273 [01:32<02:19, 962.05 examples/s]Map:  38%|███▊      | 82245/217273 [01:30<02:32, 887.35 examples/s]Map:  38%|███▊      | 82504/217273 [01:33<02:28, 905.35 examples/s]Map:  38%|███▊      | 83050/217273 [01:31<02:37, 850.62 examples/s]Map:  38%|███▊      | 82344/217273 [01:30<02:27, 912.79 examples/s]Map:  38%|███▊      | 82598/217273 [01:33<02:27, 914.47 examples/s]Map:  38%|███▊      | 83148/217273 [01:31<02:32, 876.74 examples/s]Map:  38%|███▊      | 83048/217273 [01:32<02:46, 807.11 examples/s]Map:  38%|███▊      | 82446/217273 [01:31<02:24, 935.69 examples/s]Map:  38%|███▊      | 82695/217273 [01:33<02:25, 925.23 examples/s]Map:  38%|███▊      | 83252/217273 [01:31<02:26, 913.25 examples/s]Map:  38%|███▊      | 83155/217273 [01:33<02:34, 868.90 examples/s]Map:  38%|███▊      | 82799/217273 [01:33<02:21, 952.17 examples/s]Map:  38%|███▊      | 83352/217273 [01:31<02:23, 934.53 examples/s]Map:  38%|███▊      | 82589/217273 [01:31<02:23, 938.51 examples/s]Map:  38%|███▊      | 83255/217273 [01:33<02:28, 901.38 examples/s]Map:  38%|███▊      | 82896/217273 [01:33<02:20, 955.59 examples/s]Map:  38%|███▊      | 83354/217273 [01:33<02:24, 924.43 examples/s]Map:  38%|███▊      | 83497/217273 [01:31<02:22, 941.34 examples/s]Map:  38%|███▊      | 82734/217273 [01:31<02:22, 943.18 examples/s]Map:  38%|███▊      | 82993/217273 [01:33<02:20, 957.63 examples/s]Map:  38%|███▊      | 83451/217273 [01:33<02:23, 935.63 examples/s]Map:  38%|███▊      | 83599/217273 [01:31<02:19, 958.19 examples/s]Map:  38%|███▊      | 82835/217273 [01:31<02:20, 956.99 examples/s]Map:  38%|███▊      | 83550/217273 [01:33<02:21, 947.20 examples/s]Map:  39%|███▊      | 83703/217273 [01:31<02:16, 976.31 examples/s]Map:  38%|███▊      | 83095/217273 [01:33<02:49, 792.25 examples/s]Map:  38%|███▊      | 82977/217273 [01:31<02:21, 952.07 examples/s]Map:  38%|███▊      | 83647/217273 [01:33<02:20, 950.65 examples/s]Map:  38%|███▊      | 83194/217273 [01:33<02:39, 841.26 examples/s]Map:  39%|███▊      | 83852/217273 [01:31<02:16, 978.06 examples/s]Map:  38%|███▊      | 83294/217273 [01:33<02:31, 882.79 examples/s]Map:  39%|███▊      | 83793/217273 [01:33<02:19, 956.95 examples/s]Map:  38%|███▊      | 83093/217273 [01:31<02:46, 807.39 examples/s]Map:  39%|███▊      | 83953/217273 [01:31<02:15, 984.20 examples/s]Map:  38%|███▊      | 83181/217273 [01:31<02:43, 818.47 examples/s]Map:  38%|███▊      | 83435/217273 [01:34<02:29, 897.66 examples/s]Map:  39%|███▊      | 83921/217273 [01:33<02:25, 917.71 examples/s]Map:  38%|███▊      | 83285/217273 [01:32<02:33, 870.99 examples/s]Map:  38%|███▊      | 83540/217273 [01:34<02:23, 933.80 examples/s]Map:  39%|███▊      | 84098/217273 [01:32<02:44, 809.28 examples/s]Map:  38%|███▊      | 83379/217273 [01:32<02:31, 883.83 examples/s]Map:  38%|███▊      | 83636/217273 [01:34<02:22, 937.36 examples/s]Map:  39%|███▊      | 84045/217273 [01:34<02:48, 788.53 examples/s]Map:  39%|███▉      | 84199/217273 [01:32<02:36, 850.79 examples/s]Map:  38%|███▊      | 83472/217273 [01:32<02:29, 892.65 examples/s]Map:  39%|███▊      | 83733/217273 [01:34<02:21, 941.05 examples/s]Map:  39%|███▊      | 84146/217273 [01:34<02:39, 835.59 examples/s]Map:  39%|███▉      | 84298/217273 [01:32<02:31, 879.57 examples/s]Map:  39%|███▊      | 83829/217273 [01:34<02:21, 944.56 examples/s]Map:  39%|███▉      | 84243/217273 [01:34<02:33, 864.84 examples/s]Map:  39%|███▉      | 84399/217273 [01:32<02:26, 909.55 examples/s]Map:  38%|███▊      | 83611/217273 [01:32<02:28, 902.54 examples/s]Map:  39%|███▊      | 83930/217273 [01:34<02:18, 961.12 examples/s]Map:  39%|███▉      | 84346/217273 [01:34<02:26, 904.45 examples/s]Map:  39%|███▉      | 84502/217273 [01:32<02:21, 938.10 examples/s]Map:  39%|███▊      | 83746/217273 [01:32<02:28, 898.27 examples/s]Map:  39%|███▉      | 84600/217273 [01:32<02:19, 947.68 examples/s]Map:  39%|███▉      | 84444/217273 [01:34<02:24, 919.33 examples/s]Map:  39%|███▊      | 83838/217273 [01:32<02:28, 899.21 examples/s]Map:  39%|███▊      | 84048/217273 [01:34<02:46, 799.14 examples/s]Map:  39%|███▉      | 84704/217273 [01:32<02:16, 971.08 examples/s]Map:  39%|███▉      | 84539/217273 [01:34<02:23, 924.78 examples/s]Map:  39%|███▊      | 83938/217273 [01:32<02:24, 921.74 examples/s]Map:  39%|███▊      | 84147/217273 [01:34<02:37, 844.39 examples/s]Map:  39%|███▉      | 84803/217273 [01:32<02:15, 974.48 examples/s]Map:  39%|███▉      | 84643/217273 [01:34<02:19, 953.72 examples/s]Map:  39%|███▉      | 84252/217273 [01:35<02:29, 891.17 examples/s]Map:  39%|███▉      | 84908/217273 [01:32<02:13, 992.89 examples/s]Map:  39%|███▉      | 84744/217273 [01:34<02:16, 967.85 examples/s]Map:  39%|███▊      | 84046/217273 [01:32<02:51, 777.74 examples/s]Map:  39%|███▉      | 84353/217273 [01:35<02:24, 921.23 examples/s]Map:  39%|███▉      | 84846/217273 [01:34<02:15, 979.28 examples/s]Map:  39%|███▊      | 84146/217273 [01:33<02:40, 828.80 examples/s]Map:  39%|███▉      | 84454/217273 [01:35<02:20, 943.26 examples/s]Map:  39%|███▉      | 84951/217273 [01:34<02:12, 998.18 examples/s]Map:  39%|███▉      | 85050/217273 [01:33<02:40, 822.33 examples/s]Map:  39%|███▉      | 84239/217273 [01:33<02:36, 852.47 examples/s]Map:  39%|███▉      | 84584/217273 [01:35<02:25, 909.61 examples/s]Map:  39%|███▉      | 84329/217273 [01:33<02:34, 862.74 examples/s]Map:  39%|███▉      | 85188/217273 [01:33<02:35, 851.19 examples/s]Map:  39%|███▉      | 84685/217273 [01:35<02:21, 934.49 examples/s]Map:  39%|███▉      | 85097/217273 [01:35<02:42, 815.37 examples/s]Map:  39%|███▉      | 84423/217273 [01:33<02:30, 881.96 examples/s]Map:  39%|███▉      | 85285/217273 [01:33<02:30, 875.42 examples/s]Map:  39%|███▉      | 84786/217273 [01:35<02:19, 952.71 examples/s]Map:  39%|███▉      | 85198/217273 [01:35<02:33, 857.79 examples/s]Map:  39%|███▉      | 84522/217273 [01:33<02:26, 908.45 examples/s]Map:  39%|███▉      | 85389/217273 [01:33<02:24, 913.04 examples/s]Map:  39%|███▉      | 84888/217273 [01:35<02:16, 968.21 examples/s]Map:  39%|███▉      | 85296/217273 [01:35<02:29, 885.04 examples/s]Map:  39%|███▉      | 84621/217273 [01:33<02:22, 928.99 examples/s]Map:  39%|███▉      | 85486/217273 [01:33<02:22, 926.39 examples/s]Map:  39%|███▉      | 84988/217273 [01:35<02:15, 976.70 examples/s]Map:  39%|███▉      | 85392/217273 [01:35<02:26, 902.25 examples/s]Map:  39%|███▉      | 84764/217273 [01:33<02:21, 933.65 examples/s]Map:  39%|███▉      | 85635/217273 [01:33<02:19, 945.16 examples/s]Map:  39%|███▉      | 85497/217273 [01:35<02:20, 939.89 examples/s]Map:  39%|███▉      | 84862/217273 [01:33<02:20, 942.51 examples/s]Map:  39%|███▉      | 85103/217273 [01:35<02:38, 834.16 examples/s]Map:  39%|███▉      | 85736/217273 [01:33<02:17, 958.32 examples/s]Map:  39%|███▉      | 85596/217273 [01:35<02:18, 953.73 examples/s]Map:  39%|███▉      | 84962/217273 [01:33<02:18, 952.68 examples/s]Map:  39%|███▉      | 85199/217273 [01:36<02:33, 861.65 examples/s]Map:  40%|███▉      | 85878/217273 [01:34<02:17, 953.33 examples/s]Map:  39%|███▉      | 85745/217273 [01:35<02:16, 965.40 examples/s]Map:  39%|███▉      | 85296/217273 [01:36<02:28, 887.48 examples/s]Map:  40%|███▉      | 85979/217273 [01:34<02:15, 966.42 examples/s]Map:  40%|███▉      | 85848/217273 [01:35<02:14, 978.05 examples/s]Map:  39%|███▉      | 85390/217273 [01:36<02:26, 900.47 examples/s]Map:  39%|███▉      | 85098/217273 [01:34<02:43, 807.38 examples/s]Map:  40%|███▉      | 85953/217273 [01:36<02:12, 994.21 examples/s]Map:  39%|███▉      | 85489/217273 [01:36<02:22, 922.42 examples/s]Map:  39%|███▉      | 85197/217273 [01:34<02:35, 847.60 examples/s]Map:  40%|███▉      | 86106/217273 [01:34<02:38, 827.61 examples/s]Map:  39%|███▉      | 85584/217273 [01:36<02:21, 928.24 examples/s]Map:  39%|███▉      | 85292/217273 [01:34<02:31, 871.39 examples/s]Map:  40%|███▉      | 86207/217273 [01:34<02:31, 867.89 examples/s]Map:  40%|███▉      | 86091/217273 [01:36<02:37, 832.01 examples/s]Map:  39%|███▉      | 85681/217273 [01:36<02:20, 936.37 examples/s]Map:  39%|███▉      | 85384/217273 [01:34<02:29, 882.05 examples/s]Map:  40%|███▉      | 86183/217273 [01:36<02:33, 851.48 examples/s]Map:  40%|███▉      | 86350/217273 [01:34<02:26, 892.94 examples/s]Map:  39%|███▉      | 85822/217273 [01:36<02:20, 932.36 examples/s]Map:  39%|███▉      | 85526/217273 [01:34<02:26, 901.36 examples/s]Map:  40%|███▉      | 86285/217273 [01:36<02:27, 889.76 examples/s]Map:  40%|███▉      | 86454/217273 [01:34<02:21, 925.07 examples/s]Map:  40%|███▉      | 85920/217273 [01:36<02:19, 942.91 examples/s]Map:  40%|███▉      | 86388/217273 [01:36<02:21, 923.15 examples/s]Map:  39%|███▉      | 85668/217273 [01:34<02:23, 914.34 examples/s]Map:  40%|███▉      | 86552/217273 [01:34<02:19, 936.40 examples/s]Map:  40%|███▉      | 86488/217273 [01:36<02:18, 940.93 examples/s]Map:  39%|███▉      | 85768/217273 [01:34<02:20, 933.73 examples/s]Map:  40%|███▉      | 86655/217273 [01:34<02:16, 958.19 examples/s]Map:  40%|███▉      | 86044/217273 [01:37<02:44, 798.11 examples/s]Map:  40%|███▉      | 86586/217273 [01:36<02:17, 949.41 examples/s]Map:  40%|███▉      | 85869/217273 [01:34<02:18, 951.49 examples/s]Map:  40%|███▉      | 86758/217273 [01:35<02:14, 973.93 examples/s]Map:  40%|███▉      | 86139/217273 [01:37<02:37, 830.69 examples/s]Map:  40%|███▉      | 86688/217273 [01:36<02:14, 967.82 examples/s]Map:  40%|███▉      | 85972/217273 [01:34<02:15, 969.21 examples/s]Map:  40%|███▉      | 86860/217273 [01:35<02:12, 982.38 examples/s]Map:  40%|███▉      | 86241/217273 [01:37<02:29, 876.61 examples/s]Map:  40%|███▉      | 86794/217273 [01:36<02:11, 993.22 examples/s]Map:  40%|███▉      | 86342/217273 [01:37<02:24, 909.15 examples/s]Map:  40%|███▉      | 86096/217273 [01:35<02:40, 814.99 examples/s]Map:  40%|████      | 87000/217273 [01:35<02:36, 830.43 examples/s]Map:  40%|████      | 86942/217273 [01:37<02:11, 988.31 examples/s]Map:  40%|███▉      | 86442/217273 [01:37<02:20, 931.10 examples/s]Map:  40%|███▉      | 86199/217273 [01:35<02:31, 864.09 examples/s]Map:  40%|████      | 87097/217273 [01:35<02:31, 860.68 examples/s]Map:  40%|███▉      | 86540/217273 [01:37<02:18, 942.79 examples/s]Map:  40%|███▉      | 86292/217273 [01:35<02:29, 878.86 examples/s]Map:  40%|████      | 87046/217273 [01:37<02:35, 835.59 examples/s]Map:  40%|████      | 87191/217273 [01:35<02:28, 878.64 examples/s]Map:  40%|███▉      | 86637/217273 [01:37<02:18, 945.86 examples/s]Map:  40%|███▉      | 86388/217273 [01:35<02:25, 896.74 examples/s]Map:  40%|████      | 87148/217273 [01:37<02:28, 877.67 examples/s]Map:  40%|████      | 87291/217273 [01:35<02:23, 908.83 examples/s]Map:  40%|███▉      | 86735/217273 [01:37<02:17, 950.54 examples/s]Map:  40%|███▉      | 86487/217273 [01:35<02:22, 919.81 examples/s]Map:  40%|████      | 87249/217273 [01:37<02:22, 910.27 examples/s]Map:  40%|████      | 87387/217273 [01:35<02:21, 919.70 examples/s]Map:  40%|███▉      | 86873/217273 [01:37<02:19, 934.74 examples/s]Map:  40%|███▉      | 86621/217273 [01:35<02:24, 907.08 examples/s]Map:  40%|████      | 87384/217273 [01:37<02:24, 901.60 examples/s]Map:  40%|████      | 87524/217273 [01:35<02:21, 914.27 examples/s]Map:  40%|████      | 86969/217273 [01:37<02:18, 937.63 examples/s]Map:  40%|███▉      | 86723/217273 [01:35<02:19, 933.85 examples/s]Map:  40%|████      | 87486/217273 [01:37<02:19, 929.61 examples/s]Map:  40%|████      | 87620/217273 [01:35<02:20, 922.75 examples/s]Map:  40%|███▉      | 86822/217273 [01:35<02:17, 946.98 examples/s]Map:  40%|████      | 87591/217273 [01:37<02:15, 959.93 examples/s]Map:  40%|████      | 87727/217273 [01:36<02:14, 961.96 examples/s]Map:  40%|████      | 87095/217273 [01:38<02:43, 796.19 examples/s]Map:  40%|████      | 86927/217273 [01:36<02:13, 972.78 examples/s]Map:  40%|████      | 87690/217273 [01:37<02:13, 967.26 examples/s]Map:  40%|████      | 87830/217273 [01:36<02:12, 977.66 examples/s]Map:  40%|████      | 87192/217273 [01:38<02:35, 834.63 examples/s]Map:  40%|████      | 87289/217273 [01:38<02:30, 866.16 examples/s]Map:  40%|████      | 87837/217273 [01:38<02:13, 969.55 examples/s]Map:  40%|████      | 87975/217273 [01:36<02:13, 970.13 examples/s]Map:  40%|████      | 87045/217273 [01:36<02:40, 810.05 examples/s]Map:  40%|████      | 87393/217273 [01:38<02:22, 909.54 examples/s]Map:  40%|████      | 87150/217273 [01:36<02:30, 865.09 examples/s]Map:  40%|████      | 87984/217273 [01:38<02:13, 967.68 examples/s]Map:  40%|████      | 87496/217273 [01:38<02:17, 941.69 examples/s]Map:  41%|████      | 88093/217273 [01:36<02:39, 809.58 examples/s]Map:  40%|████      | 87247/217273 [01:36<02:26, 888.56 examples/s]Map:  40%|████      | 87599/217273 [01:38<02:14, 961.46 examples/s]Map:  41%|████      | 88192/217273 [01:36<02:32, 847.12 examples/s]Map:  41%|████      | 88093/217273 [01:38<02:37, 822.26 examples/s]Map:  40%|████      | 87351/217273 [01:36<02:20, 926.32 examples/s]Map:  40%|████      | 87698/217273 [01:38<02:14, 966.33 examples/s]Map:  41%|████      | 88297/217273 [01:36<02:24, 894.15 examples/s]Map:  41%|████      | 88191/217273 [01:38<02:31, 854.05 examples/s]Map:  40%|████      | 87449/217273 [01:36<02:18, 937.55 examples/s]Map:  40%|████      | 87797/217273 [01:38<02:13, 971.89 examples/s]Map:  41%|████      | 88393/217273 [01:36<02:22, 905.45 examples/s]Map:  41%|████      | 88293/217273 [01:38<02:24, 891.34 examples/s]Map:  40%|████      | 87551/217273 [01:36<02:15, 959.18 examples/s]Map:  41%|████      | 88488/217273 [01:36<02:21, 912.44 examples/s]Map:  41%|████      | 88393/217273 [01:38<02:20, 915.20 examples/s]Map:  40%|████      | 87939/217273 [01:39<02:15, 956.18 examples/s]Map:  40%|████      | 87694/217273 [01:36<02:15, 955.64 examples/s]Map:  41%|████      | 88582/217273 [01:37<02:20, 917.08 examples/s]Map:  41%|████      | 88534/217273 [01:38<02:19, 920.46 examples/s]Map:  40%|████      | 87793/217273 [01:37<02:14, 961.64 examples/s]Map:  41%|████      | 88685/217273 [01:37<02:16, 945.15 examples/s]Map:  41%|████      | 88047/217273 [01:39<02:40, 804.95 examples/s]Map:  41%|████      | 88634/217273 [01:39<02:17, 936.25 examples/s]Map:  40%|████      | 87892/217273 [01:37<02:13, 966.60 examples/s]Map:  41%|████      | 88785/217273 [01:37<02:13, 958.91 examples/s]Map:  41%|████      | 88148/217273 [01:39<02:31, 849.99 examples/s]Map:  41%|████      | 88732/217273 [01:39<02:15, 945.67 examples/s]Map:  40%|████      | 87993/217273 [01:37<02:12, 975.25 examples/s]Map:  41%|████      | 88883/217273 [01:37<02:13, 961.86 examples/s]Map:  41%|████      | 88246/217273 [01:39<02:26, 880.18 examples/s]Map:  41%|████      | 88833/217273 [01:39<02:13, 960.86 examples/s]Map:  41%|████      | 88985/217273 [01:37<02:11, 975.40 examples/s]Map:  41%|████      | 88346/217273 [01:39<02:21, 911.04 examples/s]Map:  41%|████      | 88102/217273 [01:37<02:37, 821.62 examples/s]Map:  41%|████      | 88936/217273 [01:39<02:11, 975.27 examples/s]Map:  41%|████      | 88441/217273 [01:39<02:20, 916.88 examples/s]Map:  41%|████      | 88199/217273 [01:37<02:30, 856.37 examples/s]Map:  41%|████      | 89103/217273 [01:37<02:36, 820.28 examples/s]Map:  41%|████      | 88539/217273 [01:39<02:18, 929.92 examples/s]Map:  41%|████      | 88299/217273 [01:37<02:24, 890.28 examples/s]Map:  41%|████      | 89045/217273 [01:39<02:38, 808.21 examples/s]Map:  41%|████      | 89202/217273 [01:37<02:28, 860.90 examples/s]Map:  41%|████      | 88638/217273 [01:39<02:16, 940.95 examples/s]Map:  41%|████      | 88395/217273 [01:37<02:22, 906.73 examples/s]Map:  41%|████      | 89140/217273 [01:39<02:32, 841.06 examples/s]Map:  41%|████      | 88740/217273 [01:39<02:13, 962.51 examples/s]Map:  41%|████      | 89314/217273 [01:37<02:36, 818.94 examples/s]Map:  41%|████      | 88493/217273 [01:37<02:19, 923.77 examples/s]Map:  41%|████      | 89244/217273 [01:39<02:23, 890.86 examples/s]Map:  41%|████      | 88838/217273 [01:40<02:13, 963.58 examples/s]Map:  41%|████      | 89409/217273 [01:38<02:30, 849.26 examples/s]Map:  41%|████      | 88588/217273 [01:37<02:18, 928.78 examples/s]Map:  41%|████      | 89350/217273 [01:39<02:17, 933.71 examples/s]Map:  41%|████      | 88936/217273 [01:40<02:12, 965.99 examples/s]Map:  41%|████      | 89505/217273 [01:38<02:25, 877.16 examples/s]Map:  41%|████      | 88687/217273 [01:37<02:16, 943.92 examples/s]Map:  41%|████      | 89447/217273 [01:39<02:15, 940.47 examples/s]Map:  41%|████      | 89598/217273 [01:38<02:23, 888.84 examples/s]Map:  41%|████      | 89544/217273 [01:40<02:15, 944.55 examples/s]Map:  41%|████      | 88814/217273 [01:38<02:21, 905.61 examples/s]Map:  41%|████      | 89038/217273 [01:40<02:46, 771.28 examples/s]Map:  41%|████▏     | 89734/217273 [01:38<02:22, 893.99 examples/s]Map:  41%|████      | 88915/217273 [01:38<02:17, 930.70 examples/s]Map:  41%|████▏     | 89693/217273 [01:40<02:13, 957.90 examples/s]Map:  41%|████      | 89136/217273 [01:40<02:36, 821.20 examples/s]Map:  41%|████▏     | 89828/217273 [01:38<02:21, 902.15 examples/s]Map:  41%|████▏     | 89798/217273 [01:40<02:10, 977.97 examples/s]Map:  41%|████      | 89237/217273 [01:40<02:27, 868.37 examples/s]Map:  41%|████▏     | 89923/217273 [01:38<02:19, 913.23 examples/s]Map:  41%|████▏     | 89900/217273 [01:40<02:09, 985.20 examples/s]Map:  41%|████      | 89339/217273 [01:40<02:21, 903.69 examples/s]Map:  41%|████      | 89049/217273 [01:38<02:42, 790.71 examples/s]Map:  41%|████      | 89438/217273 [01:40<02:17, 926.94 examples/s]Map:  41%|████      | 89140/217273 [01:38<02:36, 816.36 examples/s]Map:  41%|████▏     | 90000/217273 [01:40<02:34, 823.91 examples/s]Map:  41%|████▏     | 90049/217273 [01:38<02:43, 776.68 examples/s]Map:  41%|████      | 89540/217273 [01:40<02:14, 951.40 examples/s]Map:  41%|████      | 89238/217273 [01:38<02:30, 852.14 examples/s]Map:  41%|████▏     | 90095/217273 [01:40<02:28, 853.98 examples/s]Map:  41%|████▏     | 90146/217273 [01:38<02:35, 819.99 examples/s]Map:  41%|████▏     | 89644/217273 [01:40<02:11, 970.67 examples/s]Map:  41%|████      | 89339/217273 [01:38<02:23, 889.42 examples/s]Map:  42%|████▏     | 90195/217273 [01:40<02:22, 890.62 examples/s]Map:  42%|████▏     | 90241/217273 [01:38<02:29, 851.19 examples/s]Map:  41%|████▏     | 89746/217273 [01:41<02:09, 981.08 examples/s]Map:  41%|████      | 89482/217273 [01:38<02:20, 908.58 examples/s]Map:  42%|████▏     | 90292/217273 [01:40<02:19, 908.23 examples/s]Map:  42%|████▏     | 90331/217273 [01:39<02:27, 861.79 examples/s]Map:  41%|████▏     | 89847/217273 [01:41<02:09, 987.69 examples/s]Map:  41%|████      | 89577/217273 [01:39<02:19, 915.60 examples/s]Map:  42%|████▏     | 90389/217273 [01:40<02:17, 921.19 examples/s]Map:  42%|████▏     | 90424/217273 [01:39<02:24, 878.24 examples/s]Map:  41%|████▏     | 89993/217273 [01:41<02:09, 980.46 examples/s]Map:  42%|████▏     | 90490/217273 [01:41<02:14, 943.59 examples/s]Map:  42%|████▏     | 90520/217273 [01:39<02:20, 899.68 examples/s]Map:  41%|████▏     | 89718/217273 [01:39<02:18, 919.03 examples/s]Map:  42%|████▏     | 90587/217273 [01:41<02:13, 950.16 examples/s]Map:  42%|████▏     | 90614/217273 [01:39<02:19, 906.45 examples/s]Map:  41%|████▏     | 89813/217273 [01:39<02:17, 924.32 examples/s]Map:  41%|████▏     | 90092/217273 [01:41<02:36, 811.26 examples/s]Map:  42%|████▏     | 90691/217273 [01:41<02:10, 972.93 examples/s]Map:  42%|████▏     | 90714/217273 [01:39<02:16, 927.45 examples/s]Map:  42%|████▏     | 90183/217273 [01:41<02:32, 832.74 examples/s]Map:  41%|████▏     | 89946/217273 [01:39<02:20, 907.98 examples/s]Map:  42%|████▏     | 90820/217273 [01:41<02:16, 927.61 examples/s]Map:  42%|████▏     | 90280/217273 [01:41<02:26, 864.13 examples/s]Map:  42%|████▏     | 90847/217273 [01:39<02:19, 908.57 examples/s]Map:  42%|████▏     | 90923/217273 [01:41<02:12, 953.24 examples/s]Map:  42%|████▏     | 90379/217273 [01:41<02:21, 894.60 examples/s]Map:  42%|████▏     | 90943/217273 [01:39<02:18, 914.86 examples/s]Map:  41%|████▏     | 90045/217273 [01:39<02:44, 774.09 examples/s]Map:  42%|████▏     | 90474/217273 [01:41<02:19, 906.56 examples/s]Map:  41%|████▏     | 90145/217273 [01:39<02:34, 822.58 examples/s]Map:  42%|████▏     | 91040/217273 [01:41<02:40, 784.50 examples/s]Map:  42%|████▏     | 90567/217273 [01:41<02:18, 911.65 examples/s]Map:  42%|████▏     | 91046/217273 [01:39<02:47, 753.22 examples/s]Map:  42%|████▏     | 90239/217273 [01:39<02:29, 849.18 examples/s]Map:  42%|████▏     | 91141/217273 [01:41<02:30, 835.66 examples/s]Map:  42%|████▏     | 90667/217273 [01:42<02:15, 933.12 examples/s]Map:  42%|████▏     | 91146/217273 [01:40<02:35, 809.16 examples/s]Map:  42%|████▏     | 90339/217273 [01:39<02:23, 884.18 examples/s]Map:  42%|████▏     | 91242/217273 [01:41<02:23, 876.77 examples/s]Map:  42%|████▏     | 90764/217273 [01:42<02:14, 940.12 examples/s]Map:  42%|████▏     | 91243/217273 [01:40<02:28, 848.33 examples/s]Map:  42%|████▏     | 90437/217273 [01:40<02:19, 907.61 examples/s]Map:  42%|████▏     | 91341/217273 [01:42<02:19, 901.91 examples/s]Map:  42%|████▏     | 90861/217273 [01:42<02:13, 946.38 examples/s]Map:  42%|████▏     | 91340/217273 [01:40<02:23, 879.00 examples/s]Map:  42%|████▏     | 90535/217273 [01:40<02:17, 924.50 examples/s]Map:  42%|████▏     | 91443/217273 [01:42<02:14, 932.70 examples/s]Map:  42%|████▏     | 90957/217273 [01:42<02:13, 946.58 examples/s]Map:  42%|████▏     | 91438/217273 [01:40<02:19, 901.08 examples/s]Map:  42%|████▏     | 90637/217273 [01:40<02:13, 947.12 examples/s]Map:  42%|████▏     | 91542/217273 [01:42<02:12, 946.07 examples/s]Map:  42%|████▏     | 91542/217273 [01:40<02:14, 936.31 examples/s]Map:  42%|████▏     | 90739/217273 [01:40<02:11, 965.47 examples/s]Map:  42%|████▏     | 91647/217273 [01:42<02:09, 971.63 examples/s]Map:  42%|████▏     | 91644/217273 [01:40<02:11, 956.46 examples/s]Map:  42%|████▏     | 90837/217273 [01:40<02:10, 968.88 examples/s]Map:  42%|████▏     | 91095/217273 [01:42<02:38, 794.92 examples/s]Map:  42%|████▏     | 91749/217273 [01:40<02:08, 976.41 examples/s]Map:  42%|████▏     | 91190/217273 [01:42<02:32, 828.87 examples/s]Map:  42%|████▏     | 91758/217273 [01:42<02:22, 878.20 examples/s]Map:  42%|████▏     | 90982/217273 [01:40<02:10, 964.93 examples/s]Map:  42%|████▏     | 91849/217273 [01:40<02:07, 980.55 examples/s]Map:  42%|████▏     | 91288/217273 [01:42<02:25, 862.95 examples/s]Map:  42%|████▏     | 91892/217273 [01:42<02:22, 878.38 examples/s]Map:  42%|████▏     | 91986/217273 [01:40<02:11, 951.29 examples/s]Map:  42%|████▏     | 91083/217273 [01:40<02:42, 774.86 examples/s]Map:  42%|████▏     | 91418/217273 [01:42<02:26, 861.66 examples/s]Map:  42%|████▏     | 91988/217273 [01:42<02:20, 894.37 examples/s]Map:  42%|████▏     | 91186/217273 [01:40<02:31, 833.43 examples/s]Map:  42%|████▏     | 91515/217273 [01:43<02:21, 887.45 examples/s]Map:  42%|████▏     | 92100/217273 [01:41<02:34, 809.99 examples/s]Map:  42%|████▏     | 91288/217273 [01:40<02:23, 879.76 examples/s]Map:  42%|████▏     | 91613/217273 [01:43<02:18, 909.99 examples/s]Map:  42%|████▏     | 92098/217273 [01:42<02:41, 773.23 examples/s]Map:  42%|████▏     | 92204/217273 [01:41<02:24, 862.90 examples/s]Map:  42%|████▏     | 91392/217273 [01:41<02:16, 921.00 examples/s]Map:  42%|████▏     | 91714/217273 [01:43<02:14, 932.39 examples/s]Map:  42%|████▏     | 92198/217273 [01:43<02:31, 823.29 examples/s]Map:  42%|████▏     | 92305/217273 [01:41<02:19, 896.79 examples/s]Map:  42%|████▏     | 91496/217273 [01:41<02:12, 952.70 examples/s]Map:  42%|████▏     | 91810/217273 [01:43<02:13, 938.92 examples/s]Map:  42%|████▏     | 92297/217273 [01:43<02:25, 861.35 examples/s]Map:  43%|████▎     | 92408/217273 [01:41<02:14, 929.35 examples/s]Map:  42%|████▏     | 91598/217273 [01:41<02:10, 965.73 examples/s]Map:  42%|████▏     | 91915/217273 [01:43<02:09, 967.77 examples/s]Map:  43%|████▎     | 92390/217273 [01:43<02:22, 877.60 examples/s]Map:  43%|████▎     | 92507/217273 [01:41<02:12, 942.37 examples/s]Map:  42%|████▏     | 91697/217273 [01:41<02:09, 970.11 examples/s]Map:  43%|████▎     | 92486/217273 [01:43<02:19, 896.58 examples/s]Map:  43%|████▎     | 92615/217273 [01:41<02:07, 977.42 examples/s]Map:  42%|████▏     | 91798/217273 [01:41<02:08, 977.76 examples/s]Map:  42%|████▏     | 92046/217273 [01:43<02:33, 818.40 examples/s]Map:  43%|████▎     | 92584/217273 [01:43<02:15, 916.88 examples/s]Map:  42%|████▏     | 91901/217273 [01:41<02:06, 988.43 examples/s]Map:  42%|████▏     | 92143/217273 [01:43<02:26, 853.10 examples/s]Map:  43%|████▎     | 92679/217273 [01:43<02:15, 922.80 examples/s]Map:  43%|████▎     | 92762/217273 [01:41<02:07, 973.39 examples/s]Map:  42%|████▏     | 92243/217273 [01:43<02:20, 890.18 examples/s]Map:  43%|████▎     | 92773/217273 [01:43<02:14, 924.85 examples/s]Map:  43%|████▎     | 92863/217273 [01:41<02:06, 981.77 examples/s]Map:  43%|████▎     | 92344/217273 [01:43<02:15, 920.89 examples/s]Map:  42%|████▏     | 92048/217273 [01:41<02:30, 834.12 examples/s]Map:  43%|████▎     | 92875/217273 [01:43<02:11, 948.64 examples/s]Map:  43%|████▎     | 92442/217273 [01:44<02:13, 932.66 examples/s]Map:  42%|████▏     | 92150/217273 [01:41<02:22, 877.14 examples/s]Map:  43%|████▎     | 92978/217273 [01:43<02:08, 969.71 examples/s]Map:  43%|████▎     | 93000/217273 [01:42<02:31, 821.44 examples/s]Map:  43%|████▎     | 92539/217273 [01:44<02:13, 934.07 examples/s]Map:  42%|████▏     | 92253/217273 [01:41<02:16, 913.87 examples/s]Map:  43%|████▎     | 93094/217273 [01:42<02:26, 845.93 examples/s]Map:  43%|████▎     | 92353/217273 [01:42<02:13, 935.55 examples/s]Map:  43%|████▎     | 92641/217273 [01:44<02:10, 954.04 examples/s]Map:  43%|████▎     | 93093/217273 [01:44<02:37, 790.85 examples/s]Map:  43%|████▎     | 93197/217273 [01:42<02:19, 889.44 examples/s]Map:  43%|████▎     | 92741/217273 [01:44<02:09, 964.23 examples/s]Map:  43%|████▎     | 92452/217273 [01:42<02:12, 942.16 examples/s]Map:  43%|████▎     | 93192/217273 [01:44<02:28, 835.97 examples/s]Map:  43%|████▎     | 93297/217273 [01:42<02:15, 914.69 examples/s]Map:  43%|████▎     | 92842/217273 [01:44<02:07, 976.35 examples/s]Map:  43%|████▎     | 92551/217273 [01:42<02:10, 953.03 examples/s]Map:  43%|████▎     | 93291/217273 [01:44<02:21, 874.93 examples/s]Map:  43%|████▎     | 93401/217273 [01:42<02:11, 942.60 examples/s]Map:  43%|████▎     | 92660/217273 [01:42<02:05, 989.58 examples/s]Map:  43%|████▎     | 93391/217273 [01:44<02:16, 906.97 examples/s]Map:  43%|████▎     | 93502/217273 [01:42<02:09, 958.12 examples/s]Map:  43%|████▎     | 92988/217273 [01:44<02:07, 971.06 examples/s]Map:  43%|████▎     | 93494/217273 [01:44<02:12, 935.37 examples/s]Map:  43%|████▎     | 93609/217273 [01:42<02:05, 984.73 examples/s]Map:  43%|████▎     | 92805/217273 [01:42<02:07, 977.77 examples/s]Map:  43%|████▎     | 93092/217273 [01:44<02:31, 817.24 examples/s]Map:  43%|████▎     | 92910/217273 [01:42<02:05, 992.44 examples/s]Map:  43%|████▎     | 93641/217273 [01:44<02:10, 946.80 examples/s]Map:  43%|████▎     | 93762/217273 [01:42<02:04, 993.44 examples/s]Map:  43%|████▎     | 93195/217273 [01:44<02:23, 866.39 examples/s]Map:  43%|████▎     | 93743/217273 [01:44<02:08, 963.31 examples/s]Map:  43%|████▎     | 93863/217273 [01:42<02:04, 993.09 examples/s]Map:  43%|████▎     | 93290/217273 [01:45<02:20, 885.35 examples/s]Map:  43%|████▎     | 93049/217273 [01:42<02:25, 854.09 examples/s]Map:  43%|████▎     | 93894/217273 [01:44<02:06, 976.10 examples/s]Map:  43%|████▎     | 93393/217273 [01:45<02:14, 921.14 examples/s]Map:  43%|████▎     | 93147/217273 [01:42<02:20, 880.92 examples/s]Map:  43%|████▎     | 94000/217273 [01:43<02:27, 837.67 examples/s]Map:  43%|████▎     | 93497/217273 [01:45<02:10, 951.31 examples/s]Map:  43%|████▎     | 93252/217273 [01:43<02:15, 918.15 examples/s]Map:  43%|████▎     | 94102/217273 [01:43<02:20, 878.92 examples/s]Map:  43%|████▎     | 94000/217273 [01:45<02:33, 804.94 examples/s]Map:  43%|████▎     | 93595/217273 [01:45<02:09, 955.05 examples/s]Map:  43%|████▎     | 94201/217273 [01:43<02:16, 903.31 examples/s]Map:  43%|████▎     | 94093/217273 [01:45<02:28, 830.84 examples/s]Map:  43%|████▎     | 93395/217273 [01:43<02:14, 924.37 examples/s]Map:  43%|████▎     | 93697/217273 [01:45<02:07, 970.68 examples/s]Map:  43%|████▎     | 94307/217273 [01:43<02:10, 940.87 examples/s]Map:  43%|████▎     | 94194/217273 [01:45<02:21, 871.64 examples/s]Map:  43%|████▎     | 93498/217273 [01:43<02:10, 946.74 examples/s]Map:  43%|████▎     | 93798/217273 [01:45<02:06, 976.50 examples/s]Map:  43%|████▎     | 94410/217273 [01:43<02:07, 962.10 examples/s]Map:  43%|████▎     | 94290/217273 [01:45<02:17, 891.64 examples/s]Map:  43%|████▎     | 93598/217273 [01:43<02:09, 956.56 examples/s]Map:  43%|████▎     | 93943/217273 [01:45<02:07, 970.39 examples/s]Map:  44%|████▎     | 94515/217273 [01:43<02:05, 980.25 examples/s]Map:  43%|████▎     | 94390/217273 [01:45<02:13, 917.92 examples/s]Map:  43%|████▎     | 93697/217273 [01:43<02:08, 963.22 examples/s]Map:  43%|████▎     | 94493/217273 [01:45<02:09, 946.80 examples/s]Map:  43%|████▎     | 93799/217273 [01:43<02:06, 976.72 examples/s]Map:  44%|████▎     | 94662/217273 [01:43<02:05, 975.80 examples/s]Map:  43%|████▎     | 94049/217273 [01:45<02:29, 823.47 examples/s]Map:  44%|████▎     | 94593/217273 [01:45<02:07, 960.60 examples/s]Map:  43%|████▎     | 93899/217273 [01:43<02:05, 980.93 examples/s]Map:  44%|████▎     | 94768/217273 [01:43<02:03, 992.38 examples/s]Map:  43%|████▎     | 94146/217273 [01:45<02:24, 852.89 examples/s]Map:  44%|████▎     | 94692/217273 [01:45<02:06, 966.12 examples/s]Map:  44%|████▎     | 94870/217273 [01:43<02:02, 998.89 examples/s]Map:  43%|████▎     | 94246/217273 [01:46<02:18, 886.46 examples/s]Map:  43%|████▎     | 94000/217273 [01:43<02:30, 817.02 examples/s]Map:  44%|████▎     | 94790/217273 [01:45<02:06, 966.79 examples/s]Map:  44%|████▎     | 94974/217273 [01:44<02:01, 1005.84 examples/s]Map:  43%|████▎     | 94342/217273 [01:46<02:16, 903.51 examples/s]Map:  43%|████▎     | 94098/217273 [01:43<02:23, 855.98 examples/s]Map:  44%|████▎     | 94890/217273 [01:45<02:05, 975.10 examples/s]Map:  43%|████▎     | 94446/217273 [01:46<02:11, 937.21 examples/s]Map:  43%|████▎     | 94190/217273 [01:44<02:21, 871.17 examples/s]Map:  44%|████▍     | 95102/217273 [01:44<02:23, 849.19 examples/s] Map:  44%|████▎     | 94547/217273 [01:46<02:08, 956.42 examples/s]Map:  43%|████▎     | 94292/217273 [01:44<02:15, 908.52 examples/s]Map:  44%|████▎     | 95000/217273 [01:46<02:30, 812.01 examples/s]Map:  44%|████▍     | 95202/217273 [01:44<02:18, 881.52 examples/s]Map:  44%|████▎     | 94647/217273 [01:46<02:06, 966.77 examples/s]Map:  43%|████▎     | 94393/217273 [01:44<02:11, 935.44 examples/s]Map:  44%|████▍     | 95097/217273 [01:46<02:23, 848.90 examples/s]Map:  44%|████▍     | 95301/217273 [01:44<02:14, 907.73 examples/s]Map:  44%|████▎     | 94747/217273 [01:46<02:06, 972.26 examples/s]Map:  43%|████▎     | 94493/217273 [01:44<02:09, 949.17 examples/s]Map:  44%|████▍     | 95193/217273 [01:46<02:19, 876.97 examples/s]Map:  44%|████▍     | 95396/217273 [01:44<02:13, 915.34 examples/s]Map:  44%|████▎     | 94849/217273 [01:46<02:04, 984.15 examples/s]Map:  44%|████▎     | 94596/217273 [01:44<02:06, 966.43 examples/s]Map:  44%|████▍     | 95296/217273 [01:46<02:13, 915.45 examples/s]Map:  44%|████▍     | 95503/217273 [01:44<02:07, 953.87 examples/s]Map:  44%|████▎     | 94699/217273 [01:44<02:04, 982.18 examples/s]Map:  44%|████▍     | 95393/217273 [01:46<02:11, 927.30 examples/s]Map:  44%|████▎     | 94990/217273 [01:46<02:06, 965.76 examples/s]Map:  44%|████▍     | 95605/217273 [01:44<02:05, 970.00 examples/s]Map:  44%|████▍     | 95489/217273 [01:46<02:10, 933.42 examples/s]Map:  44%|████▎     | 94845/217273 [01:44<02:05, 975.72 examples/s]Map:  44%|████▍     | 95713/217273 [01:44<02:01, 999.38 examples/s]Map:  44%|████▍     | 95096/217273 [01:46<02:29, 817.30 examples/s]Map:  44%|████▍     | 95589/217273 [01:46<02:07, 952.02 examples/s]Map:  44%|████▎     | 94946/217273 [01:44<02:04, 983.19 examples/s]Map:  44%|████▍     | 95815/217273 [01:44<02:01, 1003.22 examples/s]Map:  44%|████▍     | 95193/217273 [01:47<02:23, 851.31 examples/s]Map:  44%|████▍     | 95686/217273 [01:46<02:07, 954.43 examples/s]Map:  44%|████▍     | 95921/217273 [01:45<01:59, 1016.45 examples/s]Map:  44%|████▍     | 95292/217273 [01:47<02:17, 885.62 examples/s]Map:  44%|████▍     | 95784/217273 [01:46<02:06, 958.69 examples/s]Map:  44%|████▎     | 95050/217273 [01:45<02:27, 827.14 examples/s]Map:  44%|████▍     | 95389/217273 [01:47<02:14, 905.54 examples/s]Map:  44%|████▍     | 95882/217273 [01:47<02:06, 962.65 examples/s]Map:  44%|████▍     | 95156/217273 [01:45<02:18, 882.09 examples/s]Map:  44%|████▍     | 96050/217273 [01:45<02:23, 843.06 examples/s] Map:  44%|████▍     | 95486/217273 [01:47<02:12, 919.76 examples/s]Map:  44%|████▍     | 95260/217273 [01:45<02:12, 920.46 examples/s]Map:  44%|████▍     | 96146/217273 [01:45<02:19, 869.20 examples/s]Map:  44%|████▍     | 96000/217273 [01:47<02:31, 797.89 examples/s]Map:  44%|████▍     | 95584/217273 [01:47<02:10, 933.52 examples/s]Map:  44%|████▍     | 95359/217273 [01:45<02:10, 935.81 examples/s]Map:  44%|████▍     | 96251/217273 [01:45<02:12, 914.26 examples/s]Map:  44%|████▍     | 96091/217273 [01:47<02:27, 824.00 examples/s]Map:  44%|████▍     | 95684/217273 [01:47<02:07, 950.64 examples/s]Map:  44%|████▍     | 95462/217273 [01:45<02:07, 956.52 examples/s]Map:  44%|████▍     | 96353/217273 [01:45<02:08, 941.61 examples/s]Map:  44%|████▍     | 96193/217273 [01:47<02:19, 870.41 examples/s]Map:  44%|████▍     | 95782/217273 [01:47<02:07, 952.91 examples/s]Map:  44%|████▍     | 95563/217273 [01:45<02:05, 969.29 examples/s]Map:  44%|████▍     | 96486/217273 [01:45<02:11, 918.61 examples/s]Map:  44%|████▍     | 96329/217273 [01:47<02:17, 880.15 examples/s]Map:  44%|████▍     | 95912/217273 [01:47<02:12, 915.00 examples/s]Map:  44%|████▍     | 95697/217273 [01:45<02:09, 935.81 examples/s]Map:  44%|████▍     | 96581/217273 [01:45<02:10, 924.66 examples/s]Map:  44%|████▍     | 96429/217273 [01:47<02:13, 907.17 examples/s]Map:  44%|████▍     | 95794/217273 [01:45<02:08, 942.22 examples/s]Map:  44%|████▍     | 96684/217273 [01:45<02:06, 952.79 examples/s]Map:  44%|████▍     | 96529/217273 [01:47<02:10, 927.34 examples/s]Map:  44%|████▍     | 96047/217273 [01:48<02:32, 796.26 examples/s]Map:  44%|████▍     | 95891/217273 [01:45<02:08, 947.39 examples/s]Map:  45%|█��██▍     | 96790/217273 [01:46<02:02, 980.68 examples/s]Map:  44%|████▍     | 96627/217273 [01:47<02:08, 938.82 examples/s]Map:  44%|████▍     | 96140/217273 [01:48<02:27, 823.99 examples/s]Map:  44%|████▍     | 95997/217273 [01:45<02:04, 975.26 examples/s]Map:  45%|████▍     | 96727/217273 [01:47<02:06, 954.61 examples/s]Map:  44%|████▍     | 96236/217273 [01:48<02:21, 855.81 examples/s]Map:  45%|████▍     | 96937/217273 [01:46<02:03, 976.87 examples/s]Map:  44%|████▍     | 96099/217273 [01:46<02:28, 815.57 examples/s]Map:  45%|████▍     | 96825/217273 [01:48<02:05, 959.55 examples/s]Map:  44%|████▍     | 96331/217273 [01:48<02:17, 879.98 examples/s]Map:  45%|████▍     | 97041/217273 [01:46<02:27, 814.53 examples/s]Map:  44%|████▍     | 96201/217273 [01:46<02:19, 865.71 examples/s]Map:  45%|████▍     | 96923/217273 [01:48<02:05, 962.50 examples/s]Map:  44%|████▍     | 96429/217273 [01:48<02:13, 903.64 examples/s]Map:  45%|████▍     | 97147/217273 [01:46<02:18, 870.14 examples/s]Map:  44%|████▍     | 96307/217273 [01:46<02:12, 914.28 examples/s]Map:  44%|████▍     | 96529/217273 [01:48<02:09, 929.13 examples/s]Map:  45%|████▍     | 97247/217273 [01:46<02:13, 899.49 examples/s]Map:  45%|████▍     | 97046/217273 [01:48<02:29, 804.34 examples/s]Map:  44%|████▍     | 96411/217273 [01:46<02:07, 944.27 examples/s]Map:  44%|████▍     | 96626/217273 [01:48<02:08, 937.54 examples/s]Map:  45%|████▍     | 97142/217273 [01:48<02:22, 840.50 examples/s]Map:  45%|████▍     | 97349/217273 [01:46<02:09, 927.18 examples/s]Map:  44%|████▍     | 96511/217273 [01:46<02:06, 953.88 examples/s]Map:  45%|████▍     | 96724/217273 [01:48<02:07, 948.70 examples/s]Map:  45%|████▍     | 97242/217273 [01:48<02:16, 879.63 examples/s]Map:  44%|████▍     | 96622/217273 [01:46<02:01, 995.21 examples/s]Map:  45%|████▍     | 97498/217273 [01:46<02:06, 947.43 examples/s]Map:  45%|████▍     | 96866/217273 [01:48<02:07, 944.34 examples/s]Map:  45%|████▍     | 97340/217273 [01:48<02:12, 905.57 examples/s]Map:  45%|████▍     | 96726/217273 [01:46<01:59, 1007.07 examples/s]Map:  45%|████▍     | 97599/217273 [01:46<02:04, 961.09 examples/s]Map:  45%|████▍     | 97443/217273 [01:48<02:07, 939.06 examples/s]Map:  45%|████▍     | 97702/217273 [01:47<02:02, 978.61 examples/s]Map:  45%|████▍     | 96875/217273 [01:46<02:00, 999.06 examples/s] Map:  45%|████▍     | 97540/217273 [01:48<02:06, 944.86 examples/s]Map:  45%|████▍     | 97000/217273 [01:49<02:47, 717.94 examples/s]Map:  45%|████▌     | 97803/217273 [01:47<02:01, 984.55 examples/s]Map:  45%|████▍     | 97638/217273 [01:48<02:06, 949.22 examples/s]Map:  45%|████▍     | 97097/217273 [01:49<02:36, 769.22 examples/s]Map:  45%|████▍     | 97000/217273 [01:47<02:22, 841.81 examples/s]Map:  45%|████▌     | 97903/217273 [01:47<02:01, 981.91 examples/s]Map:  45%|████▍     | 97741/217273 [01:49<02:03, 971.18 examples/s]Map:  45%|████▍     | 97197/217273 [01:49<02:26, 818.30 examples/s]Map:  45%|████▍     | 97105/217273 [01:47<02:15, 888.39 examples/s]Map:  45%|████▌     | 97845/217273 [01:49<02:00, 987.63 examples/s]Map:  45%|████▍     | 97292/217273 [01:49<02:21, 848.96 examples/s]Map:  45%|████▍     | 97207/217273 [01:47<02:10, 919.03 examples/s]Map:  45%|████▌     | 98048/217273 [01:47<02:25, 820.26 examples/s]Map:  45%|████▌     | 97945/217273 [01:49<02:00, 986.56 examples/s]Map:  45%|████▍     | 97391/217273 [01:49<02:15, 882.51 examples/s]Map:  45%|████▍     | 97312/217273 [01:47<02:05, 952.51 examples/s]Map:  45%|████▌     | 98149/217273 [01:47<02:18, 863.00 examples/s]Map:  45%|████▍     | 97491/217273 [01:49<02:11, 910.17 examples/s]Map:  45%|████▌     | 98048/217273 [01:49<02:24, 826.36 examples/s]Map:  45%|████▌     | 98252/217273 [01:47<02:11, 901.91 examples/s]Map:  45%|████▍     | 97457/217273 [01:47<02:05, 954.29 examples/s]Map:  45%|████▍     | 97592/217273 [01:49<02:08, 928.99 examples/s]Map:  45%|████▌     | 98151/217273 [01:49<02:16, 875.69 examples/s]Map:  45%|████▌     | 98350/217273 [01:47<02:09, 918.19 examples/s]Map:  45%|████▍     | 97556/217273 [01:47<02:04, 961.96 examples/s]Map:  45%|████▌     | 98250/217273 [01:49<02:11, 902.04 examples/s]Map:  45%|████▌     | 98451/217273 [01:47<02:06, 940.73 examples/s]Map:  45%|████▍     | 97738/217273 [01:49<02:07, 939.42 examples/s]Map:  45%|████▍     | 97660/217273 [01:47<02:01, 981.53 examples/s]Map:  45%|████▌     | 98348/217273 [01:49<02:08, 922.41 examples/s]Map:  45%|████▌     | 98553/217273 [01:47<02:03, 958.28 examples/s]Map:  45%|████▌     | 97838/217273 [01:50<02:05, 953.38 examples/s]Map:  45%|████▌     | 97801/217273 [01:47<02:03, 963.86 examples/s]Map:  45%|████▌     | 98451/217273 [01:49<02:04, 950.91 examples/s]Map:  45%|████▌     | 98658/217273 [01:48<02:01, 979.01 examples/s]Map:  45%|████▌     | 97986/217273 [01:50<02:04, 960.39 examples/s]Map:  45%|████▌     | 97901/217273 [01:48<02:02, 970.55 examples/s]Map:  45%|████▌     | 98553/217273 [01:49<02:02, 967.00 examples/s]Map:  45%|████▌     | 98799/217273 [01:48<02:03, 961.23 examples/s]Map:  45%|████▌     | 98694/217273 [01:50<02:04, 950.06 examples/s]Map:  45%|████▌     | 98089/217273 [01:50<02:29, 797.50 examples/s]Map:  46%|████▌     | 98901/217273 [01:48<02:01, 971.67 examples/s]Map:  45%|████▌     | 98000/217273 [01:48<02:30, 794.22 examples/s]Map:  45%|████▌     | 98794/217273 [01:50<02:03, 962.81 examples/s]Map:  45%|████▌     | 98188/217273 [01:50<02:22, 837.00 examples/s]Map:  45%|████▌     | 98105/217273 [01:48<02:19, 852.70 examples/s]Map:  46%|████▌     | 99000/217273 [01:48<02:29, 790.59 examples/s]Map:  46%|████▌     | 98897/217273 [01:50<02:00, 979.19 examples/s]Map:  45%|████▌     | 98288/217273 [01:50<02:16, 874.03 examples/s]Map:  45%|████▌     | 98207/217273 [01:48<02:13, 891.11 examples/s]Map:  46%|████▌     | 99104/217273 [01:48<02:19, 849.04 examples/s]Map:  46%|████▌     | 98997/217273 [01:50<02:00, 981.44 examples/s]Map:  45%|████▌     | 98385/217273 [01:50<02:12, 895.48 examples/s]Map:  45%|████▌     | 98307/217273 [01:48<02:09, 918.50 examples/s]Map:  46%|████▌     | 99207/217273 [01:48<02:12, 891.90 examples/s]Map:  45%|████▌     | 98487/217273 [01:50<02:08, 927.40 examples/s]Map:  45%|████▌     | 98407/217273 [01:48<02:06, 938.07 examples/s]Map:  46%|████▌     | 99310/217273 [01:48<02:07, 926.22 examples/s]Map:  45%|████▌     | 98590/217273 [01:50<02:04, 953.75 examples/s]Map:  45%|████▌     | 98511/217273 [01:48<02:03, 962.86 examples/s]Map:  46%|████▌     | 99145/217273 [01:50<02:22, 828.06 examples/s]Map:  46%|████▌     | 99409/217273 [01:48<02:05, 940.42 examples/s]Map:  45%|████▌     | 98693/217273 [01:51<02:01, 973.40 examples/s]Map:  45%|████▌     | 98611/217273 [01:48<02:02, 971.15 examples/s]Map:  46%|████▌     | 99243/217273 [01:50<02:17, 860.82 examples/s]Map:  46%|████▌     | 99508/217273 [01:49<02:03, 951.21 examples/s]Map:  45%|████▌     | 98713/217273 [01:48<02:01, 979.80 examples/s]Map:  46%|████▌     | 99344/217273 [01:50<02:11, 896.86 examples/s]Map:  45%|████▌     | 98845/217273 [01:51<02:00, 985.15 examples/s]Map:  46%|████▌     | 99612/217273 [01:49<02:00, 972.81 examples/s]Map:  45%|████▌     | 98815/217273 [01:49<01:59, 988.31 examples/s]Map:  46%|████▌     | 99447/217273 [01:50<02:06, 928.31 examples/s]Map:  46%|████▌     | 98950/217273 [01:51<01:58, 997.67 examples/s]Map:  46%|████▌     | 99717/217273 [01:49<01:58, 993.88 examples/s]Map:  46%|████▌     | 98916/217273 [01:49<01:59, 992.66 examples/s]Map:  46%|████▌     | 99547/217273 [01:51<02:04, 943.82 examples/s]Map:  46%|████▌     | 99820/217273 [01:49<01:57, 1001.83 examples/s]Map:  46%|████▌     | 99645/217273 [01:51<02:04, 947.68 examples/s]Map:  46%|████▌     | 99097/217273 [01:51<02:17, 857.68 examples/s]Map:  46%|████▌     | 99047/217273 [01:49<02:23, 823.39 examples/s]Map:  46%|████▌     | 99743/217273 [01:51<02:03, 952.38 examples/s]Map:  46%|████▌     | 99960/217273 [01:49<02:00, 971.64 examples/s] Map:  46%|████▌     | 99195/217273 [01:51<02:13, 885.48 examples/s]Map:  46%|████▌     | 99143/217273 [01:49<02:18, 853.71 examples/s]Map:  46%|████▌     | 99843/217273 [01:51<02:02, 962.50 examples/s]Map:  46%|████▌     | 99291/217273 [01:51<02:10, 902.45 examples/s]Map:  46%|████▌     | 99241/217273 [01:49<02:13, 884.89 examples/s]Map:  46%|████▌     | 100099/217273 [01:49<02:20, 832.73 examples/s]Map:  46%|████▌     | 99992/217273 [01:51<02:01, 968.79 examples/s]Map:  46%|████▌     | 99341/217273 [01:49<02:08, 915.29 examples/s]Map:  46%|████▌     | 99430/217273 [01:51<02:09, 907.01 examples/s]Map:  46%|████▌     | 100205/217273 [01:49<02:12, 881.24 examples/s]Map:  46%|████▌     | 99440/217273 [01:49<02:06, 933.70 examples/s]Map:  46%|████▌     | 99531/217273 [01:51<02:06, 927.90 examples/s]Map:  46%|████▌     | 100095/217273 [01:51<02:23, 819.09 examples/s]Map:  46%|████▌     | 100307/217273 [01:49<02:08, 911.90 examples/s]Map:  46%|████▌     | 99544/217273 [01:49<02:02, 958.89 examples/s]Map:  46%|████▌     | 99633/217273 [01:52<02:04, 947.73 examples/s]Map:  46%|████▌     | 100186/217273 [01:51<02:19, 837.77 examples/s]Map:  46%|████▌     | 100403/217273 [01:50<02:06, 920.79 examples/s]Map:  46%|████▌     | 99648/217273 [01:49<02:00, 978.69 examples/s]Map:  46%|████▌     | 100294/217273 [01:51<02:10, 896.88 examples/s]Map:  46%|████▋     | 100505/217273 [01:50<02:03, 946.28 examples/s]Map:  46%|████▌     | 99775/217273 [01:52<02:04, 944.23 examples/s]Map:  46%|████▌     | 100396/217273 [01:51<02:06, 926.54 examples/s]Map:  46%|████▋     | 100606/217273 [01:50<02:01, 959.34 examples/s]Map:  46%|████▌     | 99797/217273 [01:50<01:59, 981.10 examples/s]Map:  46%|████▌     | 99917/217273 [01:52<02:04, 943.63 examples/s]Map:  46%|████▋     | 100500/217273 [01:52<02:02, 955.27 examples/s]Map:  46%|████▋     | 100710/217273 [01:50<01:59, 979.24 examples/s]Map:  46%|████▌     | 99943/217273 [01:50<02:00, 971.21 examples/s]Map:  46%|████▋     | 100606/217273 [01:52<01:58, 981.30 examples/s]Map:  46%|████▋     | 100815/217273 [01:50<01:56, 997.18 examples/s]Map:  46%|████▌     | 100045/217273 [01:52<02:24, 809.69 examples/s]Map:  46%|████▋     | 100713/217273 [01:52<01:56, 1003.83 examples/s]Map:  46%|████▋     | 100916/217273 [01:50<01:56, 999.26 examples/s]Map:  46%|████▌     | 100046/217273 [01:50<02:22, 825.09 examples/s]Map:  46%|████▌     | 100144/217273 [01:52<02:18, 847.05 examples/s]Map:  46%|████▌     | 100152/217273 [01:50<02:13, 876.49 examples/s]Map:  46%|████▋     | 100862/217273 [01:52<01:57, 993.58 examples/s] Map:  46%|████▌     | 100238/217273 [01:52<02:14, 867.03 examples/s]Map:  47%|████▋     | 101048/217273 [01:50<02:21, 823.36 examples/s]Map:  46%|████▌     | 100256/217273 [01:50<02:08, 914.16 examples/s]Map:  46%|████▋     | 100963/217273 [01:52<01:56, 994.43 examples/s]Map:  46%|████▌     | 100346/217273 [01:52<02:07, 918.29 examples/s]Map:  47%|████▋     | 101152/217273 [01:50<02:13, 872.15 examples/s]Map:  46%|████▌     | 100359/217273 [01:50<02:04, 936.98 examples/s]Map:  46%|████▌     | 100448/217273 [01:52<02:04, 941.47 examples/s]Map:  47%|████▋     | 101251/217273 [01:50<02:09, 896.51 examples/s]Map:  46%|████▌     | 100460/217273 [01:50<02:02, 954.16 examples/s]Map:  47%|████▋     | 101094/217273 [01:52<02:21, 823.41 examples/s]Map:  46%|████▋     | 100550/217273 [01:53<02:01, 959.71 examples/s]Map:  46%|████▋     | 100568/217273 [01:50<01:58, 983.68 examples/s]Map:  47%|████▋     | 101387/217273 [01:51<02:09, 896.98 examples/s]Map:  47%|████▋     | 101194/217273 [01:52<02:14, 861.95 examples/s]Map:  46%|████▋     | 100700/217273 [01:53<02:00, 970.80 examples/s]Map:  46%|████▋     | 100672/217273 [01:51<01:57, 996.08 examples/s]Map:  47%|████▋     | 101492/217273 [01:51<02:04, 933.17 examples/s]Map:  47%|████▋     | 101297/217273 [01:52<02:08, 900.93 examples/s]Map:  46%|████▋     | 100801/217273 [01:53<01:58, 979.72 examples/s]Map:  47%|████▋     | 101594/217273 [01:51<02:01, 954.35 examples/s]Map:  47%|████▋     | 101398/217273 [01:53<02:05, 926.23 examples/s]Map:  46%|████▋     | 100814/217273 [01:51<01:59, 974.83 examples/s]Map:  46%|████▋     | 100905/217273 [01:53<01:57, 993.88 examples/s]Map:  47%|████▋     | 101694/217273 [01:51<01:59, 964.96 examples/s]Map:  47%|████▋     | 101539/217273 [01:53<02:04, 927.65 examples/s]Map:  46%|████▋     | 100961/217273 [01:51<01:59, 974.20 examples/s]Map:  47%|████▋     | 101801/217273 [01:51<01:56, 990.02 examples/s]Map:  47%|████▋     | 101640/217273 [01:53<02:02, 945.14 examples/s]Map:  47%|████▋     | 101044/217273 [01:53<02:22, 817.76 examples/s]Map:  47%|████▋     | 101906/217273 [01:51<01:54, 1004.24 examples/s]Map:  47%|████▋     | 101141/217273 [01:53<02:16, 851.16 examples/s]Map:  47%|████▋     | 101101/217273 [01:51<02:16, 849.25 examples/s]Map:  47%|████▋     | 101780/217273 [01:53<02:03, 935.13 examples/s]Map:  47%|████▋     | 101233/217273 [01:53<02:14, 863.49 examples/s]Map:  47%|████▋     | 101202/217273 [01:51<02:11, 880.33 examples/s]Map:  47%|████▋     | 102044/217273 [01:51<02:17, 838.09 examples/s] Map:  47%|████▋     | 101921/217273 [01:53<02:03, 934.01 examples/s]Map:  47%|████▋     | 101329/217273 [01:53<02:11, 884.58 examples/s]Map:  47%|████▋     | 101300/217273 [01:51<02:08, 902.98 examples/s]Map:  47%|██��█▋     | 102148/217273 [01:51<02:10, 883.94 examples/s]Map:  47%|████▋     | 101428/217273 [01:54<02:07, 910.15 examples/s]Map:  47%|████▋     | 101403/217273 [01:51<02:04, 932.75 examples/s]Map:  47%|████▋     | 102246/217273 [01:51<02:07, 905.20 examples/s]Map:  47%|████▋     | 102046/217273 [01:53<02:20, 819.05 examples/s]Map:  47%|████▋     | 101534/217273 [01:54<02:02, 946.84 examples/s]Map:  47%|████▋     | 101506/217273 [01:51<02:01, 954.92 examples/s]Map:  47%|████▋     | 102352/217273 [01:52<02:01, 944.98 examples/s]Map:  47%|████▋     | 102143/217273 [01:53<02:15, 849.95 examples/s]Map:  47%|████▋     | 101637/217273 [01:54<01:59, 966.90 examples/s]Map:  47%|████▋     | 101608/217273 [01:52<01:59, 966.04 examples/s]Map:  47%|████▋     | 102454/217273 [01:52<01:59, 964.28 examples/s]Map:  47%|████▋     | 102242/217273 [01:54<02:10, 879.93 examples/s]Map:  47%|████▋     | 101738/217273 [01:54<01:58, 971.72 examples/s]Map:  47%|████▋     | 101709/217273 [01:52<01:58, 975.83 examples/s]Map:  47%|████▋     | 102559/217273 [01:52<01:57, 979.32 examples/s]Map:  47%|████▋     | 102350/217273 [01:54<02:03, 928.10 examples/s]Map:  47%|████▋     | 101839/217273 [01:54<01:57, 979.80 examples/s]Map:  47%|████▋     | 101810/217273 [01:52<01:57, 982.69 examples/s]Map:  47%|████▋     | 102661/217273 [01:52<01:56, 987.25 examples/s]Map:  47%|████▋     | 102448/217273 [01:54<02:02, 939.85 examples/s]Map:  47%|████▋     | 101941/217273 [01:54<01:56, 990.00 examples/s]Map:  47%|████▋     | 101964/217273 [01:52<01:55, 994.89 examples/s]Map:  47%|████▋     | 102547/217273 [01:54<02:00, 953.14 examples/s]Map:  47%|████▋     | 102809/217273 [01:52<01:56, 979.15 examples/s]Map:  47%|████▋     | 102652/217273 [01:54<01:57, 975.80 examples/s]Map:  47%|████▋     | 102909/217273 [01:52<01:56, 981.30 examples/s]Map:  47%|████▋     | 102089/217273 [01:54<02:21, 813.48 examples/s]Map:  47%|████▋     | 102100/217273 [01:52<02:15, 851.28 examples/s]Map:  47%|████▋     | 102755/217273 [01:54<01:55, 987.81 examples/s]Map:  47%|████▋     | 102189/217273 [01:54<02:14, 853.57 examples/s]Map:  47%|████▋     | 102195/217273 [01:52<02:11, 872.58 examples/s]Map:  47%|████▋     | 102857/217273 [01:54<01:55, 993.12 examples/s]Map:  47%|████▋     | 103048/217273 [01:52<02:16, 833.87 examples/s]Map:  47%|████▋     | 102291/217273 [01:54<02:08, 894.01 examples/s]Map:  47%|████▋     | 102293/217273 [01:52<02:08, 895.93 examples/s]Map:  47%|████▋     | 102959/217273 [01:54<01:54, 994.77 examples/s]Map:  47%|████▋     | 103140/217273 [01:52<02:14, 851.51 examples/s]Map:  47%|████▋     | 102427/217273 [01:55<02:08, 895.52 examples/s]Map:  48%|████▊     | 103238/217273 [01:53<02:09, 880.58 examples/s]Map:  47%|████▋     | 102431/217273 [01:52<02:07, 900.68 examples/s]Map:  47%|████▋     | 103100/217273 [01:54<02:18, 827.24 examples/s]Map:  47%|████▋     | 102527/217273 [01:55<02:04, 918.43 examples/s]Map:  48%|████▊     | 103340/217273 [01:53<02:04, 914.56 examples/s]Map:  47%|████▋     | 102535/217273 [01:53<02:03, 931.90 examples/s]Map:  47%|████▋     | 103199/217273 [01:55<02:12, 864.08 examples/s]Map:  47%|████▋     | 102623/217273 [01:55<02:03, 926.69 examples/s]Map:  48%|████▊     | 103442/217273 [01:53<02:01, 937.85 examples/s]Map:  47%|████▋     | 102680/217273 [01:53<02:01, 941.49 examples/s]Map:  48%|████▊     | 103302/217273 [01:55<02:05, 904.62 examples/s]Map:  47%|████▋     | 102725/217273 [01:55<02:00, 947.34 examples/s]Map:  48%|████▊     | 103548/217273 [01:53<01:57, 967.08 examples/s]Map:  47%|████▋     | 102781/217273 [01:53<01:59, 956.93 examples/s]Map:  48%|████▊     | 103410/217273 [01:55<02:00, 948.68 examples/s]Map:  47%|████▋     | 102826/217273 [01:55<01:59, 961.35 examples/s]Map:  48%|████▊     | 103647/217273 [01:53<01:57, 969.86 examples/s]Map:  47%|████▋     | 102882/217273 [01:53<01:58, 968.95 examples/s]Map:  48%|████▊     | 103513/217273 [01:55<01:57, 966.13 examples/s]Map:  47%|████▋     | 102931/217273 [01:55<01:56, 982.34 examples/s]Map:  48%|████▊     | 103796/217273 [01:53<01:56, 975.45 examples/s]Map:  47%|████▋     | 102982/217273 [01:53<01:57, 975.77 examples/s]Map:  48%|████▊     | 103661/217273 [01:55<01:57, 970.86 examples/s]Map:  48%|████▊     | 103898/217273 [01:53<01:55, 983.32 examples/s]Map:  47%|████▋     | 103048/217273 [01:55<02:17, 827.86 examples/s]Map:  47%|████▋     | 103102/217273 [01:53<02:18, 822.36 examples/s]Map:  47%|████▋     | 103153/217273 [01:55<02:09, 878.41 examples/s]Map:  48%|████▊     | 103812/217273 [01:55<01:55, 978.73 examples/s]Map:  48%|████▊     | 104000/217273 [01:53<02:16, 831.76 examples/s]Map:  47%|████▋     | 103204/217273 [01:53<02:11, 867.67 examples/s]Map:  48%|████▊     | 103251/217273 [01:56<02:06, 900.19 examples/s]Map:  48%|████▊     | 103916/217273 [01:55<01:54, 990.79 examples/s]Map:  48%|████▊     | 104102/217273 [01:54<02:09, 875.57 examples/s]Map:  48%|████▊     | 103302/217273 [01:53<02:07, 893.47 examples/s]Map:  48%|████▊     | 103354/217273 [01:56<02:02, 933.54 examples/s]Map:  48%|████▊     | 104206/217273 [01:54<02:03, 914.71 examples/s]Map:  48%|████▊     | 103403/217273 [01:54<02:03, 921.07 examples/s]Map:  48%|████▊     | 104041/217273 [01:55<02:17, 824.49 examples/s]Map:  48%|████▊     | 103494/217273 [01:56<02:02, 930.41 examples/s]Map:  48%|████▊     | 104350/217273 [01:54<02:01, 926.30 examples/s]Map:  48%|████▊     | 104141/217273 [01:56<02:10, 863.61 examples/s]Map:  48%|████▊     | 103544/217273 [01:54<02:03, 924.57 examples/s]Map:  48%|████▊     | 103598/217273 [01:56<01:58, 956.58 examples/s]Map:  48%|████▊     | 104453/217273 [01:54<01:58, 949.15 examples/s]Map:  48%|████▊     | 104242/217273 [01:56<02:06, 894.89 examples/s]Map:  48%|████▊     | 103643/217273 [01:54<02:01, 937.65 examples/s]Map:  48%|████▊     | 103699/217273 [01:56<01:57, 967.69 examples/s]Map:  48%|████▊     | 104553/217273 [01:54<01:57, 959.72 examples/s]Map:  48%|████▊     | 104340/217273 [01:56<02:03, 912.42 examples/s]Map:  48%|████▊     | 103748/217273 [01:54<01:57, 963.16 examples/s]Map:  48%|████▊     | 104656/217273 [01:54<01:55, 975.34 examples/s]Map:  48%|████▊     | 103842/217273 [01:56<01:58, 960.74 examples/s]Map:  48%|████▊     | 104444/217273 [01:56<01:59, 945.17 examples/s]Map:  48%|████▊     | 103855/217273 [01:54<01:54, 988.00 examples/s]Map:  48%|████▊     | 104755/217273 [01:54<01:55, 976.49 examples/s]Map:  48%|████▊     | 103941/217273 [01:56<01:57, 966.70 examples/s]Map:  48%|████▊     | 104544/217273 [01:56<01:57, 957.15 examples/s]Map:  48%|████▊     | 103955/217273 [01:54<01:54, 988.79 examples/s]Map:  48%|████▊     | 104860/217273 [01:54<01:52, 995.35 examples/s]Map:  48%|████▊     | 104646/217273 [01:56<01:56, 970.71 examples/s]Map:  48%|████▊     | 104049/217273 [01:56<02:17, 820.71 examples/s]Map:  48%|████▊     | 104963/217273 [01:54<01:52, 1000.13 examples/s]Map:  48%|████▊     | 104103/217273 [01:54<02:12, 855.56 examples/s]Map:  48%|████▊     | 104792/217273 [01:56<01:56, 968.09 examples/s]Map:  48%|████▊     | 104148/217273 [01:57<02:11, 859.53 examples/s]Map:  48%|████▊     | 104199/217273 [01:54<02:08, 878.64 examples/s]Map:  48%|████▊     | 104891/217273 [01:56<01:55, 970.20 examples/s]Map:  48%|████▊     | 104247/217273 [01:57<02:06, 890.19 examples/s]Map:  48%|████▊     | 105100/217273 [01:55<02:14, 836.20 examples/s] Map:  48%|████▊     | 104296/217273 [01:54<02:05, 899.28 examples/s]Map:  48%|████▊     | 104992/217273 [01:56<01:54, 979.31 examples/s]Map:  48%|████▊     | 104350/217273 [01:57<02:02, 925.09 examples/s]Map:  48%|████▊     | 105199/217273 [01:55<02:08, 871.21 examples/s]Map:  48%|████▊     | 104394/217273 [01:55<02:02, 918.48 examples/s]Map:  48%|████▊     | 104451/217273 [01:57<01:59, 946.82 examples/s]Map:  48%|████▊     | 105298/217273 [01:55<02:04, 895.85 examples/s]Map:  48%|████▊     | 104496/217273 [01:55<01:59, 944.36 examples/s]Map:  48%|████▊     | 105092/217273 [01:57<02:19, 805.43 examples/s]Map:  49%|████▊     | 105401/217273 [01:55<02:00, 927.97 examples/s]Map:  48%|████▊     | 104583/217273 [01:57<02:03, 913.24 examples/s]Map:  48%|████▊     | 105179/217273 [01:57<02:17, 817.08 examples/s]Map:  48%|████▊     | 104628/217273 [01:55<02:02, 916.40 examples/s]Map:  49%|████▊     | 105500/217273 [01:55<01:58, 941.36 examples/s]Map:  48%|████▊     | 105273/217273 [01:57<02:12, 843.75 examples/s]Map:  48%|████▊     | 104718/217273 [01:57<02:04, 906.65 examples/s]Map:  48%|████▊     | 104728/217273 [01:55<02:00, 936.20 examples/s]Map:  49%|████▊     | 105597/217273 [01:55<01:57, 947.68 examples/s]Map:  48%|████▊     | 105369/217273 [01:57<02:08, 873.40 examples/s]Map:  48%|████▊     | 104818/217273 [01:57<02:01, 927.40 examples/s]Map:  48%|████▊     | 104825/217273 [01:55<01:59, 942.12 examples/s]Map:  49%|████▊     | 105701/217273 [01:55<01:54, 973.03 examples/s]Map:  49%|████▊     | 105467/217273 [01:57<02:04, 900.91 examples/s]Map:  48%|████▊     | 104918/217273 [01:57<01:58, 944.36 examples/s]Map:  48%|████▊     | 104931/217273 [01:55<01:55, 969.20 examples/s]Map:  49%|████▊     | 105803/217273 [01:55<01:53, 983.32 examples/s]Map:  49%|████▊     | 105566/217273 [01:57<02:00, 923.33 examples/s]Map:  49%|████▊     | 105908/217273 [01:55<01:51, 1000.59 examples/s]Map:  49%|████▊     | 105665/217273 [01:57<01:58, 939.98 examples/s]Map:  48%|████▊     | 105047/217273 [01:58<02:17, 816.78 examples/s]Map:  48%|████▊     | 105051/217273 [01:55<02:17, 816.12 examples/s]Map:  49%|████▊     | 105767/217273 [01:57<01:55, 961.70 examples/s]Map:  48%|████▊     | 105145/217273 [01:58<02:11, 853.98 examples/s]Map:  48%|████▊     | 105154/217273 [01:55<02:09, 864.72 examples/s]Map:  49%|████▉     | 106044/217273 [01:56<02:13, 836.25 examples/s] Map:  49%|████▊     | 105868/217273 [01:57<01:54, 973.21 examples/s]Map:  48%|████▊     | 105240/217273 [01:58<02:07, 877.46 examples/s]Map:  48%|████▊     | 105249/217273 [01:56<02:06, 885.78 examples/s]Map:  49%|████▉     | 106141/217273 [01:56<02:08, 865.59 examples/s]Map:  48%|████▊     | 105343/217273 [01:58<02:02, 915.51 examples/s]Map:  48%|████▊     | 105351/217273 [01:56<02:01, 921.05 examples/s]Map:  49%|████▉     | 106244/217273 [01:56<02:02, 906.42 examples/s]Map:  49%|████▉     | 106000/217273 [01:58<02:15, 819.13 examples/s]Map:  49%|████▊     | 105449/217273 [01:56<01:59, 934.73 examples/s]Map:  49%|████▉     | 106348/217273 [01:56<01:58, 939.96 examples/s]Map:  49%|████▊     | 105487/217273 [01:58<02:00, 928.00 examples/s]Map:  49%|████▉     | 106097/217273 [01:58<02:10, 854.14 examples/s]Map:  49%|████▊     | 105546/217273 [01:56<01:58, 941.13 examples/s]Map:  49%|████▉     | 106450/217273 [01:56<01:55, 958.21 examples/s]Map:  49%|████▊     | 105590/217273 [01:58<01:57, 951.25 examples/s]Map:  49%|████▉     | 106191/217273 [01:58<02:07, 873.90 examples/s]Map:  49%|████▊     | 105642/217273 [01:56<01:58, 944.18 examples/s]Map:  49%|████▉     | 106554/217273 [01:56<01:52, 980.46 examples/s]Map:  49%|████▊     | 105687/217273 [01:58<01:57, 953.47 examples/s]Map:  49%|████▉     | 106285/217273 [01:58<02:04, 888.00 examples/s]Map:  49%|████▊     | 105782/217273 [01:56<01:59, 934.68 examples/s]Map:  49%|████▉     | 106380/217273 [01:58<02:02, 902.19 examples/s]Map:  49%|████▉     | 106694/217273 [01:56<01:55, 960.22 examples/s]Map:  49%|████▊     | 105826/217273 [01:58<01:58, 937.17 examples/s]Map:  49%|████▊     | 105884/217273 [01:56<01:56, 954.43 examples/s]Map:  49%|████▉     | 106476/217273 [01:58<02:01, 913.37 examples/s]Map:  49%|████▉     | 106794/217273 [01:56<01:54, 967.90 examples/s]Map:  49%|████▉     | 105961/217273 [01:58<02:00, 921.70 examples/s]Map:  49%|████▉     | 105986/217273 [01:56<01:54, 968.96 examples/s]Map:  49%|████▉     | 106576/217273 [01:58<01:58, 935.84 examples/s]Map:  49%|████▉     | 106895/217273 [01:56<01:52, 977.18 examples/s]Map:  49%|████▉     | 106678/217273 [01:58<01:55, 958.29 examples/s]Map:  49%|████▉     | 106103/217273 [01:56<02:15, 822.86 examples/s]Map:  49%|████▉     | 106094/217273 [01:59<02:18, 802.60 examples/s]Map:  49%|████▉     | 107000/217273 [01:57<02:15, 812.37 examples/s]Map:  49%|████▉     | 106824/217273 [01:58<01:55, 959.58 examples/s]Map:  49%|████▉     | 106204/217273 [01:57<02:08, 864.10 examples/s]Map:  49%|████▉     | 106189/217273 [01:59<02:13, 834.00 examples/s]Map:  49%|████▉     | 107097/217273 [01:57<02:09, 849.33 examples/s]Map:  49%|████▉     | 106310/217273 [01:57<02:01, 910.66 examples/s]Map:  49%|████▉     | 106283/217273 [01:59<02:09, 857.91 examples/s]Map:  49%|████▉     | 107198/217273 [01:57<02:03, 888.16 examples/s]Map:  49%|████▉     | 106962/217273 [01:59<01:57, 942.36 examples/s]Map:  49%|████▉     | 106413/217273 [01:57<01:57, 940.48 examples/s]Map:  49%|████▉     | 106387/217273 [01:59<02:03, 901.00 examples/s]Map:  49%|████▉     | 107341/217273 [01:57<02:01, 907.38 examples/s]Map:  49%|████▉     | 106513/217273 [01:57<01:55, 956.34 examples/s]Map:  49%|████▉     | 106488/217273 [01:59<01:59, 926.13 examples/s]Map:  49%|████▉     | 107083/217273 [01:59<02:18, 793.97 examples/s]Map:  49%|████▉     | 107443/217273 [01:57<01:57, 933.08 examples/s]Map:  49%|████▉     | 106619/217273 [01:57<01:52, 982.57 examples/s]Map:  49%|████▉     | 106588/217273 [01:59<01:57, 944.57 examples/s]Map:  49%|████▉     | 107182/217273 [01:59<02:11, 835.85 examples/s]Map:  49%|████▉     | 107545/217273 [01:57<01:55, 951.90 examples/s]Map:  49%|████▉     | 106720/217273 [01:57<01:52, 985.31 examples/s]Map:  49%|████▉     | 106689/217273 [01:59<01:55, 959.56 examples/s]Map:  49%|████▉     | 107283/217273 [01:59<02:05, 873.64 examples/s]Map:  50%|████▉     | 107650/217273 [01:57<01:52, 976.33 examples/s]Map:  49%|████▉     | 106821/217273 [01:57<01:51, 991.46 examples/s]Map:  49%|████▉     | 106794/217273 [01:59<01:52, 983.90 examples/s]Map:  49%|████▉     | 107384/217273 [01:59<02:01, 906.94 examples/s]Map:  50%|████▉     | 107797/217273 [01:57<01:52, 972.65 examples/s]Map:  49%|████▉     | 107481/217273 [01:59<01:58, 922.76 examples/s]Map:  49%|████▉     | 106968/217273 [01:57<01:52, 984.19 examples/s]Map:  49%|████▉     | 106930/217273 [02:00<01:56, 946.71 examples/s]Map:  50%|████▉     | 107898/217273 [01:58<01:51, 978.32 examples/s]Map:  50%|████▉     | 107583/217273 [01:59<01:56, 945.60 examples/s]Map:  50%|████▉     | 107682/217273 [01:59<01:54, 954.15 examples/s]Map:  49%|████▉     | 107100/217273 [01:58<02:10, 844.18 examples/s]Map:  49%|████▉     | 107050/217273 [02:00<02:15, 813.78 examples/s]Map:  50%|████▉     | 108000/217273 [01:58<02:12, 826.22 examples/s]Map:  49%|████▉     | 107203/217273 [01:58<02:04, 884.40 examples/s]Map:  49%|████▉     | 107148/217273 [02:00<02:09, 850.73 examples/s]Map:  50%|████▉     | 107825/217273 [02:00<01:55, 949.51 examples/s]Map:  50%|████▉     | 108103/217273 [01:58<02:04, 874.47 examples/s]Map:  49%|████▉     | 107307/217273 [01:58<01:59, 920.89 examples/s]Map:  49%|████▉     | 107250/217273 [02:00<02:04, 886.34 examples/s]Map:  50%|████▉     | 107923/217273 [02:00<01:54, 955.54 examples/s]Map:  50%|████▉     | 108209/217273 [01:58<01:58, 917.77 examples/s]Map:  49%|████▉     | 107410/217273 [01:58<01:56, 945.43 examples/s]Map:  49%|████▉     | 107352/217273 [02:00<01:59, 917.92 examples/s]Map:  50%|████▉     | 108310/217273 [01:58<01:55, 940.51 examples/s]Map:  49%|████▉     | 107510/217273 [01:58<01:54, 958.50 examples/s]Map:  49%|████▉     | 107448/217273 [02:00<01:58, 926.81 examples/s]Map:  50%|████▉     | 108047/217273 [02:00<02:12, 825.08 examples/s]Map:  50%|████▉     | 108409/217273 [01:58<01:54, 949.06 examples/s]Map:  50%|████▉     | 107611/217273 [01:58<01:53, 969.86 examples/s]Map:  49%|████▉     | 107543/217273 [02:00<01:58, 929.53 examples/s]Map:  50%|████▉     | 108150/217273 [02:00<02:05, 871.68 examples/s]Map:  50%|████▉     | 108511/217273 [01:58<01:52, 965.80 examples/s]Map:  50%|████▉     | 108244/217273 [02:00<02:03, 884.93 examples/s]Map:  50%|████▉     | 108612/217273 [01:58<01:51, 975.04 examples/s]Map:  50%|████▉     | 107752/217273 [01:58<01:54, 956.36 examples/s]Map:  50%|████▉     | 107685/217273 [02:00<01:57, 932.35 examples/s]Map:  50%|████▉     | 108345/217273 [02:00<01:59, 912.37 examples/s]Map:  50%|█████     | 108711/217273 [01:58<01:51, 975.33 examples/s]Map:  50%|████▉     | 107851/217273 [01:58<01:53, 961.79 examples/s]Map:  50%|████▉     | 107817/217273 [02:01<02:00, 911.71 examples/s]Map:  50%|████▉     | 108480/217273 [02:00<02:00, 904.98 examples/s]Map:  50%|█████     | 108858/217273 [01:59<01:51, 974.13 examples/s]Map:  50%|████▉     | 107993/217273 [01:58<01:54, 954.06 examples/s]Map:  50%|████▉     | 107947/217273 [02:01<02:02, 894.66 examples/s]Map:  50%|████▉     | 108613/217273 [02:01<02:01, 896.40 examples/s]Map:  50%|████▉     | 108098/217273 [01:59<02:18, 790.48 examples/s]Map:  50%|█████     | 109000/217273 [01:59<02:11, 826.03 examples/s]Map:  50%|█████     | 108713/217273 [02:01<01:58, 918.85 examples/s]Map:  50%|████▉     | 108047/217273 [02:01<02:21, 771.00 examples/s]Map:  50%|████▉     | 108203/217273 [01:59<02:08, 846.01 examples/s]Map:  50%|█████     | 109097/217273 [01:59<02:06, 856.63 examples/s]Map:  50%|█████     | 108809/217273 [02:01<01:56, 927.95 examples/s]Map:  50%|████▉     | 108132/217273 [02:01<02:18, 787.63 examples/s]Map:  50%|████▉     | 108303/217273 [01:59<02:03, 880.11 examples/s]Map:  50%|█████     | 108913/217273 [02:01<01:53, 957.62 examples/s]Map:  50%|████▉     | 108228/217273 [02:01<02:11, 826.93 examples/s]Map:  50%|█████     | 109234/217273 [01:59<02:03, 873.53 examples/s]Map:  50%|████▉     | 108326/217273 [02:01<02:06, 864.62 examples/s]Map:  50%|████▉     | 108439/217273 [01:59<02:02, 885.95 examples/s]Map:  50%|█████     | 109330/217273 [01:59<02:00, 893.10 examples/s]Map:  50%|█████     | 109044/217273 [02:01<02:14, 806.10 examples/s]Map:  50%|████▉     | 108422/217273 [02:01<02:02, 887.87 examples/s]Map:  50%|█████     | 109429/217273 [01:59<01:57, 914.19 examples/s]Map:  50%|████▉     | 108574/217273 [01:59<02:02, 888.64 examples/s]Map:  50%|█████     | 109132/217273 [02:01<02:11, 821.01 examples/s]Map:  50%|████▉     | 108513/217273 [02:01<02:02, 890.82 examples/s]Map:  50%|█████     | 109523/217273 [01:59<01:57, 916.23 examples/s]Map:  50%|█████     | 108669/217273 [01:59<02:00, 899.78 examples/s]Map:  50%|████▉     | 108609/217273 [02:01<01:59, 908.16 examples/s]Map:  50%|█████     | 109223/217273 [02:01<02:09, 836.71 examples/s]Map:  50%|█████     | 109659/217273 [02:00<01:58, 907.06 examples/s]Map:  50%|█████     | 108709/217273 [02:02<01:56, 932.57 examples/s]Map:  50%|█████     | 109325/217273 [02:01<02:02, 880.87 examples/s]Map:  50%|█████     | 108805/217273 [01:59<02:00, 900.71 examples/s]Map:  50%|█████     | 108805/217273 [02:02<01:55, 939.41 examples/s]Map:  50%|█████     | 109421/217273 [02:01<01:59, 899.44 examples/s]Map:  51%|█████     | 109798/217273 [02:00<01:57, 912.21 examples/s]Map:  50%|█████     | 108938/217273 [02:00<02:01, 894.05 examples/s]Map:  50%|█████     | 109517/217273 [02:02<01:58, 910.71 examples/s]Map:  50%|█████     | 108945/217273 [02:02<01:56, 932.30 examples/s]Map:  51%|█████     | 109931/217273 [02:00<01:59, 900.86 examples/s]Map:  50%|█████     | 109613/217273 [02:02<01:56, 921.25 examples/s]Map:  50%|█████     | 109039/217273 [02:00<02:24, 747.06 examples/s]Map:  50%|█████     | 109046/217273 [02:02<02:23, 756.66 examples/s]Map:  50%|█████     | 109130/217273 [02:00<02:18, 780.39 examples/s]Map:  51%|█████     | 109754/217273 [02:02<01:56, 925.71 examples/s]Map:  51%|█████     | 110045/217273 [02:00<02:22, 750.61 examples/s]Map:  50%|█████     | 109136/217273 [02:02<02:18, 782.14 examples/s]Map:  50%|█████     | 109219/217273 [02:00<02:14, 803.40 examples/s]Map:  51%|█████     | 109851/217273 [02:02<01:55, 933.13 examples/s]Map:  51%|█████     | 110138/217273 [02:00<02:16, 785.36 examples/s]Map:  50%|█████     | 109230/217273 [02:02<02:11, 818.96 examples/s]Map:  50%|█████     | 109315/217273 [02:00<02:08, 841.25 examples/s]Map:  51%|█████     | 110236/217273 [02:00<02:09, 828.73 examples/s]Map:  51%|█████     | 109995/217273 [02:02<01:54, 938.88 examples/s]Map:  50%|█████     | 109328/217273 [02:02<02:05, 857.20 examples/s]Map:  50%|█████     | 109411/217273 [02:00<02:04, 869.21 examples/s]Map:  51%|█████     | 110329/217273 [02:00<02:05, 850.76 examples/s]Map:  50%|█████     | 109423/217273 [02:02<02:02, 880.15 examples/s]Map:  50%|█████     | 109502/217273 [02:00<02:02, 876.99 examples/s]Map:  51%|█████     | 110092/217273 [02:02<02:16, 785.41 examples/s]Map:  51%|█████     | 110420/217273 [02:00<02:03, 863.44 examples/s]Map:  50%|█████     | 109517/217273 [02:03<02:00, 892.23 examples/s]Map:  51%|█████     | 110190/217273 [02:02<02:09, 827.10 examples/s]Map:  51%|█████     | 110514/217273 [02:01<02:00, 882.49 examples/s]Map:  50%|█████     | 109636/217273 [02:00<02:02, 879.06 examples/s]Map:  51%|█████     | 110288/217273 [02:02<02:03, 863.02 examples/s]Map:  50%|█████     | 109654/217273 [02:03<02:00, 895.25 examples/s]Map:  51%|█████     | 109727/217273 [02:01<02:01, 885.40 examples/s]Map:  51%|█████     | 110636/217273 [02:01<02:04, 854.04 examples/s]Map:  51%|█████     | 110383/217273 [02:03<02:01, 881.40 examples/s]Map:  51%|█████     | 109746/217273 [02:03<01:59, 899.05 examples/s]Map:  51%|█████     | 109819/217273 [02:01<02:00, 891.19 examples/s]Map:  51%|█████     | 110729/217273 [02:01<02:02, 869.39 examples/s]Map:  51%|█████     | 110482/217273 [02:03<01:57, 905.23 examples/s]Map:  51%|█████     | 109839/217273 [02:03<01:58, 906.56 examples/s]Map:  51%|█████     | 110819/217273 [02:01<02:01, 873.54 examples/s]Map:  51%|█████     | 109945/217273 [02:01<02:03, 867.93 examples/s]Map:  51%|█████     | 110581/217273 [02:03<01:55, 926.47 examples/s]Map:  51%|█████     | 109933/217273 [02:03<01:57, 910.90 examples/s]Map:  51%|█████     | 110912/217273 [02:01<01:59, 888.21 examples/s]Map:  51%|█████     | 110680/217273 [02:03<01:53, 940.63 examples/s]Map:  51%|█████     | 110045/217273 [02:01<02:26, 730.46 examples/s]Map:  51%|██��██     | 110045/217273 [02:03<02:20, 763.56 examples/s]Map:  51%|█████     | 110809/217273 [02:03<01:57, 905.06 examples/s]Map:  51%|█████     | 110142/217273 [02:01<02:16, 782.52 examples/s]Map:  51%|█████     | 111042/217273 [02:01<02:25, 730.30 examples/s]Map:  51%|█████     | 110134/217273 [02:03<02:15, 790.13 examples/s]Map:  51%|█████     | 110904/217273 [02:03<01:56, 916.52 examples/s]Map:  51%|█████     | 110227/217273 [02:01<02:14, 798.55 examples/s]Map:  51%|█████     | 111137/217273 [02:01<02:16, 777.26 examples/s]Map:  51%|█████     | 110232/217273 [02:03<02:08, 834.76 examples/s]Map:  51%|█████     | 110323/217273 [02:01<02:07, 838.57 examples/s]Map:  51%|█████     | 111234/217273 [02:01<02:08, 823.00 examples/s]Map:  51%|█████     | 110325/217273 [02:04<02:04, 856.40 examples/s]Map:  51%|█████     | 111000/217273 [02:03<02:16, 779.57 examples/s]Map:  51%|█████     | 110410/217273 [02:01<02:06, 845.65 examples/s]Map:  51%|█████     | 111327/217273 [02:02<02:05, 847.41 examples/s]Map:  51%|█████     | 110414/217273 [02:04<02:03, 864.21 examples/s]Map:  51%|█████     | 111090/217273 [02:03<02:11, 806.83 examples/s]Map:  51%|█████     | 110502/217273 [02:01<02:03, 863.13 examples/s]Map:  51%|█████▏    | 111424/217273 [02:02<02:00, 878.89 examples/s]Map:  51%|█████     | 110511/217273 [02:04<01:59, 893.11 examples/s]Map:  51%|█████     | 111187/217273 [02:03<02:05, 844.87 examples/s]Map:  51%|█████     | 110600/217273 [02:02<01:59, 892.94 examples/s]Map:  51%|█████▏    | 111521/217273 [02:02<01:57, 903.15 examples/s]Map:  51%|█████     | 110605/217273 [02:04<01:57, 905.74 examples/s]Map:  51%|█████     | 111278/217273 [02:04<02:03, 860.83 examples/s]Map:  51%|█████     | 110693/217273 [02:02<01:58, 901.14 examples/s]Map:  51%|█████▏    | 111614/217273 [02:02<01:56, 907.29 examples/s]Map:  51%|█████▏    | 111374/217273 [02:04<01:59, 885.52 examples/s]Map:  51%|█████     | 110788/217273 [02:02<01:56, 912.07 examples/s]Map:  51%|█████     | 110740/217273 [02:04<01:58, 900.44 examples/s]Map:  51%|█████▏    | 111469/217273 [02:04<01:57, 899.47 examples/s]Map:  51%|█████▏    | 111750/217273 [02:02<01:56, 903.69 examples/s]Map:  51%|█████     | 110882/217273 [02:02<01:56, 916.87 examples/s]Map:  51%|█████     | 110876/217273 [02:04<01:58, 901.13 examples/s]Map:  51%|█████▏    | 111563/217273 [02:04<01:56, 906.25 examples/s]Map:  51%|█████▏    | 111849/217273 [02:02<01:54, 922.11 examples/s]Map:  51%|█████     | 110971/217273 [02:04<01:56, 912.20 examples/s]Map:  51%|█████▏    | 111660/217273 [02:04<01:54, 922.86 examples/s]Map:  51%|█████     | 111000/217273 [02:02<02:23, 742.24 examples/s]Map:  52%|█████▏    | 111988/217273 [02:02<01:54, 920.29 examples/s]Map:  51%|█████▏    | 111753/217273 [02:04<01:54, 919.57 examples/s]Map:  51%|█████     | 111092/217273 [02:02<02:15, 781.33 examples/s]Map:  51%|█████     | 111099/217273 [02:04<02:13, 794.24 examples/s]Map:  51%|█████▏    | 111883/217273 [02:04<01:57, 897.41 examples/s]Map:  51%|█████     | 111185/217273 [02:02<02:10, 812.96 examples/s]Map:  52%|█████▏    | 112092/217273 [02:02<02:16, 768.90 examples/s]Map:  51%|█████     | 111185/217273 [02:05<02:11, 807.87 examples/s]Map:  52%|█████▏    | 112181/217273 [02:03<02:12, 794.39 examples/s]Map:  51%|█████     | 111274/217273 [02:05<02:08, 825.41 examples/s]Map:  51%|█████     | 111311/217273 [02:02<02:09, 818.80 examples/s]Map:  52%|█████▏    | 112274/217273 [02:03<02:07, 824.70 examples/s]Map:  52%|█████▏    | 112000/217273 [02:04<02:21, 742.20 examples/s]Map:  51%|█████▏    | 111370/217273 [02:05<02:03, 857.32 examples/s]Map:  51%|█████▏    | 111407/217273 [02:03<02:04, 851.59 examples/s]Map:  52%|█████▏    | 112372/217273 [02:03<02:01, 861.58 examples/s]Map:  52%|█████▏    | 112094/217273 [02:05<02:14, 783.77 examples/s]Map:  51%|█████▏    | 111470/217273 [02:05<01:58, 891.54 examples/s]Map:  51%|█████▏    | 111499/217273 [02:03<02:01, 868.17 examples/s]Map:  52%|█████▏    | 112468/217273 [02:03<01:58, 886.21 examples/s]Map:  52%|█████▏    | 112193/217273 [02:05<02:06, 831.32 examples/s]Map:  51%|█████▏    | 111565/217273 [02:05<01:56, 905.82 examples/s]Map:  51%|█████▏    | 111595/217273 [02:03<01:58, 889.94 examples/s]Map:  52%|█████▏    | 112561/217273 [02:03<01:57, 893.71 examples/s]Map:  52%|█████▏    | 112296/217273 [02:05<01:59, 878.37 examples/s]Map:  51%|█████���    | 111668/217273 [02:05<01:52, 939.02 examples/s]Map:  51%|█████▏    | 111733/217273 [02:03<01:58, 894.00 examples/s]Map:  52%|█████▏    | 112398/217273 [02:05<01:54, 912.62 examples/s]Map:  51%|█████▏    | 111772/217273 [02:05<01:49, 963.40 examples/s]Map:  52%|█████▏    | 112696/217273 [02:03<01:57, 893.53 examples/s]Map:  51%|█████▏    | 111826/217273 [02:03<01:57, 899.21 examples/s]Map:  52%|█████▏    | 112496/217273 [02:05<01:52, 930.35 examples/s]Map:  51%|█████▏    | 111876/217273 [02:05<01:47, 981.39 examples/s]Map:  52%|█████▏    | 112789/217273 [02:03<01:56, 900.09 examples/s]Map:  52%|█████▏    | 112596/217273 [02:05<01:50, 947.69 examples/s]Map:  52%|█████▏    | 111963/217273 [02:03<01:56, 900.13 examples/s]Map:  52%|█████▏    | 112881/217273 [02:03<01:55, 903.92 examples/s]Map:  52%|█████▏    | 112698/217273 [02:05<01:48, 965.29 examples/s]Map:  52%|█████▏    | 112000/217273 [02:05<02:08, 817.98 examples/s]Map:  52%|█████▏    | 112977/217273 [02:03<01:53, 918.66 examples/s]Map:  52%|█████▏    | 112097/217273 [02:06<02:03, 851.85 examples/s]Map:  52%|█████▏    | 112848/217273 [02:05<01:47, 973.44 examples/s]Map:  52%|█████▏    | 112094/217273 [02:03<02:17, 763.51 examples/s]Map:  52%|█████▏    | 112198/217273 [02:06<01:58, 887.07 examples/s]Map:  52%|█████▏    | 113095/217273 [02:04<02:16, 763.22 examples/s]Map:  52%|█████▏    | 112952/217273 [02:05<01:45, 989.22 examples/s]Map:  52%|█████▏    | 112191/217273 [02:03<02:10, 805.49 examples/s]Map:  52%|█████▏    | 113181/217273 [02:04<02:12, 783.90 examples/s]Map:  52%|█████▏    | 112336/217273 [02:06<01:57, 895.95 examples/s]Map:  52%|█████▏    | 112319/217273 [02:04<02:08, 816.73 examples/s]Map:  52%|█████▏    | 113270/217273 [02:04<02:08, 808.15 examples/s]Map:  52%|█████▏    | 112438/217273 [02:06<01:53, 924.81 examples/s]Map:  52%|█████▏    | 113096/217273 [02:06<02:06, 822.55 examples/s]Map:  52%|█████▏    | 112409/217273 [02:04<02:05, 833.94 examples/s]Map:  52%|█████▏    | 113363/217273 [02:04<02:05, 831.27 examples/s]Map:  52%|█████▏    | 113198/217273 [02:06<02:00, 864.65 examples/s]Map:  52%|█████▏    | 112500/217273 [02:04<02:03, 848.34 examples/s]Map:  52%|█████▏    | 112578/217273 [02:06<01:53, 925.13 examples/s]Map:  52%|█████▏    | 113458/217273 [02:04<02:00, 861.71 examples/s]Map:  52%|█████▏    | 113299/217273 [02:06<01:55, 896.82 examples/s]Map:  52%|█████▏    | 112589/217273 [02:04<02:02, 856.11 examples/s]Map:  52%|█████▏    | 113557/217273 [02:04<01:55, 896.86 examples/s]Map:  52%|█████▏    | 112723/217273 [02:06<01:51, 934.02 examples/s]Map:  52%|█████▏    | 113404/217273 [02:06<01:51, 934.67 examples/s]Map:  52%|█████▏    | 112682/217273 [02:04<01:59, 873.21 examples/s]Map:  52%|█████▏    | 113656/217273 [02:04<01:52, 921.24 examples/s]Map:  52%|█████▏    | 112821/217273 [02:06<01:51, 939.93 examples/s]Map:  52%|█████▏    | 113509/217273 [02:06<01:47, 963.49 examples/s]Map:  52%|█████▏    | 112772/217273 [02:04<01:59, 877.55 examples/s]Map:  52%|█████▏    | 113753/217273 [02:04<01:50, 933.11 examples/s]Map:  52%|█████▏    | 112922/217273 [02:06<01:49, 951.14 examples/s]Map:  52%|█████▏    | 112863/217273 [02:04<01:58, 884.73 examples/s]Map:  52%|█████▏    | 113656/217273 [02:06<01:47, 966.05 examples/s]Map:  52%|█████▏    | 113849/217273 [02:04<01:50, 939.38 examples/s]Map:  52%|█████▏    | 112960/217273 [02:04<01:55, 906.43 examples/s]Map:  52%|█████▏    | 113947/217273 [02:05<01:48, 948.90 examples/s]Map:  52%|█████▏    | 113048/217273 [02:07<02:07, 816.24 examples/s]Map:  52%|█████▏    | 113807/217273 [02:06<01:46, 975.96 examples/s]Map:  52%|█████▏    | 113147/217273 [02:07<02:01, 854.10 examples/s]Map:  52%|█████▏    | 113907/217273 [02:06<01:45, 979.47 examples/s]Map:  52%|█████▏    | 114046/217273 [02:05<02:14, 765.50 examples/s]Map:  52%|█████▏    | 113093/217273 [02:05<02:16, 762.94 examples/s]Map:  52%|█████▏    | 113248/217273 [02:07<01:57, 889.08 examples/s]Map:  53%|█████▎    | 114144/217273 [02:05<02:06, 816.82 examples/s]Map:  52%|█████▏    | 113183/217273 [02:05<02:11, 793.58 examples/s]Map:  52%|█████▏    | 113345/217273 [02:07<01:54, 908.36 examples/s]Map:  52%|█████▏    | 114046/217273 [02:07<02:02, 840.20 examples/s]Map:  53%|█████▎    | 114234/217273 [02:05<02:03, 835.85 examples/s]Map:  52%|█████▏    | 113279/217273 [02:05<02:04, 833.90 examples/s]Map:  53%|█████▎    | 114146/217273 [02:07<01:58, 872.83 examples/s]Map:  52%|█████▏    | 113490/217273 [02:07<01:52, 925.86 examples/s]Map:  53%|█████▎    | 114329/217273 [02:05<01:58, 865.74 examples/s]Map:  52%|█████▏    | 113414/217273 [02:05<02:01, 852.18 examples/s]Map:  53%|█████▎    | 114248/217273 [02:07<01:53, 905.70 examples/s]Map:  52%|█████▏    | 113594/217273 [02:07<01:49, 949.87 examples/s]Map:  53%|█████▎    | 114464/217273 [02:05<01:57, 875.98 examples/s]Map:  52%|█████▏    | 113509/217273 [02:05<01:58, 872.91 examples/s]Map:  53%|█████▎    | 114353/217273 [02:07<01:49, 937.64 examples/s]Map:  52%|█████▏    | 113694/217273 [02:07<01:47, 960.48 examples/s]Map:  53%|█████▎    | 114560/217273 [02:05<01:54, 896.03 examples/s]Map:  52%|█████▏    | 113605/217273 [02:05<01:56, 891.63 examples/s]Map:  52%|█████▏    | 113795/217273 [02:07<01:46, 968.06 examples/s]Map:  53%|█████▎    | 114506/217273 [02:07<01:47, 960.37 examples/s]Map:  53%|█████▎    | 114657/217273 [02:05<01:52, 912.53 examples/s]Map:  52%|█████▏    | 113893/217273 [02:07<01:46, 969.58 examples/s]Map:  52%|█████▏    | 113742/217273 [02:05<01:55, 894.52 examples/s]Map:  53%|█████▎    | 114605/217273 [02:07<01:46, 966.69 examples/s]Map:  53%|█████▎    | 114794/217273 [02:05<01:52, 907.80 examples/s]Map:  52%|█████▏    | 113835/217273 [02:05<01:54, 901.17 examples/s]Map:  53%|█████▎    | 114705/217273 [02:07<01:45, 973.02 examples/s]Map:  52%|█████▏    | 114000/217273 [02:08<02:09, 799.15 examples/s]Map:  53%|█████▎    | 114892/217273 [02:06<01:51, 920.94 examples/s]Map:  52%|█████▏    | 113932/217273 [02:05<01:53, 913.46 examples/s]Map:  53%|█████▎    | 114851/217273 [02:07<01:45, 968.91 examples/s]Map:  53%|█████▎    | 114095/217273 [02:08<02:03, 833.90 examples/s]Map:  53%|█████▎    | 114989/217273 [02:06<01:49, 930.00 examples/s]Map:  53%|█████▎    | 114191/217273 [02:08<01:59, 865.86 examples/s]Map:  52%|█████▏    | 114048/217273 [02:06<02:14, 767.93 examples/s]Map:  53%|█████▎    | 114995/217273 [02:08<01:46, 961.64 examples/s]Map:  53%|█████▎    | 114284/217273 [02:08<01:56, 881.41 examples/s]Map:  53%|█████▎    | 115089/217273 [02:06<02:16, 748.80 examples/s]Map:  53%|█████▎    | 114137/217273 [02:06<02:09, 794.62 examples/s]Map:  53%|█████▎    | 114381/217273 [02:08<01:54, 901.20 examples/s]Map:  53%|█████▎    | 115184/217273 [02:06<02:08, 792.99 examples/s]Map:  53%|█████▎    | 114230/217273 [02:06<02:04, 826.04 examples/s]Map:  53%|█████▎    | 115135/217273 [02:08<02:06, 809.95 examples/s]Map:  53%|█████▎    | 114475/217273 [02:08<01:52, 910.14 examples/s]Map:  53%|█████▎    | 115280/217273 [02:06<02:02, 832.90 examples/s]Map:  53%|█████▎    | 114326/217273 [02:06<01:59, 858.18 examples/s]Map:  53%|█████▎    | 115226/217273 [02:08<02:02, 829.69 examples/s]Map:  53%|█████▎    | 114607/217273 [02:08<01:54, 893.53 examples/s]Map:  53%|█████▎    | 115317/217273 [02:08<02:00, 845.13 examples/s]Map:  53%|█████▎    | 115414/217273 [02:06<01:59, 850.98 examples/s]Map:  53%|█████▎    | 114448/217273 [02:06<02:03, 834.51 examples/s]Map:  53%|█████▎    | 114704/217273 [02:08<01:52, 911.62 examples/s]Map:  53%|█████▎    | 115413/217273 [02:08<01:56, 870.74 examples/s]Map:  53%|█████▎    | 115516/217273 [02:06<01:54, 890.26 examples/s]Map:  53%|█████▎    | 114540/217273 [02:06<02:00, 854.08 examples/s]Map:  53%|█████▎    | 114799/217273 [02:08<01:51, 921.40 examples/s]Map:  53%|█████▎    | 115506/217273 [02:08<01:55, 881.93 examples/s]Map:  53%|█████▎    | 115612/217273 [02:06<01:52, 906.85 examples/s]Map:  53%|█████▎    | 114632/217273 [02:06<01:57, 870.32 examples/s]Map:  53%|█████▎    | 115599/217273 [02:08<01:53, 892.81 examples/s]Map:  53%|█████▎    | 115712/217273 [02:07<01:49, 929.37 examples/s]Map:  53%|█████▎    | 114735/217273 [02:06<01:52, 909.78 examples/s]Map:  53%|█████▎    | 114938/217273 [02:09<01:51, 921.79 examples/s]Map:  53%|█████▎    | 115690/217273 [02:08<01:53, 894.88 examples/s]Map:  53%|█████▎    | 115813/217273 [02:07<01:46, 949.13 examples/s]Map:  53%|█████▎    | 114831/217273 [02:07<01:51, 921.52 examples/s]Map:  53%|█████▎    | 115782/217273 [02:09<01:52, 900.14 examples/s]Map:  53%|█████▎    | 115910/217273 [02:07<01:46, 952.65 examples/s]Map:  53%|█████▎    | 114925/217273 [02:07<01:50, 925.76 examples/s]Map:  53%|█████▎    | 115048/217273 [02:09<02:09, 790.09 examples/s]Map:  53%|█████▎    | 115878/217273 [02:09<01:50, 914.29 examples/s]Map:  53%|█████▎    | 115145/217273 [02:09<02:03, 829.26 examples/s]Map:  53%|█████▎    | 115046/217273 [02:07<02:13, 768.56 examples/s]Map:  53%|█████▎    | 115245/217273 [02:09<01:57, 869.96 examples/s]Map:  53%|█████▎    | 116049/217273 [02:07<02:06, 797.28 examples/s]Map:  53%|█████▎    | 116000/217273 [02:09<02:12, 765.60 examples/s]Map:  53%|█████▎    | 115146/217273 [02:07<02:04, 822.72 examples/s]Map:  53%|█████▎    | 115343/217273 [02:09<01:53, 895.00 examples/s]Map:  53%|█████▎    | 116147/217273 [02:07<02:00, 838.34 examples/s]Map:  53%|█████▎    | 116094/217273 [02:09<02:05, 806.35 examples/s]Map:  53%|█████▎    | 115246/217273 [02:07<01:58, 864.10 examples/s]Map:  54%|█████▎    | 116252/217273 [02:07<01:53, 887.07 examples/s]Map:  53%|█████▎    | 115479/217273 [02:09<01:53, 895.36 examples/s]Map:  53%|█████▎    | 116193/217273 [02:09<01:58, 851.14 examples/s]Map:  53%|█████▎    | 115345/217273 [02:07<01:53, 895.86 examples/s]Map:  54%|█████▎    | 116352/217273 [02:07<01:50, 912.88 examples/s]Map:  53%|█████▎    | 115574/217273 [02:09<01:52, 907.11 examples/s]Map:  54%|█████▎    | 116294/217273 [02:09<01:53, 890.62 examples/s]Map:  53%|█████▎    | 115440/217273 [02:07<01:52, 908.69 examples/s]Map:  54%|█████▎    | 116450/217273 [02:07<01:48, 926.01 examples/s]Map:  53%|█████▎    | 115667/217273 [02:09<01:51, 910.81 examples/s]Map:  54%|█████▎    | 116423/217273 [02:09<01:54, 877.61 examples/s]Map:  53%|█████▎    | 115576/217273 [02:07<01:52, 907.13 examples/s]Map:  54%|█████▎    | 116587/217273 [02:08<01:50, 914.25 examples/s]Map:  53%|█████▎    | 115808/217273 [02:10<01:50, 916.84 examples/s]Map:  54%|█████▎    | 116521/217273 [02:09<01:51, 902.24 examples/s]Map:  53%|█████▎    | 115676/217273 [02:08<01:49, 927.99 examples/s]Map:  54%|█████▎    | 116684/217273 [02:08<01:48, 928.31 examples/s]Map:  53%|█████▎    | 115905/217273 [02:10<01:49, 928.67 examples/s]Map:  54%|█████▎    | 116616/217273 [02:10<01:50, 912.19 examples/s]Map:  53%|█████▎    | 115775/217273 [02:08<01:47, 941.21 examples/s]Map:  54%|█████▍    | 116827/217273 [02:08<01:47, 931.86 examples/s]Map:  54%|█████▎    | 116714/217273 [02:10<01:49, 921.79 examples/s]Map:  53%|█████▎    | 115879/217273 [02:08<01:45, 963.60 examples/s]Map:  53%|█████▎    | 116000/217273 [02:10<02:09, 784.50 examples/s]Map:  54%|█████▍    | 116928/217273 [02:08<01:45, 949.51 examples/s]Map:  54%|█████▍    | 116811/217273 [02:10<01:48, 928.49 examples/s]Map:  53%|█████▎    | 115983/217273 [02:08<01:43, 982.92 examples/s]Map:  53%|█████▎    | 116088/217273 [02:10<02:05, 806.52 examples/s]Map:  54%|█████▍    | 116907/217273 [02:10<01:47, 932.55 examples/s]Map:  53%|█████▎    | 116187/217273 [02:10<01:58, 851.84 examples/s]Map:  54%|█████▍    | 117051/217273 [02:08<02:04, 801.81 examples/s]Map:  53%|█████▎    | 116098/217273 [02:08<02:02, 823.88 examples/s]Map:  54%|█████▎    | 116285/217273 [02:10<01:54, 883.57 examples/s]Map:  54%|█████▍    | 117154/217273 [02:08<01:57, 851.73 examples/s]Map:  53%|█████▎    | 116198/217273 [02:08<01:56, 865.14 examples/s]Map:  54%|█████▍    | 117048/217273 [02:10<02:07, 787.39 examples/s]Map:  54%|█████▎    | 116381/217273 [02:10<01:51, 903.29 examples/s]Map:  54%|█████▍    | 117254/217273 [02:08<01:52, 885.94 examples/s]Map:  54%|█████▎    | 116299/217273 [02:08<01:52, 900.60 examples/s]Map:  54%|█████▍    | 117143/217273 [02:10<02:01, 823.63 examples/s]Map:  54%|█████▎    | 116477/217273 [02:10<01:49, 917.28 examples/s]Map:  54%|█████▍    | 117358/217273 [02:08<01:48, 924.29 examples/s]Map:  54%|█████▎    | 116401/217273 [02:08<01:48, 931.35 examples/s]Map:  54%|█████▍    | 117242/217273 [02:10<01:55, 863.89 examples/s]Map:  54%|█████▎    | 116576/217273 [02:11<01:47, 934.31 examples/s]Map:  54%|█████▎    | 116498/217273 [02:08<01:47, 939.87 examples/s]Map:  54%|█████▍    | 117340/217273 [02:10<01:52, 891.38 examples/s]Map:  54%|█████▍    | 117506/217273 [02:09<01:45, 943.02 examples/s]Map:  54%|█████▎    | 116678/217273 [02:11<01:45, 955.83 examples/s]Map:  54%|█████▎    | 116595/217273 [02:08<01:46, 943.67 examples/s]Map:  54%|█████▍    | 117433/217273 [02:10<01:51, 897.36 examples/s]Map:  54%|█████▍    | 117645/217273 [02:09<01:46, 933.80 examples/s]Map:  54%|█████▍    | 116818/217273 [02:11<01:46, 946.09 examples/s]Map:  54%|█████▎    | 116722/217273 [02:09<01:51, 904.93 examples/s]Map:  54%|█████▍    | 117563/217273 [02:11<01:53, 881.40 examples/s]Map:  54%|█████▍    | 117786/217273 [02:09<01:46, 933.87 examples/s]Map:  54%|█████▍    | 116954/217273 [02:11<01:47, 930.52 examples/s]Map:  54%|█████▍    | 116825/217273 [02:09<01:47, 933.99 examples/s]Map:  54%|█████▍    | 117656/217273 [02:11<01:51, 891.77 examples/s]Map:  54%|█████▍    | 117882/217273 [02:09<01:46, 936.40 examples/s]Map:  54%|█████▍    | 116930/217273 [02:09<01:44, 964.80 examples/s]Map:  54%|█████▍    | 117756/217273 [02:11<01:48, 915.39 examples/s]Map:  54%|█████▍    | 117980/217273 [02:09<01:44, 945.68 examples/s]Map:  54%|█████▍    | 117093/217273 [02:11<02:04, 805.25 examples/s]Map:  54%|█████▍    | 117853/217273 [02:11<01:47, 927.06 examples/s]Map:  54%|█████▍    | 117048/217273 [02:09<02:01, 824.70 examples/s]Map:  54%|█████▍    | 117189/217273 [02:11<01:59, 836.84 examples/s]Map:  54%|█████▍    | 117951/217273 [02:11<01:45, 939.33 examples/s]Map:  54%|█████▍    | 118102/217273 [02:09<02:02, 812.02 examples/s]Map:  54%|█████▍    | 117153/217273 [02:09<01:54, 875.84 examples/s]Map:  54%|█████▍    | 117290/217273 [02:11<01:54, 874.60 examples/s]Map:  54%|█████▍    | 118204/217273 [02:09<01:55, 857.03 examples/s]Map:  54%|█████▍    | 117253/217273 [02:09<01:50, 905.83 examples/s]Map:  54%|█████▍    | 118047/217273 [02:11<02:08, 773.99 examples/s]Map:  54%|█████▍    | 117384/217273 [02:11<01:52, 888.52 examples/s]Map:  54%|█████▍    | 118306/217273 [02:09<01:50, 894.48 examples/s]Map:  54%|█████▍    | 117357/217273 [02:09<01:46, 938.38 examples/s]Map:  54%|█████▍    | 118142/217273 [02:11<02:01, 815.28 examples/s]Map:  54%|█████▍    | 117483/217273 [02:12<01:49, 913.02 examples/s]Map:  54%|█████▍    | 118406/217273 [02:10<01:47, 919.64 examples/s]Map:  54%|█████▍    | 117460/217273 [02:09<01:43, 960.05 examples/s]Map:  54%|█████▍    | 118236/217273 [02:11<01:57, 846.44 examples/s]Map:  54%|█████▍    | 117584/217273 [02:12<01:46, 938.31 examples/s]Map:  55%|█████▍    | 118505/217273 [02:10<01:45, 935.94 examples/s]Map:  54%|█████▍    | 117564/217273 [02:10<01:41, 982.42 examples/s]Map:  54%|█████▍    | 118328/217273 [02:11<01:54, 862.70 examples/s]Map:  54%|█████▍    | 117680/217273 [02:12<01:45, 941.66 examples/s]Map:  55%|█████▍    | 118601/217273 [02:10<01:44, 940.75 examples/s]Map:  54%|█████▍    | 117668/217273 [02:10<01:40, 993.25 examples/s]Map:  55%|█████▍    | 118424/217273 [02:12<01:51, 888.42 examples/s]Map:  54%|█████▍    | 117778/217273 [02:12<01:44, 949.64 examples/s]Map:  55%|█████▍    | 118702/217273 [02:10<01:42, 957.97 examples/s]Map:  54%|█████▍    | 117773/217273 [02:10<01:38, 1006.46 examples/s]Map:  55%|█████▍    | 118516/217273 [02:12<01:50, 895.18 examples/s]Map:  54%|█████▍    | 117882/217273 [02:12<01:42, 971.17 examples/s]Map:  55%|█████▍    | 118609/217273 [02:12<01:49, 898.20 examples/s]Map:  55%|█████▍    | 118845/217273 [02:10<01:43, 953.19 examples/s]Map:  54%|█████▍    | 117911/217273 [02:10<01:42, 968.20 examples/s] Map:  55%|█████▍    | 118701/217273 [02:12<01:49, 901.96 examples/s]Map:  54%|█████▍    | 118000/217273 [02:12<02:07, 779.20 examples/s]Map:  55%|█████▍    | 118943/217273 [02:10<01:42, 959.36 examples/s]Map:  55%|█████▍    | 118800/217273 [02:12<01:46, 924.15 examples/s]Map:  54%|█████▍    | 118093/217273 [02:12<02:01, 814.03 examples/s]Map:  54%|█████▍    | 118049/217273 [02:10<02:00, 823.67 examples/s]Map:  55%|█████▍    | 119045/217273 [02:10<02:03, 796.94 examples/s]Map:  55%|█████▍    | 118894/217273 [02:12<01:46, 925.73 examples/s]Map:  54%|█████▍    | 118198/217273 [02:12<01:53, 871.70 examples/s]Map:  54%|█████▍    | 118151/217273 [02:10<01:54, 864.10 examples/s]Map:  55%|█████▍    | 118997/217273 [02:12<01:42, 955.38 examples/s]Map:  55%|█████▍    | 119145/217273 [02:10<01:56, 842.67 examples/s]Map:  54%|█████▍    | 118292/217273 [02:12<01:51, 888.12 examples/s]Map:  54%|█████▍    | 118254/217273 [02:10<01:49, 902.09 examples/s]Map:  55%|█████▍    | 119243/217273 [02:10<01:52, 874.33 examples/s]Map:  54%|█████▍    | 118393/217273 [02:13<01:47, 918.40 examples/s]Map:  54%|���████▍    | 118353/217273 [02:10<01:47, 922.89 examples/s]Map:  55%|█████▍    | 119104/217273 [02:12<02:00, 811.77 examples/s]Map:  55%|█████▍    | 119347/217273 [02:11<01:47, 913.06 examples/s]Map:  55%|█████▍    | 118491/217273 [02:13<01:45, 933.15 examples/s]Map:  55%|█████▍    | 118458/217273 [02:11<01:43, 952.60 examples/s]Map:  55%|█████▍    | 119196/217273 [02:12<01:57, 837.85 examples/s]Map:  55%|█████▍    | 119447/217273 [02:11<01:44, 933.17 examples/s]Map:  55%|█████▍    | 118587/217273 [02:13<01:45, 937.26 examples/s]Map:  55%|█████▍    | 118561/217273 [02:11<01:42, 964.55 examples/s]Map:  55%|█████▍    | 119292/217273 [02:13<01:52, 869.69 examples/s]Map:  55%|█████▌    | 119548/217273 [02:11<01:42, 951.55 examples/s]Map:  55%|█████▍    | 118685/217273 [02:13<01:44, 942.61 examples/s]Map:  55%|█████▍    | 119387/217273 [02:13<01:50, 888.30 examples/s]Map:  55%|█████▍    | 118709/217273 [02:11<01:41, 971.19 examples/s]Map:  55%|█████▌    | 119651/217273 [02:11<01:40, 970.04 examples/s]Map:  55%|█████▍    | 118831/217273 [02:13<01:43, 949.26 examples/s]Map:  55%|█████▍    | 119489/217273 [02:13<01:45, 923.34 examples/s]Map:  55%|█████▍    | 118809/217273 [02:11<01:40, 977.70 examples/s]Map:  55%|█████▌    | 119754/217273 [02:11<01:39, 981.44 examples/s]Map:  55%|█████▍    | 118933/217273 [02:13<01:41, 964.18 examples/s]Map:  55%|█████▌    | 119593/217273 [02:13<01:42, 954.89 examples/s]Map:  55%|█████▌    | 119855/217273 [02:11<01:38, 989.11 examples/s]Map:  55%|█████▍    | 118957/217273 [02:11<01:40, 977.69 examples/s]Map:  55%|█████▌    | 119690/217273 [02:13<01:42, 951.83 examples/s]Map:  55%|█████▌    | 119956/217273 [02:11<01:37, 993.23 examples/s]Map:  55%|█████▍    | 119042/217273 [02:13<02:01, 811.22 examples/s]Map:  55%|█████▌    | 119834/217273 [02:13<01:42, 951.46 examples/s]Map:  55%|█████▍    | 119139/217273 [02:13<01:55, 847.65 examples/s]Map:  55%|█████▍    | 119101/217273 [02:11<01:56, 841.69 examples/s]Map:  55%|█████▌    | 120099/217273 [02:11<01:56, 835.86 examples/s]Map:  55%|█████▌    | 119934/217273 [02:13<01:41, 960.15 examples/s]Map:  55%|█████▍    | 119238/217273 [02:14<01:51, 881.82 examples/s]Map:  55%|█████▍    | 119200/217273 [02:11<01:52, 872.14 examples/s]Map:  55%|█████▌    | 120200/217273 [02:12<01:50, 875.79 examples/s]Map:  55%|█████▍    | 119336/217273 [02:14<01:48, 904.64 examples/s]Map:  55%|█████▍    | 119303/217273 [02:11<01:47, 908.94 examples/s]Map:  55%|█████▌    | 120047/217273 [02:13<01:58, 819.56 examples/s]Map:  55%|█████▌    | 120302/217273 [02:12<01:46, 911.22 examples/s]Map:  55%|█████▍    | 119433/217273 [02:14<01:46, 920.92 examples/s]Map:  55%|█████▍    | 119407/217273 [02:12<01:44, 940.11 examples/s]Map:  55%|█████▌    | 120150/217273 [02:14<01:51, 869.25 examples/s]Map:  55%|█████▌    | 120402/217273 [02:12<01:43, 933.62 examples/s]Map:  55%|█████▌    | 119537/217273 [02:14<01:42, 952.95 examples/s]Map:  55%|█████▌    | 120247/217273 [02:14<01:48, 892.38 examples/s]Map:  55%|█████▌    | 120508/217273 [02:12<01:40, 965.00 examples/s]Map:  55%|█████▌    | 119554/217273 [02:12<01:42, 951.20 examples/s]Map:  55%|█████▌    | 119635/217273 [02:14<01:42, 957.08 examples/s]Map:  55%|█████▌    | 120351/217273 [02:14<01:44, 928.52 examples/s]Map:  56%|█████▌    | 120609/217273 [02:12<01:39, 973.51 examples/s]Map:  55%|█████▌    | 119655/217273 [02:12<01:41, 964.09 examples/s]Map:  55%|█████▌    | 119780/217273 [02:14<01:41, 956.73 examples/s]Map:  55%|█████▌    | 120451/217273 [02:14<01:42, 945.56 examples/s]Map:  56%|█████▌    | 120712/217273 [02:12<01:38, 985.22 examples/s]Map:  55%|█████▌    | 119763/217273 [02:12<01:38, 990.80 examples/s]Map:  55%|█████▌    | 119880/217273 [02:14<01:40, 966.43 examples/s]Map:  55%|█████▌    | 119865/217273 [02:12<01:37, 997.46 examples/s]Map:  56%|█████▌    | 120817/217273 [02:12<01:36, 999.80 examples/s]Map:  56%|█████▌    | 120598/217273 [02:14<01:41, 955.58 examples/s]Map:  55%|█████▌    | 119978/217273 [02:14<01:40, 966.30 examples/s]Map:  56%|█████▌    | 120700/217273 [02:14<01:39, 966.70 examples/s]Map:  56%|█████▌    | 120964/217273 [02:12<01:37, 988.47 examples/s]Map:  55%|█████▌    | 120000/217273 [02:12<01:57, 830.91 examples/s]Map:  56%|█████▌    | 120800/217273 [02:14<01:39, 971.25 examples/s]Map:  55%|█████▌    | 120095/217273 [02:14<02:00, 809.35 examples/s]Map:  55%|█████▌    | 120094/217273 [02:12<01:53, 854.23 examples/s]Map:  56%|█████▌    | 121098/217273 [02:12<01:54, 837.21 examples/s]Map:  55%|█████▌    | 120193/217273 [02:15<01:54, 845.11 examples/s]Map:  56%|█████▌    | 120945/217273 [02:14<01:39, 965.82 examples/s]Map:  55%|█████▌    | 120193/217273 [02:12<01:49, 882.55 examples/s]Map:  56%|█████▌    | 121203/217273 [02:13<01:48, 884.73 examples/s]Map:  55%|█████▌    | 120285/217273 [02:15<01:52, 860.86 examples/s]Map:  56%|█████▌    | 121304/217273 [02:13<01:45, 912.84 examples/s]Map:  55%|█████▌    | 120333/217273 [02:13<01:47, 899.23 examples/s]Map:  55%|█████▌    | 120380/217273 [02:15<01:49, 882.95 examples/s]Map:  56%|█████▌    | 121094/217273 [02:15<01:58, 814.00 examples/s]Map:  56%|█████▌    | 121406/217273 [02:13<01:42, 939.53 examples/s]Map:  55%|█████▌    | 120428/217273 [02:13<01:46, 909.26 examples/s]Map:  55%|█████▌    | 120480/217273 [02:15<01:46, 910.30 examples/s]Map:  56%|█████▌    | 121192/217273 [02:15<01:53, 848.53 examples/s]Map:  56%|█████▌    | 121505/217273 [02:13<01:40, 950.30 examples/s]Map:  55%|█████▌    | 120525/217273 [02:13<01:44, 922.67 examples/s]Map:  55%|█████▌    | 120579/217273 [02:15<01:43, 930.08 examples/s]Map:  56%|█████▌    | 121291/217273 [02:15<01:48, 880.75 examples/s]Map:  56%|█████▌    | 121610/217273 [02:13<01:38, 975.14 examples/s]Map:  56%|█████▌    | 120628/217273 [02:13<01:42, 947.36 examples/s]Map:  56%|█████▌    | 120680/217273 [02:15<01:41, 949.82 examples/s]Map:  56%|█████▌    | 121386/217273 [02:15<01:47, 894.75 examples/s]Map:  56%|█████▌    | 121713/217273 [02:13<01:36, 988.71 examples/s]Map:  56%|█████▌    | 120728/217273 [02:13<01:40, 959.61 examples/s]Map:  56%|█████▌    | 120777/217273 [02:15<01:41, 953.98 examples/s]Map:  56%|█████▌    | 121486/217273 [02:15<01:44, 920.41 examples/s]Map:  56%|█████▌    | 120827/217273 [02:13<01:40, 963.99 examples/s]Map:  56%|█████▌    | 120874/217273 [02:15<01:40, 955.88 examples/s]Map:  56%|█████▌    | 121866/217273 [02:13<01:35, 994.36 examples/s]Map:  56%|█████▌    | 121585/217273 [02:15<01:42, 935.85 examples/s]Map:  56%|█████▌    | 120927/217273 [02:13<01:39, 973.05 examples/s]Map:  56%|█████▌    | 120980/217273 [02:15<01:37, 983.11 examples/s]Map:  56%|█████▌    | 121683/217273 [02:15<01:41, 944.26 examples/s]Map:  56%|█████▌    | 122000/217273 [02:13<01:52, 848.10 examples/s]Map:  56%|█████▌    | 121791/217273 [02:15<01:37, 978.41 examples/s]Map:  56%|█████▌    | 121101/217273 [02:16<01:55, 830.22 examples/s]Map:  56%|█████▌    | 121052/217273 [02:13<02:00, 797.77 examples/s]Map:  56%|█████▌    | 122105/217273 [02:14<01:46, 893.66 examples/s]Map:  56%|█████▌    | 121891/217273 [02:15<01:37, 981.05 examples/s]Map:  56%|█████▌    | 121193/217273 [02:16<01:52, 850.69 examples/s]Map:  56%|█████▌    | 121142/217273 [02:13<01:57, 821.17 examples/s]Map:  56%|█████▌    | 122204/217273 [02:14<01:44, 914.06 examples/s]Map:  56%|█████▌    | 121238/217273 [02:14<01:52, 852.61 examples/s]Map:  56%|█████▋    | 122308/217273 [02:14<01:40, 942.99 examples/s]Map:  56%|█████▌    | 121331/217273 [02:16<01:50, 869.54 examples/s]Map:  56%|█████▌    | 122000/217273 [02:16<02:00, 792.27 examples/s]Map:  56%|█████▌    | 121334/217273 [02:14<01:49, 879.35 examples/s]Map:  56%|█████▌    | 121431/217273 [02:16<01:46, 901.45 examples/s]Map:  56%|█████▋    | 122408/217273 [02:14<01:39, 954.84 examples/s]Map:  56%|█████▌    | 122101/217273 [02:16<01:52, 845.30 examples/s]Map:  56%|█████▌    | 121428/217273 [02:14<01:47, 893.67 examples/s]Map:  56%|█████▋    | 122509/217273 [02:14<01:37, 968.98 examples/s]Map:  56%|█████▌    | 121533/217273 [02:16<01:43, 929.42 examples/s]Map:  56%|█████▌    | 122205/217273 [02:16<01:46, 892.90 examples/s]Map:  56%|█████▌    | 121530/217273 [02:14<01:43, 929.13 examples/s]Map:  56%|█████▋    | 122608/217273 [02:14<01:37, 971.62 examples/s]Map:  56%|█████▋    | 122305/217273 [02:16<01:43, 920.40 examples/s]Map:  56%|█████▌    | 121677/217273 [02:16<01:41, 937.26 examples/s]Map:  56%|█████▋    | 122713/217273 [02:14<01:35, 990.31 examples/s]Map:  56%|█████▋    | 122405/217273 [02:16<01:40, 939.54 examples/s]Map:  56%|█████▌    | 121670/217273 [02:14<01:42, 928.66 examples/s]Map:  57%|█████▋    | 122813/217273 [02:14<01:35, 991.13 examples/s]Map:  56%|█████▌    | 121823/217273 [02:16<01:40, 946.31 examples/s]Map:  56%|█████▋    | 122506/217273 [02:16<01:39, 955.38 examples/s]Map:  56%|█████▌    | 121772/217273 [02:14<01:40, 951.14 examples/s]Map:  57%|█████▋    | 122917/217273 [02:14<01:34, 1002.56 examples/s]Map:  56%|█████▌    | 121920/217273 [02:16<01:40, 949.44 examples/s]Map:  56%|█████▌    | 121873/217273 [02:14<01:38, 965.40 examples/s]Map:  56%|█████▋    | 122651/217273 [02:16<01:38, 956.96 examples/s]Map:  56%|█████▌    | 121973/217273 [02:14<01:38, 970.72 examples/s]Map:  56%|█████▌    | 122044/217273 [02:17<01:57, 808.65 examples/s]Map:  57%|█████▋    | 122800/217273 [02:16<01:37, 965.22 examples/s]Map:  57%|█████▋    | 123050/217273 [02:15<01:53, 832.88 examples/s] Map:  56%|█████▌    | 122139/217273 [02:17<01:53, 839.11 examples/s]Map:  56%|█████▌    | 122097/217273 [02:15<01:56, 814.50 examples/s]Map:  57%|█████▋    | 123146/217273 [02:15<01:49, 859.98 examples/s]Map:  57%|█████▋    | 122947/217273 [02:17<01:37, 967.16 examples/s]Map:  56%|█████▋    | 122237/217273 [02:17<01:48, 872.66 examples/s]Map:  56%|█████▌    | 122193/217273 [02:15<01:52, 846.44 examples/s]Map:  57%|█████▋    | 123241/217273 [02:15<01:46, 879.67 examples/s]Map:  56%|█████▋    | 122329/217273 [02:17<01:47, 879.35 examples/s]Map:  56%|█████▋    | 122287/217273 [02:15<01:49, 868.50 examples/s]Map:  57%|█████▋    | 123343/217273 [02:15<01:42, 915.28 examples/s]Map:  57%|█████▋    | 123049/217273 [02:17<01:54, 820.59 examples/s]Map:  56%|█████▋    | 122423/217273 [02:17<01:46, 891.33 examples/s]Map:  56%|█████▋    | 122390/217273 [02:15<01:44, 909.33 examples/s]Map:  57%|█████▋    | 123446/217273 [02:15<01:39, 944.68 examples/s]Map:  57%|█████▋    | 123156/217273 [02:17<01:47, 874.21 examples/s]Map:  56%|█████▋    | 122518/217273 [02:17<01:44, 904.60 examples/s]Map:  56%|█████▋    | 122491/217273 [02:15<01:41, 935.14 examples/s]Map:  57%|█████▋    | 123547/217273 [02:15<01:37, 957.46 examples/s]Map:  57%|█████▋    | 123256/217273 [02:17<01:44, 902.30 examples/s]Map:  56%|█████▋    | 122614/217273 [02:17<01:43, 917.45 examples/s]Map:  56%|█████▋    | 122589/217273 [02:15<01:40, 945.10 examples/s]Map:  57%|█████▋    | 123650/217273 [02:15<01:35, 976.29 examples/s]Map:  57%|█████▋    | 123359/217273 [02:17<01:40, 930.73 examples/s]Map:  56%|█████▋    | 122716/217273 [02:17<01:40, 942.87 examples/s]Map:  56%|█████▋    | 122688/217273 [02:15<01:38, 955.63 examples/s]Map:  57%|█████▋    | 123752/217273 [02:15<01:34, 984.55 examples/s]Map:  57%|█████▋    | 123460/217273 [02:17<01:38, 947.76 examples/s]Map:  57%|█████▋    | 122816/217273 [02:17<01:38, 955.29 examples/s]Map:  57%|█████▋    | 122792/217273 [02:15<01:36, 975.94 examples/s]Map:  57%|█████▋    | 123557/217273 [02:17<01:38, 950.96 examples/s]Map:  57%|█████▋    | 123894/217273 [02:15<01:36, 968.83 examples/s]Map:  57%|█████▋    | 122916/217273 [02:18<01:37, 965.73 examples/s]Map:  57%|█████▋    | 123654/217273 [02:17<01:38, 952.12 examples/s]Map:  57%|█████▋    | 122941/217273 [02:15<01:36, 977.32 examples/s]Map:  57%|█████▋    | 123994/217273 [02:16<01:35, 975.61 examples/s]Map:  57%|█████▋    | 123751/217273 [02:17<01:38, 953.38 examples/s]Map:  57%|█████▋    | 123046/217273 [02:18<01:55, 814.47 examples/s]Map:  57%|█████▋    | 124101/217273 [02:16<01:53, 820.05 examples/s]Map:  57%|█████▋    | 123043/217273 [02:16<01:56, 810.41 examples/s]Map:  57%|█████▋    | 123851/217273 [02:18<01:37, 961.98 examples/s]Map:  57%|█████▋    | 123145/217273 [02:18<01:50, 853.31 examples/s]Map:  57%|█████▋    | 124201/217273 [02:16<01:47, 862.05 examples/s]Map:  57%|█████▋    | 123145/217273 [02:16<01:49, 858.90 examples/s]Map:  57%|█████▋    | 123999/217273 [02:18<01:36, 967.51 examples/s]Map:  57%|█████▋    | 123245/217273 [02:18<01:45, 887.60 examples/s]Map:  57%|█████▋    | 123243/217273 [02:16<01:45, 889.08 examples/s]Map:  57%|█████▋    | 123340/217273 [02:18<01:43, 903.60 examples/s]Map:  57%|█████▋    | 123345/217273 [02:16<01:42, 919.47 examples/s]Map:  57%|█████▋    | 124296/217273 [02:16<02:28, 626.77 examples/s]Map:  57%|█████▋    | 124139/217273 [02:18<01:53, 820.34 examples/s]Map:  57%|█████▋    | 123442/217273 [02:16<01:40, 929.42 examples/s]Map:  57%|█████▋    | 123484/217273 [02:18<01:42, 916.82 examples/s]Map:  57%|█████▋    | 124394/217273 [02:16<02:12, 698.99 examples/s]Map:  57%|█████▋    | 123540/217273 [02:16<01:39, 940.25 examples/s]Map:  57%|█████▋    | 123581/217273 [02:18<01:40, 929.33 examples/s]Map:  57%|█████▋    | 124493/217273 [02:16<02:01, 763.50 examples/s]Map:  57%|█████▋    | 123643/217273 [02:16<01:37, 963.19 examples/s]Map:  57%|█████▋    | 123683/217273 [02:18<01:38, 952.95 examples/s]Map:  57%|█████▋    | 124252/217273 [02:18<02:24, 642.78 examples/s]Map:  57%|█████▋    | 124597/217273 [02:16<01:51, 827.57 examples/s]Map:  57%|█████▋    | 123743/217273 [02:16<01:36, 971.82 examples/s]Map:  57%|█████▋    | 123783/217273 [02:19<01:37, 961.44 examples/s]Map:  57%|█████▋    | 124349/217273 [02:18<02:12, 702.69 examples/s]Map:  57%|█████▋    | 124702/217273 [02:16<01:44, 883.11 examples/s]Map:  57%|█████▋    | 123843/217273 [02:16<01:35, 977.95 examples/s]Map:  57%|█████▋    | 123883/217273 [02:19<01:36, 969.27 examples/s]Map:  57%|█████▋    | 124448/217273 [02:18<02:01, 762.53 examples/s]Map:  57%|█████▋    | 124803/217273 [02:17<01:41, 913.06 examples/s]Map:  57%|█████▋    | 123981/217273 [02:19<01:36, 968.73 examples/s]Map:  57%|█████▋    | 124551/217273 [02:18<01:52, 821.90 examples/s]Map:  57%|█████▋    | 123992/217273 [02:17<01:35, 981.60 examples/s]Map:  57%|█████▋    | 124909/217273 [02:17<01:37, 951.72 examples/s]Map:  57%|█████▋    | 124649/217273 [02:19<01:47, 858.58 examples/s]Map:  57%|█████▋    | 124096/217273 [02:19<01:55, 805.67 examples/s]Map:  57%|█████▋    | 124103/217273 [02:17<01:50, 844.38 examples/s]Map:  57%|█████▋    | 124751/217273 [02:19<01:43, 897.05 examples/s]Map:  58%|█████▊    | 125048/217273 [02:17<01:53, 809.21 examples/s]Map:  57%|█████▋    | 124199/217273 [02:19<01:48, 858.43 examples/s]Map:  57%|█████▋    | 124849/217273 [02:19<01:40, 916.51 examples/s]Map:  58%|█████▊    | 125152/217273 [02:17<01:47, 860.66 examples/s]Map:  58%|█████▊    | 124948/217273 [02:19<01:38, 934.89 examples/s]Map:  57%|█████▋    | 124204/217273 [02:17<02:22, 654.47 examples/s]Map:  58%|█████▊    | 125250/217273 [02:17<01:43, 889.64 examples/s]Map:  57%|█████▋    | 124297/217273 [02:19<02:27, 632.16 examples/s]Map:  57%|█████▋    | 124302/217273 [02:17<02:09, 716.70 examples/s]Map:  58%|█████▊    | 125351/217273 [02:17<01:40, 917.82 examples/s]Map:  58%|█████▊    | 125047/217273 [02:19<01:56, 790.85 examples/s]Map:  57%|█████▋    | 124390/217273 [02:19<02:14, 691.42 examples/s]Map:  57%|█████▋    | 124402/217273 [02:17<01:59, 778.50 examples/s]Map:  58%|█████▊    | 125452/217273 [02:17<01:37, 938.19 examples/s]Map:  58%|█████▊    | 125148/217273 [02:19<01:49, 842.99 examples/s]Map:  57%|█████▋    | 124489/217273 [02:19<02:02, 755.49 examples/s]Map:  57%|█████▋    | 124502/217273 [02:17<01:52, 827.45 examples/s]Map:  58%|█████▊    | 125555/217273 [02:17<01:35, 960.43 examples/s]Map:  58%|█████▊    | 125254/217273 [02:19<01:42, 896.18 examples/s]Map:  57%|█████▋    | 124607/217273 [02:17<01:44, 882.78 examples/s]Map:  57%|█████▋    | 124588/217273 [02:20<01:54, 809.36 examples/s]Map:  58%|█████▊    | 125659/217273 [02:18<01:33, 979.19 examples/s]Map:  58%|█████▊    | 125355/217273 [02:19<01:39, 923.31 examples/s]Map:  57%|█████▋    | 124706/217273 [02:17<01:41, 910.53 examples/s]Map:  57%|█████▋    | 124693/217273 [02:20<01:46, 870.47 examples/s]Map:  58%|█████▊    | 125761/217273 [02:18<01:32, 986.73 examples/s]Map:  58%|█████▊    | 125455/217273 [02:19<01:37, 942.46 examples/s]Map:  57%|█████▋    | 124805/217273 [02:18<01:39, 930.40 examples/s]Map:  57%|█████▋    | 124791/217273 [02:20<01:43, 896.91 examples/s]Map:  58%|█████▊    | 125861/217273 [02:18<01:32, 988.94 examples/s]Map:  58%|█████▊    | 125552/217273 [02:20<01:36, 948.19 examples/s]Map:  57%|█████▋    | 124905/217273 [02:18<01:37, 946.67 examples/s]Map:  57%|█████▋    | 124896/217273 [02:20<01:38, 937.04 examples/s]Map:  58%|█████▊    | 125961/217273 [02:18<01:32, 988.08 examples/s]Map:  58%|█████▊    | 125697/217273 [02:20<01:36, 947.45 examples/s]Map:  58%|█████▊    | 125000/217273 [02:20<01:57, 785.17 examples/s]Map:  58%|█████▊    | 125795/217273 [02:20<01:35, 954.08 examples/s]Map:  58%|█████▊    | 125048/217273 [02:18<01:53, 815.63 examples/s]Map:  58%|█████▊    | 126096/217273 [02:18<01:50, 821.92 examples/s]Map:  58%|█████▊    | 125091/217273 [02:20<01:53, 815.60 examples/s]Map:  58%|█████▊    | 125154/217273 [02:18<01:46, 868.84 examples/s]Map:  58%|█████▊    | 126194/217273 [02:18<01:46, 855.29 examples/s]Map:  58%|█████▊    | 125931/217273 [02:20<01:38, 931.33 examples/s]Map:  58%|█████▊    | 125194/217273 [02:20<01:45, 870.57 examples/s]Map:  58%|█████▊    | 125250/217273 [02:18<01:43, 889.30 examples/s]Map:  58%|█████▊    | 126295/217273 [02:18<01:42, 891.72 examples/s]Map:  58%|█████▊    | 125292/217273 [02:20<01:42, 898.43 examples/s]Map:  58%|█████▊    | 126393/217273 [02:18<01:39, 913.54 examples/s]Map:  58%|█████▊    | 126041/217273 [02:20<01:57, 777.87 examples/s]Map:  58%|█████▊    | 125395/217273 [02:18<01:40, 912.50 examples/s]Map:  58%|█████▊    | 126496/217273 [02:18<01:36, 941.33 examples/s]Map:  58%|█████▊    | 125433/217273 [02:20<01:40, 911.95 examples/s]Map:  58%|█████▊    | 126139/217273 [02:20<01:50, 822.49 examples/s]Map:  58%|█████▊    | 125494/217273 [02:18<01:38, 929.72 examples/s]Map:  58%|█████▊    | 126598/217273 [02:19<01:34, 961.27 examples/s]Map:  58%|█████▊    | 125532/217273 [02:21<01:38, 929.20 examples/s]Map:  58%|█████▊    | 126243/217273 [02:20<01:44, 873.81 examples/s]Map:  58%|█████▊    | 125594/217273 [02:18<01:37, 943.98 examples/s]Map:  58%|█████▊    | 126697/217273 [02:19<01:33, 964.50 examples/s]Map:  58%|█████▊    | 126348/217273 [02:20<01:39, 918.10 examples/s]Map:  58%|█████▊    | 125703/217273 [02:19<01:33, 976.09 examples/s]Map:  58%|█████▊    | 125675/217273 [02:21<01:37, 934.75 examples/s]Map:  58%|█████▊    | 126795/217273 [02:19<01:33, 968.73 examples/s]Map:  58%|█████▊    | 126445/217273 [02:21<01:37, 927.33 examples/s]Map:  58%|█████▊    | 125777/217273 [02:21<01:35, 954.27 examples/s]Map:  58%|█████▊    | 126896/217273 [02:19<01:32, 978.11 examples/s]Map:  58%|█████▊    | 125856/217273 [02:19<01:32, 986.19 examples/s]Map:  58%|█████▊    | 125876/217273 [02:21<01:35, 960.89 examples/s]Map:  58%|█████▊    | 126588/217273 [02:21<01:37, 929.94 examples/s]Map:  58%|█████▊    | 125956/217273 [02:19<01:32, 987.79 examples/s]Map:  58%|█████▊    | 126688/217273 [02:21<01:35, 946.08 examples/s]Map:  58%|█████▊    | 127000/217273 [02:19<01:53, 797.17 examples/s]Map:  58%|█████▊    | 126000/217273 [02:21<01:51, 819.11 examples/s]Map:  58%|█████▊    | 126790/217273 [02:21<01:33, 963.84 examples/s]Map:  58%|█████▊    | 127101/217273 [02:19<01:46, 849.17 examples/s]Map:  58%|█████▊    | 126100/217273 [02:19<01:48, 843.48 examples/s]Map:  58%|█████▊    | 126099/217273 [02:21<01:46, 858.66 examples/s]Map:  58%|█████▊    | 126892/217273 [02:21<01:32, 976.03 examples/s]Map:  59%|█████▊    | 127203/217273 [02:19<01:40, 891.98 examples/s]Map:  58%|█████▊    | 126199/217273 [02:19<01:44, 874.33 examples/s]Map:  58%|█████▊    | 126201/217273 [02:21<01:41, 897.29 examples/s]Map:  58%|█████▊    | 126991/217273 [02:21<01:32, 977.29 examples/s]Map:  59%|█████▊    | 127304/217273 [02:19<01:37, 922.87 examples/s]Map:  58%|█████▊    | 126302/217273 [02:19<01:39, 910.69 examples/s]Map:  58%|█████▊    | 126298/217273 [02:21<01:39, 914.89 examples/s]Map:  59%|█████▊    | 127407/217273 [02:19<01:34, 949.73 examples/s]Map:  58%|█████▊    | 126401/217273 [02:19<01:37, 927.43 examples/s]Map:  58%|█████▊    | 127094/217273 [02:21<01:51, 811.55 examples/s]Map:  58%|█████▊    | 126393/217273 [02:22<01:38, 922.31 examples/s]Map:  59%|█████▊    | 127509/217273 [02:20<01:32, 966.59 examples/s]Map:  58%|█████▊    | 126505/217273 [02:19<01:34, 956.23 examples/s]Map:  59%|█████▊    | 127196/217273 [02:21<01:44, 862.83 examples/s]Map:  58%|█████▊    | 126494/217273 [02:22<01:36, 943.89 examples/s]Map:  59%|█████▊    | 127613/217273 [02:20<01:30, 985.70 examples/s]Map:  58%|█████▊    | 126607/217273 [02:20<01:33, 973.81 examples/s]Map:  59%|█████▊    | 127302/217273 [02:21<01:38, 911.08 examples/s]Map:  58%|█████▊    | 126596/217273 [02:22<01:34, 958.17 examples/s]Map:  58%|█████▊    | 126714/217273 [02:20<01:30, 996.09 examples/s]Map:  59%|█████▉    | 127759/217273 [02:20<01:31, 978.19 examples/s]Map:  59%|█████▊    | 127403/217273 [02:22<01:35, 936.81 examples/s]Map:  58%|█████▊    | 126696/217273 [02:22<01:33, 966.62 examples/s]Map:  59%|█████▊    | 127500/217273 [02:22<01:35, 944.79 examples/s]Map:  58%|█████▊    | 126796/217273 [02:22<01:32, 974.04 examples/s]Map:  58%|█████▊    | 126863/217273 [02:20<01:31, 990.54 examples/s]Map:  59%|█████▉    | 127899/217273 [02:20<01:33, 959.32 examples/s]Map:  59%|█████▊    | 127604/217273 [02:22<01:32, 969.69 examples/s]Map:  58%|█████▊    | 126965/217273 [02:20<01:30, 996.40 examples/s]Map:  58%|█████▊    | 126941/217273 [02:22<01:33, 966.78 examples/s]Map:  59%|█████▉    | 127703/217273 [02:22<01:32, 972.90 examples/s]Map:  59%|█████▉    | 128000/217273 [02:20<01:50, 808.71 examples/s]Map:  59%|█████▉    | 127807/217273 [02:22<01:30, 988.40 examples/s]Map:  59%|█████▉    | 128103/217273 [02:20<01:43, 858.31 examples/s]Map:  58%|█████▊    | 127098/217273 [02:20<01:46, 844.87 examples/s]Map:  58%|█████▊    | 127049/217273 [02:22<01:49, 827.35 examples/s]Map:  59%|█████▉    | 127914/217273 [02:22<01:28, 1006.40 examples/s]Map:  59%|█████▉    | 128203/217273 [02:20<01:40, 888.73 examples/s]Map:  59%|█████▊    | 127203/217273 [02:20<01:41, 890.67 examples/s]Map:  59%|█████▊    | 127147/217273 [02:22<01:44, 861.33 examples/s]Map:  59%|█████▉    | 128302/217273 [02:20<01:37, 912.55 examples/s]Map:  59%|█████▊    | 127305/217273 [02:20<01:37, 921.23 examples/s]Map:  59%|█████▊    | 127245/217273 [02:22<01:41, 890.09 examples/s]Map:  59%|█████▉    | 128043/217273 [02:22<01:45, 842.89 examples/s] Map:  59%|█████▊    | 127410/217273 [02:20<01:34, 953.81 examples/s]Map:  59%|█████▊    | 127343/217273 [02:23<01:38, 912.44 examples/s]Map:  59%|█████▉    | 128445/217273 [02:21<01:36, 922.55 examples/s]Map:  59%|█████▉    | 128134/217273 [02:22<01:43, 857.37 examples/s]Map:  59%|█████▉    | 128552/217273 [02:21<01:32, 956.16 examples/s]Map:  59%|█████▊    | 127553/217273 [02:21<01:34, 951.07 examples/s]Map:  59%|█████▊    | 127477/217273 [02:23<01:39, 901.42 examples/s]Map:  59%|█████▉    | 128230/217273 [02:22<01:40, 883.03 examples/s]Map:  59%|█████▉    | 127659/217273 [02:21<01:31, 976.54 examples/s]Map:  59%|█████▊    | 127581/217273 [02:23<01:35, 934.65 examples/s]Map:  59%|█████▉    | 128329/217273 [02:23<01:37, 911.26 examples/s]Map:  59%|█████▉    | 128694/217273 [02:21<01:33, 948.30 examples/s]Map:  59%|█████▉    | 127682/217273 [02:23<01:34, 948.26 examples/s]Map:  59%|█████▉    | 128428/217273 [02:23<01:35, 932.68 examples/s]Map:  59%|█████▉    | 128795/217273 [02:21<01:32, 961.04 examples/s]Map:  59%|█████▉    | 127807/217273 [02:21<01:31, 977.98 examples/s]Map:  59%|█████▉    | 127781/217273 [02:23<01:33, 955.58 examples/s]Map:  59%|█████▉    | 128531/217273 [02:23<01:32, 958.54 examples/s]Map:  59%|█████▉    | 128896/217273 [02:21<01:30, 971.53 examples/s]Map:  59%|█████▉    | 127909/217273 [02:21<01:30, 986.86 examples/s]Map:  59%|█████▉    | 127880/217273 [02:23<01:32, 963.34 examples/s]Map:  59%|█████▉    | 128630/217273 [02:23<01:32, 963.13 examples/s]Map:  59%|█████▉    | 129000/217273 [02:21<01:46, 825.02 examples/s]Map:  59%|█████▉    | 127978/217273 [02:23<01:32, 962.94 examples/s]Map:  59%|█████▉    | 128053/217273 [02:21<01:43, 858.93 examples/s]Map:  59%|█████▉    | 128774/217273 [02:23<01:32, 959.09 examples/s]Map:  59%|█████▉    | 129100/217273 [02:21<01:42, 864.24 examples/s]Map:  59%|█████▉    | 128155/217273 [02:21<01:39, 893.89 examples/s]Map:  59%|█████▉    | 128872/217273 [02:23<01:32, 960.04 examples/s]Map:  59%|█████▉    | 128101/217273 [02:23<01:48, 823.06 examples/s]Map:  59%|█████▉    | 129191/217273 [02:21<01:40, 875.52 examples/s]Map:  59%|█████▉    | 128256/217273 [02:21<01:36, 920.98 examples/s]Map:  59%|█████▉    | 128201/217273 [02:24<01:42, 864.80 examples/s]Map:  59%|█████▉    | 128354/217273 [02:21<01:35, 930.93 examples/s]Map:  60%|█████▉    | 129293/217273 [02:22<01:50, 799.27 examples/s]Map:  59%|█████▉    | 129000/217273 [02:23<01:48, 809.89 examples/s]Map:  59%|█████▉    | 128298/217273 [02:24<01:40, 889.05 examples/s]Map:  59%|█████▉    | 128457/217273 [02:22<01:32, 955.68 examples/s]Map:  60%|█████▉    | 129381/217273 [02:22<01:47, 818.34 examples/s]Map:  59%|█████▉    | 129100/217273 [02:23<01:43, 851.06 examples/s]Map:  59%|█████▉    | 128402/217273 [02:24<01:36, 924.97 examples/s]Map:  60%|█████▉    | 129483/217273 [02:22<01:40, 870.17 examples/s]Map:  59%|█████▉    | 129199/217273 [02:24<01:39, 884.47 examples/s]Map:  59%|█████▉    | 128599/217273 [02:22<01:33, 946.10 examples/s]Map:  59%|█████▉    | 128499/217273 [02:24<01:35, 933.66 examples/s]Map:  60%|█████▉    | 129581/217273 [02:22<01:37, 896.13 examples/s]Map:  60%|█████▉    | 129336/217273 [02:24<01:38, 890.64 examples/s]Map:  59%|█████▉    | 128735/217273 [02:22<01:35, 929.75 examples/s]Map:  59%|█████▉    | 128639/217273 [02:24<01:35, 926.25 examples/s]Map:  60%|█████▉    | 129721/217273 [02:22<01:36, 904.58 examples/s]Map:  60%|█████▉    | 129441/217273 [02:24<01:34, 928.15 examples/s]Map:  59%|█████▉    | 128836/217273 [02:22<01:33, 946.74 examples/s]Map:  59%|█████▉    | 128735/217273 [02:24<01:35, 931.54 examples/s]Map:  60%|█████▉    | 129814/217273 [02:22<01:36, 910.69 examples/s]Map:  60%|█████▉    | 129538/217273 [02:24<01:33, 938.62 examples/s]Map:  59%|█████▉    | 128937/217273 [02:22<01:31, 961.55 examples/s]Map:  59%|█████▉    | 128832/217273 [02:24<01:34, 940.55 examples/s]Map:  60%|█████▉    | 129909/217273 [02:22<01:35, 918.07 examples/s]Map:  60%|█████▉    | 129644/217273 [02:24<01:30, 967.93 examples/s]Map:  59%|█████▉    | 128930/217273 [02:24<01:32, 950.39 examples/s]Map:  60%|█████▉    | 129747/217273 [02:24<01:29, 979.21 examples/s]Map:  59%|█████▉    | 129047/217273 [02:22<01:50, 796.18 examples/s]Map:  60%|█████▉    | 130049/217273 [02:22<01:52, 774.35 examples/s]Map:  59%|█████▉    | 129047/217273 [02:24<01:49, 805.80 examples/s]Map:  59%|█████▉    | 129152/217273 [02:22<01:43, 853.16 examples/s]Map:  60%|█████▉    | 129888/217273 [02:24<01:30, 960.96 examples/s]Map:  60%|█████▉    | 130156/217273 [02:23<01:44, 836.14 examples/s]Map:  59%|█████▉    | 129149/217273 [02:25<01:42, 855.77 examples/s]Map:  59%|█████▉    | 129255/217273 [02:22<01:38, 895.19 examples/s]Map:  60%|█████▉    | 129990/217273 [02:24<01:29, 975.26 examples/s]Map:  60%|█████▉    | 130256/217273 [02:23<01:39, 872.17 examples/s]Map:  59%|█████▉    | 129251/217273 [02:25<01:38, 894.59 examples/s]Map:  60%|█████▉    | 129354/217273 [02:23<01:35, 916.27 examples/s]Map:  60%|█████▉    | 130353/217273 [02:23<01:37, 893.13 examples/s]Map:  60%|█████▉    | 129354/217273 [02:25<01:34, 929.36 examples/s]Map:  60%|█████▉    | 129451/217273 [02:23<01:34, 929.09 examples/s]Map:  60%|█████▉    | 130098/217273 [02:25<01:45, 828.54 examples/s]Map:  60%|██████    | 130449/217273 [02:23<01:35, 907.21 examples/s]Map:  60%|█████▉    | 129454/217273 [02:25<01:32, 944.69 examples/s]Map:  60%|█████▉    | 129551/217273 [02:23<01:32, 945.18 examples/s]Map:  60%|█████▉    | 130203/217273 [02:25<01:38, 880.78 examples/s]Map:  60%|██████    | 130551/217273 [02:23<01:32, 934.98 examples/s]Map:  60%|█████▉    | 129552/217273 [02:25<01:32, 951.76 examples/s]Map:  60%|█████▉    | 130306/217273 [02:25<01:34, 917.86 examples/s]Map:  60%|█████▉    | 129696/217273 [02:23<01:32, 950.98 examples/s]Map:  60%|█████▉    | 129655/217273 [02:25<01:30, 968.45 examples/s]Map:  60%|██████    | 130404/217273 [02:25<01:33, 930.45 examples/s]Map:  60%|██████    | 130687/217273 [02:23<01:33, 922.42 examples/s]Map:  60%|█████▉    | 129825/217273 [02:23<01:35, 916.42 examples/s]Map:  60%|██████    | 130503/217273 [02:25<01:31, 945.25 examples/s]Map:  60%|██████    | 130782/217273 [02:23<01:33, 928.19 examples/s]Map:  60%|█████▉    | 129800/217273 [02:25<01:30, 963.98 examples/s]Map:  60%|█████▉    | 129925/217273 [02:23<01:33, 936.71 examples/s]Map:  60%|██████    | 130606/217273 [02:25<01:29, 966.22 examples/s]Map:  60%|██████    | 130888/217273 [02:23<01:29, 961.73 examples/s]Map:  60%|█████▉    | 129950/217273 [02:25<01:29, 970.96 examples/s]Map:  60%|██████    | 130706/217273 [02:25<01:28, 973.31 examples/s]Map:  60%|██████    | 130991/217273 [02:23<01:28, 978.43 examples/s]Map:  60%|█████▉    | 130048/217273 [02:23<01:48, 803.42 examples/s]Map:  60%|██████    | 130850/217273 [02:25<01:29, 963.62 examples/s]Map:  60%|█████▉    | 130052/217273 [02:26<01:43, 841.68 examples/s]Map:  60%|█████▉    | 130147/217273 [02:23<01:43, 842.48 examples/s]Map:  60%|██████    | 131099/217273 [02:24<01:46, 807.80 examples/s]Map:  60%|██████    | 130953/217273 [02:25<01:28, 976.26 examples/s]Map:  60%|█████▉    | 130152/217273 [02:26<01:39, 875.74 examples/s]Map:  60%|█████▉    | 130245/217273 [02:24<01:39, 873.69 examples/s]Map:  60%|██████    | 131200/217273 [02:24<01:40, 855.46 examples/s]Map:  60%|█████▉    | 130252/217273 [02:26<01:36, 903.68 examples/s]Map:  60%|█████▉    | 130344/217273 [02:24<01:36, 898.26 examples/s]Map:  60%|██████    | 131294/217273 [02:24<01:38, 872.80 examples/s]Map:  60%|█████▉    | 130354/217273 [02:26<01:33, 930.19 examples/s]Map:  60%|██████    | 131101/217273 [02:26<01:41, 849.15 examples/s]Map:  60%|██████    | 130446/217273 [02:24<01:33, 929.64 examples/s]Map:  60%|██████    | 130451/217273 [02:26<01:32, 938.67 examples/s]Map:  60%|██████    | 131206/217273 [02:26<01:36, 894.05 examples/s]Map:  60%|██████    | 131434/217273 [02:24<01:36, 889.72 examples/s]Map:  60%|██████    | 130588/217273 [02:24<01:33, 931.67 examples/s]Map:  60%|██████    | 130548/217273 [02:26<01:31, 945.29 examples/s]Map:  60%|██████    | 131309/217273 [02:26<01:33, 923.85 examples/s]Map:  61%|██████    | 131531/217273 [02:24<01:34, 908.15 examples/s]Map:  60%|██████    | 130684/217273 [02:24<01:32, 938.19 examples/s]Map:  60%|██████    | 130649/217273 [02:26<01:30, 960.78 examples/s]Map:  60%|██████    | 131412/217273 [02:26<01:30, 945.29 examples/s]Map:  61%|██████    | 131634/217273 [02:24<01:31, 937.87 examples/s]Map:  60%|██████    | 130786/217273 [02:24<01:30, 956.88 examples/s]Map:  60%|██████    | 130750/217273 [02:26<01:29, 971.26 examples/s]Map:  61%|██████    | 131510/217273 [02:26<01:30, 951.60 examples/s]Map:  61%|██████    | 131769/217273 [02:24<01:33, 918.75 examples/s]Map:  60%|██████    | 130923/217273 [02:24<01:32, 934.33 examples/s]Map:  60%|██████    | 130887/217273 [02:26<01:31, 941.69 examples/s]Map:  61%|██████    | 131644/217273 [02:26<01:32, 925.04 examples/s]Map:  61%|██████    | 131911/217273 [02:24<01:32, 925.14 examples/s]Map:  61%|██████    | 131744/217273 [02:26<01:30, 941.21 examples/s]Map:  60%|██████    | 131048/217273 [02:24<01:46, 810.19 examples/s]Map:  60%|██████    | 131000/217273 [02:27<01:46, 807.74 examples/s]Map:  61%|██████    | 131844/217273 [02:26<01:29, 950.00 examples/s]Map:  60%|██████    | 131147/217273 [02:25<01:41, 849.42 examples/s]Map:  60%|██████    | 131100/217273 [02:27<01:41, 850.20 examples/s]Map:  61%|██████    | 132048/217273 [02:25<01:47, 791.37 examples/s]Map:  61%|██████    | 131946/217273 [02:26<01:28, 967.75 examples/s]Map:  60%|██████    | 131248/217273 [02:25<01:36, 888.21 examples/s]Map:  60%|██████    | 131199/217273 [02:27<01:37, 884.64 examples/s]Map:  61%|██████    | 132148/217273 [02:25<01:42, 833.48 examples/s]Map:  60%|██████    | 131348/217273 [02:25<01:33, 915.84 examples/s]Map:  61%|██████    | 132044/217273 [02:27<01:47, 795.07 examples/s]Map:  60%|██████    | 131302/217273 [02:27<01:33, 919.37 examples/s]Map:  61%|██████    | 132247/217273 [02:25<01:38, 865.74 examples/s]Map:  60%|██████    | 131444/217273 [02:25<01:32, 926.90 examples/s]Map:  60%|██████    | 131405/217273 [02:27<01:30, 947.47 examples/s]Map:  61%|██████    | 132144/217273 [02:27<01:40, 842.94 examples/s]Map:  61%|██████    | 132348/217273 [02:25<01:34, 898.09 examples/s]Map:  61%|██████    | 131543/217273 [02:25<01:30, 943.14 examples/s]Map:  61%|██████    | 132242/217273 [02:27<01:36, 878.31 examples/s]Map:  61%|██████    | 131505/217273 [02:27<01:29, 959.06 examples/s]Map:  61%|██████    | 132450/217273 [02:25<01:31, 927.72 examples/s]Map:  61%|██████    | 131644/217273 [02:25<01:29, 959.93 examples/s]Map:  61%|██████    | 131605/217273 [02:27<01:28, 968.71 examples/s]Map:  61%|██████    | 132344/217273 [02:27<01:33, 912.89 examples/s]Map:  61%|██████    | 132548/217273 [02:25<01:30, 940.07 examples/s]Map:  61%|██████    | 131751/217273 [02:25<01:26, 988.57 examples/s]Map:  61%|██████    | 132446/217273 [02:27<01:30, 941.42 examples/s]Map:  61%|██████    | 131706/217273 [02:27<01:27, 977.48 examples/s]Map:  61%|██████    | 132687/217273 [02:25<01:30, 932.42 examples/s]Map:  61%|██████    | 132547/217273 [02:27<01:28, 959.01 examples/s]Map:  61%|██████    | 131894/217273 [02:25<01:27, 971.37 examples/s]Map:  61%|██████    | 131851/217273 [02:27<01:28, 967.26 examples/s]Map:  61%|██████    | 132792/217273 [02:25<01:28, 958.85 examples/s]Map:  61%|██████    | 132646/217273 [02:27<01:27, 966.69 examples/s]Map:  61%|██████    | 131995/217273 [02:25<01:27, 978.19 examples/s]Map:  61%|██████    | 131984/217273 [02:28<01:31, 935.87 examples/s]Map:  61%|██████    | 132932/217273 [02:26<01:29, 943.75 examples/s]Map:  61%|██████    | 132787/217273 [02:27<01:28, 952.60 examples/s]Map:  61%|██████    | 132103/217273 [02:26<01:45, 806.82 examples/s]Map:  61%|██████    | 132887/217273 [02:28<01:27, 964.56 examples/s]Map:  61%|██████    | 132094/217273 [02:28<01:47, 792.03 examples/s]Map:  61%|██████    | 133048/217273 [02:26<01:44, 808.40 examples/s]Map:  61%|██████    | 132204/217273 [02:26<01:39, 852.89 examples/s]Map:  61%|██████    | 132987/217273 [02:28<01:26, 973.45 examples/s]Map:  61%|██████    | 132191/217273 [02:28<01:42, 830.57 examples/s]Map:  61%|██████▏   | 133147/217273 [02:26<01:39, 845.75 examples/s]Map:  61%|██████    | 132305/217273 [02:26<01:35, 891.67 examples/s]Map:  61%|██████    | 132287/217273 [02:28<01:38, 859.00 examples/s]Map:  61%|██████    | 132402/217273 [02:26<01:33, 910.62 examples/s]Map:  61%|██████▏   | 133096/217273 [02:28<01:44, 808.41 examples/s]Map:  61%|██████▏   | 133256/217273 [02:26<01:45, 800.15 examples/s]Map:  61%|██████    | 132381/217273 [02:28<01:37, 874.30 examples/s]Map:  61%|██████    | 132499/217273 [02:26<01:31, 925.05 examples/s]Map:  61%|██████▏   | 133199/217273 [02:28<01:37, 861.56 examples/s]Map:  61%|██████    | 132479/217273 [02:28<01:34, 900.02 examples/s]Map:  61%|██████▏   | 133374/217273 [02:26<01:46, 789.57 examples/s]Map:  61%|██████    | 132597/217273 [02:26<01:30, 934.90 examples/s]Map:  61%|██████▏   | 133299/217273 [02:28<01:34, 891.26 examples/s]Map:  61%|██████▏   | 133471/217273 [02:26<01:40, 830.37 examples/s]Map:  61%|██████    | 132699/217273 [02:26<01:28, 957.15 examples/s]Map:  61%|██████▏   | 133397/217273 [02:28<01:31, 913.00 examples/s]Map:  61%|██████    | 132620/217273 [02:28<01:33, 908.83 examples/s]Map:  61%|██████▏   | 133559/217273 [02:26<01:39, 839.61 examples/s]Map:  61%|██████▏   | 133497/217273 [02:28<01:29, 935.06 examples/s]Map:  61%|██████    | 132721/217273 [02:28<01:30, 930.26 examples/s]Map:  61%|██████    | 132842/217273 [02:26<01:28, 954.82 examples/s]Map:  62%|██████▏   | 133659/217273 [02:26<01:35, 877.08 examples/s]Map:  61%|██████▏   | 133597/217273 [02:28<01:27, 952.44 examples/s]Map:  61%|██████    | 132827/217273 [02:29<01:27, 961.84 examples/s]Map:  61%|██████    | 132940/217273 [02:26<01:28, 955.36 examples/s]Map:  62%|██████▏   | 133757/217273 [02:27<01:32, 902.32 examples/s]Map:  61%|██████    | 132928/217273 [02:29<01:26, 970.79 examples/s]Map:  62%|██████▏   | 133740/217273 [02:28<01:28, 947.51 examples/s]Map:  62%|██████▏   | 133850/217273 [02:27<01:31, 907.17 examples/s]Map:  61%|██████    | 133048/217273 [02:27<01:43, 810.50 examples/s]Map:  62%|██████▏   | 133875/217273 [02:29<01:29, 928.35 examples/s]Map:  61%|██████    | 133042/217273 [02:29<01:47, 785.01 examples/s]Map:  62%|██████▏   | 133980/217273 [02:27<01:34, 885.91 examples/s]Map:  61%|██████▏   | 133135/217273 [02:27<01:42, 819.45 examples/s]Map:  62%|██████▏   | 133973/217273 [02:29<01:28, 939.52 examples/s]Map:  61%|██████▏   | 133146/217273 [02:29<01:39, 842.01 examples/s]Map:  61%|██████▏   | 133235/217273 [02:27<01:37, 862.79 examples/s]Map:  61%|██████▏   | 133242/217273 [02:29<01:36, 871.24 examples/s]Map:  61%|██████▏   | 133333/217273 [02:27<01:34, 892.01 examples/s]Map:  62%|██████▏   | 134099/217273 [02:27<01:50, 749.89 examples/s]Map:  62%|██████▏   | 134092/217273 [02:29<01:43, 800.14 examples/s]Map:  61%|██████▏   | 133344/217273 [02:29<01:32, 908.80 examples/s]Map:  61%|██████▏   | 133431/217273 [02:27<01:31, 913.84 examples/s]Map:  62%|██████▏   | 134185/217273 [02:27<01:47, 772.18 examples/s]Map:  62%|██████▏   | 134187/217273 [02:29<01:39, 833.62 examples/s]Map:  61%|██████▏   | 133440/217273 [02:29<01:31, 918.09 examples/s]Map:  61%|██████▏   | 133531/217273 [02:27<01:29, 934.20 examples/s]Map:  62%|██████▏   | 134281/217273 [02:27<01:41, 815.91 examples/s]Map:  62%|██████▏   | 134283/217273 [02:29<01:36, 861.65 examples/s]Map:  61%|██████▏   | 133541/217273 [02:29<01:28, 941.92 examples/s]Map:  62%|██████▏   | 134383/217273 [02:27<01:35, 866.45 examples/s]Map:  62%|██████▏   | 133673/217273 [02:27<01:29, 933.05 examples/s]Map:  62%|██████▏   | 134384/217273 [02:29<01:32, 895.95 examples/s]Map:  62%|██████▏   | 134482/217273 [02:27<01:32, 896.09 examples/s]Map:  62%|██████▏   | 133682/217273 [02:30<01:28, 939.24 examples/s]Map:  62%|██████▏   | 134482/217273 [02:29<01:30, 915.36 examples/s]Map:  62%|██████▏   | 133813/217273 [02:27<01:29, 929.09 examples/s]Map:  62%|██████▏   | 134583/217273 [02:28<01:29, 926.64 examples/s]Map:  62%|██████▏   | 133786/217273 [02:30<01:26, 962.64 examples/s]Map:  62%|██████▏   | 134581/217273 [02:29<01:28, 932.15 examples/s]Map:  62%|██████▏   | 133913/217273 [02:28<01:28, 943.99 examples/s]Map:  62%|██████▏   | 134686/217273 [02:28<01:26, 952.04 examples/s]Map:  62%|██████▏   | 133931/217273 [02:30<01:26, 962.74 examples/s]Map:  62%|██████▏   | 134784/217273 [02:28<01:26, 955.41 examples/s]Map:  62%|██████▏   | 134722/217273 [02:30<01:28, 932.25 examples/s]Map:  62%|██████▏   | 134885/217273 [02:28<01:25, 967.65 examples/s]Map:  62%|██████▏   | 134047/217273 [02:28<01:42, 815.06 examples/s]Map:  62%|██████▏   | 134863/217273 [02:30<01:28, 933.14 examples/s]Map:  62%|██████▏   | 134041/217273 [02:30<01:43, 800.33 examples/s]Map:  62%|██████▏   | 134989/217273 [02:28<01:23, 984.72 examples/s]Map:  62%|██████▏   | 134149/217273 [02:28<01:36, 860.23 examples/s]Map:  62%|██████▏   | 134139/217273 [02:30<01:39, 838.04 examples/s]Map:  62%|██████▏   | 134986/217273 [02:30<01:32, 892.48 examples/s]Map:  62%|██████▏   | 134289/217273 [02:28<01:34, 882.26 examples/s]Map:  62%|██████▏   | 134236/217273 [02:30<01:35, 867.55 examples/s]Map:  62%|██████▏   | 135103/217273 [02:28<01:39, 828.01 examples/s]Map:  62%|██████▏   | 134391/217273 [02:28<01:30, 913.03 examples/s]Map:  62%|██████▏   | 134335/217273 [02:30<01:32, 895.27 examples/s]Map:  62%|██████▏   | 135196/217273 [02:28<01:36, 852.37 examples/s]Map:  62%|██████▏   | 135094/217273 [02:30<01:47, 767.40 examples/s]Map:  62%|██████▏   | 134490/217273 [02:28<01:29, 929.21 examples/s]Map:  62%|██████▏   | 135298/217273 [02:28<01:31, 896.04 examples/s]Map:  62%|██████▏   | 134433/217273 [02:30<01:30, 914.62 examples/s]Map:  62%|██████▏   | 135193/217273 [02:30<01:40, 813.36 examples/s]Map:  62%|██████▏   | 134589/217273 [02:28<01:27, 943.84 examples/s]Map:  62%|██████▏   | 134535/217273 [02:31<01:27, 941.29 examples/s]Map:  62%|██████▏   | 135402/217273 [02:28<01:27, 932.49 examples/s]Map:  62%|██████▏   | 135282/217273 [02:30<01:38, 831.19 examples/s]Map:  62%|██████▏   | 134686/217273 [02:28<01:27, 947.47 examples/s]Map:  62%|██████▏   | 135502/217273 [02:29<01:26, 948.96 examples/s]Map:  62%|██████▏   | 135372/217273 [02:30<01:36, 845.34 examples/s]Map:  62%|██████▏   | 134682/217273 [02:31<01:26, 950.92 examples/s]Map:  62%|██████▏   | 134787/217273 [02:28<01:25, 962.86 examples/s]Map:  62%|██████▏   | 135610/217273 [02:29<01:23, 982.61 examples/s]Map:  62%|██████▏   | 135464/217273 [02:30<01:35, 861.08 examples/s]Map:  62%|██████▏   | 134780/217273 [02:31<01:26, 955.11 examples/s]Map:  62%|██████▏   | 135715/217273 [02:29<01:21, 998.02 examples/s]Map:  62%|██████▏   | 134934/217273 [02:29<01:25, 966.51 examples/s]Map:  62%|██████▏   | 135564/217273 [02:31<01:31, 895.86 examples/s]Map:  62%|██████▏   | 134878/217273 [02:31<01:25, 960.65 examples/s]Map:  62%|██████▏   | 135666/217273 [02:31<01:28, 927.35 examples/s]Map:  62%|██████▏   | 134979/217273 [02:31<01:24, 968.23 examples/s]Map:  63%|██████▎   | 135863/217273 [02:29<01:22, 986.96 examples/s]Map:  62%|██████▏   | 135049/217273 [02:29<01:39, 824.13 examples/s]Map:  62%|██████▏   | 135763/217273 [02:31<01:26, 937.23 examples/s]Map:  62%|██████▏   | 135148/217273 [02:29<01:35, 859.28 examples/s]Map:  63%|██████▎   | 135862/217273 [02:31<01:25, 950.25 examples/s]Map:  62%|██████▏   | 135102/217273 [02:31<01:40, 820.24 examples/s]Map:  63%|██████▎   | 136000/217273 [02:29<01:37, 837.35 examples/s]Map:  62%|██████▏   | 135249/217273 [02:29<01:31, 895.76 examples/s]Map:  62%|██████▏   | 135197/217273 [02:31<01:36, 849.76 examples/s]Map:  63%|██████▎   | 136096/217273 [02:29<01:34, 862.77 examples/s]Map:  62%|██████▏   | 135290/217273 [02:31<01:34, 867.59 examples/s]Map:  63%|██████▎   | 136000/217273 [02:31<01:42, 793.00 examples/s]Map:  62%|██████▏   | 135387/217273 [02:29<01:30, 901.54 examples/s]Map:  63%|██████▎   | 136200/217273 [02:29<01:29, 903.74 examples/s]Map:  63%|██████▎   | 136097/217273 [02:31<01:37, 833.50 examples/s]Map:  62%|██████▏   | 135395/217273 [02:31<01:29, 914.24 examples/s]Map:  62%|██████▏   | 135490/217273 [02:29<01:27, 931.40 examples/s]Map:  63%|██████▎   | 136301/217273 [02:29<01:27, 928.14 examples/s]Map:  63%|██████▎   | 136196/217273 [02:31<01:33, 870.22 examples/s]Map:  62%|██████▏   | 135591/217273 [02:29<01:26, 949.06 examples/s]Map:  62%|██████▏   | 135543/217273 [02:32<01:27, 937.74 examples/s]Map:  63%|██████▎   | 136436/217273 [02:30<01:28, 915.24 examples/s]Map:  63%|██████▎   | 136300/217273 [02:31<01:28, 911.07 examples/s]Map:  62%|██████▏   | 135691/217273 [02:29<01:24, 961.88 examples/s]Map:  62%|██████▏   | 135643/217273 [02:32<01:25, 950.39 examples/s]Map:  63%|██████▎   | 136532/217273 [02:30<01:27, 924.43 examples/s]Map:  63%|██████▎   | 136396/217273 [02:31<01:27, 923.41 examples/s]Map:  62%|██████▏   | 135791/217273 [02:30<01:24, 969.08 examples/s]Map:  62%|██████▏   | 135748/217273 [02:32<01:23, 974.33 examples/s]Map:  63%|██████▎   | 136677/217273 [02:30<01:26, 935.41 examples/s]Map:  63%|██████▎   | 135854/217273 [02:32<01:21, 997.47 examples/s]Map:  63%|██████▎   | 136535/217273 [02:32<01:27, 921.55 examples/s]Map:  63%|██████▎   | 135932/217273 [02:30<01:25, 949.76 examples/s]Map:  63%|██████▎   | 136773/217273 [02:30<01:25, 939.33 examples/s]Map:  63%|██████▎   | 136631/217273 [02:32<01:27, 926.22 examples/s]Map:  63%|██████▎   | 135997/217273 [02:32<01:23, 978.15 examples/s]Map:  63%|██████▎   | 136733/217273 [02:32<01:25, 945.71 examples/s]Map:  63%|██████▎   | 136047/217273 [02:30<01:42, 789.52 examples/s]Map:  63%|██████▎   | 136915/217273 [02:30<01:25, 938.98 examples/s]Map:  63%|██████▎   | 136144/217273 [02:30<01:37, 828.46 examples/s]Map:  63%|██████▎   | 136097/217273 [02:32<01:37, 832.46 examples/s]Map:  63%|██████▎   | 136878/217273 [02:32<01:24, 949.80 examples/s]Map:  63%|██████▎   | 136242/217273 [02:30<01:33, 864.79 examples/s]Map:  63%|██████▎   | 136199/217273 [02:32<01:32, 875.00 examples/s]Map:  63%|██████▎   | 137047/217273 [02:30<01:39, 804.61 examples/s]Map:  63%|██████▎   | 136976/217273 [02:32<01:23, 957.09 examples/s]Map:  63%|██████▎   | 136296/217273 [02:32<01:30, 897.39 examples/s]Map:  63%|██████▎   | 136340/217273 [02:30<01:31, 881.74 examples/s]Map:  63%|██████▎   | 137146/217273 [02:30<01:35, 843.23 examples/s]Map:  63%|██████▎   | 136392/217273 [02:33<01:28, 909.56 examples/s]Map:  63%|██████▎   | 136441/217273 [02:30<01:28, 912.97 examples/s]Map:  63%|██████▎   | 137239/217273 [02:30<01:33, 859.84 examples/s]Map:  63%|██████▎   | 137087/217273 [02:32<01:41, 792.85 examples/s]Map:  63%|██████▎   | 137181/217273 [02:32<01:36, 826.68 examples/s]Map:  63%|██████▎   | 136579/217273 [02:31<01:28, 913.32 examples/s]Map:  63%|██████▎   | 136530/217273 [02:33<01:29, 905.66 examples/s]Map:  63%|██████▎   | 137376/217273 [02:31<01:31, 875.86 examples/s]Map:  63%|██████▎   | 137288/217273 [02:33<01:30, 884.43 examples/s]Map:  63%|██████▎   | 136630/217273 [02:33<01:26, 928.78 examples/s]Map:  63%|██████▎   | 136675/217273 [02:31<01:27, 922.67 examples/s]Map:  63%|██████▎   | 137471/217273 [02:31<01:29, 892.38 examples/s]Map:  63%|██████▎   | 137389/217273 [02:33<01:27, 915.05 examples/s]Map:  63%|██████▎   | 136774/217273 [02:31<01:25, 938.17 examples/s]Map:  63%|██████▎   | 137570/217273 [02:31<01:27, 910.74 examples/s]Map:  63%|██████▎   | 136771/217273 [02:33<01:26, 928.32 examples/s]Map:  63%|██████▎   | 137494/217273 [02:33<01:23, 949.84 examples/s]Map:  63%|██████▎   | 136871/217273 [02:31<01:24, 946.25 examples/s]Map:  63%|██████▎   | 137669/217273 [02:31<01:25, 929.11 examples/s]Map:  63%|██████▎   | 136871/217273 [02:33<01:25, 942.45 examples/s]Map:  63%|██████▎   | 137592/217273 [02:33<01:23, 957.73 examples/s]Map:  63%|██████▎   | 136967/217273 [02:31<01:24, 949.05 examples/s]Map:  63%|██████▎   | 137769/217273 [02:31<01:23, 946.91 examples/s]Map:  63%|██████▎   | 136984/217273 [02:33<01:32, 872.52 examples/s]Map:  63%|██████▎   | 137742/217273 [02:33<01:22, 968.40 examples/s]Map:  63%|██████▎   | 137915/217273 [02:31<01:23, 950.21 examples/s]Map:  63%|██████▎   | 137095/217273 [02:31<01:41, 791.94 examples/s]Map:  63%|██████▎   | 137880/217273 [02:33<01:23, 948.96 examples/s]Map:  63%|██████▎   | 137102/217273 [02:33<01:46, 752.28 examples/s]Map:  63%|██████▎   | 137189/217273 [02:31<01:36, 826.06 examples/s]Map:  64%|██████▎   | 138049/217273 [02:31<01:37, 812.26 examples/s]Map:  64%|██████▎   | 137980/217273 [02:33<01:22, 959.68 examples/s]Map:  63%|██████▎   | 137198/217273 [02:34<01:40, 795.40 examples/s]Map:  63%|██████▎   | 137286/217273 [02:31<01:32, 860.65 examples/s]Map:  64%|██████▎   | 138146/217273 [02:32<01:33, 845.68 examples/s]Map:  63%|██████▎   | 137299/217273 [02:34<01:34, 844.53 examples/s]Map:  63%|██████▎   | 137389/217273 [02:31<01:28, 903.21 examples/s]Map:  64%|██████▎   | 138095/217273 [02:33<01:36, 818.06 examples/s]Map:  64%|██████▎   | 138248/217273 [02:32<01:29, 886.04 examples/s]Map:  63%|██████▎   | 137403/217273 [02:34<01:29, 891.85 examples/s]Map:  63%|██████▎   | 137492/217273 [02:32<01:25, 935.39 examples/s]Map:  64%|██████▎   | 138192/217273 [02:33<01:33, 850.25 examples/s]Map:  64%|██████▎   | 138346/217273 [02:32<01:27, 905.23 examples/s]Map:  63%|██████▎   | 137501/217273 [02:34<01:27, 911.65 examples/s]Map:  63%|██████▎   | 137631/217273 [02:32<01:25, 926.49 examples/s]Map:  64%|██████▎   | 138282/217273 [02:34<01:32, 858.22 examples/s]Map:  64%|██████▎   | 138484/217273 [02:32<01:26, 906.11 examples/s]Map:  63%|██████▎   | 137644/217273 [02:34<01:26, 923.42 examples/s]Map:  63%|██████▎   | 137727/217273 [02:32<01:25, 929.66 examples/s]Map:  64%|██████▎   | 138382/217273 [02:34<01:28, 890.02 examples/s]Map:  63%|██████▎   | 137748/217273 [02:34<01:23, 949.75 examples/s]Map:  64%|██████▎   | 138481/217273 [02:34<01:26, 915.49 examples/s]Map:  64%|██████▍   | 138627/217273 [02:32<01:25, 918.24 examples/s]Map:  63%|██████▎   | 137866/217273 [02:32<01:25, 925.91 examples/s]Map:  63%|██████▎   | 137848/217273 [02:34<01:22, 961.27 examples/s]Map:  64%|██████▍   | 138577/217273 [02:34<01:24, 925.96 examples/s]Map:  64%|██████▍   | 138726/217273 [02:32<01:24, 932.55 examples/s]Map:  63%|██████▎   | 137965/217273 [02:32<01:24, 938.51 examples/s]Map:  63%|██████▎   | 137946/217273 [02:34<01:22, 963.32 examples/s]Map:  64%|██████▍   | 138678/217273 [02:34<01:23, 944.76 examples/s]Map:  64%|██████▍   | 138825/217273 [02:32<01:23, 944.25 examples/s]Map:  64%|██████▍   | 138775/217273 [02:34<01:22, 947.47 examples/s]Map:  64%|██████▍   | 138926/217273 [02:32<01:21, 958.20 examples/s]Map:  64%|██████▎   | 138096/217273 [02:32<01:38, 805.92 examples/s]Map:  64%|██████▎   | 138046/217273 [02:34<01:38, 800.54 examples/s]Map:  64%|██████▍   | 138877/217273 [02:34<01:21, 963.63 examples/s]Map:  64%|██████▎   | 138193/217273 [02:32<01:33, 841.89 examples/s]Map:  64%|██████▎   | 138151/217273 [02:35<01:32, 858.50 examples/s]Map:  64%|██████▍   | 138974/217273 [02:34<01:21, 963.15 examples/s]Map:  64%|██████▍   | 139051/217273 [02:33<01:36, 813.80 examples/s]Map:  64%|██████▎   | 138289/217273 [02:32<01:30, 869.94 examples/s]Map:  64%|██████▎   | 138253/217273 [02:35<01:27, 898.56 examples/s]Map:  64%|██████▍   | 139152/217273 [02:33<01:31, 857.71 examples/s]Map:  64%|██████▎   | 138382/217273 [02:33<01:29, 882.13 examples/s]Map:  64%|██████▎   | 138353/217273 [02:35<01:25, 921.81 examples/s]Map:  64%|██████▍   | 139098/217273 [02:35<01:36, 809.66 examples/s]Map:  64%|██████▍   | 139252/217273 [02:33<01:27, 892.36 examples/s]Map:  64%|██████▎   | 138482/217273 [02:33<01:26, 910.51 examples/s]Map:  64%|██████▎   | 138454/217273 [02:35<01:23, 940.87 examples/s]Map:  64%|██████▍   | 139200/217273 [02:35<01:30, 858.44 examples/s]Map:  64%|██████▍   | 139354/217273 [02:33<01:24, 921.61 examples/s]Map:  64%|██████▍   | 138583/217273 [02:33<01:24, 936.58 examples/s]Map:  64%|██████▍   | 138551/217273 [02:35<01:23, 947.33 examples/s]Map:  64%|██████▍   | 139304/217273 [02:35<01:26, 901.00 examples/s]Map:  64%|██████▍   | 139455/217273 [02:33<01:22, 941.45 examples/s]Map:  64%|██████▍   | 138679/217273 [02:33<01:23, 940.93 examples/s]Map:  64%|██████▍   | 138650/217273 [02:35<01:22, 958.48 examples/s]Map:  64%|██████▍   | 139405/217273 [02:35<01:23, 927.53 examples/s]Map:  64%|██████▍   | 139552/217273 [02:33<01:21, 948.01 examples/s]Map:  64%|██████▍   | 138776/217273 [02:33<01:22, 947.41 examples/s]Map:  64%|██████▍   | 139506/217273 [02:35<01:21, 948.89 examples/s]Map:  64%|██████▍   | 139654/217273 [02:33<01:20, 963.02 examples/s]Map:  64%|██████▍   | 138801/217273 [02:35<01:20, 972.76 examples/s]Map:  64%|██████▍   | 138876/217273 [02:33<01:21, 958.31 examples/s]Map:  64%|██████▍   | 139604/217273 [02:35<01:21, 955.19 examples/s]Map:  64%|██████▍   | 139755/217273 [02:33<01:19, 974.77 examples/s]Map:  64%|██████▍   | 138902/217273 [02:35<01:19, 981.18 examples/s]Map:  64%|██████▍   | 138980/217273 [02:33<01:19, 980.76 examples/s]Map:  64%|██████▍   | 139702/217273 [02:35<01:21, 956.62 examples/s]Map:  64%|██████▍   | 139862/217273 [02:33<01:17, 998.32 examples/s]Map:  64%|██████▍   | 139806/217273 [02:35<01:19, 978.64 examples/s]Map:  64%|██████▍   | 139967/217273 [02:33<01:16, 1012.30 examples/s]Map:  64%|██████▍   | 139047/217273 [02:36<01:34, 830.26 examples/s]Map:  64%|██████▍   | 139098/217273 [02:33<01:35, 818.79 examples/s]Map:  64%|██████▍   | 139147/217273 [02:36<01:29, 868.11 examples/s]Map:  64%|██████▍   | 139201/217273 [02:33<01:29, 869.80 examples/s]Map:  64%|██████▍   | 139953/217273 [02:35<01:19, 973.88 examples/s]Map:  64%|██████▍   | 140099/217273 [02:34<01:31, 843.76 examples/s] Map:  64%|██████▍   | 139247/217273 [02:36<01:26, 897.29 examples/s]Map:  64%|██████▍   | 139303/217273 [02:34<01:25, 907.50 examples/s]Map:  65%|██████▍   | 140198/217273 [02:34<01:27, 876.49 examples/s]Map:  64%|██████▍   | 139344/217273 [02:36<01:25, 913.69 examples/s]Map:  64%|██████▍   | 139408/217273 [02:34<01:22, 943.19 examples/s]Map:  64%|██████▍   | 140100/217273 [02:36<01:30, 848.92 examples/s]Map:  65%|██████▍   | 140293/217273 [02:34<01:26, 893.72 examples/s]Map:  64%|██████▍   | 139511/217273 [02:34<01:20, 964.81 examples/s]Map:  64%|██████▍   | 139440/217273 [02:36<01:24, 918.24 examples/s]Map:  65%|██████▍   | 140198/217273 [02:36<01:28, 875.36 examples/s]Map:  65%|██████▍   | 140389/217273 [02:34<01:24, 908.90 examples/s]Map:  64%|██████▍   | 139611/217273 [02:34<01:19, 973.14 examples/s]Map:  64%|██████▍   | 139535/217273 [02:36<01:24, 923.66 examples/s]Map:  65%|██████▍   | 140293/217273 [02:36<01:26, 891.29 examples/s]Map:  65%|██████▍   | 140492/217273 [02:34<01:21, 940.86 examples/s]Map:  65%|██████▍   | 140392/217273 [02:36<01:24, 914.77 examples/s]Map:  64%|██████▍   | 139750/217273 [02:34<01:21, 951.66 examples/s]Map:  64%|██████▍   | 139673/217273 [02:36<01:24, 917.86 examples/s]Map:  65%|██████▍   | 140623/217273 [02:34<01:24, 911.52 examples/s]Map:  65%|██████▍   | 140522/217273 [02:36<01:25, 894.82 examples/s]Map:  64%|██████▍   | 139884/217273 [02:34<01:23, 928.64 examples/s]Map:  64%|██████▍   | 139811/217273 [02:36<01:24, 911.49 examples/s]Map:  65%|██████▍   | 140720/217273 [02:34<01:22, 924.25 examples/s]Map:  65%|██████▍   | 140614/217273 [02:36<01:25, 899.03 examples/s]Map:  64%|██████▍   | 139911/217273 [02:36<01:22, 932.36 examples/s]Map:  65%|██████▍   | 140822/217273 [02:34<01:20, 947.43 examples/s]Map:  65%|██████▍   | 140714/217273 [02:36<01:22, 923.17 examples/s]Map:  64%|██████▍   | 140000/217273 [02:34<01:37, 790.33 examples/s]Map:  65%|██████▍   | 140928/217273 [02:35<01:18, 976.34 examples/s]Map:  65%|██████▍   | 140811/217273 [02:36<01:21, 934.25 examples/s]Map:  64%|██████▍   | 140096/217273 [02:34<01:33, 826.57 examples/s]Map:  64%|██████▍   | 140043/217273 [02:37<01:36, 799.06 examples/s]Map:  65%|██████▍   | 140908/217273 [02:36<01:21, 939.19 examples/s]Map:  65%|██████▍   | 140199/217273 [02:35<01:28, 873.22 examples/s]Map:  65%|██████▍   | 140147/217273 [02:37<01:30, 850.51 examples/s]Map:  65%|██████▍   | 141045/217273 [02:35<01:35, 800.81 examples/s]Map:  65%|██████▍   | 140292/217273 [02:35<01:26, 885.22 examples/s]Map:  65%|██████▍   | 140248/217273 [02:37<01:26, 885.57 examples/s]Map:  65%|██████▍   | 141144/217273 [02:35<01:30, 843.75 examples/s]Map:  65%|██████▍   | 140391/217273 [02:35<01:24, 911.32 examples/s]Map:  65%|██████▍   | 141047/217273 [02:37<01:36, 789.24 examples/s]Map:  65%|██████▍   | 140350/217273 [02:37<01:23, 918.14 examples/s]Map:  65%|██████▌   | 141241/217273 [02:35<01:26, 874.45 examples/s]Map:  65%|██████▍   | 140487/217273 [02:35<01:23, 924.23 examples/s]Map:  65%|██████▍   | 141146/217273 [02:37<01:31, 832.32 examples/s]Map:  65%|██████▌   | 141341/217273 [02:35<01:23, 907.19 examples/s]Map:  65%|██████▍   | 140490/217273 [02:37<01:23, 918.41 examples/s]Map:  65%|██████▍   | 140584/217273 [02:35<01:22, 934.64 examples/s]Map:  65%|██████▌   | 141247/217273 [02:37<01:26, 874.94 examples/s]Map:  65%|██████▌   | 141443/217273 [02:35<01:21, 933.38 examples/s]Map:  65%|██████▍   | 140682/217273 [02:35<01:21, 944.44 examples/s]Map:  65%|██████▌   | 141349/217273 [02:37<01:23, 909.39 examples/s]Map:  65%|██████▍   | 140621/217273 [02:37<01:25, 900.38 examples/s]Map:  65%|██████▌   | 141544/217273 [02:35<01:19, 949.10 examples/s]Map:  65%|██████▍   | 140784/217273 [02:35<01:19, 962.03 examples/s]Map:  65%|██████▌   | 141452/217273 [02:37<01:20, 939.72 examples/s]Map:  65%|██████▍   | 140713/217273 [02:37<01:25, 898.65 examples/s]Map:  65%|██████▌   | 141646/217273 [02:35<01:18, 966.85 examples/s]Map:  65%|██████▌   | 141586/217273 [02:37<01:22, 919.71 examples/s]Map:  65%|██████▍   | 140920/217273 [02:35<01:21, 935.00 examples/s]Map:  65%|██████▍   | 140833/217273 [02:38<01:28, 861.68 examples/s]Map:  65%|██████▌   | 141778/217273 [02:35<01:21, 925.89 examples/s]Map:  65%|██████▌   | 141683/217273 [02:37<01:21, 930.77 examples/s]Map:  65%|██████▍   | 140922/217273 [02:38<01:28, 866.32 examples/s]Map:  65%|██████▌   | 141884/217273 [02:36<01:18, 957.26 examples/s]Map:  65%|██████▍   | 141051/217273 [02:36<01:34, 803.65 examples/s]Map:  65%|██████▌   | 141985/217273 [02:36<01:17, 970.10 examples/s]Map:  65%|██████▌   | 141824/217273 [02:37<01:21, 929.60 examples/s]Map:  65%|██████▍   | 141153/217273 [02:36<01:29, 850.53 examples/s]Map:  65%|██████▍   | 141042/217273 [02:38<01:42, 744.67 examples/s]Map:  65%|██████▌   | 141919/217273 [02:38<01:20, 932.85 examples/s]Map:  65%|██████▌   | 141256/217273 [02:36<01:25, 890.15 examples/s]Map:  65%|██████▌   | 142104/217273 [02:36<01:31, 821.38 examples/s]Map:  65%|██████▍   | 141132/217273 [02:38<01:37, 778.75 examples/s]Map:  65%|██████▌   | 141351/217273 [02:36<01:24, 902.34 examples/s]Map:  65%|██████▌   | 142207/217273 [02:36<01:26, 867.68 examples/s]Map:  65%|██████▍   | 141218/217273 [02:38<01:35, 794.18 examples/s]Map:  65%|██████▌   | 142046/217273 [02:38<01:35, 784.06 examples/s]Map:  65%|██████▌   | 141451/217273 [02:36<01:21, 924.68 examples/s]Map:  65%|██████▌   | 142300/217273 [02:36<01:25, 879.60 examples/s]Map:  65%|██████▌   | 141309/217273 [02:38<01:32, 819.35 examples/s]Map:  65%|██████▌   | 142142/217273 [02:38<01:31, 820.90 examples/s]Map:  65%|██████▌   | 141546/217273 [02:36<01:21, 929.25 examples/s]Map:  66%|██████▌   | 142398/217273 [02:36<01:22, 903.81 examples/s]Map:  65%|██████▌   | 141403/217273 [02:38<01:29, 848.23 examples/s]Map:  65%|██████▌   | 142237/217273 [02:38<01:28, 847.00 examples/s]Map:  65%|██████▌   | 141647/217273 [02:36<01:19, 949.08 examples/s]Map:  66%|██████▌   | 142501/217273 [02:36<01:20, 934.56 examples/s]Map:  65%|██████▌   | 141497/217273 [02:38<01:26, 871.01 examples/s]Map:  66%|██████▌   | 142329/217273 [02:38<01:27, 858.61 examples/s]Map:  65%|██████▌   | 141751/217273 [02:36<01:17, 968.92 examples/s]Map:  65%|██████▌   | 141590/217273 [02:38<01:25, 885.86 examples/s]Map:  66%|██████▌   | 142428/217273 [02:38<01:24, 891.00 examples/s]Map:  66%|██████▌   | 142643/217273 [02:36<01:19, 936.21 examples/s]Map:  65%|██████▌   | 141685/217273 [02:39<01:24, 899.64 examples/s]Map:  65%|██████▌   | 141899/217273 [02:36<01:17, 971.38 examples/s]Map:  66%|██████▌   | 142521/217273 [02:38<01:23, 896.91 examples/s]Map:  66%|██████▌   | 142742/217273 [02:37<01:18, 948.33 examples/s]Map:  65%|██████▌   | 141999/217273 [02:36<01:17, 975.42 examples/s]Map:  66%|██████▌   | 142619/217273 [02:38<01:21, 919.85 examples/s]Map:  65%|██████▌   | 141823/217273 [02:39<01:23, 901.50 examples/s]Map:  66%|██████▌   | 142882/217273 [02:37<01:18, 941.74 examples/s]Map:  66%|██████▌   | 142753/217273 [02:39<01:22, 900.25 examples/s]Map:  66%|██████▌   | 142982/217273 [02:37<01:17, 953.95 examples/s]Map:  65%|██████▌   | 141957/217273 [02:39<01:24, 896.07 examples/s]Map:  65%|██████▌   | 142100/217273 [02:37<01:34, 794.73 examples/s]Map:  66%|██████▌   | 142849/217273 [02:39<01:21, 914.42 examples/s]Map:  65%|██████▌   | 142193/217273 [02:37<01:30, 826.24 examples/s]Map:  66%|██████▌   | 143096/217273 [02:37<01:31, 812.65 examples/s]Map:  66%|██████▌   | 142948/217273 [02:39<01:19, 930.07 examples/s]Map:  65%|██████▌   | 142294/217273 [02:37<01:26, 870.53 examples/s]Map:  65%|██████▌   | 142093/217273 [02:39<01:37, 772.57 examples/s]Map:  66%|██████▌   | 143196/217273 [02:37<01:26, 853.88 examples/s]Map:  66%|██████▌   | 142388/217273 [02:37<01:24, 886.68 examples/s]Map:  65%|██████▌   | 142187/217273 [02:39<01:33, 807.21 examples/s]Map:  66%|██████▌   | 143047/217273 [02:39<01:36, 769.50 examples/s]Map:  66%|██████▌   | 143298/217273 [02:37<01:22, 892.94 examples/s]Map:  66%|██████▌   | 142492/217273 [02:37<01:20, 925.59 examples/s]Map:  65%|██████▌   | 142281/217273 [02:39<01:29, 837.30 examples/s]Map:  66%|██████▌   | 143150/217273 [02:39<01:29, 831.15 examples/s]Map:  66%|██████▌   | 143400/217273 [02:37<01:19, 924.68 examples/s]Map:  66%|██████▌   | 142597/217273 [02:37<01:18, 955.00 examples/s]Map:  66%|██████▌   | 142375/217273 [02:39<01:26, 861.97 examples/s]Map:  66%|██████▌   | 143252/217273 [02:39<01:24, 878.91 examples/s]Map:  66%|██████▌   | 143501/217273 [02:37<01:17, 946.37 examples/s]Map:  66%|██████▌   | 142696/217273 [02:37<01:17, 963.11 examples/s]Map:  66%|██████▌   | 142510/217273 [02:40<01:25, 872.47 examples/s]Map:  66%|██████▌   | 143345/217273 [02:39<01:22, 890.70 examples/s]Map:  66%|██████▌   | 143649/217273 [02:38<01:17, 955.84 examples/s]Map:  66%|██████▌   | 142840/217273 [02:37<01:17, 955.02 examples/s]Map:  66%|██████▌   | 142601/217273 [02:40<01:24, 881.20 examples/s]Map:  66%|██████▌   | 143443/217273 [02:39<01:20, 913.32 examples/s]Map:  66%|██████▌   | 143749/217273 [02:38<01:16, 963.70 examples/s]Map:  66%|██████▌   | 142940/217273 [02:38<01:17, 964.22 examples/s]Map:  66%|██████▌   | 143542/217273 [02:39<01:19, 931.32 examples/s]Map:  66%|██████▌   | 142729/217273 [02:40<01:25, 868.97 examples/s]Map:  66%|██████▌   | 143849/217273 [02:38<01:15, 972.16 examples/s]Map:  66%|██████▌   | 142828/217273 [02:40<01:23, 894.75 examples/s]Map:  66%|██████▌   | 143678/217273 [02:40<01:19, 920.39 examples/s]Map:  66%|██████▋   | 143950/217273 [02:38<01:14, 980.45 examples/s]Map:  66%|██████▌   | 143046/217273 [02:38<01:33, 791.34 examples/s]Map:  66%|██████▌   | 143133/217273 [02:38<01:31, 807.57 examples/s]Map:  66%|██████▌   | 143809/217273 [02:40<01:21, 901.53 examples/s]Map:  66%|██████▌   | 142962/217273 [02:40<01:23, 891.10 examples/s]Map:  66%|██████▋   | 144085/217273 [02:38<01:30, 809.27 examples/s]Map:  66%|██████▌   | 143262/217273 [02:38<01:29, 822.85 examples/s]Map:  66%|██████▌   | 143937/217273 [02:40<01:23, 883.21 examples/s]Map:  66%|██████▋   | 144180/217273 [02:38<01:27, 838.11 examples/s]Map:  66%|██████▌   | 143092/217273 [02:40<01:36, 767.24 examples/s]Map:  66%|██████▌   | 143362/217273 [02:38<01:25, 863.11 examples/s]Map:  66%|██████▋   | 144281/217273 [02:38<01:23, 878.05 examples/s]Map:  66%|██████▌   | 143184/217273 [02:40<01:32, 798.04 examples/s]Map:  66%|██████▋   | 144042/217273 [02:40<01:35, 768.34 examples/s]Map:  66%|██████▌   | 143458/217273 [02:38<01:23, 881.86 examples/s]Map:  66%|██████▋   | 144388/217273 [02:38<01:18, 925.59 examples/s]Map:  66%|██████▌   | 143272/217273 [02:40<01:30, 814.42 examples/s]Map:  66%|██████▋   | 144137/217273 [02:40<01:30, 807.10 examples/s]Map:  67%|██████▋   | 144493/217273 [02:38<01:16, 957.27 examples/s]Map:  66%|██████▌   | 143598/217273 [02:38<01:22, 895.93 examples/s]Map:  66%|██████▋   | 144228/217273 [02:40<01:28, 828.90 examples/s]Map:  66%|██████▌   | 143391/217273 [02:41<01:32, 802.27 examples/s]Map:  67%|██████▋   | 144597/217273 [02:39<01:14, 978.68 examples/s]Map:  66%|██████▌   | 143700/217273 [02:38<01:19, 925.36 examples/s]Map:  66%|██████▋   | 144320/217273 [02:40<01:26, 847.96 examples/s]Map:  66%|██████▌   | 143485/217273 [02:41<01:28, 830.91 examples/s]Map:  67%|██████▋   | 144706/217273 [02:39<01:12, 1006.34 examples/s]Map:  66%|██████▌   | 143801/217273 [02:39<01:17, 943.48 examples/s]Map:  67%|██████▋   | 144812/217273 [02:39<01:11, 1020.27 examples/s]Map:  66%|██████▌   | 143573/217273 [02:41<01:29, 825.59 examples/s]Map:  66%|██████▋   | 144417/217273 [02:41<01:34, 772.85 examples/s]Map:  66%|██████▌   | 143904/217273 [02:39<01:16, 962.55 examples/s]Map:  67%|██████▋   | 144917/217273 [02:39<01:10, 1025.12 examples/s]Map:  66%|██████▌   | 143659/217273 [02:41<01:28, 831.62 examples/s]Map:  67%|██████▋   | 144517/217273 [02:41<01:39, 730.46 examples/s]Map:  66%|██████▌   | 143752/217273 [02:41<01:26, 851.72 examples/s]Map:  66%|██████▋   | 144055/217273 [02:39<01:28, 827.51 examples/s]Map:  67%|██████▋   | 145048/217273 [02:39<01:24, 852.39 examples/s] Map:  66%|██████▌   | 143842/217273 [02:41<01:25, 861.49 examples/s]Map:  67%|██████▋   | 144631/217273 [02:41<01:38, 735.00 examples/s]Map:  66%|██████▋   | 144163/217273 [02:39<01:22, 884.42 examples/s]Map:  67%|██████▋   | 145146/217273 [02:39<01:21, 881.62 examples/s]Map:  66%|██████▌   | 143929/217273 [02:41<01:25, 860.26 examples/s]Map:  67%|██████▋   | 144717/217273 [02:41<01:35, 761.54 examples/s]Map:  66%|██████▋   | 144270/217273 [02:39<01:18, 925.96 examples/s]Map:  67%|██████▋   | 145245/217273 [02:39<01:19, 903.77 examples/s]Map:  67%|██████▋   | 144813/217273 [02:41<01:29, 809.19 examples/s]Map:  66%|██████▋   | 144369/217273 [02:39<01:17, 939.29 examples/s]Map:  66%|██████▋   | 144043/217273 [02:41<01:42, 712.75 examples/s]Map:  67%|██████▋   | 145382/217273 [02:39<01:19, 904.64 examples/s]Map:  67%|██████▋   | 144944/217273 [02:41<01:27, 826.83 examples/s]Map:  67%|██████▋   | 144493/217273 [02:39<01:21, 892.80 examples/s]Map:  67%|██████▋   | 145488/217273 [02:40<01:16, 940.44 examples/s]Map:  66%|██████▋   | 144161/217273 [02:42<01:39, 732.63 examples/s]Map:  67%|██████▋   | 144596/217273 [02:39<01:18, 926.98 examples/s]Map:  67%|██████▋   | 145045/217273 [02:41<01:40, 720.58 examples/s]Map:  67%|██████▋   | 145588/217273 [02:40<01:15, 952.94 examples/s]Map:  66%|██████▋   | 144254/217273 [02:42<01:33, 776.92 examples/s]Map:  67%|██████▋   | 144741/217273 [02:40<01:17, 937.85 examples/s]Map:  67%|██████▋   | 145137/217273 [02:41<01:34, 762.11 examples/s]Map:  67%|██████▋   | 145686/217273 [02:40<01:14, 957.09 examples/s]Map:  66%|██████▋   | 144346/217273 [02:42<01:30, 806.56 examples/s]Map:  67%|██████▋   | 144842/217273 [02:40<01:15, 955.34 examples/s]Map:  67%|██████▋   | 145224/217273 [02:42<01:31, 785.41 examples/s]Map:  66%|██████▋   | 144434/217273 [02:42<01:28, 822.89 examples/s]Map:  67%|██████▋   | 145829/217273 [02:40<01:15, 950.31 examples/s]Map:  67%|██████▋   | 145313/217273 [02:42<01:29, 808.48 examples/s]Map:  67%|██████▋   | 144523/217273 [02:42<01:26, 837.52 examples/s]Map:  67%|██████▋   | 144994/217273 [02:40<01:14, 970.45 examples/s]Map:  67%|██████▋   | 145931/217273 [02:40<01:13, 965.61 examples/s]Map:  67%|██████▋   | 145398/217273 [02:42<01:27, 817.82 examples/s]Map:  67%|██████▋   | 144610/217273 [02:42<01:26, 844.19 examples/s]Map:  67%|██████▋   | 145487/217273 [02:42<01:25, 834.76 examples/s]Map:  67%|██████▋   | 144703/217273 [02:42<01:23, 867.82 examples/s]Map:  67%|██████▋   | 145099/217273 [02:40<01:27, 824.27 examples/s]Map:  67%|██████▋   | 146049/217273 [02:40<01:26, 821.74 examples/s]Map:  67%|██████▋   | 145574/217273 [02:42<01:25, 841.06 examples/s]Map:  67%|██████▋   | 144796/217273 [02:42<01:22, 879.66 examples/s]Map:  67%|██████▋   | 145201/217273 [02:40<01:23, 867.30 examples/s]Map:  67%|██████▋   | 146156/217273 [02:40<01:20, 878.87 examples/s]Map:  67%|██████▋   | 145669/217273 [02:42<01:22, 871.07 examples/s]Map:  67%|██████▋   | 145297/217273 [02:40<01:21, 886.23 examples/s]Map:  67%|██████▋   | 146258/217273 [02:40<01:17, 911.54 examples/s]Map:  67%|██████▋   | 144919/217273 [02:42<01:24, 853.89 examples/s]Map:  67%|██████▋   | 145758/217273 [02:42<01:21, 876.08 examples/s]Map:  67%|██████▋   | 145393/217273 [02:40<01:19, 903.16 examples/s]Map:  67%|██████▋   | 146357/217273 [02:40<01:16, 930.42 examples/s]Map:  67%|██████▋   | 145494/217273 [02:40<01:17, 928.87 examples/s]Map:  67%|██████▋   | 146459/217273 [02:41<01:14, 952.93 examples/s]Map:  67%|██████▋   | 145883/217273 [02:42<01:23, 858.21 examples/s]Map:  67%|██████▋   | 145042/217273 [02:43<01:39, 723.71 examples/s]Map:  67%|██████▋   | 145629/217273 [02:41<01:18, 912.77 examples/s]Map:  67%|██████▋   | 145125/217273 [02:43<01:36, 744.29 examples/s]Map:  67%|██████▋   | 146594/217273 [02:41<01:15, 931.08 examples/s]Map:  67%|██████▋   | 146000/217273 [02:43<01:39, 713.03 examples/s]Map:  67%|██████▋   | 145722/217273 [02:41<01:18, 916.39 examples/s]Map:  67%|██████▋   | 145213/217273 [02:43<01:33, 774.53 examples/s]Map:  68%|██████▊   | 146694/217273 [02:41<01:14, 947.10 examples/s]Map:  67%|██████▋   | 146090/217273 [02:43<01:34, 751.92 examples/s]Map:  67%|██████▋   | 145823/217273 [02:41<01:16, 938.06 examples/s]Map:  67%|██████▋   | 145305/217273 [02:43<01:29, 806.59 examples/s]Map:  68%|██████▊   | 146791/217273 [02:41<01:14, 949.89 examples/s]Map:  67%|██████▋   | 146184/217273 [02:43<01:29, 795.92 examples/s]Map:  67%|██████▋   | 145919/217273 [02:41<01:15, 939.98 examples/s]Map:  67%|██████▋   | 145399/217273 [02:43<01:25, 840.39 examples/s]Map:  68%|██████▊   | 146893/217273 [02:41<01:12, 968.36 examples/s]Map:  67%|██████▋   | 146272/217273 [02:43<01:27, 811.95 examples/s]Map:  67%|██████▋   | 145493/217273 [02:43<01:22, 865.22 examples/s]Map:  67%|██████▋   | 146365/217273 [02:43<01:24, 840.67 examples/s]Map:  68%|██████▊   | 147000/217273 [02:41<01:27, 805.90 examples/s]Map:  67%|██████▋   | 146049/217273 [02:41<01:31, 778.30 examples/s]Map:  67%|██████▋   | 145587/217273 [02:43<01:21, 882.35 examples/s]Map:  67%|██████▋   | 146458/217273 [02:43<01:22, 860.22 examples/s]Map:  68%|██████▊   | 147096/217273 [02:41<01:23, 843.24 examples/s]Map:  67%|██████▋   | 146150/217273 [02:41<01:25, 829.76 examples/s]Map:  67%|██████▋   | 145678/217273 [02:43<01:20, 886.86 examples/s]Map:  67%|██████▋   | 146552/217273 [02:43<01:20, 880.27 examples/s]Map:  68%|██████▊   | 147194/217273 [02:41<01:20, 875.15 examples/s]Map:  67%|██████▋   | 146244/217273 [02:41<01:23, 854.43 examples/s]Map:  67%|██████▋   | 145815/217273 [02:44<01:19, 894.57 examples/s]Map:  67%|██████▋   | 146644/217273 [02:43<01:19, 888.62 examples/s]Map:  68%|██████▊   | 147287/217273 [02:41<01:18, 887.62 examples/s]Map:  67%|██████▋   | 146342/217273 [02:41<01:20, 886.09 examples/s]Map:  67%|██████▋   | 145908/217273 [02:44<01:19, 902.12 examples/s]Map:  68%|██████▊   | 147383/217273 [02:42<01:17, 904.78 examples/s]Map:  67%|██████▋   | 146444/217273 [02:41<01:16, 920.57 examples/s]Map:  68%|██████▊   | 146776/217273 [02:43<01:20, 879.48 examples/s]Map:  68%|██████▊   | 147479/217273 [02:42<01:16, 917.86 examples/s]Map:  67%|██████▋   | 146545/217273 [02:42<01:15, 942.01 examples/s]Map:  67%|██████▋   | 146000/217273 [02:44<01:33, 760.02 examples/s]Map:  68%|██████▊   | 146874/217273 [02:44<01:17, 903.58 examples/s]Map:  68%|██████▊   | 147578/217273 [02:42<01:14, 936.93 examples/s]Map:  67%|██████▋   | 146646/217273 [02:42<01:13, 956.72 examples/s]Map:  67%|██████▋   | 146089/217273 [02:44<01:30, 790.11 examples/s]Map:  68%|██████▊   | 146972/217273 [02:44<01:16, 922.35 examples/s]Map:  68%|██████▊   | 147675/217273 [02:42<01:13, 943.62 examples/s]Map:  67%|██████▋   | 146178/217273 [02:44<01:27, 814.74 examples/s]Map:  68%|██████▊   | 146789/217273 [02:42<01:14, 951.26 examples/s]Map:  68%|██████▊   | 147813/217273 [02:42<01:14, 930.43 examples/s]Map:  68%|██████▊   | 147076/217273 [02:44<01:38, 714.49 examples/s]Map:  67%|██████▋   | 146307/217273 [02:44<01:26, 824.64 examples/s]Map:  68%|██████▊   | 146937/217273 [02:42<01:13, 957.79 examples/s]Map:  68%|██████▊   | 147911/217273 [02:42<01:13, 940.63 examples/s]Map:  68%|██████▊   | 147173/217273 [02:44<01:30, 770.44 examples/s]Map:  67%|██████▋   | 146396/217273 [02:44<01:24, 834.70 examples/s]Map:  68%|██████▊   | 147272/217273 [02:44<01:25, 822.52 examples/s]Map:  67%|██████▋   | 146494/217273 [02:44<01:21, 872.16 examples/s]Map:  68%|██████▊   | 147047/217273 [02:42<01:25, 821.70 examples/s]Map:  68%|██████▊   | 148047/217273 [02:42<01:25, 812.51 examples/s]Map:  68%|██████▊   | 147373/217273 [02:44<01:20, 868.94 examples/s]Map:  67%|██████▋   | 146588/217273 [02:44<01:19, 888.61 examples/s]Map:  68%|██████▊   | 147151/217273 [02:42<01:20, 868.88 examples/s]Map:  68%|██████▊   | 148151/217273 [02:42<01:20, 862.83 examples/s]Map:  68%|██████▊   | 147472/217273 [02:44<01:17, 898.34 examples/s]Map:  68%|██████▊   | 146683/217273 [02:45<01:17, 905.66 examples/s]Map:  68%|██████▊   | 147258/217273 [02:42<01:16, 914.94 examples/s]Map:  68%|██████▊   | 148246/217273 [02:43<01:18, 883.89 examples/s]Map:  68%|██████▊   | 147566/217273 [02:44<01:16, 906.23 examples/s]Map:  68%|██████▊   | 147364/217273 [02:42<01:13, 949.15 examples/s]Map:  68%|██████▊   | 146808/217273 [02:45<01:20, 872.40 examples/s]Map:  68%|██████▊   | 148349/217273 [02:43<01:14, 920.79 examples/s]Map:  68%|██████▊   | 147665/217273 [02:44<01:15, 927.48 examples/s]Map:  68%|██████▊   | 146905/217273 [02:45<01:18, 895.51 examples/s]Map:  68%|██████▊   | 147507/217273 [02:43<01:13, 945.23 examples/s]Map:  68%|██████▊   | 147762/217273 [02:45<01:14, 937.91 examples/s]Map:  68%|██████▊   | 148496/217273 [02:43<01:13, 935.30 examples/s]Map:  68%|██████▊   | 147607/217273 [02:43<01:12, 955.49 examples/s]Map:  68%|██████▊   | 147862/217273 [02:45<01:12, 950.99 examples/s]Map:  68%|██████▊   | 147000/217273 [02:45<01:31, 769.11 examples/s]Map:  68%|██████▊   | 148595/217273 [02:43<01:12, 947.13 examples/s]Map:  68%|██████▊   | 147709/217273 [02:43<01:11, 970.07 examples/s]Map:  68%|██████▊   | 147090/217273 [02:45<01:27, 799.85 examples/s]Map:  68%|██████▊   | 148693/217273 [02:43<01:11, 953.56 examples/s]Map:  68%|██████▊   | 147998/217273 [02:45<01:14, 927.76 examples/s]Map:  68%|██████▊   | 147813/217273 [02:43<01:10, 986.40 examples/s]Map:  68%|██████▊   | 147182/217273 [02:45<01:24, 828.58 examples/s]Map:  68%|██████▊   | 148829/217273 [02:43<01:13, 933.38 examples/s]Map:  68%|██████▊   | 147954/217273 [02:43<01:11, 965.67 examples/s]Map:  68%|██████▊   | 148137/217273 [02:45<01:28, 785.27 examples/s]Map:  68%|██████▊   | 147315/217273 [02:45<01:22, 847.68 examples/s]Map:  69%|██████▊   | 148927/217273 [02:43<01:12, 942.69 examples/s]Map:  68%|██████▊   | 148231/217273 [02:45<01:24, 816.24 examples/s]Map:  68%|██████▊   | 147407/217273 [02:45<01:20, 862.90 examples/s]Map:  68%|██████▊   | 148099/217273 [02:43<01:22, 833.59 examples/s]Map:  68%|██████▊   | 148329/217273 [02:45<01:20, 853.50 examples/s]Map:  68%|██████▊   | 147506/217273 [02:46<01:18, 894.32 examples/s]Map:  69%|██████▊   | 149052/217273 [02:43<01:24, 809.91 examples/s]Map:  68%|██████▊   | 148191/217273 [02:43<01:21, 851.95 examples/s]Map:  68%|██████▊   | 148432/217273 [02:45<01:16, 897.03 examples/s]Map:  68%|██████▊   | 147598/217273 [02:46<01:17, 900.61 examples/s]Map:  69%|██████▊   | 149153/217273 [02:44<01:19, 853.97 examples/s]Map:  68%|██████▊   | 148291/217273 [02:43<01:17, 886.41 examples/s]Map:  68%|██████▊   | 148532/217273 [02:45<01:14, 919.17 examples/s]Map:  68%|██████▊   | 147700/217273 [02:46<01:14, 933.11 examples/s]Map:  69%|██████▊   | 149254/217273 [02:44<01:16, 889.29 examples/s]Map:  68%|██████▊   | 148393/217273 [02:44<01:15, 916.18 examples/s]Map:  68%|██████▊   | 148632/217273 [02:46<01:13, 937.24 examples/s]Map:  68%|██████▊   | 147801/217273 [02:46<01:13, 950.92 examples/s]Map:  69%|██████▊   | 149355/217273 [02:44<01:13, 919.79 examples/s]Map:  68%|██████▊   | 148490/217273 [02:44<01:14, 928.20 examples/s]Map:  68%|██████▊   | 148732/217273 [02:46<01:11, 953.40 examples/s]Map:  68%|██████▊   | 147897/217273 [02:46<01:13, 948.48 examples/s]Map:  69%|██████▉   | 149459/217273 [02:44<01:11, 948.80 examples/s]Map:  68%|██████▊   | 148595/217273 [02:44<01:11, 957.01 examples/s]Map:  68%|██████▊   | 148832/217273 [02:46<01:11, 960.03 examples/s]Map:  69%|██████▉   | 149562/217273 [02:44<01:19, 850.05 examples/s]Map:  68%|██████▊   | 148701/217273 [02:44<01:09, 982.20 examples/s]Map:  68%|██████▊   | 148000/217273 [02:46<01:26, 805.21 examples/s]Map:  69%|██████▊   | 148933/217273 [02:46<01:10, 973.75 examples/s]Map:  68%|██████▊   | 148801/217273 [02:44<01:09, 984.23 examples/s]Map:  68%|█���████▊   | 148098/217273 [02:46<01:21, 848.92 examples/s]Map:  69%|██████▉   | 149670/217273 [02:44<01:24, 801.25 examples/s]Map:  69%|██████▊   | 148905/217273 [02:44<01:08, 997.01 examples/s]Map:  68%|██████▊   | 148198/217273 [02:46<01:17, 888.50 examples/s]Map:  69%|██████▊   | 149046/217273 [02:46<01:24, 806.14 examples/s]Map:  69%|██████▉   | 149802/217273 [02:44<01:22, 821.78 examples/s]Map:  69%|██████▊   | 149151/217273 [02:46<01:18, 863.67 examples/s]Map:  68%|██████▊   | 148323/217273 [02:46<01:19, 865.96 examples/s]Map:  69%|██████▉   | 149888/217273 [02:44<01:21, 828.47 examples/s]Map:  69%|██████▊   | 149047/217273 [02:44<01:23, 816.15 examples/s]Map:  69%|██████▊   | 149288/217273 [02:46<01:17, 875.20 examples/s]Map:  69%|██████▉   | 149988/217273 [02:45<01:17, 869.68 examples/s]Map:  68%|██████▊   | 148463/217273 [02:47<01:17, 886.91 examples/s]Map:  69%|██████▊   | 149151/217273 [02:44<01:18, 866.05 examples/s]Map:  69%|██████▉   | 149390/217273 [02:46<01:15, 904.76 examples/s]Map:  68%|██████▊   | 148562/217273 [02:47<01:15, 910.50 examples/s]Map:  69%|██████▊   | 149254/217273 [02:45<01:15, 905.89 examples/s]Map:  69%|██████▉   | 149489/217273 [02:47<01:13, 924.87 examples/s]Map:  69%|██████▉   | 150101/217273 [02:45<01:28, 760.31 examples/s]Map:  68%|██████▊   | 148656/217273 [02:47<01:14, 915.59 examples/s]Map:  69%|██████▊   | 149357/217273 [02:45<01:12, 936.46 examples/s]Map:  69%|██████▉   | 149595/217273 [02:47<01:10, 959.54 examples/s]Map:  69%|██████▉   | 150202/217273 [02:45<01:22, 815.22 examples/s]Map:  68%|██████▊   | 148754/217273 [02:47<01:13, 929.89 examples/s]Map:  69%|██████▉   | 149458/217273 [02:45<01:11, 953.18 examples/s]Map:  69%|██████▉   | 149698/217273 [02:47<01:09, 976.52 examples/s]Map:  69%|██████▉   | 150301/217273 [02:45<01:18, 854.20 examples/s]Map:  69%|██████▊   | 148859/217273 [02:47<01:11, 959.81 examples/s]Map:  69%|██████▉   | 149605/217273 [02:45<01:10, 960.00 examples/s]Map:  69%|██████▉   | 150402/217273 [02:45<01:15, 890.58 examples/s]Map:  69%|██████▊   | 148957/217273 [02:47<01:10, 964.24 examples/s]Map:  69%|██████▉   | 149847/217273 [02:47<01:09, 974.86 examples/s]Map:  69%|██████▉   | 150504/217273 [02:45<01:12, 924.27 examples/s]Map:  69%|██████▉   | 149951/217273 [02:47<01:08, 989.02 examples/s]Map:  69%|██████▉   | 149746/217273 [02:45<01:11, 944.61 examples/s]Map:  69%|██████▉   | 150600/217273 [02:45<01:11, 932.19 examples/s]Map:  69%|██████▊   | 149092/217273 [02:47<01:24, 811.18 examples/s]Map:  69%|██████▉   | 149849/217273 [02:45<01:09, 964.36 examples/s]Map:  69%|██████▉   | 150698/217273 [02:45<01:10, 942.98 examples/s]Map:  69%|██████▊   | 149188/217273 [02:47<01:20, 844.45 examples/s]Map:  69%|██████▉   | 149952/217273 [02:45<01:08, 980.61 examples/s]Map:  69%|██████▉   | 150092/217273 [02:47<01:19, 841.64 examples/s]Map:  69%|██████▉   | 150794/217273 [02:45<01:10, 943.02 examples/s]Map:  69%|██████▊   | 149284/217273 [02:48<01:17, 872.02 examples/s]Map:  69%|██████▉   | 150193/217273 [02:47<01:16, 877.39 examples/s]Map:  69%|██████▉   | 149381/217273 [02:48<01:15, 896.64 examples/s]Map:  69%|██████▉   | 150940/217273 [02:46<01:09, 952.42 examples/s]Map:  69%|██████▉   | 150289/217273 [02:47<01:14, 894.86 examples/s]Map:  69%|██████▉   | 150097/217273 [02:45<01:20, 837.71 examples/s]Map:  69%|██████▉   | 149504/217273 [02:48<01:18, 865.19 examples/s]Map:  69%|██████▉   | 150421/217273 [02:48<01:15, 887.89 examples/s]Map:  69%|██████▉   | 150234/217273 [02:46<01:18, 858.05 examples/s]Map:  70%|██████▉   | 151046/217273 [02:46<01:25, 778.12 examples/s]Map:  69%|██████▉   | 149602/217273 [02:48<01:15, 893.09 examples/s]Map:  69%|██████▉   | 150525/217273 [02:48<01:12, 919.99 examples/s]Map:  69%|██████▉   | 150335/217273 [02:46<01:15, 890.73 examples/s]Map:  70%|██████▉   | 151144/217273 [02:46<01:20, 823.94 examples/s]Map:  69%|██████▉   | 149708/217273 [02:48<01:12, 934.39 examples/s]Map:  69%|██████▉   | 150625/217273 [02:48<01:11, 938.69 examples/s]Map:  69%|██████▉   | 150429/217273 [02:46<01:14, 901.52 examples/s]Map:  70%|██████▉   | 151243/217273 [02:46<01:16, 861.11 examples/s]Map:  69%|██████▉   | 149809/217273 [02:48<01:10, 951.83 examples/s]Map:  69%|██████▉   | 150727/217273 [02:48<01:09, 958.71 examples/s]Map:  69%|██████▉   | 150529/217273 [02:46<01:12, 921.23 examples/s]Map:  70%|██████▉   | 151337/217273 [02:46<01:15, 878.76 examples/s]Map:  69%|██████▉   | 149906/217273 [02:48<01:10, 954.02 examples/s]Map:  69%|██████▉   | 150828/217273 [02:48<01:08, 969.65 examples/s]Map:  70%|██████▉   | 151433/217273 [02:46<01:13, 898.74 examples/s]Map:  69%|██████▉   | 150670/217273 [02:46<01:11, 925.06 examples/s]Map:  69%|██████▉   | 150934/217273 [02:48<01:07, 989.52 examples/s]Map:  70%|██████▉   | 151529/217273 [02:46<01:12, 912.11 examples/s]Map:  69%|██████▉   | 150765/217273 [02:46<01:11, 930.06 examples/s]Map:  69%|██████▉   | 150049/217273 [02:48<01:23, 803.37 examples/s]Map:  70%|██████▉   | 151623/217273 [02:46<01:11, 915.97 examples/s]Map:  69%|██████▉   | 150860/217273 [02:46<01:11, 929.22 examples/s]Map:  70%|██████▉   | 151049/217273 [02:48<01:19, 829.33 examples/s]Map:  69%|██████▉   | 150146/217273 [02:49<01:19, 840.27 examples/s]Map:  70%|██████▉   | 151721/217273 [02:46<01:10, 930.10 examples/s]Map:  70%|██████▉   | 151151/217273 [02:48<01:15, 876.03 examples/s]Map:  69%|██████▉   | 150243/217273 [02:49<01:17, 869.53 examples/s]Map:  69%|██████▉   | 150998/217273 [02:46<01:11, 922.13 examples/s]Map:  70%|██████▉   | 151250/217273 [02:48<01:13, 902.24 examples/s]Map:  70%|██████▉   | 151862/217273 [02:47<01:10, 931.76 examples/s]Map:  69%|██████▉   | 150340/217273 [02:49<01:14, 893.57 examples/s]Map:  70%|██████▉   | 151354/217273 [02:49<01:10, 937.60 examples/s]Map:  70%|██████▉   | 151962/217273 [02:47<01:08, 946.91 examples/s]Map:  70%|██████▉   | 151094/217273 [02:47<01:26, 768.07 examples/s]Map:  69%|██████▉   | 150438/217273 [02:49<01:12, 916.61 examples/s]Map:  70%|██████▉   | 151187/217273 [02:47<01:22, 799.93 examples/s]Map:  69%|██████▉   | 150540/217273 [02:49<01:10, 940.95 examples/s]Map:  70%|██████▉   | 151500/217273 [02:49<01:09, 946.65 examples/s]Map:  70%|██████▉   | 151280/217273 [02:47<01:19, 829.04 examples/s]Map:  69%|██████▉   | 150638/217273 [02:49<01:10, 946.78 examples/s]Map:  70%|███████   | 152097/217273 [02:47<01:21, 801.71 examples/s]Map:  70%|██████▉   | 151599/217273 [02:49<01:08, 954.36 examples/s]Map:  70%|██████▉   | 151409/217273 [02:47<01:18, 836.26 examples/s]Map:  69%|██████▉   | 150777/217273 [02:49<01:11, 936.19 examples/s]Map:  70%|███████   | 152230/217273 [02:47<01:18, 824.36 examples/s]Map:  70%|██████▉   | 151741/217273 [02:49<01:09, 948.62 examples/s]Map:  70%|██████▉   | 151509/217273 [02:47<01:15, 872.25 examples/s]Map:  69%|██████▉   | 150879/217273 [02:49<01:09, 954.93 examples/s]Map:  70%|███████   | 152323/217273 [02:47<01:16, 846.81 examples/s]Map:  70%|██████▉   | 151839/217273 [02:49<01:08, 954.95 examples/s]Map:  70%|██████▉   | 151604/217273 [02:47<01:13, 889.47 examples/s]Map:  69%|██████▉   | 150977/217273 [02:49<01:09, 959.70 examples/s]Map:  70%|███████   | 152419/217273 [02:47<01:14, 872.31 examples/s]Map:  70%|██████▉   | 151936/217273 [02:49<01:08, 956.32 examples/s]Map:  70%|██████▉   | 151702/217273 [02:47<01:12, 909.80 examples/s]Map:  70%|███████   | 152513/217273 [02:47<01:12, 887.19 examples/s]Map:  70%|██████▉   | 151101/217273 [02:50<01:20, 827.06 examples/s]Map:  70%|██████▉   | 151801/217273 [02:47<01:10, 928.40 examples/s]Map:  70%|███████   | 152610/217273 [02:48<01:11, 907.14 examples/s]Map:  70%|██████▉   | 152047/217273 [02:49<01:19, 822.30 examples/s]Map:  70%|██████▉   | 151200/217273 [02:50<01:16, 866.15 examples/s]Map:  70%|███████   | 152711/217273 [02:48<01:09, 932.31 examples/s]Map:  70%|███████   | 152146/217273 [02:49<01:15, 862.08 examples/s]Map:  70%|██████▉   | 151942/217273 [02:48<01:10, 931.78 examples/s]Map:  70%|██████▉   | 151304/217273 [02:50<01:12, 908.01 examples/s]Map:  70%|███████   | 152241/217273 [02:50<01:13, 882.63 examples/s]Map:  70%|███████   | 152851/217273 [02:48<01:09, 929.01 examples/s]Map:  70%|██████▉   | 151401/217273 [02:50<01:11, 923.49 examples/s]Map:  70%|███████   | 152343/217273 [02:50<01:10, 917.12 examples/s]Map:  70%|██████▉   | 152049/217273 [02:48<01:22, 789.69 examples/s]Map:  70%|██████▉   | 151499/217273 [02:50<01:10, 936.23 examples/s]Map:  70%|███████   | 152995/217273 [02:48<01:08, 938.12 examples/s]Map:  70%|███████   | 152445/217273 [02:50<01:08, 942.31 examples/s]Map:  70%|███████   | 152149/217273 [02:48<01:17, 837.44 examples/s]Map:  70%|███████   | 152544/217273 [02:50<01:07, 953.53 examples/s]Map:  70%|███████   | 152246/217273 [02:48<01:14, 870.07 examples/s]Map:  70%|██████▉   | 151645/217273 [02:50<01:09, 945.13 examples/s]Map:  70%|███████   | 153099/217273 [02:48<01:20, 794.17 examples/s]Map:  70%|███████   | 152646/217273 [02:50<01:06, 970.27 examples/s]Map:  70%|███████   | 152341/217273 [02:48<01:13, 889.20 examples/s]Map:  70%|██████▉   | 151743/217273 [02:50<01:08, 951.01 examples/s]Map:  71%|███████   | 153197/217273 [02:48<01:16, 832.97 examples/s]Map:  70%|███████   | 152781/217273 [02:50<01:08, 938.20 examples/s]Map:  70%|███████   | 152477/217273 [02:48<01:12, 892.58 examples/s]Map:  70%|██████▉   | 151880/217273 [02:50<01:09, 935.25 examples/s]Map:  71%|███████   | 153330/217273 [02:48<01:15, 847.01 examples/s]Map:  70%|███████   | 152882/217273 [02:50<01:07, 952.30 examples/s]Map:  70%|███████   | 152570/217273 [02:48<01:11, 901.61 examples/s]Map:  70%|██████▉   | 151977/217273 [02:50<01:09, 938.18 examples/s]Map:  71%|███████   | 153426/217273 [02:48<01:13, 870.35 examples/s]Map:  70%|███████   | 152669/217273 [02:48<01:10, 922.81 examples/s]Map:  71%|███████   | 153524/217273 [02:49<01:11, 896.21 examples/s]Map:  70%|███████   | 153000/217273 [02:50<01:20, 795.90 examples/s]Map:  70%|███████   | 152768/217273 [02:48<01:08, 938.55 examples/s]Map:  70%|███████   | 152100/217273 [02:51<01:19, 818.52 examples/s]Map:  71%|███████   | 153623/217273 [02:49<01:09, 920.59 examples/s]Map:  70%|███████   | 153100/217273 [02:50<01:16, 841.04 examples/s]Map:  70%|███████   | 152866/217273 [02:49<01:07, 949.82 examples/s]Map:  70%|███████   | 152200/217273 [02:51<01:15, 858.80 examples/s]Map:  71%|███████   | 153726/217273 [02:49<01:07, 944.60 examples/s]Map:  71%|███████   | 153202/217273 [02:51<01:12, 883.15 examples/s]Map:  70%|███████   | 152967/217273 [02:49<01:06, 962.11 examples/s]Map:  70%|███████   | 152300/217273 [02:51<01:12, 890.24 examples/s]Map:  71%|███████   | 153824/217273 [02:49<01:06, 952.78 examples/s]Map:  71%|███████   | 153302/217273 [02:51<01:10, 912.18 examples/s]Map:  70%|███████   | 152397/217273 [02:51<01:11, 905.82 examples/s]Map:  71%|███████   | 153404/217273 [02:51<01:07, 940.29 examples/s]Map:  70%|███████   | 152501/217273 [02:51<01:08, 941.27 examples/s]Map:  70%|███████   | 153094/217273 [02:49<01:20, 797.32 examples/s]Map:  71%|███████   | 153971/217273 [02:49<01:05, 960.18 examples/s]Map:  71%|███████   | 153503/217273 [02:51<01:07, 951.19 examples/s]Map:  70%|███████   | 152601/217273 [02:51<01:07, 954.54 examples/s]Map:  71%|███████   | 153193/217273 [02:49<01:16, 840.73 examples/s]Map:  71%|███████   | 153602/217273 [02:51<01:06, 960.08 examples/s]Map:  70%|███████   | 152699/217273 [02:51<01:07, 961.30 examples/s]Map:  71%|███████   | 153289/217273 [02:49<01:13, 868.09 examples/s]Map:  71%|███████   | 154099/217273 [02:49<01:17, 812.86 examples/s]Map:  71%|███████   | 153704/217273 [02:51<01:05, 973.74 examples/s]Map:  71%|███████   | 154196/217273 [02:49<01:14, 846.69 examples/s]Map:  70%|███████   | 152843/217273 [02:51<01:07, 956.45 examples/s]Map:  71%|███████   | 153428/217273 [02:49<01:12, 884.38 examples/s]Map:  71%|███████   | 153803/217273 [02:51<01:05, 973.18 examples/s]Map:  71%|███████   | 154299/217273 [02:49<01:10, 889.13 examples/s]Map:  70%|███████   | 152941/217273 [02:52<01:07, 960.06 examples/s]Map:  71%|███████   | 153523/217273 [02:49<01:10, 898.62 examples/s]Map:  71%|███████   | 153938/217273 [02:51<01:07, 942.09 examples/s]Map:  71%|███████   | 154433/217273 [02:50<01:10, 886.61 examples/s]Map:  71%|███████   | 153662/217273 [02:49<01:10, 904.84 examples/s]Map:  70%|███████   | 153043/217273 [02:52<01:21, 792.62 examples/s]Map:  71%|███████   | 154528/217273 [02:50<01:09, 897.68 examples/s]Map:  71%|███████   | 153756/217273 [02:50<01:09, 912.04 examples/s]Map:  71%|███████   | 154045/217273 [02:52<01:19, 794.92 examples/s]Map:  70%|███████   | 153143/217273 [02:52<01:16, 840.22 examples/s]Map:  71%|███████   | 154626/217273 [02:50<01:08, 916.54 examples/s]Map:  71%|███████   | 153854/217273 [02:50<01:08, 926.22 examples/s]Map:  71%|███████   | 154144/217273 [02:52<01:15, 838.86 examples/s]Map:  71%|███████   | 153241/217273 [02:52<01:13, 868.93 examples/s]Map:  71%|███████   | 154725/217273 [02:50<01:07, 932.52 examples/s]Map:  71%|███████   | 153953/217273 [02:50<01:07, 941.95 examples/s]Map:  71%|███████   | 154239/217273 [02:52<01:12, 864.27 examples/s]Map:  71%|███████   | 153340/217273 [02:52<01:11, 898.60 examples/s]Map:  71%|███████▏  | 154827/217273 [02:50<01:05, 955.16 examples/s]Map:  71%|███████   | 154332/217273 [02:52<01:11, 879.82 examples/s]Map:  71%|███████   | 153437/217273 [02:52<01:09, 916.38 examples/s]Map:  71%|███████   | 154049/217273 [02:50<01:20, 782.40 examples/s]Map:  71%|███████   | 154427/217273 [02:52<01:10, 896.96 examples/s]Map:  71%|███████▏  | 154969/217273 [02:50<01:05, 944.28 examples/s]Map:  71%|███████   | 153536/217273 [02:52<01:08, 934.93 examples/s]Map:  71%|███████   | 154154/217273 [02:50<01:14, 847.46 examples/s]Map:  71%|███████   | 153638/217273 [02:52<01:06, 956.93 examples/s]Map:  71%|███████   | 154564/217273 [02:52<01:09, 901.00 examples/s]Map:  71%|███████   | 154257/217273 [02:50<01:10, 892.50 examples/s]Map:  71%|███████▏  | 155104/217273 [02:50<01:16, 817.62 examples/s]Map:  71%|███████   | 153735/217273 [02:52<01:06, 956.83 examples/s]Map:  71%|███████   | 154660/217273 [02:52<01:08, 914.26 examples/s]Map:  71%|███████   | 154360/217273 [02:50<01:07, 926.82 examples/s]Map:  71%|███████▏  | 155199/217273 [02:50<01:13, 843.54 examples/s]Map:  71%|███████   | 153838/217273 [02:53<01:05, 974.06 examples/s]Map:  71%|███████   | 154757/217273 [02:52<01:07, 927.32 examples/s]Map:  71%|███████   | 154461/217273 [02:50<01:06, 946.15 examples/s]Map:  71%|███████▏  | 155301/217273 [02:51<01:10, 884.24 examples/s]Map:  71%|███████   | 153937/217273 [02:53<01:04, 976.21 examples/s]Map:  71%|███████▏  | 154851/217273 [02:52<01:07, 929.46 examples/s]Map:  71%|███████   | 154561/217273 [02:50<01:05, 957.28 examples/s]Map:  72%|███████▏  | 155405/217273 [02:51<01:07, 922.97 examples/s]Map:  71%|███████▏  | 154949/217273 [02:52<01:06, 941.66 examples/s]Map:  71%|███████   | 154038/217273 [02:53<01:21, 777.51 examples/s]Map:  71%|███████   | 154701/217273 [02:51<01:06, 944.44 examples/s]Map:  72%|███████▏  | 155535/217273 [02:51<01:08, 900.33 examples/s]Map:  71%|███████   | 154134/217273 [02:53<01:16, 820.90 examples/s]Map:  71%|███████▏  | 155048/217273 [02:53<01:22, 752.43 examples/s]Map:  72%|███████▏  | 155636/217273 [02:51<01:06, 925.80 examples/s]Map:  71%|███████▏  | 154846/217273 [02:51<01:05, 951.36 examples/s]Map:  71%|███████   | 154234/217273 [02:53<01:12, 867.61 examples/s]Map:  71%|███████▏  | 155145/217273 [02:53<01:17, 802.54 examples/s]Map:  72%|███████▏  | 155734/217273 [02:51<01:05, 937.17 examples/s]Map:  71%|███████▏  | 154953/217273 [02:51<01:03, 978.66 examples/s]Map:  71%|███████   | 154335/217273 [02:53<01:09, 903.23 examples/s]Map:  71%|███████▏  | 155240/217273 [02:53<01:13, 839.40 examples/s]Map:  72%|███████▏  | 155834/217273 [02:51<01:04, 951.25 examples/s]Map:  71%|███████   | 154433/217273 [02:53<01:08, 921.27 examples/s]Map:  71%|███████▏  | 155340/217273 [02:53<01:10, 881.27 examples/s]Map:  72%|███████▏  | 155937/217273 [02:51<01:03, 970.32 examples/s]Map:  71%|███████▏  | 155102/217273 [02:51<01:12, 857.04 examples/s]Map:  71%|███████   | 154530/217273 [02:53<01:07, 933.72 examples/s]Map:  72%|███████▏  | 155434/217273 [02:53<01:09, 895.63 examples/s]Map:  71%|███████▏  | 155204/217273 [02:51<01:09, 889.69 examples/s]Map:  72%|███████▏  | 155530/217273 [02:53<01:07, 912.11 examples/s]Map:  72%|███████▏  | 156049/217273 [02:51<01:14, 821.49 examples/s]Map:  71%|███████   | 154678/217273 [02:53<01:05, 949.91 examples/s]Map:  71%|███████▏  | 155306/217273 [02:51<01:07, 919.89 examples/s]Map:  72%|███████▏  | 156146/217273 [02:51<01:11, 855.51 examples/s]Map:  71%|███████   | 154780/217273 [02:54<01:04, 964.82 examples/s]Map:  72%|████��██▏  | 155410/217273 [02:51<01:05, 949.24 examples/s]Map:  72%|███████▏  | 155665/217273 [02:53<01:08, 905.69 examples/s]Map:  72%|███████▏  | 156243/217273 [02:52<01:09, 879.38 examples/s]Map:  71%|███████▏  | 154884/217273 [02:54<01:04, 974.77 examples/s]Map:  72%|███████▏  | 155555/217273 [02:52<01:04, 953.36 examples/s]Map:  72%|███████▏  | 155791/217273 [02:53<01:09, 878.85 examples/s]Map:  72%|███████▏  | 156346/217273 [02:52<01:06, 918.40 examples/s]Map:  72%|███████▏  | 155653/217273 [02:52<01:04, 958.18 examples/s]Map:  72%|███████▏  | 155888/217273 [02:54<01:08, 898.95 examples/s]Map:  71%|███████▏  | 155000/217273 [02:54<01:16, 816.51 examples/s]Map:  72%|███████▏  | 156491/217273 [02:52<01:05, 932.99 examples/s]Map:  72%|███████▏  | 155752/217273 [02:52<01:03, 964.07 examples/s]Map:  72%|███████▏  | 155982/217273 [02:54<01:07, 907.30 examples/s]Map:  71%|███████▏  | 155102/217273 [02:54<01:12, 861.93 examples/s]Map:  72%|███████▏  | 156593/217273 [02:52<01:03, 954.51 examples/s]Map:  71%|███████▏  | 155193/217273 [02:54<01:11, 873.01 examples/s]Map:  72%|███████▏  | 155892/217273 [02:52<01:04, 950.38 examples/s]Map:  72%|███████▏  | 156690/217273 [02:52<01:03, 954.43 examples/s]Map:  72%|███████▏  | 156081/217273 [02:54<01:22, 738.31 examples/s]Map:  71%|███████▏  | 155318/217273 [02:54<01:12, 854.75 examples/s]Map:  72%|███████▏  | 156178/217273 [02:54<01:17, 790.67 examples/s]Map:  72%|███████▏  | 156838/217273 [02:52<01:03, 959.05 examples/s]Map:  72%|███████▏  | 156000/217273 [02:52<01:20, 758.18 examples/s]Map:  72%|███████▏  | 155414/217273 [02:54<01:10, 878.32 examples/s]Map:  72%|███████▏  | 156272/217273 [02:54<01:13, 826.08 examples/s]Map:  72%|███████▏  | 156941/217273 [02:52<01:02, 973.10 examples/s]Map:  72%|███████▏  | 156092/217273 [02:52<01:17, 792.93 examples/s]Map:  72%|███████▏  | 155507/217273 [02:54<01:09, 890.44 examples/s]Map:  72%|███████▏  | 156370/217273 [02:54<01:10, 863.55 examples/s]Map:  72%|███████▏  | 156190/217273 [02:52<01:13, 836.11 examples/s]Map:  72%|███████▏  | 155604/217273 [02:55<01:07, 908.98 examples/s]Map:  72%|███████▏  | 157052/217273 [02:52<01:12, 828.29 examples/s]Map:  72%|███████▏  | 156508/217273 [02:54<01:09, 878.87 examples/s]Map:  72%|███████▏  | 156289/217273 [02:52<01:09, 873.09 examples/s]Map:  72%|███████▏  | 155697/217273 [02:55<01:07, 913.36 examples/s]Map:  72%|███████▏  | 157153/217273 [02:53<01:09, 868.82 examples/s]Map:  72%|███████▏  | 156601/217273 [02:54<01:08, 889.47 examples/s]Map:  72%|███████▏  | 156382/217273 [02:53<01:08, 885.76 examples/s]Map:  72%|███████▏  | 155792/217273 [02:55<01:06, 921.03 examples/s]Map:  72%|███████▏  | 157251/217273 [02:53<01:07, 887.48 examples/s]Map:  72%|███████▏  | 156699/217273 [02:55<01:06, 911.18 examples/s]Map:  72%|███████▏  | 156480/217273 [02:53<01:07, 904.68 examples/s]Map:  72%|███████▏  | 155887/217273 [02:55<01:06, 926.53 examples/s]Map:  72%|███████▏  | 157348/217273 [02:53<01:06, 907.24 examples/s]Map:  72%|███████▏  | 156799/217273 [02:55<01:04, 933.48 examples/s]Map:  72%|███████▏  | 156577/217273 [02:53<01:05, 920.50 examples/s]Map:  72%|███████▏  | 157446/217273 [02:53<01:04, 923.90 examples/s]Map:  72%|███████▏  | 156901/217273 [02:55<01:03, 954.46 examples/s]Map:  72%|███████▏  | 156674/217273 [02:53<01:05, 929.28 examples/s]Map:  72%|███████▏  | 156000/217273 [02:55<01:20, 765.25 examples/s]Map:  73%|███████▎  | 157551/217273 [02:53<01:02, 957.19 examples/s]Map:  72%|███████▏  | 156999/217273 [02:55<01:02, 958.61 examples/s]Map:  72%|███████▏  | 156094/217273 [02:55<01:15, 805.59 examples/s]Map:  72%|███████▏  | 156818/217273 [02:53<01:04, 934.98 examples/s]Map:  73%|███████▎  | 157697/217273 [02:53<01:02, 959.28 examples/s]Map:  72%|███████▏  | 156186/217273 [02:55<01:13, 832.09 examples/s]Map:  72%|███████▏  | 157098/217273 [02:55<01:15, 796.91 examples/s]Map:  73%|███████▎  | 157794/217273 [02:53<01:02, 958.40 examples/s]Map:  72%|███████▏  | 156954/217273 [02:53<01:05, 921.42 examples/s]Map:  72%|███████▏  | 156276/217273 [02:55<01:12, 846.95 examples/s]Map:  72%|███████▏  | 157195/217273 [02:55<01:11, 838.89 examples/s]Map:  72%|███████▏  | 156367/217273 [02:55<01:10, 861.56 examples/s]Map:  73%|███████▎  | 157941/217273 [02:53<01:01, 963.53 examples/s]Map:  72%|███████▏  | 157326/217273 [02:55<01:10, 845.95 examples/s]Map:  72%|███████▏  | 157084/217273 [02:53<01:20, 747.44 examples/s]Map:  72%|███████▏  | 156490/217273 [02:56<01:12, 841.86 examples/s]Map:  72%|███████▏  | 157418/217273 [02:55<01:09, 859.85 examples/s]Map:  73%|███████▎  | 158052/217273 [02:54<01:13, 809.16 examples/s]Map:  72%|███████▏  | 157187/217273 [02:53<01:14, 804.41 examples/s]Map:  72%|███████▏  | 156584/217273 [02:56<01:10, 865.48 examples/s]Map:  72%|███████▏  | 157515/217273 [02:55<01:07, 885.39 examples/s]Map:  73%|███████▎  | 158151/217273 [02:54<01:09, 849.38 examples/s]Map:  72%|███████▏  | 157284/217273 [02:54<01:11, 840.33 examples/s]Map:  72%|███████▏  | 156680/217273 [02:56<01:08, 890.19 examples/s]Map:  73%|███████▎  | 157609/217273 [02:56<01:06, 897.91 examples/s]Map:  73%|███████▎  | 158252/217273 [02:54<01:06, 886.61 examples/s]Map:  72%|███████▏  | 157382/217273 [02:54<01:08, 872.99 examples/s]Map:  72%|███████▏  | 156771/217273 [02:56<01:07, 895.25 examples/s]Map:  73%|███████▎  | 157709/217273 [02:56<01:04, 924.00 examples/s]Map:  73%|███████▎  | 158347/217273 [02:54<01:05, 902.16 examples/s]Map:  72%|███████▏  | 157478/217273 [02:54<01:07, 892.46 examples/s]Map:  72%|███████▏  | 156866/217273 [02:56<01:06, 910.25 examples/s]Map:  73%|███████▎  | 157811/217273 [02:56<01:02, 947.42 examples/s]Map:  73%|███████▎  | 158442/217273 [02:54<01:04, 915.03 examples/s]Map:  73%|███████▎  | 157572/217273 [02:54<01:06, 902.58 examples/s]Map:  73%|███████▎  | 157911/217273 [02:56<01:01, 960.68 examples/s]Map:  73%|███████▎  | 158542/217273 [02:54<01:02, 936.98 examples/s]Map:  73%|███████▎  | 157670/217273 [02:54<01:04, 919.45 examples/s]Map:  72%|███████▏  | 157000/217273 [02:56<01:18, 765.31 examples/s]Map:  73%|███████▎  | 157767/217273 [02:54<01:03, 931.72 examples/s]Map:  73%|███████▎  | 158683/217273 [02:54<01:02, 936.09 examples/s]Map:  72%|███████▏  | 157093/217273 [02:56<01:15, 801.86 examples/s]Map:  73%|███████▎  | 158045/217273 [02:56<01:12, 816.05 examples/s]Map:  73%|███████▎  | 157864/217273 [02:54<01:03, 939.22 examples/s]Map:  73%|███████▎  | 158783/217273 [02:54<01:01, 950.88 examples/s]Map:  72%|███████▏  | 157184/217273 [02:56<01:12, 827.85 examples/s]Map:  73%|███████▎  | 158142/217273 [02:56<01:09, 851.85 examples/s]Map:  73%|███████▎  | 157966/217273 [02:54<01:01, 959.28 examples/s]Map:  72%|███████▏  | 157275/217273 [02:56<01:10, 847.37 examples/s]Map:  73%|███████▎  | 158242/217273 [02:56<01:06, 884.98 examples/s]Map:  73%|███████▎  | 158932/217273 [02:54<01:00, 961.40 examples/s]Map:  72%|███████▏  | 157366/217273 [02:57<01:09, 862.43 examples/s]Map:  73%|███████▎  | 158337/217273 [02:56<01:05, 901.08 examples/s]Map:  73%|███████▎  | 158094/217273 [02:54<01:14, 798.53 examples/s]Map:  72%|███████▏  | 157456/217273 [02:57<01:08, 871.64 examples/s]Map:  73%|███████▎  | 159048/217273 [02:55<01:11, 814.61 examples/s]Map:  73%|███████▎  | 158185/217273 [02:55<01:11, 823.09 examples/s]Map:  73%|███████▎  | 158473/217273 [02:57<01:05, 899.16 examples/s]Map:  73%|███████▎  | 159145/217273 [02:55<01:08, 848.22 examples/s]Map:  73%|███████▎  | 157578/217273 [02:57<01:10, 844.65 examples/s]Map:  73%|███████▎  | 158276/217273 [02:55<01:10, 842.56 examples/s]Map:  73%|███████▎  | 159251/217273 [02:55<01:04, 897.52 examples/s]Map:  73%|███████▎  | 158616/217273 [02:57<01:04, 914.46 examples/s]Map:  73%|███████▎  | 158374/217273 [02:55<01:07, 878.41 examples/s]Map:  73%|███████▎  | 157711/217273 [02:57<01:10, 850.87 examples/s]Map:  73%|███████▎  | 159353/217273 [02:55<01:02, 926.76 examples/s]Map:  73%|███████▎  | 158712/217273 [02:57<01:03, 923.06 examples/s]Map:  73%|███████▎  | 158477/217273 [02:55<01:04, 915.43 examples/s]Map:  73%|███████▎  | 159457/217273 [02:55<01:00, 953.93 examples/s]Map:  73%|███████▎  | 158809/217273 [02:57<01:02, 933.52 examples/s]Map:  73%|███████▎  | 157842/217273 [02:57<01:09, 854.52 examples/s]Map:  73%|███████▎  | 158576/217273 [02:55<01:02, 935.64 examples/s]Map:  73%|███████▎  | 158909/217273 [02:57<01:01, 947.60 examples/s]Map:  73%|███████▎  | 157934/217273 [02:57<01:08, 868.49 examples/s]Map:  73%|███████▎  | 158685/217273 [02:55<01:00, 975.06 examples/s]Map:  73%|███████▎  | 159605/217273 [02:55<01:00, 960.62 examples/s]Map:  73%|███████▎  | 158789/217273 [02:55<00:59, 990.93 examples/s]Map:  74%|███████▎  | 159708/217273 [02:55<00:58, 975.88 examples/s]Map:  73%|███████▎  | 158047/217273 [02:57<01:18, 750.20 examples/s]Map:  73%|███████▎  | 159047/217273 [02:57<01:12, 805.72 examples/s]Map:  74%|███████▎  | 159813/217273 [02:55<00:57, 990.80 examples/s]Map:  73%|███████▎  | 158942/217273 [02:55<00:58, 999.39 examples/s]Map:  73%|███████▎  | 158138/217273 [02:58<01:15, 781.67 examples/s]Map:  73%|███████▎  | 159143/217273 [02:57<01:09, 838.48 examples/s]Map:  74%|███████▎  | 159914/217273 [02:56<00:57, 993.64 examples/s]Map:  73%|███████▎  | 158225/217273 [02:58<01:13, 800.58 examples/s]Map:  73%|███████▎  | 159245/217273 [02:57<01:05, 881.62 examples/s]Map:  73%|███████▎  | 159047/217273 [02:56<01:09, 839.05 examples/s]Map:  73%|███████▎  | 158319/217273 [02:58<01:10, 833.54 examples/s]Map:  73%|███████▎  | 159343/217273 [02:58<01:03, 905.61 examples/s]Map:  73%|███████▎  | 159151/217273 [02:56<01:05, 886.22 examples/s]Map:  74%|███████▎  | 160044/217273 [02:56<01:11, 798.24 examples/s]Map:  73%|███████▎  | 158414/217273 [02:58<01:08, 859.84 examples/s]Map:  73%|███████▎  | 159252/217273 [02:56<01:03, 913.13 examples/s]Map:  73%|███████▎  | 159476/217273 [02:58<01:04, 895.85 examples/s]Map:  74%|███████▎  | 160141/217273 [02:56<01:08, 835.55 examples/s]Map:  73%|███████▎  | 158509/217273 [02:58<01:06, 881.08 examples/s]Map:  73%|███████▎  | 159351/217273 [02:56<01:02, 926.40 examples/s]Map:  74%|███████▎  | 160237/217273 [02:56<01:06, 864.07 examples/s]Map:  73%|███████▎  | 159612/217273 [02:58<01:04, 891.11 examples/s]Map:  73%|███████▎  | 158633/217273 [02:58<01:08, 858.22 examples/s]Map:  74%|███████▍  | 160337/217273 [02:56<01:03, 898.97 examples/s]Map:  73%|███████▎  | 159496/217273 [02:56<01:01, 937.99 examples/s]Map:  74%|███████▎  | 159704/217273 [02:58<01:04, 896.30 examples/s]Map:  73%|███████▎  | 158724/217273 [02:58<01:07, 868.23 examples/s]Map:  74%|███████▍  | 160436/217273 [02:56<01:01, 923.24 examples/s]Map:  73%|███████▎  | 159592/217273 [02:56<01:01, 942.19 examples/s]Map:  74%|███████▎  | 159803/217273 [02:58<01:02, 918.39 examples/s]Map:  73%|███████▎  | 158813/217273 [02:58<01:06, 872.93 examples/s]Map:  74%|███████▍  | 160538/217273 [02:56<00:59, 949.10 examples/s]Map:  73%|███████▎  | 159691/217273 [02:56<01:00, 953.31 examples/s]Map:  73%|███████▎  | 158906/217273 [02:58<01:05, 885.81 examples/s]Map:  74%|███████▎  | 159941/217273 [02:58<01:02, 915.05 examples/s]Map:  74%|███████▍  | 160638/217273 [02:56<00:58, 960.83 examples/s]Map:  74%|███████▎  | 159794/217273 [02:56<00:59, 969.60 examples/s]Map:  73%|███████▎  | 158997/217273 [02:59<01:05, 886.73 examples/s]Map:  74%|███████▍  | 160788/217273 [02:57<00:58, 972.20 examples/s]Map:  74%|███████▎  | 160047/217273 [02:58<01:11, 804.38 examples/s]Map:  74%|███████▎  | 159936/217273 [02:56<00:59, 956.48 examples/s]Map:  74%|███████▍  | 160890/217273 [02:57<00:57, 982.67 examples/s]Map:  73%|███████▎  | 159092/217273 [02:59<01:17, 747.37 examples/s]Map:  74%|███████▎  | 160140/217273 [02:58<01:08, 828.53 examples/s]Map:  74%|███████▍  | 160994/217273 [02:57<00:56, 995.82 examples/s]Map:  73%|███████▎  | 159189/217273 [02:59<01:12, 801.33 examples/s]Map:  74%|███████▍  | 160243/217273 [02:59<01:05, 876.80 examples/s]Map:  74%|███████▎  | 160049/217273 [02:57<01:10, 811.56 examples/s]Map:  73%|███████▎  | 159275/217273 [02:59<01:11, 814.98 examples/s]Map:  74%|███████▍  | 160346/217273 [02:59<01:02, 912.88 examples/s]Map:  74%|███████▎  | 160157/217273 [02:57<01:05, 871.40 examples/s]Map:  74%|███████▍  | 161095/217273 [02:57<01:08, 820.50 examples/s]Map:  73%|███████▎  | 159373/217273 [02:59<01:07, 857.70 examples/s]Map:  74%|███████▍  | 160447/217273 [02:59<01:00, 935.78 examples/s]Map:  74%|███████▍  | 160256/217273 [02:57<01:03, 896.40 examples/s]Map:  74%|███████▍  | 161198/217273 [02:57<01:04, 868.47 examples/s]Map:  73%|███████▎  | 159462/217273 [02:59<01:07, 862.18 examples/s]Map:  74%|███████▍  | 160549/217273 [02:59<00:59, 957.59 examples/s]Map:  74%|███████▍  | 160358/217273 [02:57<01:01, 926.00 examples/s]Map:  74%|███████▍  | 161301/217273 [02:57<01:01, 908.27 examples/s]Map:  73%|███████▎  | 159559/217273 [02:59<01:04, 890.05 examples/s]Map:  74%|███████▍  | 160649/217273 [02:59<00:58, 968.44 examples/s]Map:  74%|███████▍  | 160462/217273 [02:57<00:59, 952.99 examples/s]Map:  74%|███████▍  | 161399/217273 [02:57<01:00, 925.10 examples/s]Map:  74%|███████▍  | 160563/217273 [02:57<00:58, 966.38 examples/s]Map:  73%|███████▎  | 159695/217273 [02:59<01:04, 892.44 examples/s]Map:  74%|███████▍  | 160793/217273 [02:59<00:58, 961.22 examples/s]Map:  74%|███████▍  | 161505/217273 [02:57<00:58, 961.14 examples/s]Map:  74%|███████▍  | 160664/217273 [02:57<00:58, 975.67 examples/s]Map:  74%|███████▎  | 159787/217273 [02:59<01:04, 895.92 examples/s]Map:  74%|███████▍  | 161604/217273 [02:57<00:57, 967.45 examples/s]Map:  74%|███████▍  | 160934/217273 [02:59<00:59, 950.69 examples/s]Map:  74%|███████▍  | 160767/217273 [02:57<00:57, 988.93 examples/s]Map:  74%|███████▎  | 159880/217273 [03:00<01:03, 901.96 examples/s]Map:  74%|███████▍  | 161709/217273 [02:58<00:56, 989.08 examples/s]Map:  74%|███████▍  | 160876/217273 [02:57<00:55, 1015.45 examples/s]Map:  74%|███████▍  | 161812/217273 [02:58<00:55, 999.60 examples/s]Map:  74%|███████▍  | 161046/217273 [02:59<01:09, 812.67 examples/s]Map:  74%|███████▎  | 160000/217273 [03:00<01:15, 761.92 examples/s]Map:  75%|███████▍  | 161913/217273 [02:58<00:55, 998.43 examples/s]Map:  74%|███████▍  | 161146/217273 [03:00<01:05, 853.24 examples/s]Map:  74%|███████▍  | 161000/217273 [02:58<01:06, 848.11 examples/s] Map:  74%|███████▎  | 160092/217273 [03:00<01:11, 798.45 examples/s]Map:  74%|███████▍  | 161245/217273 [03:00<01:03, 883.75 examples/s]Map:  74%|███████▍  | 161105/217273 [02:58<01:02, 895.62 examples/s]Map:  74%|███████▎  | 160186/217273 [03:00<01:08, 832.70 examples/s]Map:  75%|███████▍  | 162051/217273 [02:58<01:04, 850.54 examples/s]Map:  74%|███████▍  | 161344/217273 [03:00<01:01, 909.82 examples/s]Map:  74%|███████▍  | 161204/217273 [02:58<01:01, 916.73 examples/s]Map:  74%|███████▍  | 160277/217273 [03:00<01:06, 851.96 examples/s]Map:  75%|███████▍  | 162151/217273 [02:58<01:02, 883.30 examples/s]Map:  74%|███████▍  | 161445/217273 [03:00<00:59, 932.81 examples/s]Map:  74%|███████▍  | 161305/217273 [02:58<00:59, 938.71 examples/s]Map:  74%|███████▍  | 160373/217273 [03:00<01:04, 880.48 examples/s]Map:  75%|███████▍  | 162254/217273 [02:58<00:59, 918.56 examples/s]Map:  74%|███████▍  | 161542/217273 [03:00<00:59, 940.23 examples/s]Map:  74%|███████▍  | 161407/217273 [02:58<00:58, 956.55 examples/s]Map:  75%|███████▍  | 162356/217273 [02:58<00:58, 943.14 examples/s]Map:  74%|███████▍  | 161642/217273 [03:00<00:58, 951.50 examples/s]Map:  74%|███████▍  | 160510/217273 [03:00<01:03, 889.43 examples/s]Map:  74%|███████▍  | 161513/217273 [02:58<00:56, 981.37 examples/s]Map:  75%|███████▍  | 162462/217273 [02:58<00:56, 971.48 examples/s]Map:  74%|███████▍  | 160604/217273 [03:00<01:02, 900.28 examples/s]Map:  74%|███████▍  | 161780/217273 [03:00<00:59, 933.55 examples/s]Map:  74%|███████▍  | 161655/217273 [02:58<00:57, 963.73 examples/s]Map:  75%|███████▍  | 162599/217273 [02:58<00:57, 947.99 examples/s]Map:  75%|███████▍  | 161877/217273 [03:00<00:58, 939.91 examples/s]Map:  74%|███████▍  | 160734/217273 [03:01<01:03, 885.49 examples/s]Map:  74%|███████▍  | 161793/217273 [02:58<00:58, 946.87 examples/s]Map:  75%|███████▍  | 162697/217273 [02:59<00:57, 953.08 examples/s]Map:  74%|███████▍  | 160833/217273 [03:01<01:02, 909.62 examples/s]Map:  75%|███████▍  | 162798/217273 [02:59<00:56, 965.65 examples/s]Map:  75%|███████▍  | 162000/217273 [03:00<01:09, 799.23 examples/s]Map:  75%|██���████▍  | 161938/217273 [02:59<00:58, 950.26 examples/s]Map:  74%|███████▍  | 160967/217273 [03:01<01:02, 900.49 examples/s]Map:  75%|███████▍  | 162899/217273 [02:59<00:55, 976.72 examples/s]Map:  75%|███████▍  | 162104/217273 [03:01<01:04, 853.32 examples/s]Map:  75%|███████▍  | 162051/217273 [02:59<01:06, 825.94 examples/s]Map:  75%|███████▍  | 162202/217273 [03:01<01:02, 882.40 examples/s]Map:  75%|███████▌  | 163000/217273 [02:59<01:05, 823.27 examples/s]Map:  74%|███████▍  | 161096/217273 [03:01<01:11, 785.28 examples/s]Map:  75%|███████▍  | 162149/217273 [02:59<01:04, 857.37 examples/s]Map:  75%|███████▍  | 162302/217273 [03:01<01:00, 912.88 examples/s]Map:  75%|███████▌  | 163103/217273 [02:59<01:02, 871.94 examples/s]Map:  74%|███████▍  | 161198/217273 [03:01<01:07, 832.51 examples/s]Map:  75%|███████▍  | 162246/217273 [02:59<01:02, 880.83 examples/s]Map:  75%|███████▌  | 163206/217273 [02:59<00:59, 908.61 examples/s]Map:  75%|███████▍  | 162447/217273 [03:01<00:59, 927.91 examples/s]Map:  74%|███████▍  | 161295/217273 [03:01<01:04, 861.44 examples/s]Map:  75%|███████▍  | 162343/217273 [02:59<01:01, 899.79 examples/s]Map:  75%|███████▌  | 163308/217273 [02:59<00:57, 933.48 examples/s]Map:  75%|███████▍  | 162554/217273 [03:01<00:56, 960.60 examples/s]Map:  74%|███████▍  | 161400/217273 [03:01<01:01, 905.24 examples/s]Map:  75%|███████▌  | 163413/217273 [02:59<00:55, 964.37 examples/s]Map:  75%|███████▍  | 162485/217273 [02:59<01:00, 911.04 examples/s]Map:  75%|███████▍  | 162662/217273 [03:01<00:55, 990.18 examples/s]Map:  74%|███████▍  | 161499/217273 [03:01<01:00, 924.27 examples/s]Map:  75%|███████▌  | 163521/217273 [02:59<00:54, 993.79 examples/s]Map:  75%|███████▍  | 162582/217273 [02:59<00:59, 923.23 examples/s]Map:  74%|███████▍  | 161600/217273 [03:02<00:58, 946.71 examples/s]Map:  75%|███████▍  | 162812/217273 [03:01<00:55, 989.71 examples/s]Map:  75%|███████▌  | 163622/217273 [03:00<00:53, 995.99 examples/s]Map:  75%|███████▍  | 162721/217273 [02:59<00:59, 920.65 examples/s]Map:  74%|███████▍  | 161744/217273 [03:02<00:58, 946.90 examples/s]Map:  75%|███████▌  | 162960/217273 [03:01<00:55, 986.92 examples/s]Map:  75%|███████▌  | 163765/217273 [03:00<00:54, 976.60 examples/s]Map:  75%|███████▍  | 162858/217273 [03:00<00:59, 914.18 examples/s]Map:  75%|███████▍  | 161873/217273 [03:02<01:00, 912.16 examples/s]Map:  75%|███████▌  | 163864/217273 [03:00<00:54, 977.66 examples/s]Map:  75%|███████▌  | 162960/217273 [03:00<00:57, 936.66 examples/s]Map:  75%|███████▌  | 163098/217273 [03:02<01:04, 845.46 examples/s]Map:  75%|███████▍  | 161972/217273 [03:02<00:59, 927.45 examples/s]Map:  75%|███████▌  | 163964/217273 [03:00<00:54, 980.16 examples/s]Map:  75%|███████▌  | 163198/217273 [03:02<01:01, 876.15 examples/s]Map:  75%|███████▍  | 162096/217273 [03:02<01:08, 801.48 examples/s]Map:  75%|███████▌  | 163292/217273 [03:02<01:00, 888.30 examples/s]Map:  75%|███████▌  | 163096/217273 [03:00<01:07, 803.50 examples/s]Map:  76%|███████▌  | 164104/217273 [03:00<01:03, 842.29 examples/s]Map:  75%|███████▍  | 162191/217273 [03:02<01:06, 834.01 examples/s]Map:  75%|███████▌  | 163398/217273 [03:02<00:58, 928.56 examples/s]Map:  75%|███████▌  | 163189/217273 [03:00<01:05, 829.06 examples/s]Map:  76%|███████▌  | 164208/217273 [03:00<00:59, 886.58 examples/s]Map:  75%|███████▍  | 162286/217273 [03:02<01:03, 861.05 examples/s]Map:  75%|███████▌  | 163500/217273 [03:02<00:56, 948.90 examples/s]Map:  75%|███████▌  | 163283/217273 [03:00<01:03, 852.29 examples/s]Map:  76%|███████▌  | 164307/217273 [03:00<00:58, 911.34 examples/s]Map:  75%|███████▍  | 162381/217273 [03:02<01:02, 882.07 examples/s]Map:  75%|███████▌  | 163379/217273 [03:00<01:01, 877.35 examples/s]Map:  76%|███████▌  | 164413/217273 [03:00<00:55, 947.56 examples/s]Map:  75%|███████▌  | 163637/217273 [03:02<00:57, 932.21 examples/s]Map:  75%|███████▍  | 162478/217273 [03:03<01:00, 903.80 examples/s]Map:  75%|███████▌  | 163478/217273 [03:00<00:59, 904.22 examples/s]Map:  76%|███████▌  | 164514/217273 [03:01<00:54, 960.81 examples/s]Map:  75%|███████▌  | 163733/217273 [03:02<00:57, 937.03 examples/s]Map:  75%|███████▍  | 162574/217273 [03:03<00:59, 915.83 examples/s]Map:  75%|███████▌  | 163572/217273 [03:00<00:58, 910.63 examples/s]Map:  76%|███████▌  | 164615/217273 [03:01<00:54, 967.88 examples/s]Map:  75%|███████▌  | 163829/217273 [03:02<00:56, 941.23 examples/s]Map:  75%|███████▍  | 162673/217273 [03:03<00:58, 932.60 examples/s]Map:  75%|███████▌  | 163674/217273 [03:01<00:57, 937.58 examples/s]Map:  76%|███████▌  | 164717/217273 [03:01<00:53, 981.19 examples/s]Map:  75%|███████▍  | 162768/217273 [03:03<00:58, 935.26 examples/s]Map:  75%|███████▌  | 163969/217273 [03:03<00:57, 933.66 examples/s]Map:  75%|███████▌  | 163779/217273 [03:01<00:55, 967.29 examples/s]Map:  76%|███████▌  | 164819/217273 [03:01<00:52, 990.12 examples/s]Map:  75%|███████▍  | 162869/217273 [03:03<00:57, 949.97 examples/s]Map:  75%|███████▌  | 163915/217273 [03:01<00:56, 939.06 examples/s]Map:  76%|███████▌  | 164952/217273 [03:01<00:55, 945.43 examples/s]Map:  76%|███████▌  | 164088/217273 [03:03<01:07, 785.57 examples/s]Map:  76%|███████▌  | 164192/217273 [03:03<01:03, 840.88 examples/s]Map:  75%|███████▌  | 163000/217273 [03:03<01:08, 794.04 examples/s]Map:  76%|███████▌  | 164046/217273 [03:01<01:08, 775.25 examples/s]Map:  76%|███████▌  | 164292/217273 [03:03<01:00, 878.42 examples/s]Map:  76%|███████▌  | 165095/217273 [03:01<01:04, 808.99 examples/s]Map:  75%|███████▌  | 163094/217273 [03:03<01:05, 827.94 examples/s]Map:  76%|███████▌  | 164145/217273 [03:01<01:04, 819.43 examples/s]Map:  76%|███████▌  | 164387/217273 [03:03<00:59, 893.81 examples/s]Map:  76%|███████▌  | 165196/217273 [03:01<01:01, 852.14 examples/s]Map:  75%|███████▌  | 163195/217273 [03:03<01:01, 873.11 examples/s]Map:  76%|███████▌  | 164241/217273 [03:01<01:02, 850.43 examples/s]Map:  76%|███████▌  | 164489/217273 [03:03<00:57, 925.28 examples/s]Map:  76%|███████▌  | 165291/217273 [03:01<00:59, 872.74 examples/s]Map:  75%|███████▌  | 163294/217273 [03:03<00:59, 901.33 examples/s]Map:  76%|███████▌  | 164341/217273 [03:01<00:59, 884.95 examples/s]Map:  76%|███████▌  | 164590/217273 [03:03<00:55, 947.52 examples/s]Map:  76%|███████▌  | 165391/217273 [03:02<00:57, 900.15 examples/s]Map:  75%|███████▌  | 163398/217273 [03:04<00:57, 938.58 examples/s]Map:  76%|███████▌  | 164434/217273 [03:01<00:59, 893.53 examples/s]Map:  76%|███████▌  | 164691/217273 [03:03<00:54, 962.59 examples/s]Map:  76%|███████▌  | 165532/217273 [03:02<00:56, 911.37 examples/s]Map:  75%|███████▌  | 163537/217273 [03:04<00:57, 931.59 examples/s]Map:  76%|███████▌  | 164563/217273 [03:02<01:00, 875.11 examples/s]Map:  76%|███████▌  | 164835/217273 [03:04<00:54, 954.67 examples/s]Map:  75%|███████▌  | 163635/217273 [03:04<00:56, 942.16 examples/s]Map:  76%|███████▌  | 165669/217273 [03:02<00:56, 911.38 examples/s]Map:  76%|███████▌  | 164654/217273 [03:02<00:59, 882.78 examples/s]Map:  76%|███████▌  | 164932/217273 [03:04<00:54, 958.21 examples/s]Map:  76%|███████▋  | 165764/217273 [03:02<00:56, 916.54 examples/s]Map:  75%|███████▌  | 163771/217273 [03:04<00:57, 928.43 examples/s]Map:  76%|███████▌  | 164793/217273 [03:02<00:58, 893.05 examples/s]Map:  76%|███████▋  | 165864/217273 [03:02<00:54, 935.80 examples/s]Map:  75%|███████▌  | 163874/217273 [03:04<00:56, 949.15 examples/s]Map:  76%|███████▌  | 165044/217273 [03:04<01:04, 814.23 examples/s]Map:  76%|███████▌  | 164886/217273 [03:02<00:58, 900.96 examples/s]Map:  75%|███████▌  | 163971/217273 [03:04<00:56, 950.42 examples/s]Map:  76%|███████▌  | 165140/217273 [03:04<01:01, 846.82 examples/s]Map:  76%|███████▋  | 166000/217273 [03:02<01:05, 777.61 examples/s]Map:  76%|███████▌  | 165234/217273 [03:04<00:59, 869.25 examples/s]Map:  76%|███████▌  | 165000/217273 [03:02<01:09, 749.27 examples/s]Map:  76%|███████▌  | 164096/217273 [03:04<01:07, 792.62 examples/s]Map:  76%|███████▋  | 166099/217273 [03:02<01:02, 823.44 examples/s]Map:  76%|███████▌  | 165336/217273 [03:04<00:57, 904.28 examples/s]Map:  76%|███████▌  | 165106/217273 [03:02<01:03, 816.62 examples/s]Map:  76%|███████▌  | 164188/217273 [03:04<01:04, 818.98 examples/s]Map:  76%|███████▋  | 166201/217273 [03:02<00:58, 866.94 examples/s]Map:  76%|███████▌  | 165443/217273 [03:04<00:54, 946.19 examples/s]Map:  76%|███████▌  | 165207/217273 [03:02<01:00, 863.34 examples/s]Map:  76%|███████▌  | 164280/217273 [03:05<01:02, 842.52 examples/s]Map:  77%|███████▋  | 166298/217273 [03:03<00:57, 892.76 examples/s]Map:  76%|███████▌  | 165545/217273 [03:04<00:53, 963.92 examples/s]Map:  76%|███████▌  | 165307/217273 [03:02<00:57, 896.02 examples/s]Map:  76%|███████▌  | 164371/217273 [03:05<01:01, 857.19 examples/s]Map:  77%|███████▋  | 166399/217273 [03:03<00:55, 920.45 examples/s]Map:  76%|███████▌  | 165646/217273 [03:04<00:52, 975.98 examples/s]Map:  76%|███████▌  | 165408/217273 [03:03<00:56, 923.44 examples/s]Map:  76%|███████▌  | 164462/217273 [03:05<01:00, 868.11 examples/s]Map:  77%|███████▋  | 166502/217273 [03:03<00:53, 948.16 examples/s]Map:  76%|███████▋  | 165746/217273 [03:05<00:52, 979.75 examples/s]Map:  76%|███████▌  | 165513/217273 [03:03<00:54, 952.43 examples/s]Map:  76%|███████▌  | 164554/217273 [03:05<00:59, 882.05 examples/s]Map:  77%|███████▋  | 166604/217273 [03:03<00:52, 965.22 examples/s]Map:  76%|███████▋  | 165851/217273 [03:05<00:51, 996.73 examples/s]Map:  76%|███████▌  | 164647/217273 [03:05<00:58, 894.75 examples/s]Map:  77%|███████▋  | 166706/217273 [03:03<00:51, 979.27 examples/s]Map:  76%|███████▋  | 165953/217273 [03:05<00:51, 1001.26 examples/s]Map:  76%|███████▌  | 165658/217273 [03:03<00:54, 951.73 examples/s]Map:  76%|███████▌  | 164739/217273 [03:05<00:58, 899.99 examples/s]Map:  77%|███████▋  | 166813/217273 [03:03<00:50, 1002.10 examples/s]Map:  76%|███████▋  | 165806/217273 [03:03<00:53, 962.04 examples/s]Map:  76%|███████▌  | 164839/217273 [03:05<00:56, 926.60 examples/s]Map:  77%|███████▋  | 166916/217273 [03:03<00:49, 1008.11 examples/s]Map:  76%|███████▋  | 166100/217273 [03:05<01:00, 841.53 examples/s] Map:  76%|███████▌  | 164940/217273 [03:05<00:55, 944.36 examples/s]Map:  76%|███████▋  | 165955/217273 [03:03<00:53, 967.93 examples/s]Map:  76%|███████▋  | 166204/217273 [03:05<00:57, 885.90 examples/s]Map:  77%|███████▋  | 167048/217273 [03:03<00:59, 850.75 examples/s] Map:  77%|███████▋  | 166305/217273 [03:05<00:55, 915.60 examples/s]Map:  76%|███████▌  | 165047/217273 [03:05<01:07, 776.98 examples/s]Map:  77%|███████▋  | 167149/217273 [03:03<00:56, 885.69 examples/s]Map:  76%|███████▋  | 166088/217273 [03:03<01:02, 820.56 examples/s]Map:  76%|███████▌  | 165132/217273 [03:06<01:05, 793.33 examples/s]Map:  77%|███████▋  | 166435/217273 [03:05<00:56, 895.27 examples/s]Map:  77%|███████▋  | 167278/217273 [03:04<00:57, 872.99 examples/s]Map:  77%|███████▋  | 166216/217273 [03:03<01:01, 827.85 examples/s]Map:  77%|███████▋  | 166566/217273 [03:05<00:57, 886.90 examples/s]Map:  76%|███████▌  | 165257/217273 [03:06<01:04, 804.44 examples/s]Map:  77%|███████▋  | 167374/217273 [03:04<00:56, 890.12 examples/s]Map:  77%|███████▋  | 166320/217273 [03:04<00:58, 869.28 examples/s]Map:  77%|███████▋  | 166665/217273 [03:06<00:55, 910.22 examples/s]Map:  76%|███████▌  | 165353/217273 [03:06<01:01, 840.30 examples/s]Map:  77%|███████▋  | 167476/217273 [03:04<00:54, 919.56 examples/s]Map:  77%|███████▋  | 166420/217273 [03:04<00:56, 896.75 examples/s]Map:  77%|███████▋  | 166763/217273 [03:06<00:54, 926.28 examples/s]Map:  76%|███████▌  | 165449/217273 [03:06<00:59, 869.89 examples/s]Map:  77%|███████▋  | 167584/217273 [03:04<00:51, 960.67 examples/s]Map:  77%|███████▋  | 166524/217273 [03:04<00:54, 922.99 examples/s]Map:  77%|███████▋  | 166865/217273 [03:06<00:53, 947.77 examples/s]Map:  77%|███████▋  | 167686/217273 [03:04<00:51, 971.57 examples/s]Map:  76%|███████▌  | 165584/217273 [03:06<00:58, 876.78 examples/s]Map:  77%|███████▋  | 166624/217273 [03:04<00:53, 941.02 examples/s]Map:  77%|███████▋  | 166970/217273 [03:06<00:51, 971.60 examples/s]Map:  76%|███████▋  | 165676/217273 [03:06<00:58, 884.49 examples/s]Map:  77%|███████▋  | 166727/217273 [03:04<00:52, 962.66 examples/s]Map:  77%|███████▋  | 167832/217273 [03:04<00:51, 968.71 examples/s]Map:  77%|███████▋  | 167935/217273 [03:04<00:50, 981.59 examples/s]Map:  76%|███████▋  | 165768/217273 [03:06<01:05, 784.99 examples/s]Map:  77%|███████▋  | 166874/217273 [03:04<00:52, 966.02 examples/s]Map:  77%|███████▋  | 167099/217273 [03:06<01:02, 805.49 examples/s]Map:  76%|███████▋  | 165863/217273 [03:06<01:02, 824.18 examples/s]Map:  77%|███████▋  | 166978/217273 [03:04<00:51, 983.84 examples/s]Map:  77%|███████▋  | 167197/217273 [03:06<00:59, 844.82 examples/s]Map:  77%|███████▋  | 168047/217273 [03:04<00:59, 826.82 examples/s]Map:  76%|███████▋  | 165955/217273 [03:07<01:00, 846.91 examples/s]Map:  77%|███████▋  | 167293/217273 [03:06<00:57, 872.77 examples/s]Map:  77%|███████▋  | 168144/217273 [03:05<00:57, 859.72 examples/s]Map:  77%|███████▋  | 167101/217273 [03:04<01:00, 830.68 examples/s]Map:  77%|███████▋  | 167393/217273 [03:06<00:55, 904.17 examples/s]Map:  77%|███████▋  | 168244/217273 [03:05<00:54, 892.79 examples/s]Map:  76%|███████▋  | 166044/217273 [03:07<01:12, 705.83 examples/s]Map:  77%|███████▋  | 167198/217273 [03:05<00:58, 860.93 examples/s]Map:  77%|███████▋  | 167498/217273 [03:06<00:52, 941.81 examples/s]Map:  77%|███████▋  | 168337/217273 [03:05<00:54, 901.98 examples/s]Map:  76%|███████▋  | 166132/217273 [03:07<01:08, 746.53 examples/s]Map:  77%|███████▋  | 167297/217273 [03:05<00:56, 890.81 examples/s]Map:  77%|███████▋  | 167597/217273 [03:07<00:52, 952.65 examples/s]Map:  78%|███████▊  | 168430/217273 [03:05<00:53, 904.86 examples/s]Map:  77%|███████▋  | 166218/217273 [03:07<01:06, 772.94 examples/s]Map:  77%|███████▋  | 167431/217273 [03:05<00:56, 885.04 examples/s]Map:  77%|███████▋  | 167735/217273 [03:07<00:53, 925.14 examples/s]Map:  77%|███████▋  | 166304/217273 [03:07<01:04, 792.49 examples/s]Map:  78%|███████▊  | 168572/217273 [03:05<00:53, 916.58 examples/s]Map:  77%|███████▋  | 167531/217273 [03:05<00:54, 912.63 examples/s]Map:  77%|███████▋  | 167832/217273 [03:07<00:52, 933.63 examples/s]Map:  77%|███████▋  | 166396/217273 [03:07<01:01, 826.19 examples/s]Map:  78%|███████▊  | 168668/217273 [03:05<00:52, 925.21 examples/s]Map:  77%|███████▋  | 167631/217273 [03:05<00:53, 929.93 examples/s]Map:  77%|███████▋  | 167938/217273 [03:07<00:51, 964.24 examples/s]Map:  77%|███████▋  | 166491/217273 [03:07<00:58, 860.87 examples/s]Map:  78%|███████▊  | 168768/217273 [03:05<00:51, 944.64 examples/s]Map:  77%|███████▋  | 167735/217273 [03:05<00:51, 957.38 examples/s]Map:  77%|███████▋  | 166582/217273 [03:07<00:58, 871.61 examples/s]Map:  77%|███████▋  | 168049/217273 [03:07<01:00, 820.38 examples/s]Map:  77%|███████▋  | 167833/217273 [03:05<00:51, 962.01 examples/s]Map:  78%|███████▊  | 168911/217273 [03:05<00:51, 945.22 examples/s]Map:  77%|███████▋  | 166675/217273 [03:07<00:57, 883.32 examples/s]Map:  77%|███████▋  | 168154/217273 [03:07<00:56, 874.41 examples/s]Map:  77%|███████▋  | 166766/217273 [03:08<00:56, 889.76 examples/s]Map:  77%|███████▋  | 167973/217273 [03:05<00:51, 948.51 examples/s]Map:  77%|███████▋  | 168257/217273 [03:07<00:53, 913.03 examples/s]Map:  78%|███████▊  | 169047/217273 [03:06<00:59, 804.44 examples/s]Map:  77%|███████▋  | 166860/217273 [03:08<00:55, 900.99 examples/s]Map:  78%|███████▊  | 169143/217273 [03:06<00:57, 837.42 examples/s]Map:  78%|███████▊  | 168399/217273 [03:07<00:53, 920.65 examples/s]Map:  77%|███████▋  | 168102/217273 [03:06<01:00, 812.85 examples/s]Map:  77%|███████▋  | 166995/217273 [03:08<00:56, 896.64 examples/s]Map:  78%|███████▊  | 169238/217273 [03:06<00:55, 862.72 examples/s]Map:  78%|███████▊  | 168500/217273 [03:08<00:51, 941.18 examples/s]Map:  77%|███████▋  | 168199/217273 [03:06<00:57, 847.34 examples/s]Map:  78%|███████▊  | 169340/217273 [03:06<00:53, 896.19 examples/s]Map:  78%|███████▊  | 168606/217273 [03:08<00:50, 968.56 examples/s]Map:  77%|███████▋  | 168300/217273 [03:06<00:55, 884.22 examples/s]Map:  77%|███████▋  | 167091/217273 [03:08<01:06, 749.31 examples/s]Map:  78%|███████▊  | 169439/217273 [03:06<00:52, 918.60 examples/s]Map:  78%|███████▊  | 168706/217273 [03:08<00:49, 972.82 examples/s]Map:  78%|███████▊  | 168404/217273 [03:06<00:53, 920.57 examples/s]Map:  77%|███████▋  | 167187/217273 [03:08<01:02, 798.17 examples/s]Map:  77%|███████▋  | 167275/217273 [03:08<01:01, 818.16 examples/s]Map:  78%|███████▊  | 169573/217273 [03:06<00:52, 903.23 examples/s]Map:  78%|███████▊  | 168834/217273 [03:08<00:52, 923.24 examples/s]Map:  78%|███████▊  | 168536/217273 [03:06<00:54, 901.41 examples/s]Map:  77%|███████▋  | 167361/217273 [03:08<01:00, 829.03 examples/s]Map:  78%|███████▊  | 169670/217273 [03:06<00:51, 917.61 examples/s]Map:  78%|███████▊  | 168932/217273 [03:08<00:51, 934.66 examples/s]Map:  78%|███████▊  | 168632/217273 [03:06<00:53, 914.64 examples/s]Map:  77%|███████▋  | 167458/217273 [03:08<00:57, 864.97 examples/s]Map:  78%|███████▊  | 169770/217273 [03:06<00:50, 936.66 examples/s]Map:  78%|███████▊  | 168726/217273 [03:06<00:52, 919.85 examples/s]Map:  77%|███████▋  | 167553/217273 [03:08<00:56, 878.76 examples/s]Map:  78%|███████▊  | 169048/217273 [03:08<00:59, 810.34 examples/s]Map:  78%|███████▊  | 169869/217273 [03:06<00:50, 947.78 examples/s]Map:  78%|███████▊  | 168824/217273 [03:06<00:51, 934.04 examples/s]Map:  77%|███████▋  | 167646/217273 [03:09<00:55, 889.94 examples/s]Map:  78%|███████▊  | 169154/217273 [03:08<00:55, 867.41 examples/s]Map:  78%|███████▊  | 169971/217273 [03:07<00:48, 966.63 examples/s]Map:  78%|███████▊  | 168923/217273 [03:06<00:51, 945.88 examples/s]Map:  77%|███████▋  | 167741/217273 [03:09<00:54, 902.84 examples/s]Map:  78%|███████▊  | 169259/217273 [03:08<00:52, 910.15 examples/s]Map:  77%|███████▋  | 167836/217273 [03:09<00:54, 915.25 examples/s]Map:  78%|███████▊  | 169363/217273 [03:09<00:50, 942.44 examples/s]Map:  78%|███████▊  | 170096/217273 [03:07<00:59, 798.82 examples/s]Map:  78%|███████▊  | 169048/217273 [03:07<01:01, 777.99 examples/s]Map:  78%|███████▊  | 169471/217273 [03:09<00:48, 979.35 examples/s]Map:  78%|███████▊  | 170190/217273 [03:07<00:56, 830.62 examples/s]Map:  77%|███████▋  | 167972/217273 [03:09<00:54, 906.05 examples/s]Map:  78%|███████▊  | 169146/217273 [03:07<00:58, 824.59 examples/s]Map:  78%|███████▊  | 170283/217273 [03:07<00:55, 852.70 examples/s]Map:  78%|███████▊  | 169243/217273 [03:07<00:55, 858.92 examples/s]Map:  78%|███████▊  | 169621/217273 [03:09<00:48, 983.31 examples/s]Map:  78%|███████▊  | 170381/217273 [03:07<00:53, 882.04 examples/s]Map:  77%|███████▋  | 168089/217273 [03:09<01:04, 765.80 examples/s]Map:  78%|███████▊  | 169343/217273 [03:07<00:53, 895.16 examples/s]Map:  78%|███████▊  | 169723/217273 [03:09<00:48, 987.38 examples/s]Map:  78%|███████▊  | 170484/217273 [03:07<00:50, 920.67 examples/s]Map:  77%|███████▋  | 168184/217273 [03:09<01:00, 806.29 examples/s]Map:  78%|███████▊  | 169443/217273 [03:07<00:52, 919.36 examples/s]Map:  78%|███████▊  | 169829/217273 [03:09<00:47, 1000.79 examples/s]Map:  79%|███████▊  | 170584/217273 [03:07<00:49, 939.85 examples/s]Map:  77%|███████▋  | 168279/217273 [03:09<00:58, 839.28 examples/s]Map:  78%|███████▊  | 169543/217273 [03:07<00:50, 939.54 examples/s]Map:  78%|███████▊  | 169973/217273 [03:09<00:48, 982.51 examples/s] Map:  79%|███████▊  | 170715/217273 [03:07<00:50, 913.77 examples/s]Map:  78%|███████▊  | 168410/217273 [03:09<00:57, 850.29 examples/s]Map:  78%|███████▊  | 169674/217273 [03:07<00:52, 912.43 examples/s]Map:  79%|███████▊  | 170812/217273 [03:08<00:50, 923.80 examples/s]Map:  78%|███████▊  | 168508/217273 [03:10<00:55, 880.49 examples/s]Map:  78%|███████▊  | 169772/217273 [03:07<00:51, 925.38 examples/s]Map:  78%|███████▊  | 170096/217273 [03:09<00:57, 824.62 examples/s]Map:  79%|███████▊  | 170906/217273 [03:08<00:50, 924.99 examples/s]Map:  78%|███████▊  | 168601/217273 [03:10<00:54, 890.54 examples/s]Map:  78%|███████▊  | 169875/217273 [03:08<00:49, 951.51 examples/s]Map:  78%|███████▊  | 170199/217273 [03:09<00:54, 868.35 examples/s]Map:  78%|███████▊  | 168693/217273 [03:10<00:54, 897.43 examples/s]Map:  78%|███████▊  | 169979/217273 [03:08<00:48, 973.61 examples/s]Map:  78%|███████▊  | 170303/217273 [03:10<00:51, 905.96 examples/s]Map:  79%|███████▊  | 171000/217273 [03:08<00:59, 774.65 examples/s]Map:  78%|███████▊  | 168789/217273 [03:10<00:53, 913.05 examples/s]Map:  78%|███████▊  | 170403/217273 [03:10<00:50, 926.78 examples/s]Map:  79%|███████▊  | 171089/217273 [03:08<00:57, 800.68 examples/s]Map:  78%|███████▊  | 170097/217273 [03:08<00:57, 815.43 examples/s]Map:  78%|███████▊  | 168883/217273 [03:10<00:52, 918.95 examples/s]Map:  78%|███████▊  | 170501/217273 [03:10<00:49, 938.62 examples/s]Map:  79%|███████▉  | 171194/217273 [03:08<00:53, 864.27 examples/s]Map:  78%|███████▊  | 170197/217273 [03:08<00:54, 858.48 examples/s]Map:  78%|███████▊  | 168980/217273 [03:10<00:51, 931.17 examples/s]Map:  79%|███████▊  | 170602/217273 [03:10<00:48, 956.43 examples/s]Map:  79%|███████▉  | 171335/217273 [03:08<00:51, 886.55 examples/s]Map:  78%|███████▊  | 170294/217273 [03:08<00:53, 885.06 examples/s]Map:  79%|███████▊  | 170750/217273 [03:10<00:48, 964.62 examples/s]Map:  78%|███████▊  | 169092/217273 [03:10<01:02, 772.41 examples/s]Map:  79%|███████▉  | 171430/217273 [03:08<00:50, 901.14 examples/s]Map:  78%|███████▊  | 170432/217273 [03:08<00:52, 897.00 examples/s]Map:  79%|███████▊  | 170850/217273 [03:10<00:47, 970.77 examples/s]Map:  78%|███████▊  | 169187/217273 [03:10<00:59, 814.57 examples/s]Map:  79%|███████▉  | 171530/217273 [03:08<00:49, 922.87 examples/s]Map:  78%|███████▊  | 170527/217273 [03:08<00:51, 907.15 examples/s]Map:  79%|███████▊  | 170954/217273 [03:10<00:46, 986.10 examples/s]Map:  78%|███████▊  | 169284/217273 [03:10<00:56, 854.11 examples/s]Map:  79%|███████▉  | 171629/217273 [03:08<00:48, 940.75 examples/s]Map:  79%|███████▊  | 170624/217273 [03:08<00:50, 922.40 examples/s]Map:  78%|███████▊  | 169374/217273 [03:11<00:55, 861.34 examples/s]Map:  79%|███████▉  | 171767/217273 [03:09<00:49, 927.08 examples/s]Map:  78%|███████▊  | 169464/217273 [03:11<00:55, 868.59 examples/s]Map:  79%|███████▊  | 171101/217273 [03:10<00:55, 833.80 examples/s]Map:  79%|███████▊  | 170761/217273 [03:09<00:50, 914.94 examples/s]Map:  79%|███████▉  | 171865/217273 [03:09<00:48, 936.90 examples/s]Map:  79%|███████▉  | 171209/217273 [03:11<00:51, 888.93 examples/s]Map:  79%|███████▊  | 170861/217273 [03:09<00:49, 935.82 examples/s]Map:  78%|███████▊  | 169600/217273 [03:11<00:54, 879.19 examples/s]Map:  79%|███████▉  | 171962/217273 [03:09<00:48, 942.58 examples/s]Map:  79%|███████▉  | 171313/217273 [03:11<00:49, 923.81 examples/s]Map:  79%|███████▊  | 170965/217273 [03:09<00:48, 960.88 examples/s]Map:  78%|███████▊  | 169699/217273 [03:11<00:52, 902.78 examples/s]Map:  79%|███████▉  | 171457/217273 [03:11<00:49, 932.40 examples/s]Map:  78%|███████▊  | 169795/217273 [03:11<00:51, 914.08 examples/s]Map:  79%|███████▉  | 172097/217273 [03:09<00:56, 797.39 examples/s]Map:  79%|███████▊  | 171101/217273 [03:09<00:56, 821.47 examples/s]Map:  79%|███████▉  | 171558/217273 [03:11<00:48, 948.68 examples/s]Map:  78%|███████▊  | 169898/217273 [03:11<00:50, 945.92 examples/s]Map:  79%|███████▉  | 172203/217273 [03:09<00:52, 855.22 examples/s]Map:  79%|███████▉  | 171198/217273 [03:09<00:53, 854.62 examples/s]Map:  79%|███████▉  | 171659/217273 [03:11<00:47, 960.61 examples/s]Map:  78%|███████▊  | 169999/217273 [03:11<00:49, 959.88 examples/s]Map:  79%|███████▉  | 171299/217273 [03:09<00:51, 892.07 examples/s]Map:  79%|███████▉  | 172338/217273 [03:09<00:51, 868.43 examples/s]Map:  79%|███████▉  | 171806/217273 [03:11<00:47, 964.41 examples/s]Map:  79%|███████▉  | 171400/217273 [03:09<00:49, 922.07 examples/s]Map:  79%|███████▉  | 172439/217273 [03:09<00:49, 897.80 examples/s]Map:  78%|███████▊  | 170143/217273 [03:11<00:58, 808.80 examples/s]Map:  79%|███████▉  | 171499/217273 [03:09<00:48, 935.34 examples/s]Map:  79%|███████▉  | 172539/217273 [03:09<00:48, 920.96 examples/s]Map:  79%|███████▉  | 171952/217273 [03:11<00:46, 964.93 examples/s]Map:  78%|███████▊  | 170240/217273 [03:12<00:55, 844.96 examples/s]Map:  79%|███████▉  | 171604/217273 [03:09<00:47, 965.26 examples/s]Map:  79%|███████▉  | 172642/217273 [03:10<00:47, 947.25 examples/s]Map:  78%|███████▊  | 170340/217273 [03:12<00:53, 880.76 examples/s]Map:  79%|███████▉  | 171703/217273 [03:10<00:46, 971.74 examples/s]Map:  80%|███████▉  | 172744/217273 [03:10<00:46, 964.41 examples/s]Map:  79%|███████▉  | 172093/217273 [03:12<00:54, 831.62 examples/s]Map:  78%|███████▊  | 170475/217273 [03:12<00:52, 883.70 examples/s]Map:  79%|███████▉  | 171844/217273 [03:10<00:47, 953.81 examples/s]Map:  79%|███████▉  | 172188/217273 [03:12<00:52, 854.46 examples/s]Map:  80%|███████▉  | 172881/217273 [03:10<00:47, 940.18 examples/s]Map:  79%|███████▊  | 170579/217273 [03:12<00:50, 920.57 examples/s]Map:  79%|███████▉  | 171941/217273 [03:10<00:47, 953.77 examples/s]Map:  79%|███████▉  | 172286/217273 [03:12<00:50, 882.59 examples/s]Map:  80%|███████▉  | 172980/217273 [03:10<00:46, 951.65 examples/s]Map:  79%|███████▊  | 170682/217273 [03:12<00:49, 946.92 examples/s]Map:  79%|███████▉  | 172389/217273 [03:12<00:48, 916.96 examples/s]Map:  79%|███████▊  | 170780/217273 [03:12<00:48, 952.00 examples/s]Map:  79%|███████▉  | 172048/217273 [03:10<00:55, 811.10 examples/s]Map:  80%|███████▉  | 173097/217273 [03:10<00:54, 804.26 examples/s]Map:  79%|███████▉  | 172494/217273 [03:12<00:47, 948.02 examples/s]Map:  79%|███████▊  | 170887/217273 [03:12<00:47, 978.80 examples/s]Map:  79%|███████▉  | 172152/217273 [03:10<00:52, 857.28 examples/s]Map:  80%|███████▉  | 173199/217273 [03:10<00:51, 853.02 examples/s]Map:  79%|███████▉  | 172598/217273 [03:12<00:46, 970.77 examples/s]Map:  79%|███████▉  | 172253/217273 [03:10<00:50, 895.75 examples/s]Map:  80%|███████▉  | 173297/217273 [03:10<00:49, 881.95 examples/s]Map:  79%|███████▉  | 172703/217273 [03:12<00:45, 989.00 examples/s]Map:  79%|███████▊  | 171000/217273 [03:12<00:55, 826.65 examples/s]Map:  79%|███████▉  | 172353/217273 [03:10<00:48, 920.54 examples/s]Map:  80%|███████▉  | 173391/217273 [03:10<00:49, 895.47 examples/s]Map:  80%|███████▉  | 172807/217273 [03:12<00:44, 998.40 examples/s]Map:  79%|███████▊  | 171094/217273 [03:13<00:54, 850.47 examples/s]Map:  79%|███████▉  | 172458/217273 [03:10<00:46, 953.95 examples/s]Map:  80%|███████▉  | 173489/217273 [03:11<00:47, 918.19 examples/s]Map:  80%|███████▉  | 172910/217273 [03:12<00:44, 1005.18 examples/s]Map:  79%|███████▉  | 171190/217273 [03:13<00:52, 873.82 examples/s]Map:  79%|███████▉  | 172557/217273 [03:10<00:46, 962.39 examples/s]Map:  80%|███████▉  | 173587/217273 [03:11<00:46, 932.46 examples/s]Map:  79%|███████▉  | 171290/217273 [03:13<00:51, 901.04 examples/s]Map:  79%|███████▉  | 172655/217273 [03:11<00:46, 961.54 examples/s]Map:  80%|███████▉  | 173690/217273 [03:11<00:45, 958.59 examples/s]Map:  80%|███████▉  | 173045/217273 [03:13<00:52, 845.37 examples/s] Map:  79%|███████▉  | 171387/217273 [03:13<00:49, 918.63 examples/s]Map:  80%|███████▉  | 172757/217273 [03:11<00:45, 976.08 examples/s]Map:  80%|███████▉  | 173791/217273 [03:11<00:44, 969.24 examples/s]Map:  80%|███████▉  | 173146/217273 [03:13<00:49, 882.85 examples/s]Map:  79%|███████▉  | 171489/217273 [03:13<00:48, 943.89 examples/s]Map:  80%|███████▉  | 173242/217273 [03:13<00:48, 900.09 examples/s]Map:  80%|███████▉  | 172904/217273 [03:11<00:45, 970.05 examples/s]Map:  79%|███████▉  | 171588/217273 [03:13<00:48, 951.68 examples/s]Map:  80%|████████  | 173931/217273 [03:11<00:45, 951.00 examples/s]Map:  80%|███████▉  | 173340/217273 [03:13<00:47, 915.31 examples/s]Map:  79%|███████▉  | 171690/217273 [03:13<00:47, 968.43 examples/s]Map:  80%|███████▉  | 173442/217273 [03:13<00:46, 942.27 examples/s]Map:  80%|████████  | 174046/217273 [03:11<00:53, 815.54 examples/s]Map:  79%|███████▉  | 171793/217273 [03:13<00:46, 984.12 examples/s]Map:  80%|███████▉  | 173052/217273 [03:11<00:52, 835.63 examples/s]Map:  80%|███████▉  | 173550/217273 [03:13<00:44, 979.44 examples/s]Map:  80%|████████  | 174148/217273 [03:11<00:50, 861.39 examples/s]Map:  80%|███████▉  | 173155/217273 [03:11<00:50, 876.44 examples/s]Map:  79%|███████▉  | 171939/217273 [03:13<00:46, 972.18 examples/s]Map:  80%|███████▉  | 173653/217273 [03:13<00:44, 989.88 examples/s]Map:  80%|████████  | 174257/217273 [03:11<00:46, 916.88 examples/s]Map:  80%|███████▉  | 173259/217273 [03:11<00:48, 913.44 examples/s]Map:  80%|███████▉  | 173759/217273 [03:13<00:43, 1005.96 examples/s]Map:  80%|████████  | 174356/217273 [03:11<00:45, 933.89 examples/s]Map:  80%|███████▉  | 173365/217273 [03:11<00:46, 948.06 examples/s]Map:  79%|███████▉  | 172048/217273 [03:14<00:54, 823.56 examples/s]Map:  80%|████████  | 173867/217273 [03:13<00:42, 1024.42 examples/s]Map:  80%|████████  | 174456/217273 [03:12<00:45, 949.06 examples/s]Map:  80%|███████▉  | 173467/217273 [03:11<00:45, 966.55 examples/s]Map:  79%|███████▉  | 172152/217273 [03:14<00:51, 873.01 examples/s]Map:  80%|████████  | 174564/217273 [03:12<00:43, 984.64 examples/s]Map:  80%|███████▉  | 173567/217273 [03:12<00:44, 974.14 examples/s]Map:  79%|███████▉  | 172256/217273 [03:14<00:49, 914.01 examples/s]Map:  80%|████████  | 174000/217273 [03:14<00:50, 852.95 examples/s] Map:  80%|████████  | 174667/217273 [03:12<00:42, 995.63 examples/s]Map:  80%|███████▉  | 173671/217273 [03:12<00:44, 989.23 examples/s]Map:  79%|███████▉  | 172357/217273 [03:14<00:47, 939.02 examples/s]Map:  80%|████████  | 174096/217273 [03:14<00:49, 878.08 examples/s]Map:  80%|████████  | 174772/217273 [03:12<00:42, 1009.59 examples/s]Map:  80%|███████▉  | 173774/217273 [03:12<00:43, 996.88 examples/s]Map:  79%|███████▉  | 172460/217273 [03:14<00:46, 959.98 examples/s]Map:  80%|████████  | 174876/217273 [03:12<00:41, 1015.50 examples/s]Map:  80%|████████  | 174235/217273 [03:14<00:48, 890.60 examples/s]Map:  80%|████████  | 173921/217273 [03:12<00:43, 985.32 examples/s]Map:  79%|███████▉  | 172605/217273 [03:14<00:46, 958.21 examples/s]Map:  80%|████████  | 174329/217273 [03:14<00:47, 897.69 examples/s]Map:  81%|████████  | 175000/217273 [03:12<00:51, 824.33 examples/s] Map:  80%|████████  | 174430/217273 [03:14<00:46, 924.77 examples/s]Map:  80%|███████▉  | 172754/217273 [03:14<00:46, 966.79 examples/s]Map:  80%|████████  | 174053/217273 [03:12<00:52, 828.42 examples/s]Map:  81%|████████  | 175099/217273 [03:12<00:48, 862.04 examples/s]Map:  80%|████████  | 174534/217273 [03:14<00:44, 951.22 examples/s]Map:  80%|███████▉  | 172853/217273 [03:14<00:45, 971.08 examples/s]Map:  80%|████████  | 174151/217273 [03:12<00:50, 860.32 examples/s]Map:  81%|████████  | 175204/217273 [03:12<00:46, 906.13 examples/s]Map:  80%|████████  | 174637/217273 [03:14<00:43, 969.37 examples/s]Map:  80%|███████▉  | 172957/217273 [03:14<00:45, 983.30 examples/s]Map:  80%|████████  | 174252/217273 [03:12<00:48, 894.74 examples/s]Map:  81%|████████  | 175302/217273 [03:12<00:45, 924.79 examples/s]Map:  80%|████████  | 174359/217273 [03:12<00:45, 934.58 examples/s]Map:  80%|████████  | 174787/217273 [03:14<00:43, 978.49 examples/s]Map:  81%|████████  | 175406/217273 [03:13<00:43, 953.95 examples/s]Map:  80%|███████▉  | 173096/217273 [03:15<00:52, 837.06 examples/s]Map:  81%|████████  | 175506/217273 [03:13<00:43, 963.64 examples/s]Map:  80%|████████  | 174502/217273 [03:13<00:45, 937.30 examples/s]Map:  81%|████████  | 174932/217273 [03:14<00:43, 970.47 examples/s]Map:  80%|███████▉  | 173192/217273 [03:15<00:51, 863.23 examples/s]Map:  81%|████████  | 175606/217273 [03:13<00:42, 973.78 examples/s]Map:  80%|████████  | 174602/217273 [03:13<00:44, 950.83 examples/s]Map:  80%|███████▉  | 173285/217273 [03:15<00:50, 876.23 examples/s]Map:  81%|████████  | 175708/217273 [03:13<00:42, 984.40 examples/s]Map:  81%|████████  | 175052/217273 [03:15<00:50, 840.06 examples/s]Map:  80%|████████  | 174703/217273 [03:13<00:44, 963.18 examples/s]Map:  80%|███████▉  | 173380/217273 [03:15<00:49, 892.35 examples/s]Map:  81%|████████  | 175818/217273 [03:13<00:40, 1014.21 examples/s]Map:  81%|████████  | 175148/217273 [03:15<00:48, 865.44 examples/s]Map:  80%|████████  | 174809/217273 [03:13<00:43, 986.94 examples/s]Map:  80%|███████▉  | 173479/217273 [03:15<00:47, 915.27 examples/s]Map:  81%|████████  | 175927/217273 [03:13<00:40, 1032.17 examples/s]Map:  81%|████████  | 175247/217273 [03:15<00:47, 892.22 examples/s]Map:  81%|████████  | 174912/217273 [03:13<00:42, 995.08 examples/s]Map:  80%|███████▉  | 173574/217273 [03:15<00:47, 921.12 examples/s]Map:  81%|████████  | 175352/217273 [03:15<00:45, 930.41 examples/s]Map:  80%|███████▉  | 173669/217273 [03:15<00:46, 929.25 examples/s]Map:  81%|████████  | 176042/217273 [03:13<00:49, 833.85 examples/s] Map:  81%|████████  | 175451/217273 [03:15<00:44, 944.72 examples/s]Map:  81%|████████  | 175043/217273 [03:13<00:50, 831.14 examples/s]Map:  81%|████████  | 176138/217273 [03:13<00:47, 864.06 examples/s]Map:  80%|███████▉  | 173808/217273 [03:15<00:47, 924.19 examples/s]Map:  81%|████████  | 175553/217273 [03:15<00:43, 961.85 examples/s]Map:  81%|████████  | 175145/217273 [03:13<00:48, 874.36 examples/s]Map:  81%|████████  | 176234/217273 [03:13<00:46, 888.45 examples/s]Map:  80%|████████  | 173903/217273 [03:16<00:46, 925.20 examples/s]Map:  81%|████████  | 175652/217273 [03:15<00:42, 968.06 examples/s]Map:  81%|████████  | 175245/217273 [03:13<00:46, 905.12 examples/s]Map:  81%|████████  | 176332/217273 [03:14<00:44, 910.49 examples/s]Map:  81%|████████  | 175757/217273 [03:15<00:42, 988.11 examples/s]Map:  81%|████████  | 175346/217273 [03:13<00:45, 928.21 examples/s]Map:  80%|████████  | 174000/217273 [03:16<00:54, 792.62 examples/s]Map:  81%|████████  | 176436/217273 [03:14<00:44, 919.53 examples/s]Map:  81%|████████  | 175866/217273 [03:15<00:40, 1015.35 examples/s]Map:  81%|████████  | 175451/217273 [03:14<00:43, 959.28 examples/s]Map:  80%|████████  | 174096/217273 [03:16<00:51, 831.17 examples/s]Map:  81%|████████▏ | 176540/217273 [03:14<00:42, 950.04 examples/s]Map:  81%|████████  | 175552/217273 [03:14<00:43, 970.16 examples/s]Map:  80%|████████  | 174194/217273 [03:16<00:49, 867.93 examples/s]Map:  81%|████████▏ | 176640/217273 [03:14<00:42, 962.85 examples/s]Map:  81%|████████  | 176000/217273 [03:16<00:48, 859.71 examples/s] Map:  81%|████████  | 175654/217273 [03:14<00:42, 980.64 examples/s]Map:  80%|████████  | 174293/217273 [03:16<00:47, 896.85 examples/s]Map:  81%|████████  | 176103/217273 [03:16<00:45, 898.37 examples/s]Map:  81%|████████▏ | 176792/217273 [03:14<00:41, 977.13 examples/s]Map:  80%|████████  | 174395/217273 [03:16<00:46, 928.38 examples/s]Map:  81%|████████  | 175803/217273 [03:14<00:42, 984.01 examples/s]Map:  81%|████████  | 176211/217273 [03:16<00:43, 943.44 examples/s]Map:  81%|████████▏ | 176896/217273 [03:14<00:40, 989.19 examples/s]Map:  80%|████████  | 174492/217273 [03:16<00:45, 937.41 examples/s]Map:  81%|████████  | 176320/217273 [03:16<00:41, 980.72 examples/s]Map:  81%|████████  | 175954/217273 [03:14<00:41, 986.25 examples/s]Map:  80%|████████  | 174590/217273 [03:16<00:45, 947.19 examples/s]Map:  81%|████████  | 176425/217273 [03:16<00:41, 995.06 examples/s]Map:  81%|████████▏ | 177000/217273 [03:14<00:48, 834.54 examples/s]Map:  80%|████████  | 174733/217273 [03:16<00:45, 944.53 examples/s]Map:  82%|████████▏ | 177097/217273 [03:14<00:46, 864.83 examples/s]Map:  81%|████████  | 176098/217273 [03:14<00:48, 846.67 examples/s]Map:  81%|████████▏ | 176572/217273 [03:16<00:41, 986.24 examples/s]Map:  82%|████████▏ | 177190/217273 [03:15<00:45, 878.50 examples/s]Map:  81%|████████  | 176188/217273 [03:14<00:47, 856.71 examples/s]Map:  80%|████████  | 174875/217273 [03:17<00:45, 940.85 examples/s]Map:  81%|████████▏ | 176719/217273 [03:16<00:41, 979.74 examples/s]Map:  82%|████████▏ | 177292/217273 [03:15<00:43, 913.42 examples/s]Map:  81%|████████  | 176289/217273 [03:15<00:45, 891.41 examples/s]Map:  81%|████████  | 174973/217273 [03:17<00:44, 947.20 examples/s]Map:  82%|████████▏ | 177390/217273 [03:15<00:42, 929.52 examples/s]Map:  81%|████████  | 176388/217273 [03:15<00:44, 912.24 examples/s]Map:  81%|████████▏ | 176865/217273 [03:17<00:41, 970.80 examples/s]Map:  82%|████████▏ | 177497/217273 [03:15<00:41, 968.72 examples/s]Map:  81%|████████  | 176491/217273 [03:15<00:43, 942.81 examples/s]Map:  81%|████████▏ | 176973/217273 [03:17<00:40, 994.47 examples/s]Map:  81%|████████  | 175098/217273 [03:17<00:51, 820.07 examples/s]Map:  82%|████████▏ | 177602/217273 [03:15<00:40, 987.31 examples/s]Map:  81%|████████  | 175199/217273 [03:17<00:48, 861.55 examples/s]Map:  81%|████████▏ | 176637/217273 [03:15<00:42, 951.52 examples/s]Map:  82%|████████▏ | 177707/217273 [03:15<00:39, 1002.91 examples/s]Map:  82%|████████▏ | 177106/217273 [03:17<00:46, 862.56 examples/s]Map:  81%|████████  | 175295/217273 [03:17<00:47, 885.46 examples/s]Map:  81%|████████▏ | 176734/217273 [03:15<00:42, 953.04 examples/s]Map:  82%|████████▏ | 177204/217273 [03:17<00:45, 886.20 examples/s]Map:  81%|████████  | 175393/217273 [03:17<00:46, 906.12 examples/s]Map:  82%|████████▏ | 177855/217273 [03:15<00:39, 992.68 examples/s] Map:  81%|████████▏ | 176835/217273 [03:15<00:41, 966.78 examples/s]Map:  82%|████████▏ | 177307/217273 [03:17<00:43, 918.86 examples/s]Map:  81%|████████  | 175495/217273 [03:17<00:44, 931.94 examples/s]Map:  82%|████████▏ | 177966/217273 [03:15<00:38, 1019.87 examples/s]Map:  81%|████████▏ | 176938/217273 [03:15<00:41, 983.24 examples/s]Map:  82%|████████▏ | 177407/217273 [03:17<00:42, 937.22 examples/s]Map:  81%|████████  | 175591/217273 [03:17<00:44, 939.12 examples/s]Map:  82%|████████▏ | 177507/217273 [03:17<00:41, 950.26 examples/s]Map:  81%|████████  | 175691/217273 [03:18<00:43, 953.49 examples/s]Map:  81%|████████▏ | 177048/217273 [03:15<00:48, 824.35 examples/s]Map:  82%|████████▏ | 178097/217273 [03:15<00:45, 856.13 examples/s] Map:  81%|████████  | 175791/217273 [03:18<00:42, 964.85 examples/s]Map:  82%|████████▏ | 177144/217273 [03:15<00:46, 856.20 examples/s]Map:  82%|████████▏ | 178197/217273 [03:16<00:44, 885.56 examples/s]Map:  82%|████████▏ | 177654/217273 [03:17<00:41, 957.85 examples/s]Map:  82%|████████▏ | 177236/217273 [03:16<00:46, 869.01 examples/s]Map:  82%|████████▏ | 178293/217273 [03:16<00:43, 899.88 examples/s]Map:  82%|████████▏ | 177755/217273 [03:18<00:40, 969.06 examples/s]Map:  81%|████████  | 175918/217273 [03:18<00:45, 913.24 examples/s]Map:  82%|████████▏ | 177330/217273 [03:16<00:45, 885.38 examples/s]Map:  82%|████████▏ | 178438/217273 [03:16<00:42, 918.62 examples/s]Map:  82%|████████▏ | 177906/217273 [03:18<00:40, 978.81 examples/s]Map:  82%|████████▏ | 177428/217273 [03:16<00:43, 908.49 examples/s]Map:  82%|████████▏ | 178534/217273 [03:16<00:41, 926.19 examples/s]Map:  81%|████████  | 176045/217273 [03:18<00:57, 721.49 examples/s]Map:  82%|████████▏ | 177523/217273 [03:16<00:43, 914.60 examples/s]Map:  82%|████████▏ | 178636/217273 [03:16<00:40, 946.40 examples/s]Map:  81%|████████  | 176137/217273 [03:18<00:53, 762.15 examples/s]Map:  82%|████████▏ | 178050/217273 [03:18<00:46, 844.78 examples/s]Map:  82%|████████▏ | 177622/217273 [03:16<00:42, 930.60 examples/s]Map:  82%|████████▏ | 178736/217273 [03:16<00:40, 959.56 examples/s]Map:  81%|████████  | 176229/217273 [03:18<00:51, 796.48 examples/s]Map:  82%|████████▏ | 178149/217273 [03:18<00:44, 874.57 examples/s]Map:  82%|████████▏ | 177765/217273 [03:16<00:42, 933.04 examples/s]Map:  82%|████████▏ | 178840/217273 [03:16<00:39, 979.79 examples/s]Map:  81%|████████  | 176324/217273 [03:18<00:49, 830.98 examples/s]Map:  82%|████████▏ | 178251/217273 [03:18<00:43, 905.98 examples/s]Map:  82%|████████▏ | 177862/217273 [03:16<00:41, 940.75 examples/s]Map:  82%|████████▏ | 178943/217273 [03:16<00:38, 990.92 examples/s]Map:  82%|████████▏ | 178351/217273 [03:18<00:41, 927.27 examples/s]Map:  81%|████████  | 176452/217273 [03:18<00:48, 833.45 examples/s]Map:  82%|████████▏ | 177959/217273 [03:16<00:41, 947.03 examples/s]Map:  82%|████████▏ | 178453/217273 [03:18<00:40, 949.44 examples/s]Map:  82%|████████▏ | 179047/217273 [03:17<00:47, 812.74 examples/s]Map:  81%|████████▏ | 176541/217273 [03:19<00:48, 843.81 examples/s]Map:  82%|████████▏ | 178555/217273 [03:18<00:40, 964.86 examples/s]Map:  82%|████████▏ | 179148/217273 [03:17<00:44, 860.72 examples/s]Map:  81%|████████▏ | 176634/217273 [03:19<00:47, 860.33 examples/s]Map:  82%|████████▏ | 178103/217273 [03:17<00:47, 819.09 examples/s]Map:  83%|████████▎ | 179251/217273 [03:17<00:42, 903.77 examples/s]Map:  82%|████████▏ | 178696/217273 [03:19<00:40, 950.43 examples/s]Map:  82%|████████▏ | 178202/217273 [03:17<00:45, 856.90 examples/s]Map:  81%|████████▏ | 176763/217273 [03:19<00:47, 858.37 examples/s]Map:  83%|████████▎ | 179357/217273 [03:17<00:40, 943.05 examples/s]Map:  82%|████████▏ | 178796/217273 [03:19<00:40, 959.11 examples/s]Map:  82%|████████▏ | 178305/217273 [03:17<00:43, 899.09 examples/s]Map:  83%|████████▎ | 179458/217273 [03:17<00:39, 958.92 examples/s]Map:  81%|████████▏ | 176894/217273 [03:19<00:47, 858.22 examples/s]Map:  82%|████████▏ | 178402/217273 [03:17<00:42, 916.63 examples/s]Map:  82%|████████▏ | 178943/217273 [03:19<00:39, 963.03 examples/s]Map:  81%|████████▏ | 176986/217273 [03:19<00:46, 868.27 examples/s]Map:  82%|████████▏ | 178505/217273 [03:17<00:41, 944.57 examples/s]Map:  83%|████████▎ | 179603/217273 [03:17<00:39, 957.69 examples/s]Map:  82%|████████▏ | 178605/217273 [03:17<00:40, 956.58 examples/s]Map:  82%|████████▏ | 179049/217273 [03:19<00:46, 820.10 examples/s]Map:  83%|████████▎ | 179710/217273 [03:17<00:38, 982.81 examples/s]Map:  82%|████████▏ | 177092/217273 [03:19<00:54, 738.79 examples/s]Map:  82%|████████▏ | 178708/217273 [03:17<00:39, 974.61 examples/s]Map:  82%|████████▏ | 179152/217273 [03:19<00:43, 867.54 examples/s]Map:  83%|████████▎ | 179812/217273 [03:17<00:37, 988.89 examples/s]Map:  82%|████████▏ | 177185/217273 [03:19<00:51, 778.62 examples/s]Map:  82%|████████▏ | 178813/217273 [03:17<00:38, 994.05 examples/s]Map:  83%|████████▎ | 179259/217273 [03:19<00:41, 915.76 examples/s]Map:  83%|████████▎ | 179917/217273 [03:17<00:37, 1002.36 examples/s]Map:  82%|████████▏ | 177272/217273 [03:19<00:49, 800.65 examples/s]Map:  83%|████████▎ | 179363/217273 [03:19<00:40, 944.20 examples/s]Map:  82%|████████▏ | 178962/217273 [03:17<00:38, 989.22 examples/s]Map:  82%|████████▏ | 177367/217273 [03:20<00:47, 837.10 examples/s]Map:  83%|████████▎ | 179463/217273 [03:19<00:39, 956.91 examples/s]Map:  83%|████████▎ | 180045/217273 [03:18<00:44, 827.76 examples/s] Map:  82%|████████▏ | 177463/217273 [03:20<00:45, 867.60 examples/s]Map:  83%|████████▎ | 179561/217273 [03:19<00:39, 960.30 examples/s]Map:  83%|████████▎ | 180147/217273 [03:18<00:42, 871.93 examples/s]Map:  82%|████████▏ | 179099/217273 [03:18<00:45, 847.14 examples/s]Map:  82%|████████▏ | 177556/217273 [03:20<00:45, 881.71 examples/s]Map:  83%|████████▎ | 179668/217273 [03:20<00:38, 989.38 examples/s]Map:  83%|████████▎ | 180250/217273 [03:18<00:40, 908.77 examples/s]Map:  82%|████████▏ | 179200/217273 [03:18<00:43, 882.52 examples/s]Map:  82%|████████▏ | 177655/217273 [03:20<00:43, 910.17 examples/s]Map:  83%|████████▎ | 180356/217273 [03:18<00:39, 946.30 examples/s]Map:  83%|████████▎ | 179294/217273 [03:18<00:42, 893.38 examples/s]Map:  83%|████████▎ | 179816/217273 [03:20<00:38, 982.89 examples/s]Map:  82%|████████▏ | 177750/217273 [03:20<00:43, 918.30 examples/s]Map:  83%|████████▎ | 180462/217273 [03:18<00:37, 973.42 examples/s]Map:  83%|████████▎ | 179397/217273 [03:18<00:40, 924.92 examples/s]Map:  83%|████████▎ | 179918/217273 [03:20<00:37, 985.24 examples/s]Map:  82%|████████▏ | 177847/217273 [03:20<00:42, 928.83 examples/s]Map:  83%|████████▎ | 180563/217273 [03:18<00:37, 978.88 examples/s]Map:  83%|████████▎ | 179495/217273 [03:18<00:40, 937.99 examples/s]Map:  82%|████████▏ | 177985/217273 [03:20<00:42, 917.90 examples/s]Map:  83%|████████▎ | 180664/217273 [03:18<00:37, 979.27 examples/s]Map:  83%|████████▎ | 179597/217273 [03:18<00:39, 958.03 examples/s]Map:  83%|████████▎ | 180045/217273 [03:20<00:45, 817.05 examples/s]Map:  83%|████████▎ | 180770/217273 [03:18<00:36, 999.18 examples/s]Map:  83%|████████▎ | 180146/217273 [03:20<00:43, 859.61 examples/s]Map:  83%|████████▎ | 179743/217273 [03:18<00:39, 959.96 examples/s]Map:  82%|████████▏ | 178089/217273 [03:20<00:50, 774.42 examples/s]Map:  83%|████████▎ | 180250/217273 [03:20<00:41, 900.71 examples/s]Map:  83%|████████▎ | 180914/217273 [03:18<00:37, 980.37 examples/s]Map:  82%|████████▏ | 178191/217273 [03:21<00:47, 830.34 examples/s]Map:  83%|████████▎ | 179894/217273 [03:18<00:38, 974.86 examples/s]Map:  83%|████████▎ | 180354/217273 [03:20<00:39, 935.14 examples/s]Map:  82%|████████▏ | 178282/217273 [03:21<00:45, 848.62 examples/s]Map:  83%|████████▎ | 179994/217273 [03:19<00:38, 978.74 examples/s]Map:  83%|████████▎ | 180463/217273 [03:20<00:37, 972.15 examples/s]Map:  83%|████████▎ | 181050/217273 [03:19<00:42, 845.57 examples/s]Map:  82%|████████▏ | 178381/217273 [03:21<00:44, 883.74 examples/s]Map:  83%|████████▎ | 180566/217273 [03:21<00:37, 984.30 examples/s]Map:  83%|████████▎ | 181149/217273 [03:19<00:41, 877.36 examples/s]Map:  82%|████████▏ | 178483/217273 [03:21<00:42, 919.58 examples/s]Map:  83%|████████▎ | 180102/217273 [03:19<00:44, 830.85 examples/s]Map:  83%|████████▎ | 180670/217273 [03:21<00:36, 997.15 examples/s]Map:  83%|████████▎ | 181244/217273 [03:19<00:40, 892.15 examples/s]Map:  83%|████████▎ | 180204/217273 [03:19<00:42, 873.32 examples/s]Map:  82%|████████▏ | 178623/217273 [03:21<00:42, 919.34 examples/s]Map:  83%|████████▎ | 180773/217273 [03:21<00:36, 1004.45 examples/s]Map:  83%|████████▎ | 181337/217273 [03:19<00:40, 897.95 examples/s]Map:  83%|████████▎ | 180305/217273 [03:19<00:40, 906.39 examples/s]Map:  82%|████████▏ | 178720/217273 [03:21<00:41, 929.27 examples/s]Map:  83%|████████▎ | 180875/217273 [03:21<00:36, 1007.17 examples/s]Map:  84%|████████▎ | 181434/217273 [03:19<00:39, 912.29 examples/s]Map:  83%|████████▎ | 180408/217273 [03:19<00:39, 937.51 examples/s]Map:  84%|████████▎ | 181533/217273 [03:19<00:38, 929.57 examples/s]Map:  82%|████████▏ | 178865/217273 [03:21<00:40, 936.89 examples/s]Map:  83%|████████▎ | 180513/217273 [03:19<00:38, 966.69 examples/s]Map:  83%|████████▎ | 181000/217273 [03:21<00:43, 833.52 examples/s] Map:  82%|████████▏ | 178962/217273 [03:21<00:40, 942.17 examples/s]Map:  84%|████████▎ | 181679/217273 [03:19<00:37, 941.29 examples/s]Map:  83%|████████▎ | 181101/217273 [03:21<00:41, 875.95 examples/s]Map:  83%|████████▎ | 180658/217273 [03:19<00:38, 962.52 examples/s]Map:  84%|████████▎ | 181782/217273 [03:19<00:36, 964.07 examples/s]Map:  83%|████████▎ | 181201/217273 [03:21<00:39, 905.08 examples/s]Map:  83%|████████▎ | 180761/217273 [03:19<00:37, 976.94 examples/s]Map:  82%|████████▏ | 179096/217273 [03:22<00:47, 810.53 examples/s]Map:  84%|████████▎ | 181885/217273 [03:20<00:36, 980.08 examples/s]Map:  83%|████████▎ | 181306/217273 [03:21<00:38, 938.06 examples/s]Map:  83%|████████▎ | 180867/217273 [03:19<00:36, 995.53 examples/s]Map:  82%|████████▏ | 179195/217273 [03:22<00:44, 849.89 examples/s]Map:  84%|████████▍ | 181986/217273 [03:20<00:35, 985.47 examples/s]Map:  83%|████████▎ | 181405/217273 [03:21<00:37, 949.53 examples/s]Map:  83%|████████▎ | 180972/217273 [03:20<00:36, 1008.33 examples/s]Map:  83%|████████▎ | 179289/217273 [03:22<00:43, 870.89 examples/s]Map:  84%|████████▎ | 181505/217273 [03:22<00:37, 960.52 examples/s]Map:  83%|████████▎ | 179389/217273 [03:22<00:42, 901.31 examples/s]Map:  84%|████████▍ | 182100/217273 [03:20<00:42, 820.95 examples/s]Map:  84%|████████▎ | 181604/217273 [03:22<00:36, 965.24 examples/s]Map:  83%|████████▎ | 181100/217273 [03:20<00:42, 850.49 examples/s] Map:  84%|████████▍ | 182208/217273 [03:20<00:39, 881.89 examples/s]Map:  83%|████████▎ | 179499/217273 [03:22<00:45, 835.87 examples/s]Map:  83%|████████▎ | 181204/217273 [03:20<00:40, 891.88 examples/s]Map:  84%|████████▍ | 182317/217273 [03:20<00:37, 933.50 examples/s]Map:  84%|████████▎ | 181755/217273 [03:22<00:36, 978.01 examples/s]Map:  83%|████████▎ | 181308/217273 [03:20<00:38, 927.25 examples/s]Map:  83%|████████▎ | 179622/217273 [03:22<00:45, 826.86 examples/s]Map:  84%|████████▍ | 182421/217273 [03:20<00:36, 960.84 examples/s]Map:  84%|████████▎ | 181857/217273 [03:22<00:35, 985.07 examples/s]Map:  83%|████████▎ | 181412/217273 [03:20<00:37, 955.33 examples/s]Map:  83%|████████▎ | 179718/217273 [03:22<00:43, 857.28 examples/s]Map:  84%|████████▍ | 182529/217273 [03:20<00:35, 990.36 examples/s]Map:  84%|████████▎ | 181963/217273 [03:22<00:35, 1001.76 examples/s]Map:  84%|████████▎ | 181562/217273 [03:20<00:36, 970.00 examples/s]Map:  83%|████████▎ | 179830/217273 [03:22<00:45, 817.18 examples/s]Map:  84%|████████▍ | 182668/217273 [03:20<00:35, 964.28 examples/s]Map:  84%|████████▎ | 181663/217273 [03:20<00:36, 979.39 examples/s]Map:  84%|████████▍ | 182096/217273 [03:22<00:42, 821.38 examples/s] Map:  83%|████████▎ | 179923/217273 [03:23<00:44, 843.37 examples/s]Map:  84%|████████▍ | 182818/217273 [03:21<00:35, 974.70 examples/s]Map:  84%|████████▎ | 181767/217273 [03:20<00:35, 992.68 examples/s]Map:  84%|████████▍ | 182195/217273 [03:22<00:40, 859.28 examples/s]Map:  84%|████████▍ | 182922/217273 [03:21<00:34, 986.14 examples/s]Map:  84%|████████▎ | 181869/217273 [03:20<00:35, 997.04 examples/s]Map:  83%|████████▎ | 180040/217273 [03:23<00:51, 722.29 examples/s]Map:  84%|████████▍ | 182337/217273 [03:22<00:39, 883.26 examples/s]Map:  84%|████████▍ | 181971/217273 [03:21<00:35, 1000.21 examples/s]Map:  83%|████████▎ | 180131/217273 [03:23<00:48, 761.04 examples/s]Map:  84%|████████▍ | 182436/217273 [03:23<00:38, 906.83 examples/s]Map:  84%|████████▍ | 183052/217273 [03:21<00:40, 845.78 examples/s]Map:  83%|████████▎ | 180218/217273 [03:23<00:47, 784.50 examples/s]Map:  84%|████████▍ | 182541/217273 [03:23<00:36, 941.08 examples/s]Map:  84%|████████▍ | 183154/217273 [03:21<00:38, 882.19 examples/s]Map:  84%|████████▍ | 182100/217273 [03:21<00:41, 846.93 examples/s] Map:  83%|████████▎ | 180305/217273 [03:23<00:46, 801.81 examples/s]Map:  84%|████████▍ | 182639/217273 [03:23<00:36, 947.83 examples/s]Map:  84%|████████▍ | 183255/217273 [03:21<00:37, 910.40 examples/s]Map:  84%|████████▍ | 182199/217273 [03:21<00:39, 879.47 examples/s]Map:  84%|████████▍ | 183356/217273 [03:21<00:36, 935.02 examples/s]Map:  84%|████████▍ | 182302/217273 [03:21<00:38, 915.62 examples/s]Map:  83%|████████▎ | 180409/217273 [03:23<00:48, 758.33 examples/s]Map:  84%|████████▍ | 182758/217273 [03:23<00:38, 889.58 examples/s]Map:  84%|████████▍ | 183464/217273 [03:21<00:34, 972.82 examples/s]Map:  84%|████████▍ | 182408/217273 [03:21<00:36, 950.99 examples/s]Map:  84%|████████▍ | 182859/217273 [03:23<00:37, 916.27 examples/s]Map:  83%|████████▎ | 180523/217273 [03:23<00:48, 756.54 examples/s]Map:  84%|████████▍ | 183570/217273 [03:21<00:33, 994.98 examples/s]Map:  84%|████████▍ | 182510/217273 [03:21<00:35, 966.13 examples/s]Map:  84%|████████▍ | 182957/217273 [03:23<00:36, 931.59 examples/s]Map:  83%|████████▎ | 180605/217273 [03:23<00:47, 769.50 examples/s]Map:  85%|████████▍ | 183717/217273 [03:21<00:34, 985.70 examples/s]Map:  84%|████████▍ | 182650/217273 [03:21<00:36, 949.72 examples/s]Map:  83%|████████▎ | 180688/217273 [03:24<00:46, 783.78 examples/s]Map:  84%|████████▍ | 183088/217273 [03:23<00:44, 776.21 examples/s]Map:  85%|████████▍ | 183831/217273 [03:22<00:36, 904.36 examples/s]Map:  84%|████████▍ | 182792/217273 [03:21<00:36, 945.09 examples/s]Map:  83%|████████▎ | 180787/217273 [03:24<00:49, 736.79 examples/s]Map:  84%|████████▍ | 183189/217273 [03:23<00:41, 827.75 examples/s]Map:  85%|████████▍ | 183926/217273 [03:22<00:36, 914.80 examples/s]Map:  84%|████████▍ | 182897/217273 [03:22<00:35, 970.47 examples/s]Map:  83%|████████▎ | 180881/217273 [03:24<00:46, 784.15 examples/s]Map:  84%|████████▍ | 183284/217273 [03:24<00:40, 844.83 examples/s]Map:  84%|████████▍ | 182997/217273 [03:22<00:35, 976.73 examples/s]Map:  83%|████████▎ | 180967/217273 [03:24<00:45, 802.45 examples/s]Map:  84%|████████▍ | 183379/217273 [03:24<00:38, 869.71 examples/s]Map:  85%|████████▍ | 184052/217273 [03:22<00:42, 788.82 examples/s]Map:  84%|████████▍ | 183480/217273 [03:24<00:37, 904.92 examples/s]Map:  84%|████████▍ | 183099/217273 [03:22<00:41, 818.45 examples/s]Map:  85%|████████▍ | 184150/217273 [03:22<00:39, 831.45 examples/s]Map:  83%|████���███▎ | 181087/217273 [03:24<00:52, 694.83 examples/s]Map:  84%|████████▍ | 183580/217273 [03:24<00:36, 929.47 examples/s]Map:  84%|████████▍ | 183201/217273 [03:22<00:39, 865.38 examples/s]Map:  85%|████████▍ | 184252/217273 [03:22<00:37, 875.60 examples/s]Map:  83%|████████▎ | 181163/217273 [03:24<00:51, 706.81 examples/s]Map:  85%|████████▍ | 183681/217273 [03:24<00:35, 950.28 examples/s]Map:  84%|████████▍ | 183301/217273 [03:22<00:38, 893.65 examples/s]Map:  85%|████████▍ | 184353/217273 [03:22<00:36, 907.93 examples/s]Map:  83%|████████▎ | 181270/217273 [03:24<00:51, 704.48 examples/s]Map:  84%|████████▍ | 183405/217273 [03:22<00:36, 930.78 examples/s]Map:  85%|████████▍ | 183828/217273 [03:24<00:34, 956.61 examples/s]Map:  85%|████████▍ | 184453/217273 [03:22<00:35, 929.94 examples/s]Map:  84%|████████▍ | 183507/217273 [03:22<00:35, 951.84 examples/s]Map:  85%|████████▍ | 183925/217273 [03:24<00:34, 956.24 examples/s]Map:  85%|████████▍ | 184557/217273 [03:22<00:34, 957.28 examples/s]Map:  83%|████████▎ | 181368/217273 [03:25<00:52, 682.48 examples/s]Map:  85%|████████▍ | 183609/217273 [03:22<00:34, 967.59 examples/s]Map:  85%|████████▍ | 184665/217273 [03:23<00:32, 988.40 examples/s]Map:  84%|████████▎ | 181452/217273 [03:25<00:49, 717.33 examples/s]Map:  85%|████████▍ | 183711/217273 [03:22<00:34, 981.05 examples/s]Map:  85%|████████▍ | 184045/217273 [03:24<00:41, 806.91 examples/s]Map:  84%|████████▎ | 181541/217273 [03:25<00:47, 759.30 examples/s]Map:  85%|████████▌ | 184818/217273 [03:23<00:32, 995.46 examples/s]Map:  85%|████████▍ | 184141/217273 [03:25<00:39, 841.53 examples/s]Map:  84%|████████▎ | 181622/217273 [03:25<00:46, 769.11 examples/s]Map:  85%|████████▍ | 183850/217273 [03:23<00:34, 957.01 examples/s]Map:  85%|████████▍ | 184237/217273 [03:25<00:37, 869.41 examples/s]Map:  85%|████████▌ | 184954/217273 [03:23<00:33, 960.06 examples/s]Map:  84%|████████▎ | 181711/217273 [03:25<00:44, 799.08 examples/s]Map:  85%|████████▍ | 183948/217273 [03:23<00:34, 961.53 examples/s]Map:  85%|████████▍ | 184344/217273 [03:25<00:35, 920.00 examples/s]Map:  84%|████████▎ | 181796/217273 [03:25<00:43, 811.61 examples/s]Map:  85%|████████▍ | 184443/217273 [03:25<00:35, 935.35 examples/s]Map:  85%|████████▍ | 184049/217273 [03:23<00:40, 816.22 examples/s]Map:  85%|████████▌ | 185103/217273 [03:23<00:38, 846.13 examples/s]Map:  84%|████████▎ | 181882/217273 [03:25<00:43, 817.97 examples/s]Map:  85%|████████▍ | 184542/217273 [03:25<00:34, 947.45 examples/s]Map:  85%|████████▍ | 184153/217273 [03:23<00:38, 869.44 examples/s]Map:  85%|████████▌ | 185201/217273 [03:23<00:36, 874.30 examples/s]Map:  84%|████████▍ | 181968/217273 [03:25<00:42, 825.08 examples/s]Map:  85%|████████▍ | 184644/217273 [03:25<00:33, 964.39 examples/s]Map:  85%|████████▍ | 184259/217273 [03:23<00:36, 914.70 examples/s]Map:  85%|████████▌ | 185306/217273 [03:23<00:34, 913.35 examples/s]Map:  85%|████████▌ | 184744/217273 [03:25<00:33, 970.04 examples/s]Map:  85%|████████▍ | 184360/217273 [03:23<00:35, 937.77 examples/s]Map:  85%|████████▌ | 185406/217273 [03:23<00:34, 931.80 examples/s]Map:  84%|████████▍ | 182090/217273 [03:25<00:50, 703.62 examples/s]Map:  85%|████████▍ | 184457/217273 [03:23<00:34, 943.56 examples/s]Map:  85%|████████▌ | 185513/217273 [03:23<00:32, 963.34 examples/s]Map:  84%|████████▍ | 182181/217273 [03:26<00:46, 749.98 examples/s]Map:  85%|████████▌ | 184893/217273 [03:25<00:33, 976.50 examples/s]Map:  85%|████████▍ | 184560/217273 [03:23<00:33, 965.02 examples/s]Map:  85%|████████▌ | 185616/217273 [03:24<00:32, 978.07 examples/s]Map:  85%|████████▌ | 184994/217273 [03:25<00:32, 982.39 examples/s]Map:  84%|████████▍ | 182270/217273 [03:26<00:45, 777.46 examples/s]Map:  85%|████████▍ | 184664/217273 [03:24<00:33, 985.60 examples/s]Map:  85%|████████▌ | 185719/217273 [03:24<00:31, 990.32 examples/s]Map:  84%|████████▍ | 182362/217273 [03:26<00:43, 811.88 examples/s]Map:  85%|████████▌ | 185099/217273 [03:26<00:39, 821.56 examples/s]Map:  85%|████████▌ | 184816/217273 [03:24<00:32, 994.54 examples/s]Map:  84%|████████▍ | 182449/217273 [03:26<00:42, 825.12 examples/s]Map:  86%|████████▌ | 185867/217273 [03:24<00:31, 982.92 examples/s]Map:  85%|████████▌ | 185197/217273 [03:26<00:37, 858.21 examples/s]Map:  84%|████████▍ | 182576/217273 [03:26<00:41, 830.53 examples/s]Map:  85%|████████▌ | 184960/217273 [03:24<00:33, 978.77 examples/s]Map:  85%|████████▌ | 185288/217273 [03:26<00:36, 870.16 examples/s]Map:  86%|████████▌ | 186000/217273 [03:24<00:37, 825.24 examples/s]Map:  84%|████████▍ | 182677/217273 [03:26<00:39, 874.34 examples/s]Map:  85%|████████▌ | 185385/217273 [03:26<00:35, 895.12 examples/s]Map:  86%|████████▌ | 186097/217273 [03:24<00:36, 856.45 examples/s]Map:  84%|████████▍ | 182780/217273 [03:26<00:37, 915.07 examples/s]Map:  85%|████████▌ | 185097/217273 [03:24<00:38, 837.24 examples/s]Map:  85%|████████▌ | 185491/217273 [03:26<00:33, 936.32 examples/s]Map:  86%|████████▌ | 186201/217273 [03:24<00:34, 897.46 examples/s]Map:  84%|████████▍ | 182883/217273 [03:26<00:36, 945.78 examples/s]Map:  85%|████████▌ | 185199/217273 [03:24<00:36, 875.06 examples/s]Map:  85%|████████▌ | 185594/217273 [03:26<00:33, 958.22 examples/s]Map:  86%|████████▌ | 186299/217273 [03:24<00:33, 914.54 examples/s]Map:  85%|████████▌ | 185302/217273 [03:24<00:35, 909.29 examples/s]Map:  85%|████████▌ | 185699/217273 [03:26<00:32, 980.34 examples/s]Map:  86%|████████▌ | 186398/217273 [03:24<00:33, 932.31 examples/s]Map:  84%|████████▍ | 183000/217273 [03:27<00:43, 794.67 examples/s]Map:  85%|████████▌ | 185408/217273 [03:24<00:33, 946.29 examples/s]Map:  86%|████████▌ | 185801/217273 [03:26<00:31, 989.40 examples/s]Map:  86%|████████▌ | 186500/217273 [03:25<00:32, 955.06 examples/s]Map:  84%|████████▍ | 183099/217273 [03:27<00:40, 839.28 examples/s]Map:  85%|████████▌ | 185512/217273 [03:24<00:32, 969.74 examples/s]Map:  86%|████████▌ | 185909/217273 [03:26<00:30, 1013.81 examples/s]Map:  86%|████████▌ | 186598/217273 [03:25<00:32, 956.33 examples/s]Map:  84%|████████▍ | 183199/217273 [03:27<00:38, 878.76 examples/s]Map:  85%|████████▌ | 185661/217273 [03:25<00:32, 974.16 examples/s]Map:  86%|████████▌ | 186699/217273 [03:25<00:31, 970.43 examples/s]Map:  86%|████████▌ | 186051/217273 [03:27<00:35, 873.86 examples/s] Map:  84%|████████▍ | 183339/217273 [03:27<00:37, 895.23 examples/s]Map:  86%|████████▌ | 186803/217273 [03:25<00:30, 989.03 examples/s]Map:  86%|████████▌ | 185810/217273 [03:25<00:32, 975.29 examples/s]Map:  86%|████████▌ | 186151/217273 [03:27<00:34, 902.12 examples/s]Map:  84%|████████▍ | 183432/217273 [03:27<00:37, 900.20 examples/s]Map:  86%|████████▌ | 186903/217273 [03:25<00:30, 990.92 examples/s]Map:  86%|████████▌ | 185913/217273 [03:25<00:31, 986.80 examples/s]Map:  86%|████████▌ | 186247/217273 [03:27<00:33, 912.75 examples/s]Map:  84%|████████▍ | 183532/217273 [03:27<00:36, 925.23 examples/s]Map:  86%|████████▌ | 186385/217273 [03:27<00:33, 911.85 examples/s]Map:  85%|████████▍ | 183672/217273 [03:27<00:36, 922.76 examples/s]Map:  86%|████████▌ | 187046/217273 [03:25<00:37, 809.23 examples/s]Map:  86%|████████▌ | 186049/217273 [03:25<00:37, 827.08 examples/s]Map:  86%|████████▌ | 186493/217273 [03:27<00:32, 953.02 examples/s]Map:  85%|████████▍ | 183770/217273 [03:27<00:35, 935.36 examples/s]Map:  86%|████████▌ | 187146/217273 [03:25<00:35, 851.01 examples/s]Map:  86%|████████▌ | 186151/217273 [03:25<00:35, 867.05 examples/s]Map:  86%|████████▌ | 186592/217273 [03:27<00:31, 962.20 examples/s]Map:  86%|████████▌ | 187244/217273 [03:25<00:34, 881.02 examples/s]Map:  86%|████████▌ | 186253/217273 [03:25<00:34, 902.39 examples/s]Map:  85%|████████▍ | 183905/217273 [03:27<00:36, 921.85 examples/s]Map:  86%|████████▌ | 187352/217273 [03:25<00:32, 930.32 examples/s]Map:  86%|████████▌ | 186738/217273 [03:27<00:31, 963.19 examples/s]Map:  86%|████████▌ | 186355/217273 [03:25<00:33, 930.28 examples/s]Map:  86%|████████▋ | 187453/217273 [03:26<00:31, 951.39 examples/s]Map:  85%|████████▍ | 184000/217273 [03:28<00:43, 765.76 examples/s]Map:  86%|████████▌ | 186458/217273 [03:25<00:32, 954.09 examples/s]Map:  86%|████████▌ | 186887/217273 [03:27<00:31, 968.34 examples/s]Map:  85%|████████▍ | 184088/217273 [03:28<00:41, 790.19 examples/s]Map:  86%|████████▌ | 186559/217273 [03:26<00:31, 966.46 examples/s]Map:  86%|████████▋ | 187600/217273 [03:26<00:30, 958.88 examples/s]Map:  86%|████████▌ | 186991/217273 [03:28<00:30, 984.20 examples/s]Map:  85%|████████▍ | 184178/217273 [03:28<00:40, 815.85 examples/s]Map:  86%|████████▌ | 186660/217273 [03:26<00:31, 975.01 examples/s]Map:  86%|████████▋ | 187701/217273 [03:26<00:30, 968.48 examples/s]Map:  85%|████████▍ | 184275/217273 [03:28<00:38, 852.07 examples/s]Map:  86%|████████▌ | 186773/217273 [03:26<00:29, 1017.12 examples/s]Map:  86%|████████▌ | 187101/217273 [03:28<00:36, 833.02 examples/s]Map:  86%|████████▋ | 187803/217273 [03:26<00:30, 978.81 examples/s]Map:  85%|████████▍ | 184363/217273 [03:28<00:38, 858.80 examples/s]Map:  86%|████████▌ | 187206/217273 [03:28<00:34, 882.32 examples/s]Map:  86%|████████▋ | 187905/217273 [03:26<00:29, 987.22 examples/s]Map:  86%|████████▌ | 186918/217273 [03:26<00:30, 993.90 examples/s] Map:  85%|████████▍ | 184453/217273 [03:28<00:37, 866.27 examples/s]Map:  86%|████████▌ | 187305/217273 [03:28<00:33, 906.34 examples/s]Map:  86%|████████▋ | 187402/217273 [03:28<00:32, 921.10 examples/s]Map:  87%|████████▋ | 188052/217273 [03:26<00:34, 845.65 examples/s]Map:  85%|████████▍ | 184549/217273 [03:28<00:42, 776.18 examples/s]Map:  86%|████████▌ | 187046/217273 [03:26<00:35, 843.97 examples/s]Map:  86%|████████▌ | 187136/217273 [03:26<00:35, 855.11 examples/s]Map:  86%|████████▋ | 187534/217273 [03:28<00:32, 902.32 examples/s]Map:  87%|████████▋ | 188195/217273 [03:26<00:33, 874.65 examples/s]Map:  85%|████████▍ | 184661/217273 [03:28<00:43, 756.76 examples/s]Map:  86%|████████▌ | 187236/217273 [03:26<00:33, 888.52 examples/s]Map:  86%|████████▋ | 187637/217273 [03:28<00:31, 928.84 examples/s]Map:  87%|████████▋ | 188293/217273 [03:26<00:32, 897.41 examples/s]Map:  85%|████████▌ | 184751/217273 [03:29<00:41, 791.54 examples/s]Map:  86%|████████▌ | 187334/217273 [03:26<00:32, 911.06 examples/s]Map:  86%|████████▋ | 187738/217273 [03:28<00:31, 949.03 examples/s]Map:  87%|████████▋ | 188396/217273 [03:27<00:31, 927.38 examples/s]Map:  85%|████████▌ | 184838/217273 [03:29<00:39, 811.61 examples/s]Map:  86%|████████▋ | 187431/217273 [03:27<00:32, 925.49 examples/s]Map:  86%|████████▋ | 187837/217273 [03:28<00:30, 956.24 examples/s]Map:  87%|████████▋ | 188499/217273 [03:27<00:30, 951.20 examples/s]Map:  85%|████████▌ | 184927/217273 [03:29<00:38, 832.25 examples/s]Map:  86%|████████▋ | 187530/217273 [03:27<00:31, 939.97 examples/s]Map:  87%|████████▋ | 188597/217273 [03:27<00:30, 955.65 examples/s]Map:  87%|████████▋ | 187978/217273 [03:29<00:30, 946.23 examples/s]Map:  87%|████████▋ | 188700/217273 [03:27<00:29, 973.14 examples/s]Map:  86%|████████▋ | 187671/217273 [03:27<00:31, 938.62 examples/s]Map:  85%|████████▌ | 185031/217273 [03:29<00:53, 602.79 examples/s]Map:  86%|████████▋ | 187776/217273 [03:27<00:30, 965.29 examples/s]Map:  87%|████████▋ | 188103/217273 [03:29<00:35, 818.11 examples/s]Map:  87%|████████▋ | 188846/217273 [03:27<00:29, 968.97 examples/s]Map:  86%|████████▋ | 187880/217273 [03:27<00:29, 983.56 examples/s]Map:  85%|████████▌ | 185127/217273 [03:29<00:52, 611.18 examples/s]Map:  87%|████████▋ | 188208/217273 [03:29<00:33, 869.95 examples/s]Map:  87%|████████▋ | 188948/217273 [03:27<00:28, 981.79 examples/s]Map:  87%|████████▋ | 187981/217273 [03:27<00:29, 988.58 examples/s]Map:  87%|████████▋ | 188307/217273 [03:29<00:32, 896.02 examples/s]Map:  85%|████████▌ | 185223/217273 [03:29<00:51, 617.00 examples/s]Map:  87%|████████▋ | 189048/217273 [03:27<00:34, 824.99 examples/s]Map:  87%|████████▋ | 188410/217273 [03:29<00:31, 929.20 examples/s]Map:  85%|████████▌ | 185291/217273 [03:29<00:51, 626.99 examples/s]Map:  87%|████████▋ | 188099/217273 [03:27<00:35, 827.27 examples/s]Map:  87%|████████▋ | 189152/217273 [03:27<00:32, 872.20 examples/s]Map:  87%|████████▋ | 188513/217273 [03:29<00:30, 952.80 examples/s]Map:  87%|████████▋ | 188198/217273 [03:27<00:33, 865.68 examples/s]Map:  85%|████████▌ | 185384/217273 [03:30<00:51, 621.82 examples/s]Map:  87%|████████▋ | 189287/217273 [03:28<00:31, 877.17 examples/s]Map:  87%|████████▋ | 188644/217273 [03:29<00:31, 916.13 examples/s]Map:  85%|████████▌ | 185455/217273 [03:30<00:49, 640.53 examples/s]Map:  87%|████████▋ | 188329/217273 [03:28<00:33, 865.14 examples/s]Map:  87%|████████▋ | 189423/217273 [03:28<00:31, 883.52 examples/s]Map:  85%|████████▌ | 185544/217273 [03:30<00:45, 701.52 examples/s]Map:  87%|████████▋ | 188785/217273 [03:30<00:30, 922.30 examples/s]Map:  87%|████████▋ | 188428/217273 [03:28<00:32, 893.63 examples/s]Map:  87%|████████▋ | 189520/217273 [03:28<00:30, 902.88 examples/s]Map:  85%|████████▌ | 185636/217273 [03:30<00:41, 754.12 examples/s]Map:  87%|████████▋ | 188883/217273 [03:30<00:30, 934.80 examples/s]Map:  87%|████████▋ | 188530/217273 [03:28<00:31, 923.71 examples/s]Map:  87%|████████▋ | 189626/217273 [03:28<00:29, 938.74 examples/s]Map:  85%|████████▌ | 185724/217273 [03:30<00:40, 785.15 examples/s]Map:  87%|████████▋ | 188987/217273 [03:30<00:29, 960.30 examples/s]Map:  87%|████████▋ | 188628/217273 [03:28<00:30, 938.41 examples/s]Map:  87%|████████▋ | 189722/217273 [03:28<00:29, 942.51 examples/s]Map:  86%|████████▌ | 185807/217273 [03:30<00:39, 790.88 examples/s]Map:  87%|████████▋ | 188728/217273 [03:28<00:29, 953.72 examples/s]Map:  87%|████████▋ | 189104/217273 [03:30<00:33, 830.78 examples/s]Map:  87%|████████▋ | 189826/217273 [03:28<00:28, 967.38 examples/s]Map:  86%|████████▌ | 185894/217273 [03:30<00:38, 809.88 examples/s]Map:  87%|████████▋ | 188830/217273 [03:28<00:29, 971.95 examples/s]Map:  87%|████████▋ | 189205/217273 [03:30<00:32, 871.91 examples/s]Map:  86%|████████▌ | 185980/217273 [03:30<00:38, 819.40 examples/s]Map:  87%|████████▋ | 188930/217273 [03:28<00:29, 976.10 examples/s]Map:  87%|████████▋ | 189972/217273 [03:28<00:28, 965.18 examples/s]Map:  87%|████████▋ | 189302/217273 [03:30<00:31, 894.96 examples/s]Map:  87%|████████▋ | 189402/217273 [03:30<00:30, 918.16 examples/s]Map:  86%|████████▌ | 186093/217273 [03:30<00:44, 707.27 examples/s]Map:  87%|████████▋ | 189048/217273 [03:28<00:34, 813.41 examples/s]Map:  87%|████████▋ | 190101/217273 [03:28<00:32, 827.59 examples/s]Map:  86%|████████▌ | 186179/217273 [03:31<00:41, 741.31 examples/s]Map:  87%|████████▋ | 189139/217273 [03:28<00:33, 835.44 examples/s]Map:  87%|████████▋ | 189547/217273 [03:30<00:29, 924.75 examples/s]Map:  88%|████████▊ | 190200/217273 [03:29<00:31, 862.94 examples/s]Map:  86%|████████▌ | 186268/217273 [03:31<00:39, 777.53 examples/s]Map:  87%|████████▋ | 189232/217273 [03:29<00:32, 858.71 examples/s]Map:  87%|████████▋ | 189646/217273 [03:30<00:29, 938.86 examples/s]Map:  88%|████████▊ | 190302/217273 [03:29<00:29, 900.91 examples/s]Map:  86%|████████▌ | 186363/217273 [03:31<00:37, 820.75 examples/s]Map:  87%|████████▋ | 189334/217273 [03:29<00:31, 900.41 examples/s]Map:  87%|████████▋ | 189752/217273 [03:31<00:28, 968.61 examples/s]Map:  88%|████████▊ | 190402/217273 [03:29<00:29, 924.49 examples/s]Map:  86%|████████▌ | 186451/217273 [03:31<00:36, 835.43 examples/s]Map:  87%|████████▋ | 189434/217273 [03:29<00:30, 924.86 examples/s]Map:  87%|████████▋ | 189854/217273 [03:31<00:27, 981.11 examples/s]Map:  88%|████████▊ | 190502/217273 [03:29<00:28, 940.46 examples/s]Map:  86%|████████▌ | 186545/217273 [03:31<00:35, 862.62 examples/s]Map:  87%|████████▋ | 189960/217273 [03:31<00:27, 1001.85 examples/s]Map:  88%|████████▊ | 190599/217273 [03:29<00:28, 945.23 examples/s]Map:  87%|████████▋ | 189575/217273 [03:29<00:29, 925.95 examples/s]Map:  86%|████████▌ | 186639/217273 [03:31<00:34, 879.05 examples/s]Map:  88%|████████▊ | 190705/217273 [03:29<00:27, 973.18 examples/s]Map:  87%|████████▋ | 189680/217273 [03:29<00:28, 956.47 examples/s]Map:  86%|████████▌ | 186740/217273 [03:31<00:33, 912.34 examples/s]Map:  87%|████████▋ | 190098/217273 [03:31<00:32, 844.47 examples/s] Map:  88%|████████▊ | 190806/217273 [03:29<00:27, 978.15 examples/s]Map:  87%|████████▋ | 189783/217273 [03:29<00:28, 973.24 examples/s]Map:  88%|████████▊ | 190202/217273 [03:31<00:30, 888.91 examples/s]Map:  88%|████████▊ | 190908/217273 [03:29<00:26, 987.65 examples/s]Map:  86%|████████▌ | 186877/217273 [03:31<00:33, 908.25 examples/s]Map:  87%|████████▋ | 189923/217273 [03:29<00:28, 954.10 examples/s]Map:  86%|████████▌ | 186969/217273 [03:31<00:33, 907.99 examples/s]Map:  88%|████████▊ | 190347/217273 [03:31<00:29, 909.19 examples/s]Map:  88%|████████▊ | 191049/217273 [03:30<00:31, 824.45 examples/s]Map:  88%|████████▊ | 190446/217273 [03:31<00:29, 923.13 examples/s]Map:  87%|████████▋ | 190047/217273 [03:29<00:34, 799.10 examples/s]Map:  86%|████████▌ | 187092/217273 [03:32<00:39, 766.79 examples/s]Map:  88%|████████▊ | 191150/217273 [03:30<00:30, 866.40 examples/s]Map:  88%|████████▊ | 190549/217273 [03:31<00:28, 947.12 examples/s]Map:  88%|████████▊ | 190144/217273 [03:30<00:32, 835.96 examples/s]Map:  86%|████████▌ | 187193/217273 [03:32<00:36, 822.10 examples/s]Map:  88%|████████▊ | 191250/217273 [03:30<00:28, 899.55 examples/s]Map:  88%|████████▊ | 190648/217273 [03:32<00:27, 956.28 examples/s]Map:  88%|████████▊ | 190244/217273 [03:30<00:31, 870.26 examples/s]Map:  86%|████████▌ | 187289/217273 [03:32<00:35, 854.62 examples/s]Map:  88%|████████▊ | 191349/217273 [03:30<00:28, 919.19 examples/s]Map:  88%|████████▊ | 190750/217273 [03:32<00:27, 970.59 examples/s]Map:  88%|████████▊ | 190347/217273 [03:30<00:29, 906.66 examples/s]Map:  86%|████████▌ | 187381/217273 [03:32<00:34, 866.47 examples/s]Map:  88%|████████▊ | 191450/217273 [03:30<00:27, 941.44 examples/s]Map:  88%|████████▊ | 190851/217273 [03:32<00:27, 977.66 examples/s]Map:  88%|████████▊ | 190446/217273 [03:30<00:28, 926.12 examples/s]Map:  86%|████████▋ | 187477/217273 [03:32<00:33, 890.87 examples/s]Map:  88%|████████▊ | 191548/217273 [03:30<00:27, 949.68 examples/s]Map:  88%|████████▊ | 190951/217273 [03:32<00:26, 981.20 examples/s]Map:  88%|████████▊ | 190547/217273 [03:30<00:28, 945.05 examples/s]Map:  86%|████████▋ | 187576/217273 [03:32<00:32, 915.81 examples/s]Map:  88%|████████▊ | 191648/217273 [03:30<00:26, 960.80 examples/s]Map:  88%|████████▊ | 190644/217273 [03:30<00:28, 950.09 examples/s]Map:  86%|████████▋ | 187675/217273 [03:32<00:31, 932.86 examples/s]Map:  88%|████████▊ | 191746/217273 [03:30<00:26, 963.31 examples/s]Map:  88%|████████▊ | 191052/217273 [03:32<00:32, 803.82 examples/s]Map:  86%|████████▋ | 187774/217273 [03:32<00:31, 947.24 examples/s]Map:  88%|████████▊ | 190795/217273 [03:30<00:27, 967.58 examples/s]Map:  88%|████████▊ | 191851/217273 [03:30<00:25, 981.21 examples/s]Map:  88%|████████▊ | 191152/217273 [03:32<00:30, 850.10 examples/s]Map:  86%|████████▋ | 187872/217273 [03:32<00:30, 952.56 examples/s]Map:  88%|████████▊ | 190896/217273 [03:30<00:27, 976.11 examples/s]Map:  88%|████████▊ | 191249/217273 [03:32<00:29, 880.72 examples/s]Map:  88%|████████▊ | 191998/217273 [03:30<00:25, 977.92 examples/s]Map:  87%|████████▋ | 187971/217273 [03:33<00:30, 960.82 examples/s]Map:  88%|████████▊ | 190997/217273 [03:30<00:26, 982.46 examples/s]Map:  88%|████████▊ | 191349/217273 [03:32<00:28, 912.17 examples/s]Map:  88%|████████▊ | 191458/217273 [03:32<00:27, 955.97 examples/s]Map:  88%|████████▊ | 192099/217273 [03:31<00:30, 823.71 examples/s]Map:  87%|████████▋ | 188094/217273 [03:33<00:36, 798.15 examples/s]Map:  88%|████████▊ | 191559/217273 [03:33<00:26, 969.99 examples/s]Map:  88%|████████▊ | 192203/217273 [03:31<00:28, 874.36 examples/s]Map:  88%|████████▊ | 191144/217273 [03:31<00:31, 827.18 examples/s]Map:  87%|████████▋ | 188190/217273 [03:33<00:34, 834.93 examples/s]Map:  88%|████████▊ | 191664/217273 [03:33<00:25, 988.43 examples/s]Map:  89%|████████▊ | 192309/217273 [03:31<00:27, 919.21 examples/s]Map:  88%|████████▊ | 191245/217273 [03:31<00:30, 866.07 examples/s]Map:  87%|████████▋ | 188281/217273 [03:33<00:34, 850.46 examples/s]Map:  88%|████████▊ | 191340/217273 [03:31<00:29, 883.51 examples/s]Map:  88%|████████▊ | 191805/217273 [03:33<00:26, 965.31 examples/s]Map:  89%|████████▊ | 192455/217273 [03:31<00:26, 935.34 examples/s]Map:  87%|████████▋ | 188379/217273 [03:33<00:32, 883.63 examples/s]Map:  88%|████████▊ | 191445/217273 [03:31<00:27, 923.89 examples/s]Map:  88%|████████▊ | 191903/217273 [03:33<00:26, 966.33 examples/s]Map:  89%|████████▊ | 192555/217273 [03:31<00:26, 947.87 examples/s]Map:  87%|████████▋ | 188477/217273 [03:33<00:31, 907.68 examples/s]Map:  88%|████████▊ | 191543/217273 [03:31<00:27, 931.40 examples/s]Map:  89%|████████▊ | 192659/217273 [03:31<00:25, 971.21 examples/s]Map:  87%|████████▋ | 188572/217273 [03:33<00:31, 916.63 examples/s]Map:  88%|████████▊ | 191640/217273 [03:31<00:27, 938.59 examples/s]Map:  88%|████████▊ | 192052/217273 [03:33<00:29, 849.25 examples/s]Map:  89%|████████▊ | 192758/217273 [03:31<00:25, 974.47 examples/s]Map:  87%|████████▋ | 188671/217273 [03:33<00:30, 936.53 examples/s]Map:  88%|████████▊ | 191744/217273 [03:31<00:26, 960.92 examples/s]Map:  88%|████████▊ | 192160/217273 [03:33<00:27, 900.83 examples/s]Map:  87%|████████▋ | 188766/217273 [03:33<00:30, 935.54 examples/s]Map:  89%|████████▉ | 192906/217273 [03:31<00:24, 975.89 examples/s]Map:  88%|████████▊ | 191850/217273 [03:31<00:25, 987.76 examples/s]Map:  88%|████████▊ | 192264/217273 [03:33<00:26, 934.98 examples/s]Map:  87%|████████▋ | 188863/217273 [03:34<00:30, 944.32 examples/s]Map:  89%|████████▊ | 192367/217273 [03:33<00:25, 958.24 examples/s]Map:  88%|████████▊ | 191995/217273 [03:31<00:25, 976.42 examples/s]Map:  87%|████████▋ | 188961/217273 [03:34<00:29, 952.78 examples/s]Map:  89%|████████▉ | 193045/217273 [03:32<00:29, 830.34 examples/s]Map:  89%|████████▊ | 192468/217273 [03:34<00:25, 969.19 examples/s]Map:  89%|████████▉ | 193148/217273 [03:32<00:27, 872.84 examples/s]Map:  88%|████████▊ | 192102/217273 [03:32<00:30, 834.19 examples/s]Map:  89%|████████▊ | 192571/217273 [03:34<00:25, 983.97 examples/s]Map:  87%|████████▋ | 189098/217273 [03:34<00:34, 809.69 examples/s]Map:  89%|████████▉ | 193247/217273 [03:32<00:26, 895.97 examples/s]Map:  88%|████████▊ | 192203/217273 [03:32<00:28, 874.91 examples/s]Map:  89%|████████▊ | 192676/217273 [03:34<00:24, 1001.46 examples/s]Map:  87%|████████▋ | 189197/217273 [03:34<00:33, 850.63 examples/s]Map:  89%|████████▉ | 193345/217273 [03:32<00:26, 915.19 examples/s]Map:  89%|████████▊ | 192305/217273 [03:32<00:27, 908.65 examples/s]Map:  87%|████████▋ | 189294/217273 [03:34<00:31, 879.24 examples/s]Map:  89%|████████▊ | 192824/217273 [03:34<00:24, 994.34 examples/s] Map:  89%|████████▉ | 193448/217273 [03:32<00:25, 942.65 examples/s]Map:  89%|████████▊ | 192409/217273 [03:32<00:26, 938.89 examples/s]Map:  87%|████████▋ | 189390/217273 [03:34<00:31, 898.30 examples/s]Map:  89%|████████▊ | 192507/217273 [03:32<00:26, 946.65 examples/s]Map:  89%|████████▉ | 192967/217273 [03:34<00:24, 976.27 examples/s]Map:  89%|████████▉ | 193588/217273 [03:32<00:25, 935.56 examples/s]Map:  87%|████████▋ | 189483/217273 [03:34<00:30, 905.25 examples/s]Map:  89%|████████▊ | 192604/217273 [03:32<00:26, 948.77 examples/s]Map:  89%|████████▉ | 193687/217273 [03:32<00:24, 946.08 examples/s]Map:  89%|████████▊ | 192702/217273 [03:32<00:25, 952.88 examples/s]Map:  87%|████████▋ | 189623/217273 [03:34<00:30, 910.37 examples/s]Map:  89%|████████▉ | 193101/217273 [03:34<00:28, 845.34 examples/s]Map:  89%|████████▉ | 193818/217273 [03:32<00:25, 914.86 examples/s]Map:  87%|████████▋ | 189725/217273 [03:35<00:29, 934.59 examples/s]Map:  89%|████████▉ | 193203/217273 [03:34<00:27, 879.92 examples/s]Map:  89%|████████▉ | 192842/217273 [03:32<00:26, 938.25 examples/s]Map:  89%|████��███▉ | 193925/217273 [03:33<00:24, 949.23 examples/s]Map:  87%|████████▋ | 189829/217273 [03:35<00:28, 959.96 examples/s]Map:  89%|████████▉ | 193307/217273 [03:34<00:26, 916.49 examples/s]Map:  89%|████████▉ | 192943/217273 [03:33<00:25, 952.77 examples/s]Map:  87%|████████▋ | 189932/217273 [03:35<00:28, 974.55 examples/s]Map:  89%|████████▉ | 193406/217273 [03:35<00:25, 933.71 examples/s]Map:  89%|████████▉ | 194049/217273 [03:33<00:28, 811.69 examples/s]Map:  89%|████████▉ | 193508/217273 [03:35<00:24, 953.10 examples/s]Map:  89%|████████▉ | 193052/217273 [03:33<00:29, 810.65 examples/s]Map:  89%|████████▉ | 194153/217273 [03:33<00:26, 862.20 examples/s]Map:  87%|████████▋ | 190045/217273 [03:35<00:33, 814.73 examples/s]Map:  89%|████████▉ | 193607/217273 [03:35<00:24, 961.35 examples/s]Map:  89%|████████▉ | 193161/217273 [03:33<00:27, 874.17 examples/s]Map:  89%|████████▉ | 194249/217273 [03:33<00:26, 885.14 examples/s]Map:  88%|████████▊ | 190145/217273 [03:35<00:31, 858.15 examples/s]Map:  89%|████████▉ | 193706/217273 [03:35<00:24, 964.45 examples/s]Map:  89%|████████▉ | 193266/217273 [03:33<00:26, 916.24 examples/s]Map:  89%|████████▉ | 194356/217273 [03:33<00:24, 930.45 examples/s]Map:  88%|████████▊ | 190245/217273 [03:35<00:30, 892.57 examples/s]Map:  89%|████████▉ | 193364/217273 [03:33<00:25, 931.86 examples/s]Map:  89%|████████▉ | 193855/217273 [03:35<00:24, 970.60 examples/s]Map:  90%|████████▉ | 194460/217273 [03:33<00:23, 959.09 examples/s]Map:  88%|████████▊ | 190359/217273 [03:35<00:32, 840.76 examples/s]Map:  89%|████████▉ | 193954/217273 [03:35<00:23, 971.67 examples/s]Map:  89%|████████▉ | 193508/217273 [03:33<00:25, 937.84 examples/s]Map:  90%|████████▉ | 194565/217273 [03:33<00:23, 982.43 examples/s]Map:  89%|████████▉ | 193606/217273 [03:33<00:25, 944.87 examples/s]Map:  90%|████████▉ | 194669/217273 [03:33<00:22, 991.24 examples/s]Map:  88%|████████▊ | 190459/217273 [03:35<00:34, 773.56 examples/s]Map:  89%|████████▉ | 194093/217273 [03:35<00:27, 829.72 examples/s]Map:  89%|████████▉ | 193710/217273 [03:33<00:24, 968.44 examples/s]Map:  88%|████████▊ | 190547/217273 [03:36<00:33, 794.63 examples/s]Map:  90%|████████▉ | 194823/217273 [03:34<00:22, 997.87 examples/s]Map:  89%|████████▉ | 194195/217273 [03:35<00:26, 870.24 examples/s]Map:  89%|████████▉ | 193810/217273 [03:33<00:24, 974.82 examples/s]Map:  88%|████████▊ | 190638/217273 [03:36<00:32, 822.50 examples/s]Map:  89%|████████▉ | 194292/217273 [03:35<00:25, 891.34 examples/s]Map:  90%|████████▉ | 194963/217273 [03:34<00:22, 971.68 examples/s]Map:  88%|████████▊ | 190726/217273 [03:36<00:31, 835.59 examples/s]Map:  89%|████████▉ | 193940/217273 [03:34<00:25, 933.13 examples/s]Map:  89%|████████▉ | 194387/217273 [03:36<00:25, 905.12 examples/s]Map:  88%|████████▊ | 190816/217273 [03:36<00:31, 850.68 examples/s]Map:  90%|████████▉ | 194487/217273 [03:36<00:24, 930.02 examples/s]Map:  88%|████████▊ | 190913/217273 [03:36<00:29, 880.84 examples/s]Map:  90%|████████▉ | 195102/217273 [03:34<00:26, 839.76 examples/s]Map:  89%|████████▉ | 194043/217273 [03:34<00:29, 787.21 examples/s]Map:  90%|████████▉ | 194589/217273 [03:36<00:23, 954.10 examples/s]Map:  90%|████████▉ | 195201/217273 [03:34<00:25, 869.97 examples/s]Map:  89%|████████▉ | 194141/217273 [03:34<00:27, 830.72 examples/s]Map:  90%|████████▉ | 194687/217273 [03:36<00:23, 961.25 examples/s]Map:  90%|████████▉ | 195304/217273 [03:34<00:24, 904.83 examples/s]Map:  88%|████████▊ | 191041/217273 [03:36<00:35, 739.04 examples/s]Map:  89%|████████▉ | 194242/217273 [03:34<00:26, 871.96 examples/s]Map:  90%|████████▉ | 194790/217273 [03:36<00:22, 978.77 examples/s]Map:  90%|████████▉ | 195404/217273 [03:34<00:23, 927.22 examples/s]Map:  89%|████████▉ | 194338/217273 [03:34<00:25, 894.50 examples/s]Map:  88%|████████▊ | 191134/217273 [03:36<00:33, 778.78 examples/s]Map:  90%|████████▉ | 194890/217273 [03:36<00:22, 983.70 examples/s]Map:  90%|████████▉ | 195500/217273 [03:34<00:23, 933.94 examples/s]Map:  89%|���███████▉ | 194437/217273 [03:34<00:24, 918.61 examples/s]Map:  88%|████████▊ | 191223/217273 [03:36<00:32, 803.09 examples/s]Map:  90%|████████▉ | 194996/217273 [03:36<00:22, 1001.63 examples/s]Map:  90%|█████████ | 195605/217273 [03:34<00:22, 964.21 examples/s]Map:  90%|████████▉ | 194540/217273 [03:34<00:24, 947.16 examples/s]Map:  88%|████████▊ | 191314/217273 [03:36<00:31, 828.76 examples/s]Map:  90%|█████████ | 195710/217273 [03:35<00:21, 987.50 examples/s]Map:  88%|████████▊ | 191407/217273 [03:37<00:30, 853.60 examples/s]Map:  90%|████████▉ | 195103/217273 [03:36<00:26, 830.09 examples/s] Map:  90%|████████▉ | 194689/217273 [03:34<00:23, 959.41 examples/s]Map:  88%|████████▊ | 191495/217273 [03:37<00:30, 858.13 examples/s]Map:  90%|█████████ | 195862/217273 [03:35<00:21, 992.09 examples/s]Map:  90%|████████▉ | 195206/217273 [03:36<00:25, 877.80 examples/s]Map:  90%|████████▉ | 194793/217273 [03:35<00:23, 976.41 examples/s]Map:  88%|████████▊ | 191585/217273 [03:37<00:29, 868.99 examples/s]Map:  90%|████████▉ | 195312/217273 [03:37<00:23, 924.19 examples/s]Map:  90%|████████▉ | 194893/217273 [03:35<00:22, 976.00 examples/s]Map:  88%|████████▊ | 191677/217273 [03:37<00:29, 878.73 examples/s]Map:  90%|████████▉ | 195412/217273 [03:37<00:23, 942.10 examples/s]Map:  90%|█████████ | 196000/217273 [03:35<00:25, 838.97 examples/s]Map:  90%|████████▉ | 194999/217273 [03:35<00:22, 996.03 examples/s]Map:  90%|████████▉ | 195512/217273 [03:37<00:22, 954.99 examples/s]Map:  90%|█████████ | 196097/217273 [03:35<00:24, 866.70 examples/s]Map:  88%|████████▊ | 191808/217273 [03:37<00:29, 873.12 examples/s]Map:  90%|█████████ | 196190/217273 [03:35<00:23, 881.37 examples/s]Map:  90%|████████▉ | 195138/217273 [03:35<00:27, 819.68 examples/s]Map:  90%|█████████ | 195654/217273 [03:37<00:22, 946.89 examples/s]Map:  88%|████████▊ | 191938/217273 [03:37<00:29, 868.31 examples/s]Map:  90%|█████████ | 196287/217273 [03:35<00:23, 902.01 examples/s]Map:  90%|████████▉ | 195233/217273 [03:35<00:26, 846.70 examples/s]Map:  90%|█████████ | 195757/217273 [03:37<00:22, 968.11 examples/s]Map:  90%|█████████ | 196387/217273 [03:35<00:22, 924.79 examples/s]Map:  90%|████████▉ | 195330/217273 [03:35<00:25, 876.06 examples/s]Map:  90%|█████████ | 195859/217273 [03:37<00:21, 978.07 examples/s]Map:  88%|████████▊ | 192045/217273 [03:37<00:34, 732.88 examples/s]Map:  90%|█████████ | 196492/217273 [03:35<00:21, 954.74 examples/s]Map:  90%|████████▉ | 195424/217273 [03:35<00:24, 888.97 examples/s]Map:  88%|████████▊ | 192131/217273 [03:38<00:33, 759.29 examples/s]Map:  90%|█████████ | 196598/217273 [03:35<00:21, 978.27 examples/s]Map:  90%|████████▉ | 195520/217273 [03:35<00:24, 906.21 examples/s]Map:  88%|████████▊ | 192223/217273 [03:38<00:31, 795.79 examples/s]Map:  90%|█████████ | 196000/217273 [03:37<00:25, 832.64 examples/s]Map:  90%|█████████ | 195619/217273 [03:35<00:23, 928.34 examples/s]Map:  91%|█████████ | 196743/217273 [03:36<00:21, 972.23 examples/s]Map:  89%|████████▊ | 192319/217273 [03:38<00:29, 836.53 examples/s]Map:  90%|█████████ | 196100/217273 [03:37<00:24, 867.72 examples/s]Map:  90%|█████████ | 195722/217273 [03:36<00:22, 952.10 examples/s]Map:  89%|████████▊ | 192410/217273 [03:38<00:29, 852.07 examples/s]Map:  90%|█████████ | 196201/217273 [03:38<00:23, 900.61 examples/s]Map:  91%|█████████ | 196889/217273 [03:36<00:21, 964.92 examples/s]Map:  90%|█████████ | 195825/217273 [03:36<00:22, 970.01 examples/s]Map:  89%|████████▊ | 192501/217273 [03:38<00:28, 865.54 examples/s]Map:  90%|█████████ | 196304/217273 [03:38<00:22, 933.05 examples/s]Map:  91%|█████████ | 196993/217273 [03:36<00:20, 980.57 examples/s]Map:  89%|████████▊ | 192590/217273 [03:38<00:28, 869.54 examples/s]Map:  90%|█████████ | 196408/217273 [03:38<00:21, 959.10 examples/s]Map:  90%|█████████ | 195971/217273 [03:36<00:22, 967.61 examples/s]Map:  89%|████████▊ | 192683/217273 [03:38<00:27, 880.74 examples/s]Map:  90%|█████████ | 196509/217273 [03:38<00:21, 970.58 examples/s]Map:  91%|█████████ | 197103/217273 [03:36<00:24, 826.93 examples/s]Map:  89%|████████▊ | 192775/217273 [03:38<00:27, 889.82 examples/s]Map:  90%|█████████ | 196611/217273 [03:38<00:21, 981.92 examples/s]Map:  90%|█████████ | 196103/217273 [03:36<00:25, 827.16 examples/s]Map:  91%|█████████ | 197202/217273 [03:36<00:23, 864.03 examples/s]Map:  89%|████████▉ | 192867/217273 [03:38<00:27, 893.90 examples/s]Map:  90%|█████████ | 196201/217273 [03:36<00:24, 859.62 examples/s]Map:  91%|█████████ | 197310/217273 [03:36<00:21, 912.82 examples/s]Map:  91%|█████████ | 196756/217273 [03:38<00:21, 970.40 examples/s]Map:  90%|█████████ | 196302/217273 [03:36<00:23, 891.27 examples/s]Map:  91%|█████████ | 197409/217273 [03:36<00:21, 930.61 examples/s]Map:  89%|████████▉ | 192997/217273 [03:38<00:27, 878.34 examples/s]Map:  91%|█████████ | 196888/217273 [03:38<00:21, 934.68 examples/s]Map:  90%|█████████ | 196396/217273 [03:36<00:23, 901.57 examples/s]Map:  91%|█████████ | 197549/217273 [03:37<00:21, 928.82 examples/s]Map:  91%|█████████ | 196985/217273 [03:38<00:21, 940.52 examples/s]Map:  90%|█████████ | 196498/217273 [03:36<00:22, 931.27 examples/s]Map:  89%|████████▉ | 193091/217273 [03:39<00:33, 730.97 examples/s]Map:  91%|█████████ | 197646/217273 [03:37<00:20, 937.30 examples/s]Map:  90%|█████████ | 196604/217273 [03:37<00:21, 963.28 examples/s]Map:  89%|████████▉ | 193184/217273 [03:39<00:31, 776.35 examples/s]Map:  91%|█████████ | 197748/217273 [03:37<00:20, 956.37 examples/s]Map:  91%|█████████ | 197096/217273 [03:39<00:25, 797.50 examples/s]Map:  89%|████████▉ | 193275/217273 [03:39<00:29, 807.50 examples/s]Map:  91%|█████████ | 196750/217273 [03:37<00:21, 964.11 examples/s]Map:  91%|█████████ | 197196/217273 [03:39<00:23, 843.69 examples/s]Map:  91%|█████████ | 197897/217273 [03:37<00:20, 963.44 examples/s]Map:  89%|████████▉ | 193366/217273 [03:39<00:28, 833.32 examples/s]Map:  91%|█████████ | 196856/217273 [03:37<00:20, 985.74 examples/s]Map:  91%|█████████ | 197292/217273 [03:39<00:23, 868.66 examples/s]Map:  89%|████████▉ | 193459/217273 [03:39<00:27, 857.90 examples/s]Map:  91%|█████████ | 196957/217273 [03:37<00:20, 989.20 examples/s]Map:  91%|█████████ | 197391/217273 [03:39<00:22, 897.97 examples/s]Map:  91%|█████████ | 198000/217273 [03:37<00:23, 812.76 examples/s]Map:  89%|████████▉ | 193549/217273 [03:39<00:27, 866.48 examples/s]Map:  91%|█████████ | 197488/217273 [03:39<00:21, 914.30 examples/s]Map:  91%|█████████ | 198099/217273 [03:37<00:22, 850.45 examples/s]Map:  89%|████████▉ | 193642/217273 [03:39<00:26, 884.13 examples/s]Map:  91%|█████████ | 197094/217273 [03:37<00:24, 827.59 examples/s]Map:  91%|█████████ | 197588/217273 [03:39<00:21, 933.38 examples/s]Map:  91%|█████████ | 198198/217273 [03:37<00:21, 882.76 examples/s]Map:  89%|████████▉ | 193733/217273 [03:39<00:26, 889.02 examples/s]Map:  91%|█████████ | 197689/217273 [03:39<00:20, 954.52 examples/s]Map:  91%|█████████ | 197197/217273 [03:37<00:23, 871.51 examples/s]Map:  91%|█████████▏| 198295/217273 [03:37<00:20, 904.31 examples/s]Map:  89%|████████▉ | 193830/217273 [03:39<00:25, 909.95 examples/s]Map:  91%|█████████ | 197299/217273 [03:37<00:22, 906.55 examples/s]Map:  91%|█████████ | 197790/217273 [03:39<00:20, 966.02 examples/s]Map:  91%|█████████▏| 198394/217273 [03:37<00:20, 922.36 examples/s]Map:  89%|████████▉ | 193923/217273 [03:40<00:25, 913.92 examples/s]Map:  91%|█████████ | 197399/217273 [03:37<00:21, 929.08 examples/s]Map:  91%|█████████ | 197891/217273 [03:39<00:19, 975.69 examples/s]Map:  91%|█████████▏| 198495/217273 [03:38<00:19, 943.10 examples/s]Map:  91%|█████████ | 197499/217273 [03:38<00:20, 947.08 examples/s]Map:  91%|█████████ | 197995/217273 [03:39<00:19, 993.75 examples/s]Map:  89%|████████▉ | 194050/217273 [03:40<00:30, 762.34 examples/s]Map:  91%|█████████ | 197636/217273 [03:38<00:21, 929.42 examples/s]Map:  89%|████████▉ | 194133/217273 [03:40<00:29, 777.56 examples/s]Map:  91%|█████████▏| 198637/217273 [03:38<00:26, 700.17 examples/s]Map:  91%|█████████ | 198137/217273 [03:40<00:23, 804.10 examples/s]Map:  91%|█████████ | 197737/217273 [03:38<00:20, 946.90 examples/s]Map:  89%|████████▉ | 194231/217273 [03:40<00:27, 825.86 examples/s]Map:  91%|█████████▏| 198735/217273 [03:38<00:24, 757.05 examples/s]Map:  91%|█████████ | 198245/217273 [03:40<00:22, 864.84 examples/s]Map:  91%|█████████ | 197835/217273 [03:38<00:20, 952.24 examples/s]Map:  89%|████████▉ | 194331/217273 [03:40<00:26, 870.35 examples/s]Map:  92%|█████████▏| 198836/217273 [03:38<00:22, 813.67 examples/s]Map:  91%|█████████▏| 198339/217273 [03:40<00:21, 879.38 examples/s]Map:  91%|█████████ | 197936/217273 [03:38<00:20, 965.16 examples/s]Map:  89%|████████▉ | 194429/217273 [03:40<00:25, 897.41 examples/s]Map:  92%|█████████▏| 198935/217273 [03:38<00:21, 855.10 examples/s]Map:  90%|████████▉ | 194529/217273 [03:40<00:24, 922.57 examples/s]Map:  91%|█████████▏| 198482/217273 [03:40<00:20, 902.14 examples/s]Map:  91%|█████████ | 198048/217273 [03:38<00:23, 806.10 examples/s]Map:  90%|████████▉ | 194630/217273 [03:40<00:23, 946.89 examples/s]Map:  92%|█████████▏| 199052/217273 [03:38<00:23, 759.68 examples/s]Map:  91%|█████████ | 198148/217273 [03:38<00:22, 852.77 examples/s]Map:  90%|████████▉ | 194730/217273 [03:40<00:23, 959.33 examples/s]Map:  92%|█████████▏| 199155/217273 [03:38<00:22, 820.57 examples/s]Map:  91%|█████████ | 198247/217273 [03:38<00:21, 884.01 examples/s]Map:  91%|█████████▏| 198592/217273 [03:40<00:29, 623.17 examples/s]Map:  92%|█████████▏| 199250/217273 [03:39<00:21, 846.91 examples/s]Map:  90%|████████▉ | 194874/217273 [03:41<00:23, 955.21 examples/s]Map:  91%|█████████▏| 198352/217273 [03:38<00:20, 927.45 examples/s]Map:  91%|█████████▏| 198688/217273 [03:40<00:27, 685.34 examples/s]Map:  92%|█████████▏| 199350/217273 [03:39<00:20, 883.46 examples/s]Map:  90%|████████▉ | 194972/217273 [03:41<00:23, 959.22 examples/s]Map:  91%|█████████▏| 198491/217273 [03:39<00:20, 924.74 examples/s]Map:  91%|█████████▏| 198791/217273 [03:41<00:24, 755.51 examples/s]Map:  92%|█████████▏| 199443/217273 [03:39<00:19, 894.14 examples/s]Map:  92%|█████████▏| 198893/217273 [03:41<00:22, 812.73 examples/s]Map:  92%|█████████▏| 199543/217273 [03:39<00:19, 921.61 examples/s]Map:  90%|████████▉ | 195088/217273 [03:41<00:27, 794.82 examples/s]Map:  92%|█████████▏| 198996/217273 [03:41<00:21, 862.90 examples/s]Map:  92%|█████████▏| 199644/217273 [03:39<00:18, 943.80 examples/s]Map:  90%|████████▉ | 195191/217273 [03:41<00:26, 847.69 examples/s]Map:  91%|█████████▏| 198591/217273 [03:39<00:27, 668.04 examples/s]Map:  92%|█████████▏| 199745/217273 [03:39<00:18, 952.54 examples/s]Map:  91%|█████████▏| 198690/217273 [03:39<00:25, 732.69 examples/s]Map:  90%|████████▉ | 195326/217273 [03:41<00:25, 860.73 examples/s]Map:  92%|█████████▏| 199095/217273 [03:41<00:24, 742.57 examples/s]Map:  92%|█████████▏| 199845/217273 [03:39<00:18, 963.75 examples/s]Map:  91%|█████████▏| 198786/217273 [03:39<00:23, 783.26 examples/s]Map:  90%|████████▉ | 195418/217273 [03:41<00:25, 872.43 examples/s]Map:  92%|█████████▏| 199197/217273 [03:41<00:22, 806.47 examples/s]Map:  92%|█████████▏| 199945/217273 [03:39<00:17, 971.24 examples/s]Map:  92%|█████████▏| 198891/217273 [03:39<00:21, 847.10 examples/s]Map:  90%|████████▉ | 195516/217273 [03:41<00:24, 898.63 examples/s]Map:  92%|█████████▏| 199296/217273 [03:41<00:21, 848.63 examples/s]Map:  92%|█████████▏| 198992/217273 [03:39<00:20, 886.85 examples/s]Map:  90%|█████████ | 195615/217273 [03:41<00:23, 920.48 examples/s]Map:  92%|█████████▏| 199402/217273 [03:41<00:19, 902.22 examples/s]Map:  92%|█████████▏| 200050/217273 [03:39<00:21, 798.47 examples/s]Map:  90%|█████████ | 195710/217273 [03:42<00:23, 923.85 examples/s]Map:  92%|█████████▏| 199506/217273 [03:41<00:18, 938.18 examples/s]Map:  92%|█████████▏| 200148/217273 [03:40<00:20, 841.94 examples/s]Map:  92%|█████████▏| 199096/217273 [03:39<00:24, 755.64 examples/s]Map:  90%|█████████ | 195807/217273 [03:42<00:22, 935.69 examples/s]Map:  92%|█████████▏| 199608/217273 [03:41<00:18, 957.50 examples/s]Map:  92%|█████████▏| 200254/217273 [03:40<00:18, 898.61 examples/s]Map:  92%|█████████▏| 199192/217273 [03:40<00:22, 800.37 examples/s]Map:  90%|█████████ | 195908/217273 [03:42<00:22, 955.99 examples/s]Map:  92%|█████████▏| 199711/217273 [03:42<00:17, 976.29 examples/s]Map:  92%|█████████▏| 200355/217273 [03:40<00:18, 928.38 examples/s]Map:  92%|█████████▏| 199289/217273 [03:40<00:21, 839.76 examples/s]Map:  92%|█████████▏| 199816/217273 [03:42<00:17, 992.81 examples/s]Map:  92%|█████████▏| 200457/217273 [03:40<00:17, 952.72 examples/s]Map:  92%|█████████▏| 199392/217273 [03:40<00:20, 886.79 examples/s]Map:  90%|█████████ | 196048/217273 [03:42<00:26, 807.32 examples/s]Map:  92%|█████████▏| 199917/217273 [03:42<00:17, 994.49 examples/s]Map:  92%|█████████▏| 200559/217273 [03:40<00:17, 970.29 examples/s]Map:  92%|█████████▏| 199499/217273 [03:40<00:19, 933.08 examples/s]Map:  90%|█████████ | 196140/217273 [03:42<00:25, 831.92 examples/s]Map:  92%|█████████▏| 200659/217273 [03:40<00:17, 976.89 examples/s]Map:  92%|█████████▏| 199600/217273 [03:40<00:18, 951.71 examples/s]Map:  90%|█████████ | 196235/217273 [03:42<00:24, 859.58 examples/s]Map:  92%|█████████▏| 200048/217273 [03:42<00:20, 834.51 examples/s]Map:  92%|█████████▏| 200802/217273 [03:40<00:17, 963.68 examples/s]Map:  90%|█████████ | 196328/217273 [03:42<00:23, 874.19 examples/s]Map:  92%|█████████▏| 200151/217273 [03:42<00:19, 880.33 examples/s]Map:  92%|█████████▏| 199749/217273 [03:40<00:18, 963.35 examples/s]Map:  92%|█████████▏| 200906/217273 [03:40<00:16, 978.55 examples/s]Map:  90%|█████████ | 196423/217273 [03:42<00:23, 892.66 examples/s]Map:  92%|█████████▏| 200254/217273 [03:42<00:18, 914.25 examples/s]Map:  92%|█████████▏| 199853/217273 [03:40<00:17, 979.31 examples/s]Map:  90%|█████████ | 196556/217273 [03:43<00:23, 884.02 examples/s]Map:  92%|█████████▏| 200397/217273 [03:42<00:18, 925.20 examples/s]Map:  92%|█████████▏| 199997/217273 [03:40<00:17, 969.53 examples/s]Map:  93%|█████████▎| 201051/217273 [03:41<00:19, 830.81 examples/s]Map:  91%|█████████ | 196651/217273 [03:43<00:22, 898.10 examples/s]Map:  92%|█████████▏| 200501/217273 [03:42<00:17, 951.69 examples/s]Map:  93%|█████████▎| 201150/217273 [03:41<00:18, 864.47 examples/s]Map:  92%|█████████▏| 200099/217273 [03:41<00:20, 818.10 examples/s]Map:  92%|█████████▏| 200608/217273 [03:43<00:17, 977.53 examples/s]Map:  93%|█████████▎| 201254/217273 [03:41<00:17, 903.92 examples/s]Map:  91%|█████████ | 196783/217273 [03:43<00:23, 889.66 examples/s]Map:  92%|█████████▏| 200203/217273 [03:41<00:19, 866.22 examples/s]Map:  93%|█████████▎| 201353/217273 [03:41<00:17, 924.25 examples/s]Map:  92%|█████████▏| 200747/217273 [03:43<00:17, 957.26 examples/s]Map:  92%|█████████▏| 200296/217273 [03:41<00:19, 880.37 examples/s]Map:  91%|█████████ | 196915/217273 [03:43<00:23, 879.59 examples/s]Map:  93%|█████████▎| 201454/217273 [03:41<00:16, 944.01 examples/s]Map:  92%|█████████▏| 200856/217273 [03:43<00:16, 984.04 examples/s]Map:  92%|█████████▏| 200388/217273 [03:41<00:18, 888.77 examples/s]Map:  93%|█████████▎| 201559/217273 [03:41<00:16, 968.79 examples/s]Map:  92%|█████████▏| 200488/217273 [03:41<00:18, 917.02 examples/s]Map:  91%|█████████ | 197042/217273 [03:43<00:26, 751.93 examples/s]Map:  93%|█████████▎| 201658/217273 [03:41<00:16, 973.50 examples/s]Map:  93%|█████████▎| 201000/217273 [03:43<00:19, 833.96 examples/s]Map:  92%|█████████▏| 200587/217273 [03:41<00:17, 935.32 examples/s]Map:  91%|█████████ | 197137/217273 [03:43<00:25, 791.28 examples/s]Map:  93%|█████████▎| 201761/217273 [03:41<00:15, 984.62 examples/s]Map:  93%|█████████▎| 201101/217273 [03:43<00:18, 872.15 examples/s]Map:  92%|█████████▏| 200684/217273 [03:41<00:17, 942.12 examples/s]Map:  91%|█████████ | 197226/217273 [03:43<00:24, 811.52 examples/s]Map:  93%|█████████▎| 201198/217273 [03:43<00:18, 891.44 examples/s]Map:  93%|█████████▎| 201910/217273 [03:41<00:15, 986.50 examples/s]Map:  92%|█████████▏| 200782/217273 [03:41<00:17, 950.62 examples/s]Map:  91%|█████████ | 197311/217273 [03:44<00:24, 818.85 examples/s]Map:  93%|█████████▎| 201301/217273 [03:43<00:17, 923.40 examples/s]Map:  92%|█████████▏| 200883/217273 [03:41<00:17, 962.99 examples/s]Map:  91%|█████████ | 197403/217273 [03:44<00:23, 843.15 examples/s]Map:  93%|█████████▎| 201400/217273 [03:43<00:16, 939.11 examples/s]Map:  93%|█████████▎| 200985/217273 [03:41<00:16, 973.91 examples/s]Map:  93%|█████████▎| 202049/217273 [03:42<00:18, 835.17 examples/s]Map:  91%|█████████ | 197498/217273 [03:44<00:22, 867.04 examples/s]Map:  93%|█████████▎| 201501/217273 [03:43<00:16, 956.20 examples/s]Map:  93%|█████████▎| 202146/217273 [03:42<00:17, 864.59 examples/s]Map:  91%|█████████ | 197620/217273 [03:44<00:23, 846.18 examples/s]Map:  93%|█████████▎| 201087/217273 [03:42<00:20, 779.31 examples/s]Map:  93%|█████████▎| 201639/217273 [03:44<00:16, 941.22 examples/s]Map:  93%|█████████▎| 202278/217273 [03:42<00:17, 866.88 examples/s]Map:  91%|█████████ | 197711/217273 [03:44<00:22, 859.00 examples/s]Map:  93%|█████████▎| 201183/217273 [03:42<00:19, 823.20 examples/s]Map:  93%|█████████▎| 201735/217273 [03:44<00:16, 943.78 examples/s]Map:  93%|█████████▎| 202378/217273 [03:42<00:16, 897.40 examples/s]Map:  93%|█████████▎| 201281/217273 [03:42<00:18, 860.87 examples/s]Map:  91%|█████████ | 197844/217273 [03:44<00:22, 867.90 examples/s]Map:  93%|█████████▎| 201839/217273 [03:44<00:15, 968.14 examples/s]Map:  93%|█████████▎| 202476/217273 [03:42<00:16, 917.07 examples/s]Map:  93%|█████████▎| 201382/217273 [03:42<00:17, 898.97 examples/s]Map:  91%|█████████ | 197933/217273 [03:44<00:22, 872.03 examples/s]Map:  93%|█████████▎| 201939/217273 [03:44<00:15, 974.26 examples/s]Map:  93%|█████████▎| 202573/217273 [03:42<00:15, 929.59 examples/s]Map:  93%|█████████▎| 201481/217273 [03:42<00:17, 921.75 examples/s]Map:  93%|█████████▎| 201580/217273 [03:42<00:16, 935.85 examples/s]Map:  93%|█████████▎| 202713/217273 [03:42<00:15, 928.57 examples/s]Map:  93%|█████████▎| 202048/217273 [03:44<00:18, 816.26 examples/s]Map:  91%|█████████ | 198045/217273 [03:44<00:25, 739.90 examples/s]Map:  93%|█████████▎| 201684/217273 [03:42<00:16, 964.71 examples/s]Map:  93%|█████████▎| 202808/217273 [03:42<00:15, 932.56 examples/s]Map:  93%|█████████▎| 202146/217273 [03:44<00:17, 852.79 examples/s]Map:  91%|█████████ | 198131/217273 [03:45<00:25, 764.45 examples/s]Map:  93%|█████████▎| 201784/217273 [03:42<00:15, 968.38 examples/s]Map:  93%|█████████▎| 202905/217273 [03:43<00:15, 939.25 examples/s]Map:  93%|█████████▎| 202248/217273 [03:44<00:16, 894.74 examples/s]Map:  91%|█████████ | 198214/217273 [03:45<00:24, 778.68 examples/s]Map:  93%|█████████▎| 201883/217273 [03:42<00:15, 969.90 examples/s]Map:  93%|█████████▎| 202345/217273 [03:44<00:16, 914.46 examples/s]Map:  93%|█████████▎| 203000/217273 [03:43<00:18, 790.84 examples/s]Map:  91%|█████████▏| 198328/217273 [03:45<00:24, 768.72 examples/s]Map:  93%|█████████▎| 202448/217273 [03:45<00:15, 943.65 examples/s]Map:  93%|█████████▎| 203101/217273 [03:43<00:16, 843.72 examples/s]Map:  91%|█████████▏| 198418/217273 [03:45<00:23, 797.87 examples/s]Map:  93%|█████████▎| 202000/217273 [03:43<00:19, 799.93 examples/s]Map:  93%|█████████▎| 202591/217273 [03:45<00:15, 943.96 examples/s]Map:  94%|█████████▎| 203204/217273 [03:43<00:15, 888.67 examples/s]Map:  91%|█████████▏| 198512/217273 [03:45<00:22, 832.43 examples/s]Map:  93%|█████████▎| 202102/217273 [03:43<00:17, 851.81 examples/s]Map:  94%|█████████▎| 203311/217273 [03:43<00:14, 936.37 examples/s]Map:  93%|█████████▎| 202202/217273 [03:43<00:17, 885.99 examples/s]Map:  93%|█████████▎| 202735/217273 [03:45<00:15, 943.64 examples/s]Map:  94%|███████���█▎| 203410/217273 [03:43<00:14, 948.10 examples/s]Map:  93%|█████████▎| 202299/217273 [03:43<00:16, 907.15 examples/s]Map:  91%|█████████▏| 198626/217273 [03:45<00:30, 615.29 examples/s]Map:  93%|█████████▎| 202873/217273 [03:45<00:15, 934.85 examples/s]Map:  93%|█████████▎| 202394/217273 [03:43<00:16, 918.37 examples/s]Map:  94%|█████████▎| 203551/217273 [03:43<00:14, 939.84 examples/s]Map:  91%|█████████▏| 198723/217273 [03:45<00:27, 686.93 examples/s]Map:  93%|█████████▎| 202501/217273 [03:43<00:15, 957.21 examples/s]Map:  94%|█████████▎| 203652/217273 [03:43<00:14, 953.59 examples/s]Map:  92%|█████████▏| 198812/217273 [03:45<00:25, 732.05 examples/s]Map:  93%|█████████▎| 203000/217273 [03:45<00:17, 797.16 examples/s]Map:  93%|█████████▎| 202611/217273 [03:43<00:14, 992.86 examples/s]Map:  94%|█████████▍| 203753/217273 [03:43<00:13, 966.99 examples/s]Map:  92%|█████████▏| 198912/217273 [03:46<00:23, 794.85 examples/s]Map:  93%|█████████▎| 203095/217273 [03:45<00:17, 826.40 examples/s]Map:  93%|█████████▎| 202714/217273 [03:43<00:14, 999.64 examples/s]Map:  94%|█████████▍| 203857/217273 [03:44<00:13, 985.95 examples/s]Map:  94%|█████████▎| 203190/217273 [03:45<00:16, 851.59 examples/s]Map:  92%|█████████▏| 199000/217273 [03:46<00:25, 705.67 examples/s]Map:  93%|█████████▎| 202857/217273 [03:44<00:14, 979.12 examples/s]Map:  94%|█████████▎| 203288/217273 [03:46<00:15, 879.92 examples/s]Map:  92%|█████████▏| 199094/217273 [03:46<00:23, 760.48 examples/s]Map:  94%|█████████▍| 204000/217273 [03:44<00:16, 827.79 examples/s]Map:  94%|█████████▎| 203391/217273 [03:46<00:15, 915.62 examples/s]Map:  93%|█████████▎| 202998/217273 [03:44<00:14, 960.18 examples/s]Map:  92%|█████████▏| 199190/217273 [03:46<00:22, 808.04 examples/s]Map:  94%|█████████▍| 204098/217273 [03:44<00:15, 861.81 examples/s]Map:  94%|█████████▎| 203494/217273 [03:46<00:14, 945.11 examples/s]Map:  92%|█████████▏| 199283/217273 [03:46<00:21, 837.66 examples/s]Map:  94%|█████████▍| 204200/217273 [03:44<00:14, 895.56 examples/s]Map:  94%|█████████▎| 203599/217273 [03:46<00:14, 972.34 examples/s]Map:  93%|█████████▎| 203144/217273 [03:44<00:17, 824.68 examples/s]Map:  92%|█████████▏| 199377/217273 [03:46<00:20, 864.00 examples/s]Map:  94%|█████████▍| 204299/217273 [03:44<00:14, 917.59 examples/s]Map:  94%|█████████▍| 203705/217273 [03:46<00:13, 996.36 examples/s]Map:  94%|█████████▎| 203245/217273 [03:44<00:16, 861.77 examples/s]Map:  92%|█████████▏| 199470/217273 [03:46<00:20, 878.53 examples/s]Map:  94%|█████████▍| 204400/217273 [03:44<00:13, 940.68 examples/s]Map:  94%|█████████▍| 203806/217273 [03:46<00:13, 999.10 examples/s]Map:  94%|█████████▎| 203347/217273 [03:44<00:15, 896.81 examples/s]Map:  94%|█████████▍| 204508/217273 [03:44<00:13, 975.59 examples/s]Map:  92%|█████████▏| 199607/217273 [03:46<00:19, 885.95 examples/s]Map:  94%|█████████▍| 203909/217273 [03:46<00:13, 1003.40 examples/s]Map:  94%|█████████▎| 203448/217273 [03:44<00:15, 919.13 examples/s]Map:  92%|█████████▏| 199700/217273 [03:46<00:19, 896.43 examples/s]Map:  94%|█████████▍| 204659/217273 [03:44<00:12, 975.55 examples/s]Map:  94%|█████████▎| 203547/217273 [03:44<00:14, 935.80 examples/s]Map:  94%|█████████▍| 204040/217273 [03:46<00:16, 813.34 examples/s] Map:  92%|█████████▏| 199828/217273 [03:47<00:19, 876.27 examples/s]Map:  94%|█████████▍| 204798/217273 [03:45<00:13, 953.67 examples/s]Map:  94%|█████████▎| 203686/217273 [03:44<00:14, 930.83 examples/s]Map:  94%|█████████▍| 204136/217273 [03:46<00:15, 847.75 examples/s]Map:  94%|█████████▍| 204905/217273 [03:45<00:12, 979.23 examples/s]Map:  94%|█████████▍| 203788/217273 [03:45<00:14, 950.93 examples/s]Map:  92%|█████████▏| 199964/217273 [03:47<00:19, 880.31 examples/s]Map:  94%|█████████▍| 204237/217273 [03:47<00:14, 886.50 examples/s]Map:  94%|█████████▍| 203888/217273 [03:45<00:13, 962.11 examples/s]Map:  94%|█████████▍| 204337/217273 [03:47<00:14, 912.86 examples/s]Map:  94%|█████████▍| 205049/217273 [03:45<00:14, 849.30 examples/s]Map:  94%|█████████▍| 203990/217273 [03:45<00:13, 973.89 examples/s]Map:  92%|█████████▏| 200090/217273 [03:47<00:22, 759.78 examples/s]Map:  94%|█████████▍| 204436/217273 [03:47<00:13, 931.60 examples/s]Map:  94%|█████████▍| 205149/217273 [03:45<00:13, 880.71 examples/s]Map:  92%|█████████▏| 200184/217273 [03:47<00:21, 796.05 examples/s]Map:  94%|█████████▍| 204539/217273 [03:47<00:13, 955.38 examples/s]Map:  94%|█████████▍| 204097/217273 [03:45<00:16, 810.63 examples/s]Map:  94%|█████████▍| 205250/217273 [03:45<00:13, 910.94 examples/s]Map:  92%|█████████▏| 200274/217273 [03:47<00:20, 820.08 examples/s]Map:  94%|█████████▍| 204642/217273 [03:47<00:12, 973.70 examples/s]Map:  94%|█████████▍| 204199/217273 [03:45<00:15, 860.17 examples/s]Map:  95%|█████████▍| 205352/217273 [03:45<00:12, 936.32 examples/s]Map:  92%|█████████▏| 200365/217273 [03:47<00:20, 840.05 examples/s]Map:  94%|█████████▍| 204743/217273 [03:47<00:12, 979.77 examples/s]Map:  94%|█████████▍| 204295/217273 [03:45<00:14, 883.65 examples/s]Map:  95%|█████████▍| 205453/217273 [03:45<00:12, 954.15 examples/s]Map:  92%|█████████▏| 200457/217273 [03:47<00:19, 859.74 examples/s]Map:  94%|█████████▍| 204396/217273 [03:45<00:14, 915.68 examples/s]Map:  94%|█████████▍| 204890/217273 [03:47<00:12, 977.08 examples/s]Map:  92%|█████████▏| 200546/217273 [03:47<00:19, 864.53 examples/s]Map:  95%|█████████▍| 205599/217273 [03:45<00:12, 956.61 examples/s]Map:  94%|█████████▍| 204496/217273 [03:45<00:13, 938.38 examples/s]Map:  92%|█████████▏| 200636/217273 [03:48<00:19, 870.56 examples/s]Map:  95%|█████████▍| 205699/217273 [03:46<00:11, 966.91 examples/s]Map:  94%|█████████▍| 205000/217273 [03:47<00:15, 814.84 examples/s]Map:  94%|█████████▍| 204596/217273 [03:45<00:13, 952.08 examples/s]Map:  95%|█████████▍| 205798/217273 [03:46<00:11, 969.98 examples/s]Map:  94%|█████████▍| 205104/217273 [03:47<00:14, 865.29 examples/s]Map:  92%|█████████▏| 200764/217273 [03:48<00:19, 861.17 examples/s]Map:  94%|█████████▍| 204700/217273 [03:46<00:12, 973.92 examples/s]Map:  95%|█████████▍| 205900/217273 [03:46<00:11, 981.25 examples/s]Map:  94%|█████████▍| 205205/217273 [03:48<00:13, 895.42 examples/s]Map:  92%|█████████▏| 200855/217273 [03:48<00:18, 870.33 examples/s]Map:  94%|█████████▍| 204799/217273 [03:46<00:12, 975.10 examples/s]Map:  95%|█████████▍| 205348/217273 [03:48<00:13, 909.17 examples/s]Map:  92%|█████████▏| 200973/217273 [03:48<00:19, 834.59 examples/s]Map:  95%|█████████▍| 206000/217273 [03:46<00:14, 784.60 examples/s]Map:  94%|█████████▍| 204936/217273 [03:46<00:13, 944.65 examples/s]Map:  95%|█████████▍| 205446/217273 [03:48<00:12, 924.57 examples/s]Map:  95%|█████████▍| 206099/217273 [03:46<00:13, 831.79 examples/s]Map:  94%|█████████▍| 205051/217273 [03:46<00:15, 807.83 examples/s]Map:  95%|█████████▍| 206192/217273 [03:46<00:12, 855.76 examples/s]Map:  93%|█████████▎| 201089/217273 [03:48<00:22, 717.19 examples/s]Map:  95%|█████████▍| 205588/217273 [03:48<00:12, 927.11 examples/s]Map:  94%|█████████▍| 205160/217273 [03:46<00:13, 873.16 examples/s]Map:  95%|█████████▍| 206293/217273 [03:46<00:12, 892.24 examples/s]Map:  93%|█████████▎| 201178/217273 [03:48<00:21, 753.80 examples/s]Map:  95%|█████████▍| 205692/217273 [03:48<00:12, 954.53 examples/s]Map:  94%|█████████▍| 205264/217273 [03:46<00:13, 910.59 examples/s]Map:  95%|█████████▍| 206392/217273 [03:46<00:11, 916.27 examples/s]Map:  93%|█████████▎| 201265/217273 [03:48<00:20, 779.74 examples/s]Map:  95%|█████████▍| 205797/217273 [03:48<00:11, 977.17 examples/s]Map:  95%|█████████▍| 205366/217273 [03:46<00:12, 936.52 examples/s]Map:  95%|█████████▌| 206492/217273 [03:46<00:11, 936.24 examples/s]Map:  93%|█████████▎| 201373/217273 [03:49<00:21, 753.70 examples/s]Map:  95%|█████████▍| 205469/217273 [03:46<00:12, 961.20 examples/s]Map:  95%|████████���▍| 205950/217273 [03:48<00:11, 989.38 examples/s]Map:  95%|█████████▌| 206594/217273 [03:47<00:11, 956.56 examples/s]Map:  95%|█████████▌| 206697/217273 [03:47<00:10, 975.87 examples/s]Map:  93%|█████████▎| 201483/217273 [03:49<00:21, 742.77 examples/s]Map:  95%|█████████▍| 205619/217273 [03:47<00:12, 968.45 examples/s]Map:  95%|█████████▍| 206052/217273 [03:49<00:13, 836.99 examples/s]Map:  95%|█████████▌| 206800/217273 [03:47<00:10, 986.89 examples/s]Map:  93%|█████████▎| 201573/217273 [03:49<00:20, 777.17 examples/s]Map:  95%|█████████▍| 205722/217273 [03:47<00:11, 982.66 examples/s]Map:  95%|█████████▍| 206158/217273 [03:49<00:12, 887.54 examples/s]Map:  95%|█████████▌| 206902/217273 [03:47<00:10, 993.53 examples/s]Map:  93%|█████████▎| 201661/217273 [03:49<00:19, 801.72 examples/s]Map:  95%|█████████▍| 206262/217273 [03:49<00:11, 920.86 examples/s]Map:  95%|█████████▍| 205872/217273 [03:47<00:11, 984.50 examples/s]Map:  93%|█████████▎| 201749/217273 [03:49<00:18, 817.57 examples/s]Map:  95%|█████████▍| 206363/217273 [03:49<00:11, 943.30 examples/s]Map:  95%|█████████▍| 205974/217273 [03:47<00:11, 990.69 examples/s]Map:  93%|█████████▎| 201837/217273 [03:49<00:18, 831.16 examples/s]Map:  95%|█████████▌| 207052/217273 [03:47<00:12, 842.14 examples/s]Map:  95%|█████████▌| 206465/217273 [03:49<00:11, 960.04 examples/s]Map:  93%|█████████▎| 201928/217273 [03:49<00:18, 849.07 examples/s]Map:  95%|█████████▌| 207155/217273 [03:47<00:11, 883.62 examples/s]Map:  95%|█████████▍| 206096/217273 [03:47<00:13, 832.16 examples/s]Map:  95%|█████████▌| 206607/217273 [03:49<00:11, 952.00 examples/s]Map:  95%|█████████▌| 207286/217273 [03:47<00:11, 876.97 examples/s]Map:  95%|█████████▍| 206191/217273 [03:47<00:12, 855.57 examples/s]Map:  93%|█████████▎| 202045/217273 [03:49<00:21, 708.00 examples/s]Map:  95%|█████████▌| 206754/217273 [03:49<00:10, 958.41 examples/s]Map:  95%|█████████▌| 207387/217273 [03:47<00:10, 905.43 examples/s]Map:  95%|█████████▍| 206290/217273 [03:47<00:12, 884.47 examples/s]Map:  93%|█████████▎| 202135/217273 [03:50<00:20, 750.57 examples/s]Map:  95%|█████████▌| 206857/217273 [03:49<00:10, 972.36 examples/s]Map:  95%|█████████▌| 207483/217273 [03:48<00:10, 917.89 examples/s]Map:  95%|█████████▍| 206387/217273 [03:47<00:12, 905.89 examples/s]Map:  93%|█████████▎| 202222/217273 [03:50<00:19, 778.10 examples/s]Map:  96%|█████████▌| 207580/217273 [03:48<00:10, 930.25 examples/s]Map:  95%|█████████▌| 206484/217273 [03:48<00:11, 920.68 examples/s]Map:  93%|█████████▎| 202312/217273 [03:50<00:18, 808.09 examples/s]Map:  96%|█████████▌| 207681/217273 [03:48<00:10, 950.20 examples/s]Map:  95%|█████████▌| 207000/217273 [03:50<00:12, 835.45 examples/s]Map:  95%|█████████▌| 206588/217273 [03:48<00:11, 949.61 examples/s]Map:  93%|█████████▎| 202399/217273 [03:50<00:18, 822.18 examples/s]Map:  95%|█████████▌| 207099/217273 [03:50<00:11, 867.61 examples/s]Map:  95%|█████████▌| 206689/217273 [03:48<00:10, 964.54 examples/s]Map:  96%|█████████▌| 207820/217273 [03:48<00:10, 938.45 examples/s]Map:  93%|█████████▎| 202485/217273 [03:50<00:17, 830.58 examples/s]Map:  95%|█████████▌| 207202/217273 [03:50<00:11, 903.71 examples/s]Map:  96%|█████████▌| 207916/217273 [03:48<00:09, 940.57 examples/s]Map:  93%|█████████▎| 202574/217273 [03:50<00:17, 845.80 examples/s]Map:  95%|█████████▌| 206836/217273 [03:48<00:10, 966.63 examples/s]Map:  95%|█████████▌| 207300/217273 [03:50<00:10, 921.04 examples/s]Map:  93%|█████████▎| 202702/217273 [03:50<00:17, 844.39 examples/s]Map:  95%|█████████▌| 207402/217273 [03:50<00:10, 940.91 examples/s]Map:  95%|█████████▌| 206983/217273 [03:48<00:10, 964.79 examples/s]Map:  96%|█████████▌| 208047/217273 [03:48<00:11, 803.95 examples/s]Map:  93%|█████████▎| 202794/217273 [03:50<00:16, 862.63 examples/s]Map:  96%|█████████▌| 207503/217273 [03:50<00:10, 955.02 examples/s]Map:  96%|█████████▌| 208148/217273 [03:48<00:10, 848.61 examples/s]Map:  95%|█████████▌| 207098/217273 [03:48<00:12, 818.42 examples/s]Map:  93%|█████████▎| 202916/217273 [03:50<00:17, 842.73 examples/s]Map:  96%|█████████▌| 208250/217273 [03:48<00:10, 889.60 examples/s]Map:  96%|█████████▌| 207649/217273 [03:50<00:10, 960.61 examples/s]Map:  95%|█████████▌| 207200/217273 [03:48<00:11, 863.00 examples/s]Map:  96%|█████████▌| 208351/217273 [03:49<00:09, 918.12 examples/s]Map:  96%|█████████▌| 207747/217273 [03:50<00:09, 963.71 examples/s]Map:  95%|█████████▌| 207301/217273 [03:48<00:11, 896.89 examples/s]Map:  96%|█████████▌| 208451/217273 [03:49<00:09, 936.19 examples/s]Map:  96%|█████████▌| 207846/217273 [03:50<00:09, 965.40 examples/s]Map:  93%|█████████▎| 203040/217273 [03:51<00:19, 715.42 examples/s]Map:  95%|█████████▌| 207437/217273 [03:49<00:10, 896.35 examples/s]Map:  93%|█████████▎| 203122/217273 [03:51<00:19, 734.63 examples/s]Map:  96%|█████████▌| 208590/217273 [03:49<00:09, 931.29 examples/s]Map:  96%|█████████▌| 207982/217273 [03:51<00:09, 940.97 examples/s]Map:  96%|█████████▌| 207536/217273 [03:49<00:10, 916.25 examples/s]Map:  94%|█████████▎| 203212/217273 [03:51<00:18, 771.89 examples/s]Map:  96%|█████████▌| 208686/217273 [03:49<00:09, 936.34 examples/s]Map:  96%|█████████▌| 207637/217273 [03:49<00:10, 936.52 examples/s]Map:  94%|█████████▎| 203303/217273 [03:51<00:17, 802.10 examples/s]Map:  96%|█████████▌| 208104/217273 [03:51<00:11, 813.76 examples/s]Map:  96%|█████████▌| 208787/217273 [03:49<00:08, 953.42 examples/s]Map:  96%|█████████▌| 207735/217273 [03:49<00:10, 943.46 examples/s]Map:  94%|█████████▎| 203388/217273 [03:51<00:17, 810.97 examples/s]Map:  96%|█████████▌| 208207/217273 [03:51<00:10, 860.45 examples/s]Map:  96%|█████████▌| 208891/217273 [03:49<00:08, 975.75 examples/s]Map:  96%|█████████▌| 207841/217273 [03:49<00:09, 970.12 examples/s]Map:  94%|█████████▎| 203474/217273 [03:51<00:16, 821.90 examples/s]Map:  96%|█████████▌| 208310/217273 [03:51<00:09, 899.50 examples/s]Map:  96%|█████████▌| 208992/217273 [03:49<00:08, 981.90 examples/s]Map:  94%|█████████▎| 203560/217273 [03:51<00:16, 829.80 examples/s]Map:  96%|█████████▌| 208414/217273 [03:51<00:09, 932.43 examples/s]Map:  96%|█████████▌| 207980/217273 [03:49<00:09, 951.85 examples/s]Map:  94%|█████████▎| 203647/217273 [03:51<00:16, 840.43 examples/s]Map:  96%|█████████▌| 209100/217273 [03:49<00:10, 813.40 examples/s]Map:  96%|█████████▌| 208520/217273 [03:51<00:09, 964.07 examples/s]Map:  94%|█████████▍| 203735/217273 [03:51<00:15, 849.95 examples/s]Map:  96%|█████████▋| 209208/217273 [03:49<00:09, 875.72 examples/s]Map:  96%|█████████▌| 208097/217273 [03:49<00:11, 814.41 examples/s]Map:  96%|█████████▌| 208623/217273 [03:51<00:08, 978.58 examples/s]Map:  96%|█████████▋| 209308/217273 [03:50<00:08, 904.85 examples/s]Map:  96%|█████████▌| 208197/217273 [03:49<00:10, 853.49 examples/s]Map:  96%|█████████▌| 208725/217273 [03:51<00:08, 987.69 examples/s]Map:  94%|█████████▍| 203864/217273 [03:52<00:15, 850.69 examples/s]Map:  96%|█████████▋| 209416/217273 [03:50<00:08, 948.59 examples/s]Map:  96%|█████████▌| 208295/217273 [03:50<00:10, 882.09 examples/s]Map:  96%|█████████▌| 208826/217273 [03:51<00:08, 990.71 examples/s]Map:  94%|█████████▍| 203952/217273 [03:52<00:15, 857.05 examples/s]Map:  96%|█████████▋| 209518/217273 [03:50<00:08, 966.22 examples/s]Map:  96%|█████████▌| 208394/217273 [03:50<00:09, 909.09 examples/s]Map:  96%|█████████▌| 208935/217273 [03:52<00:08, 1015.55 examples/s]Map:  96%|█████████▋| 209622/217273 [03:50<00:07, 986.75 examples/s]Map:  96%|█████████▌| 208496/217273 [03:50<00:09, 935.37 examples/s]Map:  94%|█████████▍| 204040/217273 [03:52<00:18, 701.48 examples/s]Map:  96%|█████████▌| 209047/217273 [03:52<00:09, 847.62 examples/s] Map:  94%|█████████▍| 204140/217273 [03:52<00:17, 770.98 examples/s]Map:  97%|█████████▋| 209766/217273 [03:50<00:07, 970.81 examples/s]Map:  96%|█████████���| 208629/217273 [03:50<00:09, 916.16 examples/s]Map:  94%|█████████▍| 204229/217273 [03:52<00:16, 799.53 examples/s]Map:  96%|█████████▋| 209183/217273 [03:52<00:09, 862.69 examples/s]Map:  97%|█████████▋| 209868/217273 [03:50<00:07, 983.03 examples/s]Map:  96%|█████████▌| 208728/217273 [03:50<00:09, 933.28 examples/s]Map:  94%|█████████▍| 204325/217273 [03:52<00:15, 838.74 examples/s]Map:  96%|█████████▋| 209285/217273 [03:52<00:08, 899.58 examples/s]Map:  97%|█████████▋| 209969/217273 [03:50<00:07, 988.28 examples/s]Map:  96%|█████████▌| 208870/217273 [03:50<00:08, 935.98 examples/s]Map:  94%|█████████▍| 204423/217273 [03:52<00:14, 876.70 examples/s]Map:  96%|█████████▋| 209386/217273 [03:52<00:08, 924.57 examples/s]Map:  96%|█████████▌| 208970/217273 [03:50<00:08, 950.27 examples/s]Map:  94%|█████████▍| 204523/217273 [03:52<00:14, 900.57 examples/s]Map:  96%|█████████▋| 209485/217273 [03:52<00:08, 938.70 examples/s]Map:  97%|█████████▋| 210101/217273 [03:50<00:08, 839.87 examples/s]Map:  94%|█████████▍| 204620/217273 [03:53<00:13, 915.09 examples/s]Map:  96%|█████████▋| 209584/217273 [03:52<00:08, 950.70 examples/s]Map:  97%|█████████▋| 210204/217273 [03:51<00:08, 880.25 examples/s]Map:  96%|█████████▌| 209098/217273 [03:50<00:10, 813.83 examples/s]Map:  94%|█████████▍| 204719/217273 [03:53<00:13, 928.72 examples/s]Map:  97%|█████████▋| 210308/217273 [03:51<00:07, 918.10 examples/s]Map:  97%|█████████▋| 209733/217273 [03:52<00:07, 963.21 examples/s]Map:  96%|█████████▋| 209195/217273 [03:51<00:09, 846.02 examples/s]Map:  94%|█████████▍| 204813/217273 [03:53<00:13, 930.68 examples/s]Map:  97%|█████████▋| 209836/217273 [03:53<00:07, 977.30 examples/s]Map:  97%|█████████▋| 210453/217273 [03:51<00:07, 929.73 examples/s]Map:  96%|█████████▋| 209297/217273 [03:51<00:09, 886.14 examples/s]Map:  94%|█████████▍| 204950/217273 [03:53<00:13, 919.25 examples/s]Map:  97%|█████████▋| 209941/217273 [03:53<00:07, 994.53 examples/s]Map:  97%|█████████▋| 210559/217273 [03:51<00:06, 960.43 examples/s]Map:  96%|█████████▋| 209401/217273 [03:51<00:08, 923.96 examples/s]Map:  97%|█████████▋| 210662/217273 [03:51<00:06, 974.38 examples/s]Map:  96%|█████████▋| 209506/217273 [03:51<00:08, 955.78 examples/s]Map:  97%|█████████▋| 210048/217273 [03:53<00:08, 832.45 examples/s]Map:  97%|█████████▋| 210764/217273 [03:51<00:06, 984.47 examples/s]Map:  94%|█████████▍| 205086/217273 [03:53<00:15, 767.76 examples/s]Map:  96%|█████████▋| 209611/217273 [03:51<00:07, 975.78 examples/s]Map:  97%|█████████▋| 210149/217273 [03:53<00:08, 874.86 examples/s]Map:  97%|█████████▋| 210867/217273 [03:51<00:06, 994.22 examples/s]Map:  94%|█████████▍| 205180/217273 [03:53<00:15, 804.46 examples/s]Map:  97%|█████████▋| 209759/217273 [03:51<00:07, 972.69 examples/s]Map:  97%|█████████▋| 210252/217273 [03:53<00:07, 912.60 examples/s]Map:  94%|█████████▍| 205269/217273 [03:53<00:14, 824.06 examples/s]Map:  97%|█████████▋| 210968/217273 [03:51<00:06, 994.44 examples/s]Map:  97%|█████████▋| 209895/217273 [03:51<00:07, 946.97 examples/s]Map:  97%|█████████▋| 210385/217273 [03:53<00:07, 898.77 examples/s]Map:  95%|█████████▍| 205401/217273 [03:53<00:14, 840.96 examples/s]Map:  97%|█████████▋| 209993/217273 [03:51<00:07, 951.45 examples/s]Map:  97%|█████████▋| 211099/217273 [03:51<00:07, 804.35 examples/s]Map:  97%|█████████▋| 210486/217273 [03:53<00:07, 925.99 examples/s]Map:  95%|█████████▍| 205503/217273 [03:54<00:13, 883.92 examples/s]Map:  97%|█████████▋| 211192/217273 [03:52<00:07, 833.10 examples/s]Map:  97%|█████████▋| 210625/217273 [03:53<00:07, 923.65 examples/s]Map:  97%|█████████▋| 210098/217273 [03:52<00:08, 805.71 examples/s]Map:  95%|█████████▍| 205640/217273 [03:54<00:13, 888.08 examples/s]Map:  97%|█████████▋| 211295/217273 [03:52<00:06, 881.17 examples/s]Map:  97%|█████████▋| 210722/217273 [03:54<00:07, 934.04 examples/s]Map:  97%|█████████▋| 210200/217273 [03:52<00:08, 854.59 examples/s]Map:  95%|█████████▍| 205737/217273 [03:54<00:12, 907.09 examples/s]Map:  97%|█████████▋| 211398/217273 [03:52<00:06, 912.78 examples/s]Map:  97%|█████████▋| 210821/217273 [03:54<00:06, 946.62 examples/s]Map:  97%|█████████▋| 210303/217273 [03:52<00:07, 896.65 examples/s]Map:  95%|█████████▍| 205835/217273 [03:54<00:12, 923.43 examples/s]Map:  97%|█████████▋| 211497/217273 [03:52<00:06, 931.75 examples/s]Map:  97%|█████████▋| 210921/217273 [03:54<00:06, 960.44 examples/s]Map:  97%|█████████▋| 210405/217273 [03:52<00:07, 926.92 examples/s]Map:  95%|█████████▍| 205935/217273 [03:54<00:12, 940.76 examples/s]Map:  97%|█████████▋| 211597/217273 [03:52<00:05, 947.61 examples/s]Map:  97%|█████████▋| 210506/217273 [03:52<00:07, 945.08 examples/s]Map:  97%|█████████▋| 211705/217273 [03:52<00:05, 982.32 examples/s]Map:  97%|█████████▋| 211046/217273 [03:54<00:07, 804.49 examples/s]Map:  95%|█████████▍| 206048/217273 [03:54<00:14, 790.79 examples/s]Map:  97%|█████████▋| 210611/217273 [03:52<00:06, 972.04 examples/s]Map:  97%|█████████▋| 211808/217273 [03:52<00:05, 993.66 examples/s]Map:  97%|█████████▋| 211148/217273 [03:54<00:07, 854.44 examples/s]Map:  95%|█████████▍| 206146/217273 [03:54<00:13, 834.78 examples/s]Map:  97%|█████████▋| 210711/217273 [03:52<00:06, 974.19 examples/s]Map:  98%|█████████▊| 211958/217273 [03:52<00:05, 992.61 examples/s]Map:  97%|█████████▋| 211248/217273 [03:54<00:06, 888.93 examples/s]Map:  95%|█████████▍| 206248/217273 [03:54<00:12, 879.81 examples/s]Map:  97%|█████████▋| 210810/217273 [03:52<00:06, 976.27 examples/s]Map:  97%|█████████▋| 211349/217273 [03:54<00:06, 918.28 examples/s]Map:  95%|█████████▍| 206350/217273 [03:55<00:11, 912.14 examples/s]Map:  97%|█████████▋| 210962/217273 [03:52<00:06, 986.49 examples/s]Map:  97%|█████████▋| 211449/217273 [03:54<00:06, 936.86 examples/s]Map:  98%|█████████▊| 212101/217273 [03:53<00:06, 847.88 examples/s]Map:  95%|█████████▌| 206452/217273 [03:55<00:11, 938.04 examples/s]Map:  97%|█████████▋| 211550/217273 [03:54<00:06, 953.24 examples/s]Map:  98%|█████████▊| 212204/217273 [03:53<00:05, 884.35 examples/s]Map:  95%|█████████▌| 206549/217273 [03:55<00:11, 942.51 examples/s]Map:  97%|█████████▋| 211088/217273 [03:53<00:07, 821.74 examples/s]Map:  98%|█████████▊| 212299/217273 [03:53<00:05, 896.65 examples/s]Map:  97%|█████████▋| 211687/217273 [03:55<00:05, 934.79 examples/s]Map:  95%|█████████▌| 206686/217273 [03:55<00:11, 926.78 examples/s]Map:  97%|█████████▋| 211189/217273 [03:53<00:07, 863.02 examples/s]Map:  98%|█████████▊| 212403/217273 [03:53<00:05, 931.55 examples/s]Map:  95%|█████████▌| 206782/217273 [03:55<00:11, 931.74 examples/s]Map:  97%|█████████▋| 211292/217273 [03:53<00:06, 900.43 examples/s]Map:  97%|█████████▋| 211832/217273 [03:55<00:05, 942.98 examples/s]Map:  98%|█████████▊| 212549/217273 [03:53<00:05, 942.55 examples/s]Map:  95%|█████████▌| 206880/217273 [03:55<00:11, 941.64 examples/s]Map:  97%|█████████▋| 211393/217273 [03:53<00:06, 926.23 examples/s]Map:  98%|█████████▊| 211938/217273 [03:55<00:05, 967.93 examples/s]Map:  98%|█████████▊| 212650/217273 [03:53<00:04, 957.09 examples/s]Map:  95%|█████████▌| 206981/217273 [03:55<00:10, 957.69 examples/s]Map:  97%|█████████▋| 211494/217273 [03:53<00:06, 946.93 examples/s]Map:  98%|█████████▊| 212753/217273 [03:53<00:04, 975.13 examples/s]Map:  98%|█████████▊| 212050/217273 [03:55<00:06, 834.03 examples/s]Map:  97%|█████████▋| 211595/217273 [03:53<00:05, 963.50 examples/s]Map:  95%|█████████▌| 207098/217273 [03:55<00:12, 809.19 examples/s]Map:  98%|█████████▊| 212150/217273 [03:55<00:05, 869.42 examples/s]Map:  98%|█████████▊| 212898/217273 [03:53<00:04, 966.79 examples/s]Map:  97%|█████████▋| 211743/217273 [03:53<00:05, 967.07 examples/s]Map:  95%|█████████▌| 207200/217273 [03:55<00:11, 859.63 examples/s]Map:  98%|█████████▊| 212253/217273 [03:55<00:05, 907.39 examples/s]Map:  98%|█████████▊| 212998/217273 [03:53<00:04, 969.45 examples/s]Map:  98%|█████████▊| 211842/217273 [03:53<00:05, 971.33 examples/s]Map:  95%|█████████▌| 207298/217273 [03:56<00:11, 887.80 examples/s]Map:  98%|█████████▊| 212357/217273 [03:55<00:05, 939.90 examples/s]Map:  98%|█████████▊| 211949/217273 [03:53<00:05, 995.73 examples/s]Map:  95%|█████████▌| 207397/217273 [03:56<00:10, 912.56 examples/s]Map:  98%|█████████▊| 212460/217273 [03:55<00:05, 961.43 examples/s]Map:  98%|█████████▊| 213102/217273 [03:54<00:05, 827.22 examples/s]Map:  96%|█████████▌| 207497/217273 [03:56<00:10, 931.15 examples/s]Map:  98%|█████████▊| 213197/217273 [03:54<00:04, 856.10 examples/s]Map:  98%|█████████▊| 212099/217273 [03:54<00:06, 846.74 examples/s]Map:  98%|█████████▊| 213301/217273 [03:54<00:04, 901.05 examples/s]Map:  98%|█████████▊| 212591/217273 [03:56<00:05, 811.89 examples/s]Map:  96%|█████████▌| 207640/217273 [03:56<00:10, 934.66 examples/s]Map:  98%|█████████▊| 212202/217273 [03:54<00:05, 885.14 examples/s]Map:  98%|█████████▊| 213402/217273 [03:54<00:04, 929.61 examples/s]Map:  98%|█████████▊| 212685/217273 [03:56<00:05, 838.92 examples/s]Map:  96%|█████████▌| 207738/217273 [03:56<00:10, 942.62 examples/s]Map:  98%|█████████▊| 212301/217273 [03:54<00:05, 908.96 examples/s]Map:  98%|█████████▊| 213537/217273 [03:54<00:04, 917.78 examples/s]Map:  98%|█████████▊| 212777/217273 [03:56<00:06, 743.72 examples/s]Map:  98%|█████████▊| 212438/217273 [03:54<00:05, 906.22 examples/s]Map:  98%|█████████▊| 213639/217273 [03:54<00:03, 942.33 examples/s]Map:  96%|█████████▌| 207875/217273 [03:56<00:12, 778.34 examples/s]Map:  98%|█████████▊| 212902/217273 [03:56<00:05, 770.36 examples/s]Map:  98%|█████████▊| 212540/217273 [03:54<00:05, 932.03 examples/s]Map:  98%|█████████▊| 213742/217273 [03:54<00:03, 961.47 examples/s]Map:  96%|█████████▌| 207971/217273 [03:56<00:11, 816.43 examples/s]Map:  98%|█████████▊| 212995/217273 [03:56<00:05, 804.07 examples/s]Map:  98%|█████████▊| 212641/217273 [03:54<00:04, 950.66 examples/s]Map:  98%|█████████▊| 213840/217273 [03:54<00:03, 964.82 examples/s]Map:  98%|█████████▊| 213944/217273 [03:55<00:03, 981.94 examples/s]Map:  96%|█████████▌| 208090/217273 [03:57<00:12, 733.20 examples/s]Map:  98%|█████████▊| 212781/217273 [03:54<00:04, 937.73 examples/s]Map:  98%|█████████▊| 213099/217273 [03:56<00:05, 716.32 examples/s]Map:  96%|█████████▌| 208188/217273 [03:57<00:11, 784.55 examples/s]Map:  98%|█████████▊| 212883/217273 [03:55<00:04, 954.92 examples/s]Map:  98%|█████████▊| 213195/217273 [03:56<00:05, 770.14 examples/s]Map:  99%|█████████▊| 214045/217273 [03:55<00:03, 809.22 examples/s]Map:  96%|█████████▌| 208281/217273 [03:57<00:10, 818.40 examples/s]Map:  98%|█████████▊| 212986/217273 [03:55<00:04, 971.44 examples/s]Map:  98%|█████████▊| 213293/217273 [03:57<00:04, 819.22 examples/s]Map:  99%|█████████▊| 214147/217273 [03:55<00:03, 859.39 examples/s]Map:  96%|█████████▌| 208375/217273 [03:57<00:10, 847.10 examples/s]Map:  98%|█████████▊| 213387/217273 [03:57<00:04, 845.83 examples/s]Map:  99%|█████████▊| 214248/217273 [03:55<00:03, 894.84 examples/s]Map:  96%|█████████▌| 208475/217273 [03:57<00:09, 885.21 examples/s]Map:  98%|█████████▊| 213091/217273 [03:55<00:05, 798.91 examples/s]Map:  98%|█████████▊| 213483/217273 [03:57<00:04, 872.83 examples/s]Map:  99%|█████████▊| 214345/217273 [03:55<00:03, 912.42 examples/s]Map:  96%|█████████▌| 208568/217273 [03:57<00:09, 894.62 examples/s]Map:  98%|█████████▊| 213196/217273 [03:55<00:04, 856.54 examples/s]Map:  98%|█████████▊| 213589/217273 [03:57<00:04, 920.27 examples/s]Map:  99%|█████████▊| 214443/217273 [03:55<00:03, 928.87 examples/s]Map:  96%|█████████▌| 208670/217273 [03:57<00:09, 926.88 examples/s]Map:  98%|█████████▊| 213296/217273 [03:55<00:04, 890.09 examples/s]Map:  98%|█████████▊| 213693/217273 [03:57<00:03, 950.24 examples/s]Map:  99%|█████████▊| 214542/217273 [03:55<00:02, 941.09 examples/s]Map:  96%|█████████▌| 208771/217273 [03:57<00:08, 947.85 examples/s]Map:  98%|█████████▊| 213399/217273 [03:55<00:04, 925.61 examples/s]Map:  99%|█████████▉| 214644/217273 [03:55<00:02, 962.89 examples/s]Map:  98%|█████████▊| 213840/217273 [03:57<00:03, 957.73 examples/s]Map:  96%|█████████▌| 208871/217273 [03:57<00:08, 957.76 examples/s]Map:  98%|█████████▊| 213499/217273 [03:55<00:04, 942.51 examples/s]Map:  99%|█████████▉| 214784/217273 [03:55<00:02, 947.54 examples/s]Map:  98%|█████████▊| 213984/217273 [03:57<00:03, 954.21 examples/s]Map:  98%|█████████▊| 213635/217273 [03:55<00:03, 921.59 examples/s]Map:  96%|█████████▌| 209000/217273 [03:58<00:10, 800.33 examples/s]Map:  99%|█████████▉| 214884/217273 [03:56<00:02, 958.57 examples/s]Map:  98%|█████████▊| 213732/217273 [03:55<00:03, 931.44 examples/s]Map:  96%|█████████▌| 209097/217273 [03:58<00:09, 840.79 examples/s]Map:  99%|█████████▉| 214984/217273 [03:56<00:02, 966.70 examples/s]Map:  99%|█████████▊| 214099/217273 [03:57<00:03, 813.56 examples/s]Map:  98%|█████████▊| 213837/217273 [03:56<00:03, 961.07 examples/s]Map:  96%|█████████▋| 209189/217273 [03:58<00:09, 859.75 examples/s]Map:  99%|█████████▊| 214201/217273 [03:58<00:03, 856.74 examples/s]Map:  98%|█████████▊| 213942/217273 [03:56<00:03, 980.84 examples/s]Map:  96%|█████████▋| 209288/217273 [03:58<00:08, 892.36 examples/s]Map:  99%|█████████▉| 215098/217273 [03:56<00:02, 809.61 examples/s]Map:  99%|█████████▊| 214301/217273 [03:58<00:03, 887.80 examples/s]Map:  96%|█████████▋| 209381/217273 [03:58<00:08, 899.44 examples/s]Map:  99%|█████████▉| 215195/217273 [03:56<00:02, 846.45 examples/s]Map:  99%|█████████▊| 214050/217273 [03:56<00:03, 825.62 examples/s]Map:  99%|█████████▊| 214402/217273 [03:58<00:03, 913.64 examples/s]Map:  96%|█████████▋| 209476/217273 [03:58<00:08, 910.51 examples/s]Map:  99%|█████████▉| 215297/217273 [03:56<00:02, 887.64 examples/s]Map:  99%|█████████▊| 214152/217273 [03:56<00:03, 871.13 examples/s]Map:  99%|█████████▊| 214500/217273 [03:58<00:02, 929.91 examples/s]Map:  96%|█████████▋| 209574/217273 [03:58<00:08, 926.56 examples/s]Map:  99%|█████████▉| 215399/217273 [03:56<00:02, 921.67 examples/s]Map:  99%|█████████▊| 214255/217273 [03:56<00:03, 910.42 examples/s]Map:  99%|█████████▉| 214599/217273 [03:58<00:02, 945.03 examples/s]Map:  97%|█████████▋| 209671/217273 [03:58<00:08, 934.69 examples/s]Map:  99%|█████████▉| 215499/217273 [03:56<00:01, 938.67 examples/s]Map:  99%|█████████▊| 214362/217273 [03:56<00:03, 951.32 examples/s]Map:  99%|█████████▉| 214701/217273 [03:58<00:02, 962.91 examples/s]Map:  99%|█████████▉| 215605/217273 [03:56<00:01, 970.88 examples/s]Map:  99%|█████████▊| 214461/217273 [03:56<00:02, 959.05 examples/s]Map:  99%|█████████▉| 214800/217273 [03:58<00:02, 969.47 examples/s]Map:  97%|█████████▋| 209811/217273 [03:58<00:08, 929.39 examples/s]Map:  99%|█████████▉| 215708/217273 [03:56<00:01, 984.57 examples/s]Map:  99%|█████████▉| 214562/217273 [03:56<00:02, 968.71 examples/s]Map:  97%|█████████▋| 209908/217273 [03:59<00:07, 936.91 examples/s]Map:  99%|█████████▉| 214941/217273 [03:58<00:02, 954.99 examples/s]Map:  99%|█████████▉| 215808/217273 [03:57<00:01, 986.40 examples/s]Map:  99%|█████████▉| 214710/217273 [03:56<00:02, 973.51 examples/s]Map:  99%|█████████▉| 215910/217273 [03:57<00:01, 995.42 examples/s]Map:  99%|█████████▉| 215054/217273 [03:58<00:02, 815.69 examples/s]Map:  97%|█████████▋| 210046/217273 [03:59<00:09, 789.15 examples/s]Map:  99%|█████████▉| 214809/217273 [03:57<00:02, 974.77 examples/s]Map:  99%|█████████▉| 215148/217273 [03:59<00:02, 842.61 examples/s]Map:  97%|█████████▋| 210141/217273 [03:59<00:08, 823.59 examples/s]Map:  99%|█████████▉| 214947/217273 [03:57<00:02, 951.65 examples/s]Map:  99%|█████████▉| 216042/217273 [03:57<00:01, 801.05 examples/s]Map:  99%|█████████▉| 215241/217273 [03:59<00:02, 862.76 examples/s]Map:  97%|█████████▋| 210240/217273 [03:59<00:08, 861.08 examples/s]Map:  99%|█████████▉| 216143/217273 [03:57<00:01, 848.67 examples/s]Map:  99%|█████████▉| 215344/217273 [03:59<00:02, 904.28 examples/s]Map:  97%|█████████▋| 210335/217273 [03:59<00:07, 881.39 examples/s]Map:  99%|█████████▉| 215048/217273 [03:57<00:02, 821.73 examples/s]Map: 100%|█████████▉| 216240/217273 [03:57<00:01, 876.63 examples/s]Map:  99%|█████████▉| 215440/217273 [03:59<00:02, 915.73 examples/s]Map:  97%|█████████▋| 210429/217273 [03:59<00:07, 894.72 examples/s]Map:  99%|█████████▉| 215151/217273 [03:57<00:02, 868.12 examples/s]Map: 100%|█████████▉| 216336/217273 [03:57<00:01, 895.65 examples/s]Map:  99%|█████████▉| 215542/217273 [03:59<00:01, 941.97 examples/s]Map:  97%|█████████▋| 210529/217273 [03:59<00:07, 921.00 examples/s]Map:  99%|█████████▉| 215255/217273 [03:57<00:02, 910.64 examples/s]Map: 100%|█████████▉| 216431/217273 [03:57<00:00, 907.38 examples/s]Map:  99%|█████████▉| 215642/217273 [03:59<00:01, 958.02 examples/s]Map:  99%|█████████▉| 215357/217273 [03:57<00:02, 935.69 examples/s]Map:  97%|█████████▋| 210671/217273 [03:59<00:07, 927.10 examples/s]Map: 100%|█████████▉| 216532/217273 [03:57<00:00, 933.66 examples/s]Map:  99%|█████████▉| 215743/217273 [03:59<00:01, 970.20 examples/s]Map:  99%|█████████▉| 215455/217273 [03:57<00:01, 945.91 examples/s]Map:  97%|█████████▋| 210771/217273 [04:00<00:06, 943.00 examples/s]Map: 100%|█████████▉| 216632/217273 [03:57<00:00, 946.89 examples/s]Map:  99%|█████████▉| 215847/217273 [03:59<00:01, 985.54 examples/s]Map:  99%|█████████▉| 215559/217273 [03:57<00:01, 969.71 examples/s]Map: 100%|█████████▉| 216734/217273 [03:58<00:00, 964.69 examples/s]Map:  97%|█████████▋| 210911/217273 [04:00<00:06, 936.36 examples/s]Map:  99%|█████████▉| 215663/217273 [03:58<00:01, 987.04 examples/s]Map:  99%|█████████▉| 215995/217273 [03:59<00:01, 985.25 examples/s]Map: 100%|█████████▉| 216875/217273 [03:58<00:00, 951.50 examples/s]Map:  99%|█████████▉| 215810/217273 [03:58<00:01, 978.67 examples/s]Map: 100%|█████████▉| 216974/217273 [03:58<00:00, 958.58 examples/s]Map:  99%|█████████▉| 216096/217273 [04:00<00:01, 817.90 examples/s]Map:  97%|█████████▋| 211044/217273 [04:00<00:07, 797.88 examples/s]Map:  99%|█████████▉| 215914/217273 [03:58<00:01, 993.61 examples/s]Map: 100%|█████████▉| 216196/217273 [04:00<00:01, 860.36 examples/s]Map:  97%|█████████▋| 211142/217273 [04:00<00:07, 835.10 examples/s]Map: 100%|█████████▉| 217098/217273 [03:58<00:00, 812.43 examples/s]Map: 100%|█████████▉| 216298/217273 [04:00<00:01, 898.36 examples/s]Map:  97%|█████████▋| 211235/217273 [04:00<00:07, 856.05 examples/s]Map:  99%|█████████▉| 216052/217273 [03:58<00:01, 855.75 examples/s]Map: 100%|█████████▉| 217199/217273 [03:58<00:00, 858.16 examples/s]Map: 100%|█████████▉| 216398/217273 [04:00<00:00, 922.82 examples/s]Map:  97%|█████████▋| 211371/217273 [04:00<00:06, 867.66 examples/s]Map:  99%|█████████▉| 216149/217273 [03:58<00:01, 879.03 examples/s]Map: 100%|█████████▉| 216524/217273 [04:00<00:00, 890.12 examples/s]Map: 100%|█████████▉| 216242/217273 [03:58<00:01, 889.30 examples/s]Map:  97%|█████████▋| 211488/217273 [04:00<00:06, 835.08 examples/s]Map: 100%|█████████▉| 216642/217273 [04:00<00:00, 850.49 examples/s]Map:  97%|█████████▋| 211578/217273 [04:01<00:06, 846.38 examples/s]Map: 100%|█████████▉| 216382/217273 [03:58<00:00, 900.90 examples/s]Map: 100%|██████████| 217273/217273 [03:59<00:00, 908.91 examples/s]
+Map:  97%|█████████▋| 211667/217273 [04:01<00:06, 855.02 examples/s]Map: 100%|█████████▉| 216484/217273 [03:58<00:00, 928.63 examples/s]Map: 100%|█████████▉| 216773/217273 [04:00<00:00, 852.59 examples/s]Map:  97%|█████████▋| 211768/217273 [04:01<00:06, 889.54 examples/s]Map: 100%|█████████▉| 216588/217273 [03:59<00:00, 955.89 examples/s]Map: 100%|█████████▉| 216870/217273 [04:00<00:00, 876.37 examples/s]Map: 100%|█████████▉| 216687/217273 [03:59<00:00, 962.84 examples/s]Map:  98%|█████████▊| 211866/217273 [04:01<00:05, 909.02 examples/s]Map: 100%|█████████▉| 216972/217273 [04:01<00:00, 911.61 examples/s]Map: 100%|█████████▉| 216788/217273 [03:59<00:00, 971.76 examples/s]Map:  98%|█████████▊| 211960/217273 [04:01<00:05, 914.65 examples/s]Map: 100%|█████████▉| 216897/217273 [03:59<00:00, 1002.61 examples/s]Map: 100%|█████████▉| 217104/217273 [04:01<00:00, 797.45 examples/s]Map:  98%|█████████▊| 212093/217273 [04:01<00:06, 778.10 examples/s]Map: 100%|█████████▉| 217202/217273 [04:01<00:00, 837.20 examples/s]Map: 100%|█████████▉| 217000/217273 [03:59<00:00, 835.85 examples/s] Map:  98%|█████████▊| 212190/217273 [04:01<00:06, 820.09 examples/s]Map: 100%|█████████▉| 217104/217273 [03:59<00:00, 886.08 examples/s]Map:  98%|█████████▊| 212285/217273 [04:01<00:05, 850.15 examples/s]Map: 100%|█████████▉| 217204/217273 [03:59<00:00, 913.14 examples/s]Map:  98%|█████████▊| 212378/217273 [04:01<00:05, 869.84 examples/s]Map:  98%|█████████▊| 212475/217273 [04:02<00:05, 895.29 examples/s]Map: 100%|██████████| 217273/217273 [04:01<00:00, 898.61 examples/s]
+Map:  98%|█████████▊| 212568/217273 [04:02<00:05, 902.73 examples/s]Map:  98%|█████████▊| 212707/217273 [04:02<00:05, 906.33 examples/s]Map: 100%|██████████| 217273/217273 [04:00<00:00, 904.86 examples/s]
+Map:  98%|█████████▊| 212803/217273 [04:02<00:04, 918.52 examples/s]Map:  98%|█████████▊| 212944/217273 [04:02<00:04, 923.28 examples/s]Map:  98%|█████████▊| 213049/217273 [04:02<00:05, 791.20 examples/s]Map:  98%|█████████▊| 213138/217273 [04:02<00:05, 810.84 examples/s]Map:  98%|█████████▊| 213226/217273 [04:02<00:04, 827.39 examples/s]Map:  98%|█████████▊| 213321/217273 [04:03<00:04, 855.79 examples/s]Map:  98%|█████████▊| 213412/217273 [04:03<00:04, 867.63 examples/s]Map:  98%|█████████▊| 213510/217273 [04:03<00:04, 894.83 examples/s]Map:  98%|█████████▊| 213609/217273 [04:03<00:03, 918.58 examples/s]Map:  98%|█████████▊| 213739/217273 [04:03<00:03, 895.33 examples/s]Map:  98%|█████████▊| 213832/217273 [04:03<00:03, 899.88 examples/s]Map:  98%|█████████▊| 213927/217273 [04:03<00:03, 910.24 examples/s]Map:  99%|█████████▊| 214045/217273 [04:03<00:04, 771.44 examples/s]Map:  99%|█████████▊| 214136/217273 [04:03<00:03, 804.10 examples/s]Map:  99%|█████████▊| 214230/217273 [04:04<00:03, 835.00 examples/s]Map:  99%|█████████▊| 214326/217273 [04:04<00:03, 864.15 examples/s]Map:  99%|█████████▊| 214421/217273 [04:04<00:03, 885.02 examples/s]Map:  99%|█████████▊| 214548/217273 [04:04<00:03, 864.46 examples/s]Map:  99%|█████████▉| 214643/217273 [04:04<00:02, 882.72 examples/s]Map:  99%|█████████▉| 214775/217273 [04:04<00:02, 877.69 examples/s]Map:  99%|█████████▉| 214901/217273 [04:04<00:02, 858.21 examples/s]Map:  99%|█████████▉| 214989/217273 [04:04<00:02, 861.51 examples/s]Map:  99%|█████████▉| 215087/217273 [04:05<00:03, 720.51 examples/s]Map:  99%|█████████▉| 215181/217273 [04:05<00:02, 767.58 examples/s]Map:  99%|█████████▉| 215275/217273 [04:05<00:02, 805.27 examples/s]Map:  99%|█████████▉| 215371/217273 [04:05<00:02, 842.98 examples/s]Map:  99%|█████████▉| 215462/217273 [04:05<00:02, 857.68 examples/s]Map:  99%|█████████▉| 215551/217273 [04:05<00:01, 866.13 examples/s]Map:  99%|█████████▉| 215650/217273 [04:05<00:01, 895.28 examples/s]Map:  99%|█████████▉| 215788/217273 [04:05<00:01, 899.11 examples/s]Map:  99%|█████████▉| 215920/217273 [04:06<00:01, 891.16 examples/s]Map:  99%|█████████▉| 216045/217273 [04:06<00:01, 776.08 examples/s]Map:  99%|█████████▉| 216138/217273 [04:06<00:01, 807.83 examples/s]Map: 100%|█████████▉| 216231/217273 [04:06<00:01, 833.95 examples/s]Map: 100%|█████████▉| 216321/217273 [04:06<00:01, 848.40 examples/s]Map: 100%|█████████▉| 216413/217273 [04:06<00:00, 863.61 examples/s]Map: 100%|█████████▉| 216504/217273 [04:06<00:00, 871.98 examples/s]Map: 100%|█████████▉| 216593/217273 [04:06<00:00, 874.84 examples/s]Map: 100%|█████████▉| 216686/217273 [04:06<00:00, 886.17 examples/s]Map: 100%|█████████▉| 216779/217273 [04:07<00:00, 894.26 examples/s]Map: 100%|█████████▉| 216873/217273 [04:07<00:00, 905.47 examples/s]Map: 100%|█████████▉| 217000/217273 [04:07<00:00, 748.92 examples/s]Map: 100%|█████████▉| 217086/217273 [04:07<00:00, 773.64 examples/s]Map: 100%|█████████▉| 217184/217273 [04:07<00:00, 822.64 examples/s]Map: 100%|██████████| 217273/217273 [04:07<00:00, 798.04 examples/s]Map: 100%|██████████| 217273/217273 [04:08<00:00, 875.97 examples/s]
+Detected kernel version 5.4.0, which is below the recommended minimum of 5.5.0; this can cause the process to hang. It is recommended to upgrade the kernel to the minimum version or higher.
+/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+wandb: Currently logged in as: k-duan (nus_keyu). Use `wandb login --relogin` to force relogin
+wandb: Tracking run with wandb version 0.16.1
+wandb: Run data is saved locally in /home/aiops/duanky/lora-moe/experiments/launch_scripts/wandb/run-20231229_144811-o5uuhyd3
+wandb: Run `wandb offline` to turn off syncing.
+wandb: Syncing run belle_dolphine-p14
+wandb: ⭐️ View project at https://wandb.ai/nus_keyu/lora-moe
+wandb: 🚀 View run at https://wandb.ai/nus_keyu/lora-moe/runs/o5uuhyd3
+  0%|          | 0/6790 [00:00<?, ?it/s]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+  0%|          | 1/6790 [00:02<5:13:25,  2.77s/it]                                                  {'loss': 2.0757, 'learning_rate': 4.000000000000001e-06, 'epoch': 0.0}
+  0%|          | 1/6790 [00:02<5:13:25,  2.77s/it]  0%|          | 2/6790 [00:05<4:48:56,  2.55s/it]                                                  {'loss': 1.9875, 'learning_rate': 8.000000000000001e-06, 'epoch': 0.0}
+  0%|          | 2/6790 [00:05<4:48:56,  2.55s/it]  0%|          | 3/6790 [00:07<4:24:51,  2.34s/it]                                                  {'loss': 1.9478, 'learning_rate': 1.2e-05, 'epoch': 0.0}
+  0%|          | 3/6790 [00:07<4:24:51,  2.34s/it]  0%|          | 4/6790 [00:09<4:10:56,  2.22s/it]                                                  {'loss': 2.3627, 'learning_rate': 1.6000000000000003e-05, 'epoch': 0.0}
+  0%|          | 4/6790 [00:09<4:10:56,  2.22s/it]  0%|          | 5/6790 [00:11<3:55:01,  2.08s/it]                                                  {'loss': 1.9898, 'learning_rate': 2e-05, 'epoch': 0.0}
+  0%|          | 5/6790 [00:11<3:55:01,  2.08s/it]  0%|          | 6/6790 [00:13<3:50:27,  2.04s/it]                                                  {'loss': 1.9836, 'learning_rate': 2.4e-05, 'epoch': 0.0}
+  0%|          | 6/6790 [00:13<3:50:27,  2.04s/it]  0%|          | 7/6790 [00:15<4:03:55,  2.16s/it]                                                  {'loss': 1.9169, 'learning_rate': 2.8000000000000003e-05, 'epoch': 0.0}
+  0%|          | 7/6790 [00:15<4:03:55,  2.16s/it]  0%|          | 8/6790 [00:17<3:59:08,  2.12s/it]                                                  {'loss': 2.0051, 'learning_rate': 3.2000000000000005e-05, 'epoch': 0.0}
+  0%|          | 8/6790 [00:17<3:59:08,  2.12s/it]  0%|          | 9/6790 [00:19<3:55:41,  2.09s/it]                                                  {'loss': 1.9131, 'learning_rate': 3.6e-05, 'epoch': 0.0}
+  0%|          | 9/6790 [00:19<3:55:41,  2.09s/it]  0%|          | 10/6790 [00:21<3:48:16,  2.02s/it]                                                   {'loss': 1.9195, 'learning_rate': 4e-05, 'epoch': 0.0}
+  0%|          | 10/6790 [00:21<3:48:16,  2.02s/it]  0%|          | 11/6790 [00:23<3:46:20,  2.00s/it]                                                   {'loss': 2.0058, 'learning_rate': 4.4000000000000006e-05, 'epoch': 0.0}
+  0%|          | 11/6790 [00:23<3:46:20,  2.00s/it]  0%|          | 12/6790 [00:25<3:45:12,  1.99s/it]                                                   {'loss': 1.8733, 'learning_rate': 4.8e-05, 'epoch': 0.0}
+  0%|          | 12/6790 [00:25<3:45:12,  1.99s/it]  0%|          | 13/6790 [00:27<3:46:06,  2.00s/it]                                                   {'loss': 1.9044, 'learning_rate': 5.2000000000000004e-05, 'epoch': 0.0}
+  0%|          | 13/6790 [00:27<3:46:06,  2.00s/it]  0%|          | 14/6790 [00:29<3:38:10,  1.93s/it]                                                   {'loss': 1.8994, 'learning_rate': 5.6000000000000006e-05, 'epoch': 0.0}
+  0%|          | 14/6790 [00:29<3:38:10,  1.93s/it]  0%|          | 15/6790 [00:31<3:36:19,  1.92s/it]                                                   {'loss': 1.5923, 'learning_rate': 6e-05, 'epoch': 0.0}
+  0%|          | 15/6790 [00:31<3:36:19,  1.92s/it]  0%|          | 16/6790 [00:32<3:36:51,  1.92s/it]                                                   {'loss': 1.7187, 'learning_rate': 6.400000000000001e-05, 'epoch': 0.0}
+  0%|          | 16/6790 [00:32<3:36:51,  1.92s/it]  0%|          | 17/6790 [00:34<3:35:22,  1.91s/it]                                                   {'loss': 1.742, 'learning_rate': 6.800000000000001e-05, 'epoch': 0.0}
+  0%|          | 17/6790 [00:34<3:35:22,  1.91s/it]  0%|          | 18/6790 [00:36<3:35:15,  1.91s/it]                                                   {'loss': 1.8281, 'learning_rate': 7.2e-05, 'epoch': 0.0}
+  0%|          | 18/6790 [00:36<3:35:15,  1.91s/it]  0%|          | 19/6790 [00:38<3:39:42,  1.95s/it]                                                   {'loss': 1.5861, 'learning_rate': 7.6e-05, 'epoch': 0.0}
+  0%|          | 19/6790 [00:38<3:39:42,  1.95s/it]  0%|          | 20/6790 [00:40<3:44:06,  1.99s/it]                                                   {'loss': 1.6107, 'learning_rate': 8e-05, 'epoch': 0.0}
+  0%|          | 20/6790 [00:40<3:44:06,  1.99s/it]  0%|          | 21/6790 [00:42<3:47:10,  2.01s/it]                                                   {'loss': 1.7854, 'learning_rate': 8.4e-05, 'epoch': 0.0}
+  0%|          | 21/6790 [00:42<3:47:10,  2.01s/it]  0%|          | 22/6790 [00:44<3:47:10,  2.01s/it]                                                   {'loss': 1.7075, 'learning_rate': 8.800000000000001e-05, 'epoch': 0.0}
+  0%|          | 22/6790 [00:44<3:47:10,  2.01s/it]  0%|          | 23/6790 [00:47<3:55:04,  2.08s/it]                                                   {'loss': 1.8763, 'learning_rate': 9.200000000000001e-05, 'epoch': 0.0}
+  0%|          | 23/6790 [00:47<3:55:04,  2.08s/it]  0%|          | 24/6790 [00:49<3:58:41,  2.12s/it]                                                   {'loss': 1.8735, 'learning_rate': 9.6e-05, 'epoch': 0.0}
+  0%|          | 24/6790 [00:49<3:58:41,  2.12s/it]  0%|          | 25/6790 [00:51<3:57:43,  2.11s/it]                                                   {'loss': 1.7637, 'learning_rate': 0.0001, 'epoch': 0.0}
+  0%|          | 25/6790 [00:51<3:57:43,  2.11s/it]  0%|          | 26/6790 [00:54<4:15:15,  2.26s/it]                                                   {'loss': 1.7543, 'learning_rate': 0.00010400000000000001, 'epoch': 0.0}
+  0%|          | 26/6790 [00:54<4:15:15,  2.26s/it]  0%|          | 27/6790 [00:56<4:17:40,  2.29s/it]                                                   {'loss': 1.7182, 'learning_rate': 0.00010800000000000001, 'epoch': 0.0}
+  0%|          | 27/6790 [00:56<4:17:40,  2.29s/it]  0%|          | 28/6790 [00:58<4:12:41,  2.24s/it]                                                   {'loss': 1.6764, 'learning_rate': 0.00011200000000000001, 'epoch': 0.0}
+  0%|          | 28/6790 [00:58<4:12:41,  2.24s/it]  0%|          | 29/6790 [01:00<4:10:35,  2.22s/it]                                                   {'loss': 1.8441, 'learning_rate': 0.000116, 'epoch': 0.0}
+  0%|          | 29/6790 [01:00<4:10:35,  2.22s/it]  0%|          | 30/6790 [01:02<4:05:44,  2.18s/it]                                                   {'loss': 1.7919, 'learning_rate': 0.00012, 'epoch': 0.0}
+  0%|          | 30/6790 [01:02<4:05:44,  2.18s/it]  0%|          | 31/6790 [01:05<4:18:43,  2.30s/it]                                                   {'loss': 1.6958, 'learning_rate': 0.000124, 'epoch': 0.0}
+  0%|          | 31/6790 [01:05<4:18:43,  2.30s/it]  0%|          | 32/6790 [01:07<4:13:56,  2.25s/it]                                                   {'loss': 1.6923, 'learning_rate': 0.00012800000000000002, 'epoch': 0.0}
+  0%|          | 32/6790 [01:07<4:13:56,  2.25s/it]  0%|          | 33/6790 [01:09<3:56:19,  2.10s/it]                                                   {'loss': 1.504, 'learning_rate': 0.000132, 'epoch': 0.0}
+  0%|          | 33/6790 [01:09<3:56:19,  2.10s/it]  1%|          | 34/6790 [01:11<4:01:06,  2.14s/it]                                                   {'loss': 1.8161, 'learning_rate': 0.00013600000000000003, 'epoch': 0.01}
+  1%|          | 34/6790 [01:11<4:01:06,  2.14s/it]  1%|          | 35/6790 [01:13<3:56:22,  2.10s/it]                                                   {'loss': 1.7934, 'learning_rate': 0.00014, 'epoch': 0.01}
+  1%|          | 35/6790 [01:13<3:56:22,  2.10s/it]  1%|          | 36/6790 [01:15<3:49:14,  2.04s/it]                                                   {'loss': 1.5316, 'learning_rate': 0.000144, 'epoch': 0.01}
+  1%|          | 36/6790 [01:15<3:49:14,  2.04s/it]  1%|          | 37/6790 [01:18<4:11:23,  2.23s/it]                                                   {'loss': 1.5065, 'learning_rate': 0.000148, 'epoch': 0.01}
+  1%|          | 37/6790 [01:18<4:11:23,  2.23s/it]  1%|          | 38/6790 [01:20<4:04:33,  2.17s/it]                                                   {'loss': 1.6563, 'learning_rate': 0.000152, 'epoch': 0.01}
+  1%|          | 38/6790 [01:20<4:04:33,  2.17s/it]  1%|          | 39/6790 [01:22<4:06:49,  2.19s/it]                                                   {'loss': 1.7944, 'learning_rate': 0.00015600000000000002, 'epoch': 0.01}
+  1%|          | 39/6790 [01:22<4:06:49,  2.19s/it]  1%|          | 40/6790 [01:24<3:59:14,  2.13s/it]                                                   {'loss': 1.73, 'learning_rate': 0.00016, 'epoch': 0.01}
+  1%|          | 40/6790 [01:24<3:59:14,  2.13s/it]  1%|          | 41/6790 [01:26<3:54:20,  2.08s/it]                                                   {'loss': 1.7552, 'learning_rate': 0.000164, 'epoch': 0.01}
+  1%|          | 41/6790 [01:26<3:54:20,  2.08s/it]  1%|          | 42/6790 [01:28<3:51:28,  2.06s/it]                                                   {'loss': 1.4764, 'learning_rate': 0.000168, 'epoch': 0.01}
+  1%|          | 42/6790 [01:28<3:51:28,  2.06s/it]  1%|          | 43/6790 [01:30<3:52:43,  2.07s/it]                                                   {'loss': 1.6605, 'learning_rate': 0.000172, 'epoch': 0.01}
+  1%|          | 43/6790 [01:30<3:52:43,  2.07s/it]  1%|          | 44/6790 [01:32<3:49:01,  2.04s/it]                                                   {'loss': 1.6699, 'learning_rate': 0.00017600000000000002, 'epoch': 0.01}
+  1%|          | 44/6790 [01:32<3:49:01,  2.04s/it]  1%|          | 45/6790 [01:34<3:51:42,  2.06s/it]                                                   {'loss': 1.6282, 'learning_rate': 0.00018, 'epoch': 0.01}
+  1%|          | 45/6790 [01:34<3:51:42,  2.06s/it]  1%|          | 46/6790 [01:36<3:45:50,  2.01s/it]                                                   {'loss': 1.4225, 'learning_rate': 0.00018400000000000003, 'epoch': 0.01}
+  1%|          | 46/6790 [01:36<3:45:50,  2.01s/it]  1%|          | 47/6790 [01:38<3:39:10,  1.95s/it]                                                   {'loss': 1.7011, 'learning_rate': 0.000188, 'epoch': 0.01}
+  1%|          | 47/6790 [01:38<3:39:10,  1.95s/it]  1%|          | 48/6790 [01:40<3:49:39,  2.04s/it]                                                   {'loss': 1.7409, 'learning_rate': 0.000192, 'epoch': 0.01}
+  1%|          | 48/6790 [01:40<3:49:39,  2.04s/it]  1%|          | 49/6790 [01:42<3:41:54,  1.98s/it]                                                   {'loss': 1.501, 'learning_rate': 0.000196, 'epoch': 0.01}
+  1%|          | 49/6790 [01:42<3:41:54,  1.98s/it]  1%|          | 50/6790 [01:44<3:44:14,  2.00s/it]                                                   {'loss': 1.5354, 'learning_rate': 0.0002, 'epoch': 0.01}
+  1%|          | 50/6790 [01:44<3:44:14,  2.00s/it]  1%|          | 51/6790 [01:46<3:46:39,  2.02s/it]                                                   {'loss': 1.6176, 'learning_rate': 0.00020400000000000003, 'epoch': 0.01}
+  1%|          | 51/6790 [01:46<3:46:39,  2.02s/it]  1%|          | 52/6790 [01:48<3:40:10,  1.96s/it]                                                   {'loss': 1.6752, 'learning_rate': 0.00020800000000000001, 'epoch': 0.01}
+  1%|          | 52/6790 [01:48<3:40:10,  1.96s/it]  1%|          | 53/6790 [01:50<3:40:58,  1.97s/it]                                                   {'loss': 1.6557, 'learning_rate': 0.00021200000000000003, 'epoch': 0.01}
+  1%|          | 53/6790 [01:50<3:40:58,  1.97s/it]  1%|          | 54/6790 [01:52<3:46:23,  2.02s/it]                                                   {'loss': 1.7425, 'learning_rate': 0.00021600000000000002, 'epoch': 0.01}
+  1%|          | 54/6790 [01:52<3:46:23,  2.02s/it]  1%|          | 55/6790 [01:54<3:52:01,  2.07s/it]                                                   {'loss': 1.5681, 'learning_rate': 0.00022000000000000003, 'epoch': 0.01}
+  1%|          | 55/6790 [01:54<3:52:01,  2.07s/it]  1%|          | 56/6790 [01:56<3:51:34,  2.06s/it]                                                   {'loss': 1.6588, 'learning_rate': 0.00022400000000000002, 'epoch': 0.01}
+  1%|          | 56/6790 [01:56<3:51:34,  2.06s/it]  1%|          | 57/6790 [01:58<3:52:26,  2.07s/it]                                                   {'loss': 1.9836, 'learning_rate': 0.00022799999999999999, 'epoch': 0.01}
+  1%|          | 57/6790 [01:58<3:52:26,  2.07s/it]  1%|          | 58/6790 [02:00<3:47:17,  2.03s/it]                                                   {'loss': 1.6826, 'learning_rate': 0.000232, 'epoch': 0.01}
+  1%|          | 58/6790 [02:00<3:47:17,  2.03s/it]  1%|          | 59/6790 [02:02<3:48:59,  2.04s/it]                                                   {'loss': 1.4529, 'learning_rate': 0.000236, 'epoch': 0.01}
+  1%|          | 59/6790 [02:02<3:48:59,  2.04s/it]  1%|          | 60/6790 [02:04<3:48:01,  2.03s/it]                                                   {'loss': 1.4895, 'learning_rate': 0.00024, 'epoch': 0.01}
+  1%|          | 60/6790 [02:04<3:48:01,  2.03s/it]  1%|          | 61/6790 [02:06<3:54:38,  2.09s/it]                                                   {'loss': 1.6742, 'learning_rate': 0.000244, 'epoch': 0.01}
+  1%|          | 61/6790 [02:06<3:54:38,  2.09s/it]  1%|          | 62/6790 [02:08<3:42:19,  1.98s/it]                                                   {'loss': 1.568, 'learning_rate': 0.000248, 'epoch': 0.01}
+  1%|          | 62/6790 [02:08<3:42:19,  1.98s/it]  1%|          | 63/6790 [02:10<3:49:57,  2.05s/it]                                                   {'loss': 1.5808, 'learning_rate': 0.000252, 'epoch': 0.01}
+  1%|          | 63/6790 [02:10<3:49:57,  2.05s/it]  1%|          | 64/6790 [02:12<3:46:26,  2.02s/it]                                                   {'loss': 1.7791, 'learning_rate': 0.00025600000000000004, 'epoch': 0.01}
+  1%|          | 64/6790 [02:12<3:46:26,  2.02s/it]  1%|          | 65/6790 [02:14<3:49:04,  2.04s/it]                                                   {'loss': 1.5176, 'learning_rate': 0.00026000000000000003, 'epoch': 0.01}
+  1%|          | 65/6790 [02:14<3:49:04,  2.04s/it]  1%|          | 66/6790 [02:17<3:57:02,  2.12s/it]                                                   {'loss': 1.6139, 'learning_rate': 0.000264, 'epoch': 0.01}
+  1%|          | 66/6790 [02:17<3:57:02,  2.12s/it]  1%|          | 67/6790 [02:19<4:02:22,  2.16s/it]                                                   {'loss': 1.7887, 'learning_rate': 0.000268, 'epoch': 0.01}
+  1%|          | 67/6790 [02:19<4:02:22,  2.16s/it]  1%|          | 68/6790 [02:21<3:52:14,  2.07s/it]                                                   {'loss': 1.856, 'learning_rate': 0.00027200000000000005, 'epoch': 0.01}
+  1%|          | 68/6790 [02:21<3:52:14,  2.07s/it]  1%|          | 69/6790 [02:23<4:01:42,  2.16s/it]                                                   {'loss': 1.5028, 'learning_rate': 0.000276, 'epoch': 0.01}
+  1%|          | 69/6790 [02:23<4:01:42,  2.16s/it]  1%|          | 70/6790 [02:25<3:56:40,  2.11s/it]                                                   {'loss': 1.6957, 'learning_rate': 0.00028, 'epoch': 0.01}
+  1%|          | 70/6790 [02:25<3:56:40,  2.11s/it]  1%|          | 71/6790 [02:27<3:55:53,  2.11s/it]                                                   {'loss': 1.6721, 'learning_rate': 0.000284, 'epoch': 0.01}
+  1%|          | 71/6790 [02:27<3:55:53,  2.11s/it]  1%|          | 72/6790 [02:29<3:49:00,  2.05s/it]                                                   {'loss': 1.7098, 'learning_rate': 0.000288, 'epoch': 0.01}
+  1%|          | 72/6790 [02:29<3:49:00,  2.05s/it]  1%|          | 73/6790 [02:31<3:54:19,  2.09s/it]                                                   {'loss': 1.7618, 'learning_rate': 0.000292, 'epoch': 0.01}
+  1%|          | 73/6790 [02:31<3:54:19,  2.09s/it]  1%|          | 74/6790 [02:34<3:59:17,  2.14s/it]                                                   {'loss': 1.5841, 'learning_rate': 0.000296, 'epoch': 0.01}
+  1%|          | 74/6790 [02:34<3:59:17,  2.14s/it]  1%|          | 75/6790 [02:35<3:49:28,  2.05s/it]                                                   {'loss': 1.7054, 'learning_rate': 0.00030000000000000003, 'epoch': 0.01}
+  1%|          | 75/6790 [02:35<3:49:28,  2.05s/it]  1%|          | 76/6790 [02:38<3:52:23,  2.08s/it]                                                   {'loss': 1.6632, 'learning_rate': 0.000304, 'epoch': 0.01}
+  1%|          | 76/6790 [02:38<3:52:23,  2.08s/it]  1%|          | 77/6790 [02:39<3:43:39,  2.00s/it]                                                   {'loss': 1.4799, 'learning_rate': 0.000308, 'epoch': 0.01}
+  1%|          | 77/6790 [02:39<3:43:39,  2.00s/it]  1%|          | 78/6790 [02:41<3:42:11,  1.99s/it]                                                   {'loss': 1.7129, 'learning_rate': 0.00031200000000000005, 'epoch': 0.01}
+  1%|          | 78/6790 [02:41<3:42:11,  1.99s/it]  1%|          | 79/6790 [02:43<3:34:16,  1.92s/it]                                                   {'loss': 1.5251, 'learning_rate': 0.00031600000000000004, 'epoch': 0.01}
+  1%|          | 79/6790 [02:43<3:34:16,  1.92s/it]  1%|          | 80/6790 [02:45<3:40:33,  1.97s/it]                                                   {'loss': 1.7884, 'learning_rate': 0.00032, 'epoch': 0.01}
+  1%|          | 80/6790 [02:45<3:40:33,  1.97s/it]  1%|          | 81/6790 [02:48<3:50:13,  2.06s/it]                                                   {'loss': 1.5816, 'learning_rate': 0.000324, 'epoch': 0.01}
+  1%|          | 81/6790 [02:48<3:50:13,  2.06s/it]  1%|          | 82/6790 [02:49<3:47:09,  2.03s/it]                                                   {'loss': 1.5653, 'learning_rate': 0.000328, 'epoch': 0.01}
+  1%|          | 82/6790 [02:49<3:47:09,  2.03s/it]  1%|          | 83/6790 [02:52<3:53:18,  2.09s/it]                                                   {'loss': 1.7663, 'learning_rate': 0.000332, 'epoch': 0.01}
+  1%|          | 83/6790 [02:52<3:53:18,  2.09s/it]  1%|          | 84/6790 [02:54<3:47:31,  2.04s/it]                                                   {'loss': 1.6489, 'learning_rate': 0.000336, 'epoch': 0.01}
+  1%|          | 84/6790 [02:54<3:47:31,  2.04s/it]  1%|▏         | 85/6790 [02:56<3:49:49,  2.06s/it]                                                   {'loss': 1.8255, 'learning_rate': 0.00034, 'epoch': 0.01}
+  1%|▏         | 85/6790 [02:56<3:49:49,  2.06s/it]  1%|▏         | 86/6790 [02:58<4:00:23,  2.15s/it]                                                   {'loss': 1.5156, 'learning_rate': 0.000344, 'epoch': 0.01}
+  1%|▏         | 86/6790 [02:58<4:00:23,  2.15s/it]  1%|▏         | 87/6790 [03:00<3:47:25,  2.04s/it]                                                   {'loss': 1.3183, 'learning_rate': 0.000348, 'epoch': 0.01}
+  1%|▏         | 87/6790 [03:00<3:47:25,  2.04s/it]  1%|▏         | 88/6790 [03:02<3:50:20,  2.06s/it]                                                   {'loss': 1.4092, 'learning_rate': 0.00035200000000000005, 'epoch': 0.01}
+  1%|▏         | 88/6790 [03:02<3:50:20,  2.06s/it]  1%|▏         | 89/6790 [03:04<3:48:02,  2.04s/it]                                                   {'loss': 1.5494, 'learning_rate': 0.00035600000000000003, 'epoch': 0.01}
+  1%|▏         | 89/6790 [03:04<3:48:02,  2.04s/it]  1%|▏         | 90/6790 [03:06<3:42:00,  1.99s/it]                                                   {'loss': 1.6793, 'learning_rate': 0.00036, 'epoch': 0.01}
+  1%|▏         | 90/6790 [03:06<3:42:00,  1.99s/it]  1%|▏         | 91/6790 [03:08<3:41:33,  1.98s/it]                                                   {'loss': 1.5925, 'learning_rate': 0.000364, 'epoch': 0.01}
+  1%|▏         | 91/6790 [03:08<3:41:33,  1.98s/it]  1%|▏         | 92/6790 [03:10<3:45:13,  2.02s/it]                                                   {'loss': 1.5937, 'learning_rate': 0.00036800000000000005, 'epoch': 0.01}
+  1%|▏         | 92/6790 [03:10<3:45:13,  2.02s/it]  1%|▏         | 93/6790 [03:12<3:59:17,  2.14s/it]                                                   {'loss': 1.7434, 'learning_rate': 0.00037200000000000004, 'epoch': 0.01}
+  1%|▏         | 93/6790 [03:12<3:59:17,  2.14s/it]  1%|▏         | 94/6790 [03:14<3:58:18,  2.14s/it]                                                   {'loss': 1.6751, 'learning_rate': 0.000376, 'epoch': 0.01}
+  1%|▏         | 94/6790 [03:14<3:58:18,  2.14s/it]  1%|▏         | 95/6790 [03:17<4:02:53,  2.18s/it]                                                   {'loss': 1.7545, 'learning_rate': 0.00038, 'epoch': 0.01}
+  1%|▏         | 95/6790 [03:17<4:02:53,  2.18s/it]  1%|▏         | 96/6790 [03:19<3:54:07,  2.10s/it]                                                   {'loss': 1.8709, 'learning_rate': 0.000384, 'epoch': 0.01}
+  1%|▏         | 96/6790 [03:19<3:54:07,  2.10s/it]  1%|▏         | 97/6790 [03:21<3:52:45,  2.09s/it]                                                   {'loss': 1.7035, 'learning_rate': 0.000388, 'epoch': 0.01}
+  1%|▏         | 97/6790 [03:21<3:52:45,  2.09s/it]  1%|▏         | 98/6790 [03:23<3:56:30,  2.12s/it]                                                   {'loss': 1.6354, 'learning_rate': 0.000392, 'epoch': 0.01}
+  1%|▏         | 98/6790 [03:23<3:56:30,  2.12s/it]  1%|▏         | 99/6790 [03:25<3:59:24,  2.15s/it]                                                   {'loss': 1.697, 'learning_rate': 0.00039600000000000003, 'epoch': 0.01}
+  1%|▏         | 99/6790 [03:25<3:59:24,  2.15s/it]  1%|▏         | 100/6790 [03:27<3:54:50,  2.11s/it]                                                    {'loss': 1.4428, 'learning_rate': 0.0004, 'epoch': 0.01}
+  1%|▏         | 100/6790 [03:27<3:54:50,  2.11s/it]  1%|▏         | 101/6790 [03:29<3:56:37,  2.12s/it]                                                    {'loss': 1.7104, 'learning_rate': 0.0003999999779480245, 'epoch': 0.01}
+  1%|▏         | 101/6790 [03:29<3:56:37,  2.12s/it]  2%|▏         | 102/6790 [03:31<3:52:39,  2.09s/it]                                                    {'loss': 1.5222, 'learning_rate': 0.00039999991179210276, 'epoch': 0.02}
+  2%|▏         | 102/6790 [03:31<3:52:39,  2.09s/it]  2%|▏         | 103/6790 [03:34<4:09:02,  2.23s/it]                                                    {'loss': 1.6017, 'learning_rate': 0.00039999980153224943, 'epoch': 0.02}
+  2%|▏         | 103/6790 [03:34<4:09:02,  2.23s/it]  2%|▏         | 104/6790 [03:36<3:56:57,  2.13s/it]                                                    {'loss': 1.6301, 'learning_rate': 0.00039999964716848883, 'epoch': 0.02}
+  2%|▏         | 104/6790 [03:36<3:56:57,  2.13s/it]  2%|▏         | 105/6790 [03:38<3:53:44,  2.10s/it]                                                    {'loss': 1.5535, 'learning_rate': 0.0003999994487008549, 'epoch': 0.02}
+  2%|▏         | 105/6790 [03:38<3:53:44,  2.10s/it]  2%|▏         | 106/6790 [03:40<3:49:47,  2.06s/it]                                                    {'loss': 1.7935, 'learning_rate': 0.00039999920612939155, 'epoch': 0.02}
+  2%|▏         | 106/6790 [03:40<3:49:47,  2.06s/it]  2%|▏         | 107/6790 [03:42<3:39:17,  1.97s/it]                                                    {'loss': 1.7488, 'learning_rate': 0.0003999989194541522, 'epoch': 0.02}
+  2%|▏         | 107/6790 [03:42<3:39:17,  1.97s/it]  2%|▏         | 108/6790 [03:44<3:43:09,  2.00s/it]                                                    {'loss': 1.6292, 'learning_rate': 0.0003999985886752001, 'epoch': 0.02}
+  2%|▏         | 108/6790 [03:44<3:43:09,  2.00s/it]  2%|▏         | 109/6790 [03:46<3:41:30,  1.99s/it]                                                    {'loss': 1.5223, 'learning_rate': 0.00039999821379260817, 'epoch': 0.02}
+  2%|▏         | 109/6790 [03:46<3:41:30,  1.99s/it]  2%|▏         | 110/6790 [03:47<3:40:06,  1.98s/it]                                                    {'loss': 1.4636, 'learning_rate': 0.000399997794806459, 'epoch': 0.02}
+  2%|▏         | 110/6790 [03:47<3:40:06,  1.98s/it]  2%|▏         | 111/6790 [03:50<3:42:16,  2.00s/it]                                                    {'loss': 1.818, 'learning_rate': 0.0003999973317168451, 'epoch': 0.02}
+  2%|▏         | 111/6790 [03:50<3:42:16,  2.00s/it]  2%|▏         | 112/6790 [03:52<3:48:57,  2.06s/it]                                                    {'loss': 1.7942, 'learning_rate': 0.00039999682452386857, 'epoch': 0.02}
+  2%|▏         | 112/6790 [03:52<3:48:57,  2.06s/it]  2%|▏         | 113/6790 [03:54<3:54:23,  2.11s/it]                                                    {'loss': 1.7123, 'learning_rate': 0.0003999962732276412, 'epoch': 0.02}
+  2%|▏         | 113/6790 [03:54<3:54:23,  2.11s/it]  2%|▏         | 114/6790 [03:57<4:18:08,  2.32s/it]                                                    {'loss': 1.6798, 'learning_rate': 0.00039999567782828465, 'epoch': 0.02}
+  2%|▏         | 114/6790 [03:57<4:18:08,  2.32s/it]  2%|▏         | 115/6790 [03:59<4:13:52,  2.28s/it]                                                    {'loss': 1.7004, 'learning_rate': 0.0003999950383259301, 'epoch': 0.02}
+  2%|▏         | 115/6790 [03:59<4:13:52,  2.28s/it]  2%|▏         | 116/6790 [04:01<4:10:15,  2.25s/it]                                                    {'loss': 1.684, 'learning_rate': 0.00039999435472071876, 'epoch': 0.02}
+  2%|▏         | 116/6790 [04:01<4:10:15,  2.25s/it]  2%|▏         | 117/6790 [04:03<3:57:27,  2.14s/it]                                                    {'loss': 1.5815, 'learning_rate': 0.0003999936270128011, 'epoch': 0.02}
+  2%|▏         | 117/6790 [04:03<3:57:27,  2.14s/it]  2%|▏         | 118/6790 [04:05<3:58:10,  2.14s/it]                                                    {'loss': 1.6033, 'learning_rate': 0.0003999928552023378, 'epoch': 0.02}
+  2%|▏         | 118/6790 [04:05<3:58:10,  2.14s/it]  2%|▏         | 119/6790 [04:07<3:53:56,  2.10s/it]                                                    {'loss': 1.5368, 'learning_rate': 0.00039999203928949906, 'epoch': 0.02}
+  2%|▏         | 119/6790 [04:07<3:53:56,  2.10s/it]  2%|▏         | 120/6790 [04:09<4:00:08,  2.16s/it]                                                    {'loss': 1.6893, 'learning_rate': 0.0003999911792744648, 'epoch': 0.02}
+  2%|▏         | 120/6790 [04:09<4:00:08,  2.16s/it]  2%|▏         | 121/6790 [04:11<3:49:41,  2.07s/it]                                                    {'loss': 1.53, 'learning_rate': 0.00039999027515742454, 'epoch': 0.02}
+  2%|▏         | 121/6790 [04:11<3:49:41,  2.07s/it]  2%|▏         | 122/6790 [04:13<3:49:51,  2.07s/it]                                                    {'loss': 1.5987, 'learning_rate': 0.0003999893269385778, 'epoch': 0.02}
+  2%|▏         | 122/6790 [04:13<3:49:51,  2.07s/it]  2%|▏         | 123/6790 [04:15<3:45:46,  2.03s/it]                                                    {'loss': 1.6644, 'learning_rate': 0.00039998833461813354, 'epoch': 0.02}
+  2%|▏         | 123/6790 [04:15<3:45:46,  2.03s/it]  2%|▏         | 124/6790 [04:18<4:00:33,  2.17s/it]                                                    {'loss': 1.685, 'learning_rate': 0.0003999872981963107, 'epoch': 0.02}
+  2%|▏         | 124/6790 [04:18<4:00:33,  2.17s/it]  2%|▏         | 125/6790 [04:20<3:54:49,  2.11s/it]                                                    {'loss': 1.45, 'learning_rate': 0.0003999862176733378, 'epoch': 0.02}
+  2%|▏         | 125/6790 [04:20<3:54:49,  2.11s/it]  2%|▏         | 126/6790 [04:22<3:59:43,  2.16s/it]                                                    {'loss': 1.4791, 'learning_rate': 0.0003999850930494532, 'epoch': 0.02}
+  2%|▏         | 126/6790 [04:22<3:59:43,  2.16s/it]  2%|▏         | 127/6790 [04:24<3:56:13,  2.13s/it]                                                    {'loss': 1.7671, 'learning_rate': 0.0003999839243249047, 'epoch': 0.02}
+  2%|▏         | 127/6790 [04:24<3:56:13,  2.13s/it]  2%|▏         | 128/6790 [04:26<3:56:12,  2.13s/it]                                                    {'loss': 1.7443, 'learning_rate': 0.0003999827114999502, 'epoch': 0.02}
+  2%|▏         | 128/6790 [04:26<3:56:12,  2.13s/it]  2%|▏         | 129/6790 [04:29<4:06:33,  2.22s/it]                                                    {'loss': 1.7581, 'learning_rate': 0.0003999814545748571, 'epoch': 0.02}
+  2%|▏         | 129/6790 [04:29<4:06:33,  2.22s/it]  2%|▏         | 130/6790 [04:31<4:03:40,  2.20s/it]                                                    {'loss': 1.5924, 'learning_rate': 0.00039998015354990253, 'epoch': 0.02}
+  2%|▏         | 130/6790 [04:31<4:03:40,  2.20s/it]  2%|▏         | 131/6790 [04:33<3:54:07,  2.11s/it]                                                    {'loss': 1.4712, 'learning_rate': 0.0003999788084253735, 'epoch': 0.02}
+  2%|▏         | 131/6790 [04:33<3:54:07,  2.11s/it]  2%|▏         | 132/6790 [04:35<3:50:24,  2.08s/it]                                                    {'loss': 1.6466, 'learning_rate': 0.00039997741920156656, 'epoch': 0.02}
+  2%|▏         | 132/6790 [04:35<3:50:24,  2.08s/it]  2%|▏         | 133/6790 [04:37<3:58:13,  2.15s/it]                                                    {'loss': 1.6701, 'learning_rate': 0.00039997598587878806, 'epoch': 0.02}
+  2%|▏         | 133/6790 [04:37<3:58:13,  2.15s/it]  2%|▏         | 134/6790 [04:40<4:08:57,  2.24s/it]                                                    {'loss': 1.5634, 'learning_rate': 0.0003999745084573541, 'epoch': 0.02}
+  2%|▏         | 134/6790 [04:40<4:08:57,  2.24s/it]  2%|▏         | 135/6790 [04:41<3:56:40,  2.13s/it]                                                    {'loss': 1.695, 'learning_rate': 0.0003999729869375905, 'epoch': 0.02}
+  2%|▏         | 135/6790 [04:41<3:56:40,  2.13s/it]  2%|▏         | 136/6790 [04:43<3:51:14,  2.09s/it]                                                    {'loss': 1.5627, 'learning_rate': 0.0003999714213198327, 'epoch': 0.02}
+  2%|▏         | 136/6790 [04:43<3:51:14,  2.09s/it]  2%|▏         | 137/6790 [04:46<4:18:56,  2.34s/it]                                                    {'loss': 1.5928, 'learning_rate': 0.000399969811604426, 'epoch': 0.02}
+  2%|▏         | 137/6790 [04:46<4:18:56,  2.34s/it]  2%|▏         | 138/6790 [04:48<4:07:20,  2.23s/it]                                                    {'loss': 1.7722, 'learning_rate': 0.00039996815779172544, 'epoch': 0.02}
+  2%|▏         | 138/6790 [04:48<4:07:20,  2.23s/it]  2%|▏         | 139/6790 [04:50<3:53:22,  2.11s/it]                                                    {'loss': 1.627, 'learning_rate': 0.0003999664598820956, 'epoch': 0.02}
+  2%|▏         | 139/6790 [04:50<3:53:22,  2.11s/it]  2%|▏         | 140/6790 [04:52<3:51:46,  2.09s/it]                                                    {'loss': 1.6012, 'learning_rate': 0.000399964717875911, 'epoch': 0.02}
+  2%|▏         | 140/6790 [04:52<3:51:46,  2.09s/it]  2%|▏         | 141/6790 [04:54<3:55:39,  2.13s/it]                                                    {'loss': 1.5681, 'learning_rate': 0.00039996293177355574, 'epoch': 0.02}
+  2%|▏         | 141/6790 [04:54<3:55:39,  2.13s/it]  2%|▏         | 142/6790 [04:57<3:57:43,  2.15s/it]                                                    {'loss': 1.6342, 'learning_rate': 0.0003999611015754237, 'epoch': 0.02}
+  2%|▏         | 142/6790 [04:57<3:57:43,  2.15s/it]  2%|▏         | 143/6790 [04:59<3:58:21,  2.15s/it]                                                    {'loss': 1.6779, 'learning_rate': 0.0003999592272819184, 'epoch': 0.02}
+  2%|▏         | 143/6790 [04:59<3:58:21,  2.15s/it]  2%|▏         | 144/6790 [05:01<4:15:14,  2.30s/it]                                                    {'loss': 1.6892, 'learning_rate': 0.00039995730889345334, 'epoch': 0.02}
+  2%|▏         | 144/6790 [05:01<4:15:14,  2.30s/it]  2%|▏         | 145/6790 [05:04<4:14:13,  2.30s/it]                                                    {'loss': 1.3043, 'learning_rate': 0.0003999553464104514, 'epoch': 0.02}
+  2%|▏         | 145/6790 [05:04<4:14:13,  2.30s/it]  2%|▏         | 146/6790 [05:06<4:08:31,  2.24s/it]                                                    {'loss': 1.5841, 'learning_rate': 0.0003999533398333454, 'epoch': 0.02}
+  2%|▏         | 146/6790 [05:06<4:08:31,  2.24s/it]  2%|▏         | 147/6790 [05:08<3:54:57,  2.12s/it]                                                    {'loss': 1.6602, 'learning_rate': 0.00039995128916257784, 'epoch': 0.02}
+  2%|▏         | 147/6790 [05:08<3:54:57,  2.12s/it]  2%|▏         | 148/6790 [05:09<3:44:17,  2.03s/it]                                                    {'loss': 1.7782, 'learning_rate': 0.0003999491943986009, 'epoch': 0.02}
+  2%|▏         | 148/6790 [05:09<3:44:17,  2.03s/it]  2%|▏         | 149/6790 [05:12<4:07:08,  2.23s/it]                                                    {'loss': 1.7341, 'learning_rate': 0.0003999470555418766, 'epoch': 0.02}
+  2%|▏         | 149/6790 [05:12<4:07:08,  2.23s/it]  2%|▏         | 150/6790 [05:15<4:22:21,  2.37s/it]                                                    {'loss': 1.5795, 'learning_rate': 0.00039994487259287654, 'epoch': 0.02}
+  2%|▏         | 150/6790 [05:15<4:22:21,  2.37s/it]  2%|▏         | 151/6790 [05:17<4:09:04,  2.25s/it]                                                    {'loss': 1.6511, 'learning_rate': 0.00039994264555208203, 'epoch': 0.02}
+  2%|▏         | 151/6790 [05:17<4:09:04,  2.25s/it]  2%|▏         | 152/6790 [05:19<3:57:41,  2.15s/it]                                                    {'loss': 1.5869, 'learning_rate': 0.0003999403744199843, 'epoch': 0.02}
+  2%|▏         | 152/6790 [05:19<3:57:41,  2.15s/it]  2%|▏         | 153/6790 [05:21<3:50:38,  2.09s/it]                                                    {'loss': 1.5598, 'learning_rate': 0.00039993805919708416, 'epoch': 0.02}
+  2%|▏         | 153/6790 [05:21<3:50:38,  2.09s/it]  2%|▏         | 154/6790 [05:23<3:43:41,  2.02s/it]                                                    {'loss': 1.4968, 'learning_rate': 0.0003999356998838921, 'epoch': 0.02}
+  2%|▏         | 154/6790 [05:23<3:43:41,  2.02s/it]  2%|▏         | 155/6790 [05:25<3:43:33,  2.02s/it]                                                    {'loss': 1.868, 'learning_rate': 0.0003999332964809284, 'epoch': 0.02}
+  2%|▏         | 155/6790 [05:25<3:43:33,  2.02s/it]  2%|▏         | 156/6790 [05:27<3:41:59,  2.01s/it]                                                    {'loss': 1.5642, 'learning_rate': 0.00039993084898872313, 'epoch': 0.02}
+  2%|▏         | 156/6790 [05:27<3:41:59,  2.01s/it]  2%|▏         | 157/6790 [05:29<3:43:57,  2.03s/it]                                                    {'loss': 1.7403, 'learning_rate': 0.00039992835740781593, 'epoch': 0.02}
+  2%|▏         | 157/6790 [05:29<3:43:57,  2.03s/it]  2%|▏         | 158/6790 [05:30<3:39:13,  1.98s/it]                                                    {'loss': 1.6301, 'learning_rate': 0.0003999258217387563, 'epoch': 0.02}
+  2%|▏         | 158/6790 [05:30<3:39:13,  1.98s/it]  2%|▏         | 159/6790 [05:32<3:36:40,  1.96s/it]                                                    {'loss': 1.4405, 'learning_rate': 0.00039992324198210335, 'epoch': 0.02}
+  2%|▏         | 159/6790 [05:32<3:36:40,  1.96s/it]  2%|▏         | 160/6790 [05:34<3:39:54,  1.99s/it]                                                    {'loss': 1.5882, 'learning_rate': 0.00039992061813842603, 'epoch': 0.02}
+  2%|▏         | 160/6790 [05:34<3:39:54,  1.99s/it]  2%|▏         | 161/6790 [05:37<3:49:21,  2.08s/it]                                                    {'loss': 1.6731, 'learning_rate': 0.00039991795020830295, 'epoch': 0.02}
+  2%|▏         | 161/6790 [05:37<3:49:21,  2.08s/it]  2%|▏         | 162/6790 [05:39<3:47:58,  2.06s/it]                                                    {'loss': 1.6462, 'learning_rate': 0.00039991523819232235, 'epoch': 0.02}
+  2%|▏         | 162/6790 [05:39<3:47:58,  2.06s/it]  2%|▏         | 163/6790 [05:41<3:43:05,  2.02s/it]                                                    {'loss': 1.5686, 'learning_rate': 0.00039991248209108243, 'epoch': 0.02}
+  2%|▏         | 163/6790 [05:41<3:43:05,  2.02s/it]  2%|▏         | 164/6790 [05:43<3:46:31,  2.05s/it]                                                    {'loss': 1.6835, 'learning_rate': 0.0003999096819051908, 'epoch': 0.02}
+  2%|▏         | 164/6790 [05:43<3:46:31,  2.05s/it]  2%|▏         | 165/6790 [05:45<3:49:53,  2.08s/it]                                                    {'loss': 1.4027, 'learning_rate': 0.0003999068376352651, 'epoch': 0.02}
+  2%|▏         | 165/6790 [05:45<3:49:53,  2.08s/it]  2%|▏         | 166/6790 [05:47<3:53:30,  2.12s/it]                                                    {'loss': 1.2967, 'learning_rate': 0.0003999039492819324, 'epoch': 0.02}
+  2%|▏         | 166/6790 [05:47<3:53:30,  2.12s/it]  2%|▏         | 167/6790 [05:49<3:47:42,  2.06s/it]                                                    {'loss': 1.3614, 'learning_rate': 0.0003999010168458297, 'epoch': 0.02}
+  2%|▏         | 167/6790 [05:49<3:47:42,  2.06s/it]  2%|▏         | 168/6790 [05:51<3:47:38,  2.06s/it]                                                    {'loss': 1.5476, 'learning_rate': 0.0003998980403276038, 'epoch': 0.02}
+  2%|▏         | 168/6790 [05:51<3:47:38,  2.06s/it]  2%|▏         | 169/6790 [05:53<3:54:15,  2.12s/it]                                                    {'loss': 1.6363, 'learning_rate': 0.0003998950197279109, 'epoch': 0.02}
+  2%|▏         | 169/6790 [05:53<3:54:15,  2.12s/it]  3%|▎         | 170/6790 [05:55<3:50:34,  2.09s/it]                                                    {'loss': 1.5766, 'learning_rate': 0.0003998919550474172, 'epoch': 0.03}
+  3%|▎         | 170/6790 [05:55<3:50:34,  2.09s/it]  3%|▎         | 171/6790 [05:57<3:47:47,  2.06s/it]                                                    {'loss': 1.807, 'learning_rate': 0.0003998888462867985, 'epoch': 0.03}
+  3%|▎         | 171/6790 [05:57<3:47:47,  2.06s/it]  3%|▎         | 172/6790 [05:59<3:35:21,  1.95s/it]                                                    {'loss': 1.4256, 'learning_rate': 0.0003998856934467403, 'epoch': 0.03}
+  3%|▎         | 172/6790 [05:59<3:35:21,  1.95s/it]  3%|▎         | 173/6790 [06:01<3:37:08,  1.97s/it]                                                    {'loss': 1.3884, 'learning_rate': 0.0003998824965279379, 'epoch': 0.03}
+  3%|▎         | 173/6790 [06:01<3:37:08,  1.97s/it]  3%|▎         | 174/6790 [06:03<3:35:19,  1.95s/it]                                                    {'loss': 1.6485, 'learning_rate': 0.00039987925553109624, 'epoch': 0.03}
+  3%|▎         | 174/6790 [06:03<3:35:19,  1.95s/it]  3%|▎         | 175/6790 [06:05<3:36:32,  1.96s/it]                                                    {'loss': 1.6324, 'learning_rate': 0.00039987597045693015, 'epoch': 0.03}
+  3%|▎         | 175/6790 [06:05<3:36:32,  1.96s/it]  3%|▎         | 176/6790 [06:07<3:39:02,  1.99s/it]                                                    {'loss': 1.5961, 'learning_rate': 0.0003998726413061639, 'epoch': 0.03}
+  3%|▎         | 176/6790 [06:07<3:39:02,  1.99s/it]  3%|▎         | 177/6790 [06:09<3:34:36,  1.95s/it]                                                    {'loss': 1.4983, 'learning_rate': 0.00039986926807953173, 'epoch': 0.03}
+  3%|▎         | 177/6790 [06:09<3:34:36,  1.95s/it]  3%|▎         | 178/6790 [06:11<3:42:28,  2.02s/it]                                                    {'loss': 1.7092, 'learning_rate': 0.00039986585077777745, 'epoch': 0.03}
+  3%|▎         | 178/6790 [06:11<3:42:28,  2.02s/it]  3%|▎         | 179/6790 [06:13<3:43:51,  2.03s/it]                                                    {'loss': 1.6379, 'learning_rate': 0.00039986238940165465, 'epoch': 0.03}
+  3%|▎         | 179/6790 [06:13<3:43:51,  2.03s/it]  3%|▎         | 180/6790 [06:15<3:42:05,  2.02s/it]                                                    {'loss': 1.7078, 'learning_rate': 0.00039985888395192674, 'epoch': 0.03}
+  3%|▎         | 180/6790 [06:15<3:42:05,  2.02s/it]  3%|▎         | 181/6790 [06:18<4:00:09,  2.18s/it]                                                    {'loss': 1.5577, 'learning_rate': 0.00039985533442936654, 'epoch': 0.03}
+  3%|▎         | 181/6790 [06:18<4:00:09,  2.18s/it]  3%|▎         | 182/6790 [06:20<3:52:28,  2.11s/it]                                                    {'loss': 1.6209, 'learning_rate': 0.000399851740834757, 'epoch': 0.03}
+  3%|▎         | 182/6790 [06:20<3:52:28,  2.11s/it]  3%|▎         | 183/6790 [06:22<3:49:47,  2.09s/it]                                                    {'loss': 1.4901, 'learning_rate': 0.0003998481031688904, 'epoch': 0.03}
+  3%|▎         | 183/6790 [06:22<3:49:47,  2.09s/it]  3%|▎         | 184/6790 [06:24<3:48:36,  2.08s/it]                                                    {'loss': 1.8356, 'learning_rate': 0.000399844421432569, 'epoch': 0.03}
+  3%|▎         | 184/6790 [06:24<3:48:36,  2.08s/it]  3%|▎         | 185/6790 [06:26<3:45:09,  2.05s/it]                                                    {'loss': 1.7403, 'learning_rate': 0.0003998406956266047, 'epoch': 0.03}
+  3%|▎         | 185/6790 [06:26<3:45:09,  2.05s/it]  3%|▎         | 186/6790 [06:28<3:45:03,  2.04s/it]                                                    {'loss': 1.4272, 'learning_rate': 0.0003998369257518191, 'epoch': 0.03}
+  3%|▎         | 186/6790 [06:28<3:45:03,  2.04s/it]  3%|▎         | 187/6790 [06:30<3:36:05,  1.96s/it]                                                    {'loss': 1.6484, 'learning_rate': 0.0003998331118090435, 'epoch': 0.03}
+  3%|▎         | 187/6790 [06:30<3:36:05,  1.96s/it]  3%|▎         | 188/6790 [06:31<3:34:09,  1.95s/it]                                                    {'loss': 1.515, 'learning_rate': 0.0003998292537991191, 'epoch': 0.03}
+  3%|▎         | 188/6790 [06:31<3:34:09,  1.95s/it]  3%|▎         | 189/6790 [06:33<3:35:28,  1.96s/it]                                                    {'loss': 1.7864, 'learning_rate': 0.00039982535172289644, 'epoch': 0.03}
+  3%|▎         | 189/6790 [06:33<3:35:28,  1.96s/it]  3%|▎         | 190/6790 [06:36<3:41:29,  2.01s/it]                                                    {'loss': 1.5783, 'learning_rate': 0.00039982140558123615, 'epoch': 0.03}
+  3%|▎         | 190/6790 [06:36<3:41:29,  2.01s/it]  3%|▎         | 191/6790 [06:37<3:33:00,  1.94s/it]                                                    {'loss': 1.6643, 'learning_rate': 0.00039981741537500843, 'epoch': 0.03}
+  3%|▎         | 191/6790 [06:37<3:33:00,  1.94s/it]  3%|▎         | 192/6790 [06:40<3:48:59,  2.08s/it]                                                    {'loss': 1.6573, 'learning_rate': 0.0003998133811050931, 'epoch': 0.03}
+  3%|▎         | 192/6790 [06:40<3:48:59,  2.08s/it]  3%|▎         | 193/6790 [06:42<3:56:58,  2.16s/it]                                                    {'loss': 1.4607, 'learning_rate': 0.0003998093027723799, 'epoch': 0.03}
+  3%|▎         | 193/6790 [06:42<3:56:58,  2.16s/it]  3%|▎         | 194/6790 [06:44<3:54:46,  2.14s/it]                                                    {'loss': 1.4438, 'learning_rate': 0.0003998051803777682, 'epoch': 0.03}
+  3%|▎         | 194/6790 [06:44<3:54:46,  2.14s/it]  3%|▎         | 195/6790 [06:46<3:51:33,  2.11s/it]                                                    {'loss': 1.7795, 'learning_rate': 0.000399801013922167, 'epoch': 0.03}
+  3%|▎         | 195/6790 [06:46<3:51:33,  2.11s/it]  3%|▎         | 196/6790 [06:48<3:56:09,  2.15s/it]                                                    {'loss': 1.7432, 'learning_rate': 0.00039979680340649504, 'epoch': 0.03}
+  3%|▎         | 196/6790 [06:48<3:56:09,  2.15s/it]  3%|▎         | 197/6790 [06:51<3:54:43,  2.14s/it]                                                    {'loss': 1.5958, 'learning_rate': 0.00039979254883168095, 'epoch': 0.03}
+  3%|▎         | 197/6790 [06:51<3:54:43,  2.14s/it]  3%|▎         | 198/6790 [06:53<3:52:19,  2.11s/it]                                                    {'loss': 1.541, 'learning_rate': 0.00039978825019866283, 'epoch': 0.03}
+  3%|▎         | 198/6790 [06:53<3:52:19,  2.11s/it]  3%|▎         | 199/6790 [06:54<3:43:01,  2.03s/it]                                                    {'loss': 1.8556, 'learning_rate': 0.00039978390750838866, 'epoch': 0.03}
+  3%|▎         | 199/6790 [06:54<3:43:01,  2.03s/it]  3%|▎         | 200/6790 [06:57<3:59:03,  2.18s/it]                                                    {'loss': 1.6584, 'learning_rate': 0.0003997795207618162, 'epoch': 0.03}
+  3%|▎         | 200/6790 [06:57<3:59:03,  2.18s/it]  3%|▎         | 201/6790 [06:59<4:07:09,  2.25s/it]                                                    {'loss': 1.4267, 'learning_rate': 0.0003997750899599126, 'epoch': 0.03}
+  3%|▎         | 201/6790 [06:59<4:07:09,  2.25s/it]  3%|▎         | 202/6790 [07:01<3:53:15,  2.12s/it]                                                    {'loss': 1.4841, 'learning_rate': 0.0003997706151036551, 'epoch': 0.03}
+  3%|▎         | 202/6790 [07:01<3:53:15,  2.12s/it]  3%|▎         | 203/6790 [07:03<3:49:57,  2.09s/it]                                                    {'loss': 1.5104, 'learning_rate': 0.0003997660961940304, 'epoch': 0.03}
+  3%|▎         | 203/6790 [07:03<3:49:57,  2.09s/it]  3%|▎         | 204/6790 [07:05<3:53:31,  2.13s/it]                                                    {'loss': 1.596, 'learning_rate': 0.00039976153323203513, 'epoch': 0.03}
+  3%|▎         | 204/6790 [07:05<3:53:31,  2.13s/it]  3%|▎         | 205/6790 [07:07<3:50:42,  2.10s/it]                                                    {'loss': 1.5982, 'learning_rate': 0.00039975692621867535, 'epoch': 0.03}
+  3%|▎         | 205/6790 [07:07<3:50:42,  2.10s/it]  3%|▎         | 206/6790 [07:10<3:59:32,  2.18s/it]                                                    {'loss': 1.7528, 'learning_rate': 0.00039975227515496713, 'epoch': 0.03}
+  3%|▎         | 206/6790 [07:10<3:59:32,  2.18s/it]  3%|▎         | 207/6790 [07:13<4:22:21,  2.39s/it]                                                    {'loss': 1.3808, 'learning_rate': 0.0003997475800419361, 'epoch': 0.03}
+  3%|▎         | 207/6790 [07:13<4:22:21,  2.39s/it]  3%|▎         | 208/6790 [07:15<4:08:52,  2.27s/it]                                                    {'loss': 1.8153, 'learning_rate': 0.0003997428408806175, 'epoch': 0.03}
+  3%|▎         | 208/6790 [07:15<4:08:52,  2.27s/it]  3%|▎         | 209/6790 [07:17<4:02:24,  2.21s/it]                                                    {'loss': 1.5508, 'learning_rate': 0.00039973805767205665, 'epoch': 0.03}
+  3%|▎         | 209/6790 [07:17<4:02:24,  2.21s/it]  3%|▎         | 210/6790 [07:19<3:53:20,  2.13s/it]                                                    {'loss': 1.6476, 'learning_rate': 0.0003997332304173081, 'epoch': 0.03}
+  3%|▎         | 210/6790 [07:19<3:53:20,  2.13s/it]  3%|▎         | 211/6790 [07:21<3:45:42,  2.06s/it]                                                    {'loss': 1.4912, 'learning_rate': 0.00039972835911743644, 'epoch': 0.03}
+  3%|▎         | 211/6790 [07:21<3:45:42,  2.06s/it]  3%|▎         | 212/6790 [07:23<3:45:18,  2.06s/it]                                                    {'loss': 1.4338, 'learning_rate': 0.000399723443773516, 'epoch': 0.03}
+  3%|▎         | 212/6790 [07:23<3:45:18,  2.06s/it]  3%|▎         | 213/6790 [07:25<3:45:52,  2.06s/it]                                                    {'loss': 1.5958, 'learning_rate': 0.0003997184843866305, 'epoch': 0.03}
+  3%|▎         | 213/6790 [07:25<3:45:52,  2.06s/it]  3%|▎         | 214/6790 [07:27<3:45:50,  2.06s/it]                                                    {'loss': 1.606, 'learning_rate': 0.00039971348095787373, 'epoch': 0.03}
+  3%|▎         | 214/6790 [07:27<3:45:50,  2.06s/it]  3%|▎         | 215/6790 [07:29<3:39:33,  2.00s/it]                                                    {'loss': 1.5469, 'learning_rate': 0.00039970843348834903, 'epoch': 0.03}
+  3%|▎         | 215/6790 [07:29<3:39:33,  2.00s/it]  3%|▎         | 216/6790 [07:31<3:39:26,  2.00s/it]                                                    {'loss': 1.4804, 'learning_rate': 0.0003997033419791695, 'epoch': 0.03}
+  3%|▎         | 216/6790 [07:31<3:39:26,  2.00s/it]  3%|▎         | 217/6790 [07:33<3:44:11,  2.05s/it]                                                    {'loss': 1.6223, 'learning_rate': 0.0003996982064314578, 'epoch': 0.03}
+  3%|▎         | 217/6790 [07:33<3:44:11,  2.05s/it]  3%|▎         | 218/6790 [07:35<3:35:47,  1.97s/it]                                                    {'loss': 1.5996, 'learning_rate': 0.0003996930268463465, 'epoch': 0.03}
+  3%|▎         | 218/6790 [07:35<3:35:47,  1.97s/it]  3%|▎         | 219/6790 [07:36<3:31:58,  1.94s/it]                                                    {'loss': 1.608, 'learning_rate': 0.00039968780322497777, 'epoch': 0.03}
+  3%|▎         | 219/6790 [07:36<3:31:58,  1.94s/it]  3%|▎         | 220/6790 [07:38<3:34:59,  1.96s/it]                                                    {'loss': 1.5006, 'learning_rate': 0.00039968253556850355, 'epoch': 0.03}
+  3%|▎         | 220/6790 [07:39<3:34:59,  1.96s/it]  3%|▎         | 221/6790 [07:41<3:42:17,  2.03s/it]                                                    {'loss': 1.5793, 'learning_rate': 0.0003996772238780855, 'epoch': 0.03}
+  3%|▎         | 221/6790 [07:41<3:42:17,  2.03s/it]  3%|▎         | 222/6790 [07:43<3:35:42,  1.97s/it]                                                    {'loss': 1.4451, 'learning_rate': 0.00039967186815489486, 'epoch': 0.03}
+  3%|▎         | 222/6790 [07:43<3:35:42,  1.97s/it]  3%|▎         | 223/6790 [07:44<3:34:09,  1.96s/it]                                                    {'loss': 1.7581, 'learning_rate': 0.0003996664684001127, 'epoch': 0.03}
+  3%|▎         | 223/6790 [07:44<3:34:09,  1.96s/it]  3%|▎         | 224/6790 [07:46<3:36:50,  1.98s/it]                                                    {'loss': 1.497, 'learning_rate': 0.0003996610246149298, 'epoch': 0.03}
+  3%|▎         | 224/6790 [07:46<3:36:50,  1.98s/it]  3%|▎         | 225/6790 [07:49<3:45:05,  2.06s/it]                                                    {'loss': 1.4664, 'learning_rate': 0.0003996555368005466, 'epoch': 0.03}
+  3%|▎         | 225/6790 [07:49<3:45:05,  2.06s/it]  3%|▎         | 226/6790 [07:51<3:43:56,  2.05s/it]                                                    {'loss': 1.6605, 'learning_rate': 0.00039965000495817334, 'epoch': 0.03}
+  3%|▎         | 226/6790 [07:51<3:43:56,  2.05s/it]  3%|▎         | 227/6790 [07:53<3:46:47,  2.07s/it]                                                    {'loss': 1.8601, 'learning_rate': 0.0003996444290890298, 'epoch': 0.03}
+  3%|▎         | 227/6790 [07:53<3:46:47,  2.07s/it]  3%|▎         | 228/6790 [07:55<3:52:57,  2.13s/it]                                                    {'loss': 1.5943, 'learning_rate': 0.0003996388091943456, 'epoch': 0.03}
+  3%|▎         | 228/6790 [07:55<3:52:57,  2.13s/it]  3%|▎         | 229/6790 [07:57<3:44:14,  2.05s/it]                                                    {'loss': 1.405, 'learning_rate': 0.0003996331452753601, 'epoch': 0.03}
+  3%|▎         | 229/6790 [07:57<3:44:14,  2.05s/it]  3%|▎         | 230/6790 [07:59<3:48:29,  2.09s/it]                                                    {'loss': 1.8435, 'learning_rate': 0.00039962743733332217, 'epoch': 0.03}
+  3%|▎         | 230/6790 [07:59<3:48:29,  2.09s/it]  3%|▎         | 231/6790 [08:01<3:45:32,  2.06s/it]                                                    {'loss': 1.7668, 'learning_rate': 0.00039962168536949067, 'epoch': 0.03}
+  3%|▎         | 231/6790 [08:01<3:45:32,  2.06s/it]  3%|▎         | 232/6790 [08:04<3:57:09,  2.17s/it]                                                    {'loss': 1.5809, 'learning_rate': 0.000399615889385134, 'epoch': 0.03}
+  3%|▎         | 232/6790 [08:04<3:57:09,  2.17s/it]  3%|▎         | 233/6790 [08:06<3:50:04,  2.11s/it]                                                    {'loss': 1.3963, 'learning_rate': 0.0003996100493815302, 'epoch': 0.03}
+  3%|▎         | 233/6790 [08:06<3:50:04,  2.11s/it]  3%|▎         | 234/6790 [08:08<3:48:46,  2.09s/it]                                                    {'loss': 1.7476, 'learning_rate': 0.00039960416535996717, 'epoch': 0.03}
+  3%|▎         | 234/6790 [08:08<3:48:46,  2.09s/it]  3%|▎         | 235/6790 [08:10<3:43:36,  2.05s/it]                                                    {'loss': 1.5147, 'learning_rate': 0.0003995982373217424, 'epoch': 0.03}
+  3%|▎         | 235/6790 [08:10<3:43:36,  2.05s/it]  3%|▎         | 236/6790 [08:12<3:49:01,  2.10s/it]                                                    {'loss': 1.8521, 'learning_rate': 0.00039959226526816317, 'epoch': 0.03}
+  3%|▎         | 236/6790 [08:12<3:49:01,  2.10s/it]  3%|▎         | 237/6790 [08:14<3:58:12,  2.18s/it]                                                    {'loss': 1.5722, 'learning_rate': 0.00039958624920054654, 'epoch': 0.03}
+  3%|▎         | 237/6790 [08:14<3:58:12,  2.18s/it]  4%|▎         | 238/6790 [08:16<3:54:16,  2.15s/it]                                                    {'loss': 1.6618, 'learning_rate': 0.00039958018912021896, 'epoch': 0.04}
+  4%|▎         | 238/6790 [08:16<3:54:16,  2.15s/it]  4%|▎         | 239/6790 [08:18<3:48:49,  2.10s/it]                                                    {'loss': 1.5729, 'learning_rate': 0.00039957408502851703, 'epoch': 0.04}
+  4%|▎         | 239/6790 [08:18<3:48:49,  2.10s/it]  4%|▎         | 240/6790 [08:20<3:42:31,  2.04s/it]                                                    {'loss': 1.5775, 'learning_rate': 0.0003995679369267866, 'epoch': 0.04}
+  4%|▎         | 240/6790 [08:20<3:42:31,  2.04s/it]  4%|▎         | 241/6790 [08:22<3:44:29,  2.06s/it]                                                    {'loss': 1.5679, 'learning_rate': 0.00039956174481638364, 'epoch': 0.04}
+  4%|▎         | 241/6790 [08:22<3:44:29,  2.06s/it]  4%|▎         | 242/6790 [08:24<3:44:20,  2.06s/it]                                                    {'loss': 1.706, 'learning_rate': 0.0003995555086986735, 'epoch': 0.04}
+  4%|▎         | 242/6790 [08:24<3:44:20,  2.06s/it]  4%|▎         | 243/6790 [08:26<3:39:24,  2.01s/it]                                                    {'loss': 1.5541, 'learning_rate': 0.0003995492285750315, 'epoch': 0.04}
+  4%|▎         | 243/6790 [08:26<3:39:24,  2.01s/it]  4%|▎         | 244/6790 [08:28<3:32:46,  1.95s/it]                                                    {'loss': 1.4252, 'learning_rate': 0.00039954290444684236, 'epoch': 0.04}
+  4%|▎         | 244/6790 [08:28<3:32:46,  1.95s/it]  4%|▎         | 245/6790 [08:30<3:40:29,  2.02s/it]                                                    {'loss': 1.3999, 'learning_rate': 0.0003995365363155008, 'epoch': 0.04}
+  4%|▎         | 245/6790 [08:30<3:40:29,  2.02s/it]  4%|▎         | 246/6790 [08:32<3:37:56,  2.00s/it]                                                    {'loss': 1.581, 'learning_rate': 0.00039953012418241104, 'epoch': 0.04}
+  4%|▎         | 246/6790 [08:32<3:37:56,  2.00s/it]  4%|▎         | 247/6790 [08:34<3:44:27,  2.06s/it]                                                    {'loss': 1.6188, 'learning_rate': 0.0003995236680489871, 'epoch': 0.04}
+  4%|▎         | 247/6790 [08:34<3:44:27,  2.06s/it]  4%|▎         | 248/6790 [08:36<3:42:25,  2.04s/it]                                                    {'loss': 1.4069, 'learning_rate': 0.00039951716791665275, 'epoch': 0.04}
+  4%|▎         | 248/6790 [08:36<3:42:25,  2.04s/it]  4%|▎         | 249/6790 [08:39<3:51:33,  2.12s/it]                                                    {'loss': 1.4419, 'learning_rate': 0.0003995106237868414, 'epoch': 0.04}
+  4%|▎         | 249/6790 [08:39<3:51:33,  2.12s/it]  4%|▎         | 250/6790 [08:41<3:50:15,  2.11s/it]                                                    {'loss': 1.599, 'learning_rate': 0.0003995040356609961, 'epoch': 0.04}
+  4%|▎         | 250/6790 [08:41<3:50:15,  2.11s/it]  4%|▎         | 251/6790 [08:43<3:45:39,  2.07s/it]                                                    {'loss': 1.5566, 'learning_rate': 0.0003994974035405696, 'epoch': 0.04}
+  4%|▎         | 251/6790 [08:43<3:45:39,  2.07s/it]  4%|▎         | 252/6790 [08:45<3:43:50,  2.05s/it]                                                    {'loss': 1.4832, 'learning_rate': 0.00039949072742702455, 'epoch': 0.04}
+  4%|▎         | 252/6790 [08:45<3:43:50,  2.05s/it]  4%|▎         | 253/6790 [08:47<3:40:52,  2.03s/it]                                                    {'loss': 1.5697, 'learning_rate': 0.0003994840073218331, 'epoch': 0.04}
+  4%|▎         | 253/6790 [08:47<3:40:52,  2.03s/it]  4%|▎         | 254/6790 [08:50<4:09:45,  2.29s/it]                                                    {'loss': 1.4782, 'learning_rate': 0.0003994772432264771, 'epoch': 0.04}
+  4%|▎         | 254/6790 [08:50<4:09:45,  2.29s/it]  4%|▍         | 255/6790 [08:52<3:58:25,  2.19s/it]                                                    {'loss': 1.5058, 'learning_rate': 0.00039947043514244836, 'epoch': 0.04}
+  4%|▍         | 255/6790 [08:52<3:58:25,  2.19s/it]  4%|▍         | 256/6790 [08:53<3:49:39,  2.11s/it]                                                    {'loss': 1.6365, 'learning_rate': 0.000399463583071248, 'epoch': 0.04}
+  4%|▍         | 256/6790 [08:53<3:49:39,  2.11s/it]  4%|▍         | 257/6790 [08:56<3:55:20,  2.16s/it]                                                    {'loss': 1.7114, 'learning_rate': 0.0003994566870143872, 'epoch': 0.04}
+  4%|▍         | 257/6790 [08:56<3:55:20,  2.16s/it]  4%|▍         | 258/6790 [08:58<3:52:15,  2.13s/it]                                                    {'loss': 1.5717, 'learning_rate': 0.00039944974697338643, 'epoch': 0.04}
+  4%|▍         | 258/6790 [08:58<3:52:15,  2.13s/it]  4%|▍         | 259/6790 [09:00<3:49:42,  2.11s/it]                                                    {'loss': 1.6165, 'learning_rate': 0.0003994427629497764, 'epoch': 0.04}
+  4%|▍         | 259/6790 [09:00<3:49:42,  2.11s/it]  4%|▍         | 260/6790 [09:02<3:52:30,  2.14s/it]                                                    {'loss': 1.5864, 'learning_rate': 0.00039943573494509704, 'epoch': 0.04}
+  4%|▍         | 260/6790 [09:02<3:52:30,  2.14s/it]  4%|▍         | 261/6790 [09:05<4:04:18,  2.25s/it]                                                    {'loss': 1.4914, 'learning_rate': 0.00039942866296089816, 'epoch': 0.04}
+  4%|▍         | 261/6790 [09:05<4:04:18,  2.25s/it]  4%|▍         | 262/6790 [09:07<3:59:53,  2.20s/it]                                                    {'loss': 1.7077, 'learning_rate': 0.00039942154699873945, 'epoch': 0.04}
+  4%|▍         | 262/6790 [09:07<3:59:53,  2.20s/it]  4%|▍         | 263/6790 [09:09<4:04:01,  2.24s/it]                                                    {'loss': 1.5882, 'learning_rate': 0.00039941438706018995, 'epoch': 0.04}
+  4%|▍         | 263/6790 [09:09<4:04:01,  2.24s/it]  4%|▍         | 264/6790 [09:11<4:05:33,  2.26s/it]                                                    {'loss': 1.3808, 'learning_rate': 0.00039940718314682855, 'epoch': 0.04}
+  4%|▍         | 264/6790 [09:11<4:05:33,  2.26s/it]  4%|▍         | 265/6790 [09:14<4:05:23,  2.26s/it]                                                    {'loss': 1.6445, 'learning_rate': 0.00039939993526024397, 'epoch': 0.04}
+  4%|▍         | 265/6790 [09:14<4:05:23,  2.26s/it]  4%|▍         | 266/6790 [09:16<4:15:13,  2.35s/it]                                                    {'loss': 1.4559, 'learning_rate': 0.00039939264340203444, 'epoch': 0.04}
+  4%|▍         | 266/6790 [09:16<4:15:13,  2.35s/it]  4%|▍         | 267/6790 [09:19<4:17:51,  2.37s/it]                                                    {'loss': 1.6483, 'learning_rate': 0.000399385307573808, 'epoch': 0.04}
+  4%|▍         | 267/6790 [09:19<4:17:51,  2.37s/it]  4%|▍         | 268/6790 [09:21<4:10:10,  2.30s/it]                                                    {'loss': 1.5486, 'learning_rate': 0.00039937792777718236, 'epoch': 0.04}
+  4%|▍         | 268/6790 [09:21<4:10:10,  2.30s/it]  4%|▍         | 269/6790 [09:23<4:05:27,  2.26s/it]                                                    {'loss': 1.5724, 'learning_rate': 0.00039937050401378483, 'epoch': 0.04}
+  4%|▍         | 269/6790 [09:23<4:05:27,  2.26s/it]  4%|▍         | 270/6790 [09:25<4:07:02,  2.27s/it]                                                    {'loss': 1.4924, 'learning_rate': 0.00039936303628525254, 'epoch': 0.04}
+  4%|▍         | 270/6790 [09:25<4:07:02,  2.27s/it]  4%|▍         | 271/6790 [09:27<4:01:56,  2.23s/it]                                                    {'loss': 1.601, 'learning_rate': 0.00039935552459323224, 'epoch': 0.04}
+  4%|▍         | 271/6790 [09:27<4:01:56,  2.23s/it]  4%|▍         | 272/6790 [09:29<3:59:29,  2.20s/it]                                                    {'loss': 1.7831, 'learning_rate': 0.00039934796893938054, 'epoch': 0.04}
+  4%|▍         | 272/6790 [09:29<3:59:29,  2.20s/it]  4%|▍         | 273/6790 [09:31<3:51:29,  2.13s/it]                                                    {'loss': 1.5741, 'learning_rate': 0.0003993403693253634, 'epoch': 0.04}
+  4%|▍         | 273/6790 [09:31<3:51:29,  2.13s/it]  4%|▍         | 274/6790 [09:33<3:50:31,  2.12s/it]                                                    {'loss': 1.2097, 'learning_rate': 0.0003993327257528569, 'epoch': 0.04}
+  4%|▍         | 274/6790 [09:33<3:50:31,  2.12s/it]  4%|▍         | 275/6790 [09:35<3:47:45,  2.10s/it]                                                    {'loss': 1.6514, 'learning_rate': 0.00039932503822354647, 'epoch': 0.04}
+  4%|▍         | 275/6790 [09:35<3:47:45,  2.10s/it]  4%|▍         | 276/6790 [09:37<3:40:24,  2.03s/it]                                                    {'loss': 1.6751, 'learning_rate': 0.00039931730673912737, 'epoch': 0.04}
+  4%|▍         | 276/6790 [09:37<3:40:24,  2.03s/it]  4%|▍         | 277/6790 [09:40<3:46:52,  2.09s/it]                                                    {'loss': 1.5137, 'learning_rate': 0.00039930953130130453, 'epoch': 0.04}
+  4%|▍         | 277/6790 [09:40<3:46:52,  2.09s/it]  4%|▍         | 278/6790 [09:41<3:39:49,  2.03s/it]                                                    {'loss': 1.5319, 'learning_rate': 0.00039930171191179266, 'epoch': 0.04}
+  4%|▍         | 278/6790 [09:41<3:39:49,  2.03s/it]  4%|▍         | 279/6790 [09:43<3:38:01,  2.01s/it]                                                    {'loss': 1.4837, 'learning_rate': 0.00039929384857231604, 'epoch': 0.04}
+  4%|▍         | 279/6790 [09:43<3:38:01,  2.01s/it]  4%|▍         | 280/6790 [09:45<3:36:46,  2.00s/it]                                                    {'loss': 1.4373, 'learning_rate': 0.0003992859412846087, 'epoch': 0.04}
+  4%|▍         | 280/6790 [09:45<3:36:46,  2.00s/it]  4%|▍         | 281/6790 [09:47<3:38:14,  2.01s/it]                                                    {'loss': 1.7161, 'learning_rate': 0.00039927799005041434, 'epoch': 0.04}
+  4%|▍         | 281/6790 [09:47<3:38:14,  2.01s/it]  4%|▍         | 282/6790 [09:50<3:43:15,  2.06s/it]                                                    {'loss': 1.6907, 'learning_rate': 0.0003992699948714864, 'epoch': 0.04}
+  4%|▍         | 282/6790 [09:50<3:43:15,  2.06s/it]  4%|▍         | 283/6790 [09:52<3:43:49,  2.06s/it]                                                    {'loss': 1.6317, 'learning_rate': 0.00039926195574958796, 'epoch': 0.04}
+  4%|▍         | 283/6790 [09:52<3:43:49,  2.06s/it]  4%|▍         | 284/6790 [09:54<3:44:42,  2.07s/it]                                                    {'loss': 1.6084, 'learning_rate': 0.00039925387268649183, 'epoch': 0.04}
+  4%|▍         | 284/6790 [09:54<3:44:42,  2.07s/it]  4%|▍         | 285/6790 [09:56<3:43:12,  2.06s/it]                                                    {'loss': 1.557, 'learning_rate': 0.0003992457456839804, 'epoch': 0.04}
+  4%|▍         | 285/6790 [09:56<3:43:12,  2.06s/it]  4%|▍         | 286/6790 [09:58<3:48:34,  2.11s/it]                                                    {'loss': 1.5411, 'learning_rate': 0.00039923757474384587, 'epoch': 0.04}
+  4%|▍         | 286/6790 [09:58<3:48:34,  2.11s/it]  4%|▍         | 287/6790 [10:00<3:44:04,  2.07s/it]                                                    {'loss': 1.4989, 'learning_rate': 0.0003992293598678902, 'epoch': 0.04}
+  4%|▍         | 287/6790 [10:00<3:44:04,  2.07s/it]  4%|▍         | 288/6790 [10:03<3:58:59,  2.21s/it]                                                    {'loss': 1.4845, 'learning_rate': 0.0003992211010579248, 'epoch': 0.04}
+  4%|▍         | 288/6790 [10:03<3:58:59,  2.21s/it]  4%|▍         | 289/6790 [10:05<3:52:21,  2.14s/it]                                                    {'loss': 1.7035, 'learning_rate': 0.00039921279831577094, 'epoch': 0.04}
+  4%|▍         | 289/6790 [10:05<3:52:21,  2.14s/it]  4%|▍         | 290/6790 [10:07<3:48:44,  2.11s/it]                                                    {'loss': 1.5035, 'learning_rate': 0.00039920445164325953, 'epoch': 0.04}
+  4%|▍         | 290/6790 [10:07<3:48:44,  2.11s/it]  4%|▍         | 291/6790 [10:09<3:46:59,  2.10s/it]                                                    {'loss': 1.5472, 'learning_rate': 0.00039919606104223116, 'epoch': 0.04}
+  4%|▍         | 291/6790 [10:09<3:46:59,  2.10s/it]  4%|▍         | 292/6790 [10:11<3:44:58,  2.08s/it]                                                    {'loss': 1.7518, 'learning_rate': 0.0003991876265145362, 'epoch': 0.04}
+  4%|▍         | 292/6790 [10:11<3:44:58,  2.08s/it]  4%|▍         | 293/6790 [10:13<3:38:11,  2.02s/it]                                                    {'loss': 1.515, 'learning_rate': 0.00039917914806203463, 'epoch': 0.04}
+  4%|▍         | 293/6790 [10:13<3:38:11,  2.02s/it]  4%|▍         | 294/6790 [10:15<3:45:12,  2.08s/it]                                                    {'loss': 1.7659, 'learning_rate': 0.00039917062568659603, 'epoch': 0.04}
+  4%|▍         | 294/6790 [10:15<3:45:12,  2.08s/it]  4%|▍         | 295/6790 [10:17<3:37:49,  2.01s/it]                                                    {'loss': 1.5993, 'learning_rate': 0.0003991620593900998, 'epoch': 0.04}
+  4%|▍         | 295/6790 [10:17<3:37:49,  2.01s/it]  4%|▍         | 296/6790 [10:19<3:35:10,  1.99s/it]                                                    {'loss': 1.4352, 'learning_rate': 0.0003991534491744349, 'epoch': 0.04}
+  4%|▍         | 296/6790 [10:19<3:35:10,  1.99s/it]  4%|▍         | 297/6790 [10:20<3:32:13,  1.96s/it]                                                    {'loss': 1.6372, 'learning_rate': 0.0003991447950415002, 'epoch': 0.04}
+  4%|▍         | 297/6790 [10:20<3:32:13,  1.96s/it]  4%|▍         | 298/6790 [10:22<3:29:03,  1.93s/it]                                                    {'loss': 1.571, 'learning_rate': 0.00039913609699320407, 'epoch': 0.04}
+  4%|▍         | 298/6790 [10:22<3:29:03,  1.93s/it]  4%|▍         | 299/6790 [10:25<3:37:04,  2.01s/it]                                                    {'loss': 1.5746, 'learning_rate': 0.0003991273550314645, 'epoch': 0.04}
+  4%|▍         | 299/6790 [10:25<3:37:04,  2.01s/it]  4%|▍         | 300/6790 [10:27<3:46:30,  2.09s/it]                                                    {'loss': 1.291, 'learning_rate': 0.0003991185691582093, 'epoch': 0.04}
+  4%|▍         | 300/6790 [10:27<3:46:30,  2.09s/it]  4%|▍         | 301/6790 [10:29<3:34:00,  1.98s/it]                                                    {'loss': 1.5993, 'learning_rate': 0.000399109739375376, 'epoch': 0.04}
+  4%|▍         | 301/6790 [10:29<3:34:00,  1.98s/it]  4%|▍         | 302/6790 [10:30<3:31:38,  1.96s/it]                                                    {'loss': 1.7251, 'learning_rate': 0.00039910086568491166, 'epoch': 0.04}
+  4%|▍         | 302/6790 [10:30<3:31:38,  1.96s/it]  4%|▍         | 303/6790 [10:33<3:40:34,  2.04s/it]                                                    {'loss': 1.7101, 'learning_rate': 0.00039909194808877314, 'epoch': 0.04}
+  4%|▍         | 303/6790 [10:33<3:40:34,  2.04s/it]  4%|▍         | 304/6790 [10:34<3:31:53,  1.96s/it]                                                    {'loss': 1.4058, 'learning_rate': 0.000399082986588927, 'epoch': 0.04}
+  4%|▍         | 304/6790 [10:34<3:31:53,  1.96s/it]  4%|▍         | 305/6790 [10:36<3:32:03,  1.96s/it]                                                    {'loss': 1.6663, 'learning_rate': 0.00039907398118734937, 'epoch': 0.04}
+  4%|▍         | 305/6790 [10:36<3:32:03,  1.96s/it]  5%|▍         | 306/6790 [10:38<3:30:59,  1.95s/it]                                                    {'loss': 1.5224, 'learning_rate': 0.0003990649318860261, 'epoch': 0.05}
+  5%|▍         | 306/6790 [10:38<3:30:59,  1.95s/it]  5%|▍         | 307/6790 [10:40<3:36:28,  2.00s/it]                                                    {'loss': 1.4564, 'learning_rate': 0.0003990558386869528, 'epoch': 0.05}
+  5%|▍         | 307/6790 [10:40<3:36:28,  2.00s/it]  5%|▍         | 308/6790 [10:42<3:34:35,  1.99s/it]                                                    {'loss': 1.5236, 'learning_rate': 0.0003990467015921346, 'epoch': 0.05}
+  5%|▍         | 308/6790 [10:42<3:34:35,  1.99s/it]  5%|▍         | 309/6790 [10:44<3:33:16,  1.97s/it]                                                    {'loss': 1.7184, 'learning_rate': 0.00039903752060358653, 'epoch': 0.05}
+  5%|▍         | 309/6790 [10:44<3:33:16,  1.97s/it]  5%|▍         | 310/6790 [10:46<3:36:03,  2.00s/it]                                                    {'loss': 1.5195, 'learning_rate': 0.0003990282957233331, 'epoch': 0.05}
+  5%|▍         | 310/6790 [10:46<3:36:03,  2.00s/it]  5%|▍         | 311/6790 [10:48<3:29:49,  1.94s/it]                                                    {'loss': 1.491, 'learning_rate': 0.00039901902695340855, 'epoch': 0.05}
+  5%|▍         | 311/6790 [10:48<3:29:49,  1.94s/it]  5%|▍         | 312/6790 [10:50<3:35:41,  2.00s/it]                                                    {'loss': 1.4775, 'learning_rate': 0.0003990097142958569, 'epoch': 0.05}
+  5%|▍         | 312/6790 [10:50<3:35:41,  2.00s/it]  5%|▍         | 313/6790 [10:52<3:37:44,  2.02s/it]                                                    {'loss': 1.5668, 'learning_rate': 0.00039900035775273184, 'epoch': 0.05}
+  5%|▍         | 313/6790 [10:52<3:37:44,  2.02s/it]  5%|▍         | 314/6790 [10:55<4:07:04,  2.29s/it]                                                    {'loss': 1.7499, 'learning_rate': 0.0003989909573260965, 'epoch': 0.05}
+  5%|▍         | 314/6790 [10:55<4:07:04,  2.29s/it]  5%|▍         | 315/6790 [10:57<3:59:49,  2.22s/it]                                                    {'loss': 1.5615, 'learning_rate': 0.0003989815130180239, 'epoch': 0.05}
+  5%|▍         | 315/6790 [10:57<3:59:49,  2.22s/it]  5%|▍         | 316/6790 [11:00<3:59:45,  2.22s/it]                                                    {'loss': 1.6831, 'learning_rate': 0.0003989720248305969, 'epoch': 0.05}
+  5%|▍         | 316/6790 [11:00<3:59:45,  2.22s/it]  5%|▍         | 317/6790 [11:02<4:10:30,  2.32s/it]                                                    {'loss': 1.4251, 'learning_rate': 0.00039896249276590755, 'epoch': 0.05}
+  5%|▍         | 317/6790 [11:02<4:10:30,  2.32s/it]  5%|▍         | 318/6790 [11:04<3:58:38,  2.21s/it]                                                    {'loss': 1.7124, 'learning_rate': 0.00039895291682605805, 'epoch': 0.05}
+  5%|▍         | 318/6790 [11:04<3:58:38,  2.21s/it]  5%|▍         | 319/6790 [11:06<3:53:55,  2.17s/it]                                                    {'loss': 1.5372, 'learning_rate': 0.00039894329701316, 'epoch': 0.05}
+  5%|▍         | 319/6790 [11:06<3:53:55,  2.17s/it]  5%|▍         | 320/6790 [11:08<3:54:08,  2.17s/it]                                                    {'loss': 1.5441, 'learning_rate': 0.00039893363332933475, 'epoch': 0.05}
+  5%|▍         | 320/6790 [11:08<3:54:08,  2.17s/it]  5%|▍         | 321/6790 [11:10<3:51:21,  2.15s/it]                                                    {'loss': 1.6676, 'learning_rate': 0.00039892392577671335, 'epoch': 0.05}
+  5%|▍         | 321/6790 [11:10<3:51:21,  2.15s/it]  5%|▍         | 322/6790 [11:13<3:51:26,  2.15s/it]                                                    {'loss': 1.6574, 'learning_rate': 0.0003989141743574365, 'epoch': 0.05}
+  5%|▍         | 322/6790 [11:13<3:51:26,  2.15s/it]  5%|▍         | 323/6790 [11:15<4:04:47,  2.27s/it]                                                    {'loss': 1.8681, 'learning_rate': 0.0003989043790736547, 'epoch': 0.05}
+  5%|▍         | 323/6790 [11:15<4:04:47,  2.27s/it]  5%|▍         | 324/6790 [11:17<3:54:47,  2.18s/it]                                                    {'loss': 1.4901, 'learning_rate': 0.0003988945399275278, 'epoch': 0.05}
+  5%|▍         | 324/6790 [11:17<3:54:47,  2.18s/it]  5%|▍         | 325/6790 [11:19<3:53:04,  2.16s/it]                                                    {'loss': 1.7363, 'learning_rate': 0.00039888465692122565, 'epoch': 0.05}
+  5%|▍         | 325/6790 [11:19<3:53:04,  2.16s/it]  5%|▍         | 326/6790 [11:21<3:51:23,  2.15s/it]                                                    {'loss': 1.522, 'learning_rate': 0.0003988747300569277, 'epoch': 0.05}
+  5%|▍         | 326/6790 [11:21<3:51:23,  2.15s/it]  5%|▍         | 327/6790 [11:23<3:49:47,  2.13s/it]                                                    {'loss': 1.6674, 'learning_rate': 0.0003988647593368229, 'epoch': 0.05}
+  5%|▍         | 327/6790 [11:23<3:49:47,  2.13s/it]  5%|▍         | 328/6790 [11:26<3:47:44,  2.11s/it]                                                    {'loss': 1.7895, 'learning_rate': 0.00039885474476311, 'epoch': 0.05}
+  5%|▍         | 328/6790 [11:26<3:47:44,  2.11s/it]  5%|▍         | 329/6790 [11:28<3:51:08,  2.15s/it]                                                    {'loss': 1.8207, 'learning_rate': 0.0003988446863379974, 'epoch': 0.05}
+  5%|▍         | 329/6790 [11:28<3:51:08,  2.15s/it]  5%|▍         | 330/6790 [11:30<3:47:08,  2.11s/it]                                                    {'loss': 1.6472, 'learning_rate': 0.0003988345840637033, 'epoch': 0.05}
+  5%|▍         | 330/6790 [11:30<3:47:08,  2.11s/it]  5%|▍         | 331/6790 [11:32<3:37:27,  2.02s/it]                                                    {'loss': 1.5229, 'learning_rate': 0.0003988244379424554, 'epoch': 0.05}
+  5%|▍         | 331/6790 [11:32<3:37:27,  2.02s/it]  5%|▍         | 332/6790 [11:34<3:35:14,  2.00s/it]                                                    {'loss': 1.6058, 'learning_rate': 0.0003988142479764911, 'epoch': 0.05}
+  5%|▍         | 332/6790 [11:34<3:35:14,  2.00s/it]  5%|▍         | 333/6790 [11:35<3:29:44,  1.95s/it]                                                    {'loss': 1.5832, 'learning_rate': 0.00039880401416805746, 'epoch': 0.05}
+  5%|▍         | 333/6790 [11:35<3:29:44,  1.95s/it]  5%|▍         | 334/6790 [11:38<3:52:19,  2.16s/it]                                                    {'loss': 1.6998, 'learning_rate': 0.00039879373651941126, 'epoch': 0.05}
+  5%|▍         | 334/6790 [11:38<3:52:19,  2.16s/it]  5%|▍         | 335/6790 [11:41<4:24:42,  2.46s/it]                                                    {'loss': 1.5201, 'learning_rate': 0.000398783415032819, 'epoch': 0.05}
+  5%|▍         | 335/6790 [11:41<4:24:42,  2.46s/it]  5%|▍         | 336/6790 [11:43<4:14:32,  2.37s/it]                                                    {'loss': 1.6113, 'learning_rate': 0.0003987730497105566, 'epoch': 0.05}
+  5%|▍         | 336/6790 [11:43<4:14:32,  2.37s/it]  5%|▍         | 337/6790 [11:46<4:11:26,  2.34s/it]                                                    {'loss': 1.4334, 'learning_rate': 0.0003987626405549099, 'epoch': 0.05}
+  5%|▍         | 337/6790 [11:46<4:11:26,  2.34s/it]  5%|▍         | 338/6790 [11:48<3:59:23,  2.23s/it]                                                    {'loss': 1.4381, 'learning_rate': 0.0003987521875681744, 'epoch': 0.05}
+  5%|▍         | 338/6790 [11:48<3:59:23,  2.23s/it]  5%|▍         | 339/6790 [11:50<3:55:36,  2.19s/it]                                                    {'loss': 1.696, 'learning_rate': 0.00039874169075265514, 'epoch': 0.05}
+  5%|▍         | 339/6790 [11:50<3:55:36,  2.19s/it]  5%|▌         | 340/6790 [11:52<3:46:21,  2.11s/it]                                                    {'loss': 1.4626, 'learning_rate': 0.0003987311501106669, 'epoch': 0.05}
+  5%|▌         | 340/6790 [11:52<3:46:21,  2.11s/it]  5%|▌         | 341/6790 [11:54<3:45:01,  2.09s/it]                                                    {'loss': 1.6239, 'learning_rate': 0.00039872056564453406, 'epoch': 0.05}
+  5%|▌         | 341/6790 [11:54<3:45:01,  2.09s/it]  5%|▌         | 342/6790 [11:56<3:47:09,  2.11s/it]                                                    {'loss': 1.4817, 'learning_rate': 0.0003987099373565906, 'epoch': 0.05}
+  5%|▌         | 342/6790 [11:56<3:47:09,  2.11s/it]  5%|▌         | 343/6790 [11:58<3:42:51,  2.07s/it]                                                    {'loss': 1.8449, 'learning_rate': 0.0003986992652491805, 'epoch': 0.05}
+  5%|▌         | 343/6790 [11:58<3:42:51,  2.07s/it]  5%|▌         | 344/6790 [12:00<3:42:03,  2.07s/it]                                                    {'loss': 1.8038, 'learning_rate': 0.000398688549324657, 'epoch': 0.05}
+  5%|▌         | 344/6790 [12:00<3:42:03,  2.07s/it]  5%|▌         | 345/6790 [12:02<3:38:35,  2.04s/it]                                                    {'loss': 1.7869, 'learning_rate': 0.00039867778958538325, 'epoch': 0.05}
+  5%|▌         | 345/6790 [12:02<3:38:35,  2.04s/it]  5%|▌         | 346/6790 [12:04<3:45:56,  2.10s/it]                                                    {'loss': 1.7971, 'learning_rate': 0.000398666986033732, 'epoch': 0.05}
+  5%|▌         | 346/6790 [12:04<3:45:56,  2.10s/it]  5%|▌         | 347/6790 [12:06<3:37:08,  2.02s/it]                                                    {'loss': 1.6161, 'learning_rate': 0.00039865613867208553, 'epoch': 0.05}
+  5%|▌         | 347/6790 [12:06<3:37:08,  2.02s/it]  5%|▌         | 348/6790 [12:08<3:28:21,  1.94s/it]                                                    {'loss': 1.5515, 'learning_rate': 0.000398645247502836, 'epoch': 0.05}
+  5%|▌         | 348/6790 [12:08<3:28:21,  1.94s/it]  5%|▌         | 349/6790 [12:10<3:32:38,  1.98s/it]                                                    {'loss': 1.6161, 'learning_rate': 0.0003986343125283851, 'epoch': 0.05}
+  5%|▌         | 349/6790 [12:10<3:32:38,  1.98s/it]  5%|▌         | 350/6790 [12:12<3:36:57,  2.02s/it]                                                    {'loss': 1.8468, 'learning_rate': 0.0003986233337511442, 'epoch': 0.05}
+  5%|▌         | 350/6790 [12:12<3:36:57,  2.02s/it]  5%|▌         | 351/6790 [12:14<3:37:11,  2.02s/it]                                                    {'loss': 1.4182, 'learning_rate': 0.0003986123111735343, 'epoch': 0.05}
+  5%|▌         | 351/6790 [12:14<3:37:11,  2.02s/it]  5%|▌         | 352/6790 [12:16<3:35:55,  2.01s/it]                                                    {'loss': 1.4161, 'learning_rate': 0.0003986012447979863, 'epoch': 0.05}
+  5%|▌         | 352/6790 [12:16<3:35:55,  2.01s/it]  5%|▌         | 353/6790 [12:18<3:36:14,  2.02s/it]                                                    {'loss': 1.5226, 'learning_rate': 0.0003985901346269403, 'epoch': 0.05}
+  5%|▌         | 353/6790 [12:18<3:36:14,  2.02s/it]  5%|▌         | 354/6790 [12:20<3:30:13,  1.96s/it]                                                    {'loss': 1.6461, 'learning_rate': 0.00039857898066284636, 'epoch': 0.05}
+  5%|▌         | 354/6790 [12:20<3:30:13,  1.96s/it]  5%|▌         | 355/6790 [12:22<3:34:07,  2.00s/it]                                                    {'loss': 1.5097, 'learning_rate': 0.00039856778290816425, 'epoch': 0.05}
+  5%|▌         | 355/6790 [12:22<3:34:07,  2.00s/it]  5%|▌         | 356/6790 [12:24<3:38:32,  2.04s/it]                                                    {'loss': 1.6536, 'learning_rate': 0.00039855654136536323, 'epoch': 0.05}
+  5%|▌         | 356/6790 [12:24<3:38:32,  2.04s/it]  5%|▌         | 357/6790 [12:26<3:32:29,  1.98s/it]                                                    {'loss': 1.632, 'learning_rate': 0.0003985452560369223, 'epoch': 0.05}
+  5%|▌         | 357/6790 [12:26<3:32:29,  1.98s/it]  5%|▌         | 358/6790 [12:28<3:25:27,  1.92s/it]                                                    {'loss': 1.385, 'learning_rate': 0.0003985339269253301, 'epoch': 0.05}
+  5%|▌         | 358/6790 [12:28<3:25:27,  1.92s/it]  5%|▌         | 359/6790 [12:29<3:26:27,  1.93s/it]                                                    {'loss': 1.531, 'learning_rate': 0.00039852255403308493, 'epoch': 0.05}
+  5%|▌         | 359/6790 [12:29<3:26:27,  1.93s/it]  5%|▌         | 360/6790 [12:31<3:27:17,  1.93s/it]                                                    {'loss': 1.3888, 'learning_rate': 0.0003985111373626947, 'epoch': 0.05}
+  5%|▌         | 360/6790 [12:31<3:27:17,  1.93s/it]  5%|▌         | 361/6790 [12:34<3:31:30,  1.97s/it]                                                    {'loss': 1.6587, 'learning_rate': 0.00039849967691667703, 'epoch': 0.05}
+  5%|▌         | 361/6790 [12:34<3:31:30,  1.97s/it]  5%|▌         | 362/6790 [12:35<3:28:07,  1.94s/it]                                                    {'loss': 1.6238, 'learning_rate': 0.0003984881726975592, 'epoch': 0.05}
+  5%|▌         | 362/6790 [12:35<3:28:07,  1.94s/it]  5%|▌         | 363/6790 [12:38<3:53:24,  2.18s/it]                                                    {'loss': 1.6448, 'learning_rate': 0.00039847662470787813, 'epoch': 0.05}
+  5%|▌         | 363/6790 [12:38<3:53:24,  2.18s/it]  5%|▌         | 364/6790 [12:40<3:45:09,  2.10s/it]                                                    {'loss': 1.6387, 'learning_rate': 0.0003984650329501803, 'epoch': 0.05}
+  5%|▌         | 364/6790 [12:40<3:45:09,  2.10s/it]  5%|▌         | 365/6790 [12:42<3:49:25,  2.14s/it]                                                    {'loss': 1.6623, 'learning_rate': 0.000398453397427022, 'epoch': 0.05}
+  5%|▌         | 365/6790 [12:42<3:49:25,  2.14s/it]  5%|▌         | 366/6790 [12:44<3:46:08,  2.11s/it]                                                    {'loss': 1.5612, 'learning_rate': 0.0003984417181409691, 'epoch': 0.05}
+  5%|▌         | 366/6790 [12:44<3:46:08,  2.11s/it]  5%|▌         | 367/6790 [12:47<3:51:47,  2.17s/it]                                                    {'loss': 1.5383, 'learning_rate': 0.00039842999509459695, 'epoch': 0.05}
+  5%|▌         | 367/6790 [12:47<3:51:47,  2.17s/it]  5%|▌         | 368/6790 [12:49<3:52:04,  2.17s/it]                                                    {'loss': 1.6209, 'learning_rate': 0.00039841822829049094, 'epoch': 0.05}
+  5%|▌         | 368/6790 [12:49<3:52:04,  2.17s/it]  5%|▌         | 369/6790 [12:51<3:44:22,  2.10s/it]                                                    {'loss': 1.5839, 'learning_rate': 0.0003984064177312457, 'epoch': 0.05}
+  5%|▌         | 369/6790 [12:51<3:44:22,  2.10s/it]  5%|▌         | 370/6790 [12:53<3:48:17,  2.13s/it]                                                    {'loss': 1.6077, 'learning_rate': 0.0003983945634194659, 'epoch': 0.05}
+  5%|▌         | 370/6790 [12:53<3:48:17,  2.13s/it]  5%|▌         | 371/6790 [12:56<4:03:43,  2.28s/it]                                                    {'loss': 1.4211, 'learning_rate': 0.00039838266535776543, 'epoch': 0.05}
+  5%|▌         | 371/6790 [12:56<4:03:43,  2.28s/it]  5%|▌         | 372/6790 [12:58<4:04:14,  2.28s/it]                                                    {'loss': 1.4477, 'learning_rate': 0.0003983707235487682, 'epoch': 0.05}
+  5%|▌         | 372/6790 [12:58<4:04:14,  2.28s/it]  5%|▌         | 373/6790 [13:01<4:47:46,  2.69s/it]                                                    {'loss': 1.6463, 'learning_rate': 0.00039835873799510754, 'epoch': 0.05}
+  5%|▌         | 373/6790 [13:01<4:47:46,  2.69s/it]  6%|▌         | 374/6790 [13:04<4:50:21,  2.72s/it]                                                    {'loss': 1.5374, 'learning_rate': 0.0003983467086994265, 'epoch': 0.06}
+  6%|▌         | 374/6790 [13:04<4:50:21,  2.72s/it]  6%|▌         | 375/6790 [13:06<4:23:30,  2.46s/it]                                                    {'loss': 1.4111, 'learning_rate': 0.00039833463566437777, 'epoch': 0.06}
+  6%|▌         | 375/6790 [13:06<4:23:30,  2.46s/it]  6%|▌         | 376/6790 [13:08<4:11:04,  2.35s/it]                                                    {'loss': 1.6402, 'learning_rate': 0.00039832251889262375, 'epoch': 0.06}
+  6%|▌         | 376/6790 [13:08<4:11:04,  2.35s/it]  6%|▌         | 377/6790 [13:10<4:03:08,  2.27s/it]                                                    {'loss': 1.4274, 'learning_rate': 0.00039831035838683646, 'epoch': 0.06}
+  6%|▌         | 377/6790 [13:10<4:03:08,  2.27s/it]  6%|▌         | 378/6790 [13:13<4:09:58,  2.34s/it]                                                    {'loss': 1.4816, 'learning_rate': 0.00039829815414969735, 'epoch': 0.06}
+  6%|▌         | 378/6790 [13:13<4:09:58,  2.34s/it]  6%|▌         | 379/6790 [13:15<3:52:52,  2.18s/it]                                                    {'loss': 1.4251, 'learning_rate': 0.00039828590618389784, 'epoch': 0.06}
+  6%|▌         | 379/6790 [13:15<3:52:52,  2.18s/it]  6%|▌         | 380/6790 [13:17<4:11:15,  2.35s/it]                                                    {'loss': 1.7404, 'learning_rate': 0.0003982736144921389, 'epoch': 0.06}
+  6%|▌         | 380/6790 [13:17<4:11:15,  2.35s/it]  6%|▌         | 381/6790 [13:19<3:55:58,  2.21s/it]                                                    {'loss': 1.5814, 'learning_rate': 0.0003982612790771309, 'epoch': 0.06}
+  6%|▌         | 381/6790 [13:19<3:55:58,  2.21s/it]  6%|▌         | 382/6790 [13:21<3:50:35,  2.16s/it]                                                    {'loss': 1.6694, 'learning_rate': 0.0003982488999415942, 'epoch': 0.06}
+  6%|▌         | 382/6790 [13:21<3:50:35,  2.16s/it]  6%|▌         | 383/6790 [13:23<3:45:48,  2.11s/it]                                                    {'loss': 1.6656, 'learning_rate': 0.0003982364770882586, 'epoch': 0.06}
+  6%|▌         | 383/6790 [13:23<3:45:48,  2.11s/it]  6%|▌         | 384/6790 [13:25<3:40:39,  2.07s/it]                                                    {'loss': 1.43, 'learning_rate': 0.0003982240105198636, 'epoch': 0.06}
+  6%|▌         | 384/6790 [13:25<3:40:39,  2.07s/it]  6%|▌         | 385/6790 [13:27<3:41:22,  2.07s/it]                                                    {'loss': 1.3906, 'learning_rate': 0.00039821150023915835, 'epoch': 0.06}
+  6%|▌         | 385/6790 [13:27<3:41:22,  2.07s/it]  6%|▌         | 386/6790 [13:29<3:33:14,  2.00s/it]                                                    {'loss': 1.51, 'learning_rate': 0.0003981989462489015, 'epoch': 0.06}
+  6%|▌         | 386/6790 [13:29<3:33:14,  2.00s/it]  6%|▌         | 387/6790 [13:31<3:25:07,  1.92s/it]                                                    {'loss': 1.466, 'learning_rate': 0.00039818634855186155, 'epoch': 0.06}
+  6%|▌         | 387/6790 [13:31<3:25:07,  1.92s/it]  6%|▌         | 388/6790 [13:33<3:20:25,  1.88s/it]                                                    {'loss': 1.4311, 'learning_rate': 0.00039817370715081646, 'epoch': 0.06}
+  6%|▌         | 388/6790 [13:33<3:20:25,  1.88s/it]  6%|▌         | 389/6790 [13:35<3:25:03,  1.92s/it]                                                    {'loss': 1.6227, 'learning_rate': 0.000398161022048554, 'epoch': 0.06}
+  6%|▌         | 389/6790 [13:35<3:25:03,  1.92s/it]  6%|▌         | 390/6790 [13:37<3:26:20,  1.93s/it]                                                    {'loss': 1.6498, 'learning_rate': 0.0003981482932478715, 'epoch': 0.06}
+  6%|▌         | 390/6790 [13:37<3:26:20,  1.93s/it]  6%|▌         | 391/6790 [13:39<3:29:16,  1.96s/it]                                                    {'loss': 1.6288, 'learning_rate': 0.00039813552075157585, 'epoch': 0.06}
+  6%|▌         | 391/6790 [13:39<3:29:16,  1.96s/it]  6%|▌         | 392/6790 [13:41<3:35:47,  2.02s/it]                                                    {'loss': 1.5591, 'learning_rate': 0.0003981227045624836, 'epoch': 0.06}
+  6%|▌         | 392/6790 [13:41<3:35:47,  2.02s/it]  6%|▌         | 393/6790 [13:43<3:33:16,  2.00s/it]                                                    {'loss': 1.8217, 'learning_rate': 0.00039810984468342103, 'epoch': 0.06}
+  6%|▌         | 393/6790 [13:43<3:33:16,  2.00s/it]  6%|▌         | 394/6790 [13:45<3:33:18,  2.00s/it]                                                    {'loss': 1.5938, 'learning_rate': 0.00039809694111722405, 'epoch': 0.06}
+  6%|▌         | 394/6790 [13:45<3:33:18,  2.00s/it]  6%|▌         | 395/6790 [13:47<3:35:00,  2.02s/it]                                                    {'loss': 1.6056, 'learning_rate': 0.000398083993866738, 'epoch': 0.06}
+  6%|▌         | 395/6790 [13:47<3:35:00,  2.02s/it]  6%|▌         | 396/6790 [13:49<3:32:58,  2.00s/it]                                                    {'loss': 1.4995, 'learning_rate': 0.0003980710029348182, 'epoch': 0.06}
+  6%|▌         | 396/6790 [13:49<3:32:58,  2.00s/it]  6%|▌         | 397/6790 [13:51<3:45:00,  2.11s/it]                                                    {'loss': 1.8153, 'learning_rate': 0.0003980579683243292, 'epoch': 0.06}
+  6%|▌         | 397/6790 [13:51<3:45:00,  2.11s/it]  6%|▌         | 398/6790 [13:53<3:33:04,  2.00s/it]                                                    {'loss': 1.3875, 'learning_rate': 0.0003980448900381456, 'epoch': 0.06}
+  6%|▌         | 398/6790 [13:53<3:33:04,  2.00s/it]  6%|▌         | 399/6790 [13:55<3:24:40,  1.92s/it]                                                    {'loss': 1.4348, 'learning_rate': 0.0003980317680791512, 'epoch': 0.06}
+  6%|▌         | 399/6790 [13:55<3:24:40,  1.92s/it]  6%|▌         | 400/6790 [13:56<3:20:31,  1.88s/it]                                                    {'loss': 1.5889, 'learning_rate': 0.00039801860245023985, 'epoch': 0.06}
+  6%|▌         | 400/6790 [13:56<3:20:31,  1.88s/it]  6%|▌         | 401/6790 [13:58<3:16:01,  1.84s/it]                                                    {'loss': 1.4764, 'learning_rate': 0.00039800539315431465, 'epoch': 0.06}
+  6%|▌         | 401/6790 [13:58<3:16:01,  1.84s/it]  6%|▌         | 402/6790 [14:00<3:24:19,  1.92s/it]                                                    {'loss': 1.7089, 'learning_rate': 0.0003979921401942887, 'epoch': 0.06}
+  6%|▌         | 402/6790 [14:00<3:24:19,  1.92s/it]  6%|▌         | 403/6790 [14:02<3:30:18,  1.98s/it]                                                    {'loss': 1.6527, 'learning_rate': 0.00039797884357308444, 'epoch': 0.06}
+  6%|▌         | 403/6790 [14:02<3:30:18,  1.98s/it]  6%|▌         | 404/6790 [14:04<3:32:33,  2.00s/it]                                                    {'loss': 1.5651, 'learning_rate': 0.000397965503293634, 'epoch': 0.06}
+  6%|▌         | 404/6790 [14:04<3:32:33,  2.00s/it]  6%|▌         | 405/6790 [14:07<3:44:22,  2.11s/it]                                                    {'loss': 1.6245, 'learning_rate': 0.00039795211935887925, 'epoch': 0.06}
+  6%|▌         | 405/6790 [14:07<3:44:22,  2.11s/it]  6%|▌         | 406/6790 [14:09<3:39:05,  2.06s/it]                                                    {'loss': 1.707, 'learning_rate': 0.0003979386917717715, 'epoch': 0.06}
+  6%|▌         | 406/6790 [14:09<3:39:05,  2.06s/it]  6%|▌         | 407/6790 [14:11<3:34:22,  2.02s/it]                                                    {'loss': 1.5326, 'learning_rate': 0.000397925220535272, 'epoch': 0.06}
+  6%|▌         | 407/6790 [14:11<3:34:22,  2.02s/it]  6%|▌         | 408/6790 [14:13<3:29:57,  1.97s/it]                                                    {'loss': 1.2171, 'learning_rate': 0.0003979117056523512, 'epoch': 0.06}
+  6%|▌         | 408/6790 [14:13<3:29:57,  1.97s/it]  6%|▌         | 409/6790 [14:14<3:28:36,  1.96s/it]                                                    {'loss': 1.2504, 'learning_rate': 0.00039789814712598955, 'epoch': 0.06}
+  6%|▌         | 409/6790 [14:14<3:28:36,  1.96s/it]  6%|▌         | 410/6790 [14:17<3:31:10,  1.99s/it]                                                    {'loss': 1.4966, 'learning_rate': 0.0003978845449591769, 'epoch': 0.06}
+  6%|▌         | 410/6790 [14:17<3:31:10,  1.99s/it]  6%|▌         | 411/6790 [14:18<3:26:24,  1.94s/it]                                                    {'loss': 1.4069, 'learning_rate': 0.00039787089915491284, 'epoch': 0.06}
+  6%|▌         | 411/6790 [14:18<3:26:24,  1.94s/it]  6%|▌         | 412/6790 [14:21<4:03:37,  2.29s/it]                                                    {'loss': 1.6532, 'learning_rate': 0.00039785720971620653, 'epoch': 0.06}
+  6%|▌         | 412/6790 [14:21<4:03:37,  2.29s/it]  6%|▌         | 413/6790 [14:23<3:52:40,  2.19s/it]                                                    {'loss': 1.5782, 'learning_rate': 0.00039784347664607677, 'epoch': 0.06}
+  6%|▌         | 413/6790 [14:23<3:52:40,  2.19s/it]  6%|▌         | 414/6790 [14:26<4:06:01,  2.32s/it]                                                    {'loss': 1.5442, 'learning_rate': 0.0003978296999475519, 'epoch': 0.06}
+  6%|▌         | 414/6790 [14:26<4:06:01,  2.32s/it]  6%|▌         | 415/6790 [14:28<3:52:09,  2.19s/it]                                                    {'loss': 1.6325, 'learning_rate': 0.00039781587962367006, 'epoch': 0.06}
+  6%|▌         | 415/6790 [14:28<3:52:09,  2.19s/it]  6%|▌         | 416/6790 [14:30<3:47:15,  2.14s/it]                                                    {'loss': 1.63, 'learning_rate': 0.0003978020156774788, 'epoch': 0.06}
+  6%|▌         | 416/6790 [14:30<3:47:15,  2.14s/it]  6%|▌         | 417/6790 [14:32<3:36:21,  2.04s/it]                                                    {'loss': 1.6714, 'learning_rate': 0.0003977881081120355, 'epoch': 0.06}
+  6%|▌         | 417/6790 [14:32<3:36:21,  2.04s/it]  6%|▌         | 418/6790 [14:34<3:38:10,  2.05s/it]                                                    {'loss': 1.656, 'learning_rate': 0.0003977741569304069, 'epoch': 0.06}
+  6%|▌         | 418/6790 [14:34<3:38:10,  2.05s/it]  6%|▌         | 419/6790 [14:36<3:43:49,  2.11s/it]                                                    {'loss': 1.5981, 'learning_rate': 0.0003977601621356697, 'epoch': 0.06}
+  6%|▌         | 419/6790 [14:36<3:43:49,  2.11s/it]  6%|▌         | 420/6790 [14:38<3:33:57,  2.02s/it]                                                    {'loss': 1.6093, 'learning_rate': 0.00039774612373090994, 'epoch': 0.06}
+  6%|▌         | 420/6790 [14:38<3:33:57,  2.02s/it]  6%|▌         | 421/6790 [14:40<3:34:36,  2.02s/it]                                                    {'loss': 1.7316, 'learning_rate': 0.0003977320417192234, 'epoch': 0.06}
+  6%|▌         | 421/6790 [14:40<3:34:36,  2.02s/it]  6%|▌         | 422/6790 [14:42<3:39:25,  2.07s/it]                                                    {'loss': 1.768, 'learning_rate': 0.00039771791610371525, 'epoch': 0.06}
+  6%|▌         | 422/6790 [14:42<3:39:25,  2.07s/it]  6%|▌         | 423/6790 [14:44<3:33:08,  2.01s/it]                                                    {'loss': 1.3698, 'learning_rate': 0.00039770374688750075, 'epoch': 0.06}
+  6%|▌         | 423/6790 [14:44<3:33:08,  2.01s/it]  6%|▌         | 424/6790 [14:46<3:36:25,  2.04s/it]                                                    {'loss': 1.5422, 'learning_rate': 0.0003976895340737044, 'epoch': 0.06}
+  6%|▌         | 424/6790 [14:46<3:36:25,  2.04s/it]  6%|▋         | 425/6790 [14:48<3:33:15,  2.01s/it]                                                    {'loss': 1.6188, 'learning_rate': 0.00039767527766546023, 'epoch': 0.06}
+  6%|▋         | 425/6790 [14:48<3:33:15,  2.01s/it]  6%|▋         | 426/6790 [14:50<3:32:41,  2.01s/it]                                                    {'loss': 1.8201, 'learning_rate': 0.00039766097766591235, 'epoch': 0.06}
+  6%|▋         | 426/6790 [14:50<3:32:41,  2.01s/it]  6%|▋         | 427/6790 [14:53<3:50:52,  2.18s/it]                                                    {'loss': 1.4786, 'learning_rate': 0.00039764663407821396, 'epoch': 0.06}
+  6%|▋         | 427/6790 [14:53<3:50:52,  2.18s/it]  6%|▋         | 428/6790 [14:54<3:39:43,  2.07s/it]                                                    {'loss': 1.5325, 'learning_rate': 0.0003976322469055282, 'epoch': 0.06}
+  6%|▋         | 428/6790 [14:54<3:39:43,  2.07s/it]  6%|▋         | 429/6790 [14:56<3:33:28,  2.01s/it]                                                    {'loss': 1.6914, 'learning_rate': 0.00039761781615102774, 'epoch': 0.06}
+  6%|▋         | 429/6790 [14:56<3:33:28,  2.01s/it]  6%|▋         | 430/6790 [14:58<3:36:55,  2.05s/it]                                                    {'loss': 1.7092, 'learning_rate': 0.0003976033418178948, 'epoch': 0.06}
+  6%|▋         | 430/6790 [14:58<3:36:55,  2.05s/it]  6%|▋         | 431/6790 [15:00<3:27:15,  1.96s/it]                                                    {'loss': 1.5761, 'learning_rate': 0.0003975888239093213, 'epoch': 0.06}
+  6%|▋         | 431/6790 [15:00<3:27:15,  1.96s/it]  6%|▋         | 432/6790 [15:02<3:23:32,  1.92s/it]                                                    {'loss': 1.4052, 'learning_rate': 0.0003975742624285087, 'epoch': 0.06}
+  6%|▋         | 432/6790 [15:02<3:23:32,  1.92s/it]  6%|▋         | 433/6790 [15:04<3:28:36,  1.97s/it]                                                    {'loss': 1.5484, 'learning_rate': 0.00039755965737866807, 'epoch': 0.06}
+  6%|▋         | 433/6790 [15:04<3:28:36,  1.97s/it]  6%|▋         | 434/6790 [15:06<3:25:13,  1.94s/it]                                                    {'loss': 1.3791, 'learning_rate': 0.00039754500876302017, 'epoch': 0.06}
+  6%|▋         | 434/6790 [15:06<3:25:13,  1.94s/it]  6%|▋         | 435/6790 [15:08<3:29:06,  1.97s/it]                                                    {'loss': 1.7864, 'learning_rate': 0.00039753031658479527, 'epoch': 0.06}
+  6%|▋         | 435/6790 [15:08<3:29:06,  1.97s/it]  6%|▋         | 436/6790 [15:10<3:40:36,  2.08s/it]                                                    {'loss': 1.4996, 'learning_rate': 0.0003975155808472333, 'epoch': 0.06}
+  6%|▋         | 436/6790 [15:10<3:40:36,  2.08s/it]  6%|▋         | 437/6790 [15:12<3:31:35,  2.00s/it]                                                    {'loss': 1.5726, 'learning_rate': 0.0003975008015535838, 'epoch': 0.06}
+  6%|▋         | 437/6790 [15:12<3:31:35,  2.00s/it]  6%|▋         | 438/6790 [15:14<3:34:21,  2.02s/it]                                                    {'loss': 1.5527, 'learning_rate': 0.0003974859787071058, 'epoch': 0.06}
+  6%|▋         | 438/6790 [15:14<3:34:21,  2.02s/it]  6%|▋         | 439/6790 [15:17<3:47:24,  2.15s/it]                                                    {'loss': 1.6359, 'learning_rate': 0.0003974711123110681, 'epoch': 0.06}
+  6%|▋         | 439/6790 [15:17<3:47:24,  2.15s/it]  6%|▋         | 440/6790 [15:19<3:51:41,  2.19s/it]                                                    {'loss': 1.4634, 'learning_rate': 0.0003974562023687491, 'epoch': 0.06}
+  6%|▋         | 440/6790 [15:19<3:51:41,  2.19s/it]  6%|▋         | 441/6790 [15:21<3:47:18,  2.15s/it]                                                    {'loss': 1.6526, 'learning_rate': 0.00039744124888343665, 'epoch': 0.06}
+  6%|▋         | 441/6790 [15:21<3:47:18,  2.15s/it]  7%|▋         | 442/6790 [15:23<3:36:51,  2.05s/it]                                                    {'loss': 1.5784, 'learning_rate': 0.0003974262518584283, 'epoch': 0.07}
+  7%|▋         | 442/6790 [15:23<3:36:51,  2.05s/it]  7%|▋         | 443/6790 [15:25<3:41:17,  2.09s/it]                                                    {'loss': 1.6034, 'learning_rate': 0.0003974112112970312, 'epoch': 0.07}
+  7%|▋         | 443/6790 [15:25<3:41:17,  2.09s/it]  7%|▋         | 444/6790 [15:27<3:41:58,  2.10s/it]                                                    {'loss': 1.6236, 'learning_rate': 0.0003973961272025621, 'epoch': 0.07}
+  7%|▋         | 444/6790 [15:27<3:41:58,  2.10s/it]  7%|▋         | 445/6790 [15:29<3:48:14,  2.16s/it]                                                    {'loss': 1.5095, 'learning_rate': 0.00039738099957834736, 'epoch': 0.07}
+  7%|▋         | 445/6790 [15:29<3:48:14,  2.16s/it]  7%|▋         | 446/6790 [15:32<3:46:47,  2.14s/it]                                                    {'loss': 1.5907, 'learning_rate': 0.0003973658284277229, 'epoch': 0.07}
+  7%|▋         | 446/6790 [15:32<3:46:47,  2.14s/it]  7%|▋         | 447/6790 [15:33<3:38:26,  2.07s/it]                                                    {'loss': 1.4992, 'learning_rate': 0.00039735061375403423, 'epoch': 0.07}
+  7%|▋         | 447/6790 [15:33<3:38:26,  2.07s/it]  7%|▋         | 448/6790 [15:35<3:37:57,  2.06s/it]                                                    {'loss': 1.8073, 'learning_rate': 0.0003973353555606365, 'epoch': 0.07}
+  7%|▋         | 448/6790 [15:35<3:37:57,  2.06s/it]  7%|▋         | 449/6790 [15:38<3:39:14,  2.07s/it]                                                    {'loss': 1.7525, 'learning_rate': 0.00039732005385089444, 'epoch': 0.07}
+  7%|▋         | 449/6790 [15:38<3:39:14,  2.07s/it]  7%|▋         | 450/6790 [15:39<3:33:33,  2.02s/it]                                                    {'loss': 1.6149, 'learning_rate': 0.00039730470862818246, 'epoch': 0.07}
+  7%|▋         | 450/6790 [15:39<3:33:33,  2.02s/it]  7%|▋         | 451/6790 [15:41<3:29:47,  1.99s/it]                                                    {'loss': 1.2932, 'learning_rate': 0.00039728931989588436, 'epoch': 0.07}
+  7%|▋         | 451/6790 [15:41<3:29:47,  1.99s/it]  7%|▋         | 452/6790 [15:43<3:28:28,  1.97s/it]                                                    {'loss': 1.6065, 'learning_rate': 0.0003972738876573937, 'epoch': 0.07}
+  7%|▋         | 452/6790 [15:43<3:28:28,  1.97s/it]  7%|▋         | 453/6790 [15:46<3:34:55,  2.03s/it]                                                    {'loss': 1.404, 'learning_rate': 0.0003972584119161137, 'epoch': 0.07}
+  7%|▋         | 453/6790 [15:46<3:34:55,  2.03s/it]  7%|▋         | 454/6790 [15:48<3:37:11,  2.06s/it]                                                    {'loss': 1.7282, 'learning_rate': 0.00039724289267545684, 'epoch': 0.07}
+  7%|▋         | 454/6790 [15:48<3:37:11,  2.06s/it]  7%|▋         | 455/6790 [15:50<3:53:35,  2.21s/it]                                                    {'loss': 1.4959, 'learning_rate': 0.00039722732993884566, 'epoch': 0.07}
+  7%|▋         | 455/6790 [15:50<3:53:35,  2.21s/it]  7%|▋         | 456/6790 [15:53<3:57:52,  2.25s/it]                                                    {'loss': 1.5699, 'learning_rate': 0.0003972117237097119, 'epoch': 0.07}
+  7%|▋         | 456/6790 [15:53<3:57:52,  2.25s/it]  7%|▋         | 457/6790 [15:55<3:57:54,  2.25s/it]                                                    {'loss': 1.746, 'learning_rate': 0.00039719607399149706, 'epoch': 0.07}
+  7%|▋         | 457/6790 [15:55<3:57:54,  2.25s/it]  7%|▋         | 458/6790 [15:57<3:48:22,  2.16s/it]                                                    {'loss': 1.4402, 'learning_rate': 0.0003971803807876523, 'epoch': 0.07}
+  7%|▋         | 458/6790 [15:57<3:48:22,  2.16s/it]  7%|▋         | 459/6790 [15:59<4:01:26,  2.29s/it]                                                    {'loss': 1.4108, 'learning_rate': 0.00039716464410163816, 'epoch': 0.07}
+  7%|▋         | 459/6790 [15:59<4:01:26,  2.29s/it]  7%|▋         | 460/6790 [16:01<3:48:32,  2.17s/it]                                                    {'loss': 1.5417, 'learning_rate': 0.000397148863936925, 'epoch': 0.07}
+  7%|▋         | 460/6790 [16:01<3:48:32,  2.17s/it]  7%|▋         | 461/6790 [16:03<3:41:32,  2.10s/it]                                                    {'loss': 1.599, 'learning_rate': 0.0003971330402969926, 'epoch': 0.07}
+  7%|▋         | 461/6790 [16:03<3:41:32,  2.10s/it]  7%|▋         | 462/6790 [16:05<3:37:25,  2.06s/it]                                                    {'loss': 1.5958, 'learning_rate': 0.0003971171731853304, 'epoch': 0.07}
+  7%|▋         | 462/6790 [16:05<3:37:25,  2.06s/it]  7%|▋         | 463/6790 [16:07<3:30:00,  1.99s/it]                                                    {'loss': 1.6444, 'learning_rate': 0.00039710126260543736, 'epoch': 0.07}
+  7%|▋         | 463/6790 [16:07<3:30:00,  1.99s/it]  7%|▋         | 464/6790 [16:09<3:42:23,  2.11s/it]                                                    {'loss': 1.4439, 'learning_rate': 0.0003970853085608222, 'epoch': 0.07}
+  7%|▋         | 464/6790 [16:09<3:42:23,  2.11s/it]  7%|▋         | 465/6790 [16:12<3:44:28,  2.13s/it]                                                    {'loss': 1.754, 'learning_rate': 0.00039706931105500294, 'epoch': 0.07}
+  7%|▋         | 465/6790 [16:12<3:44:28,  2.13s/it]  7%|▋         | 466/6790 [16:13<3:32:32,  2.02s/it]                                                    {'loss': 1.6078, 'learning_rate': 0.0003970532700915075, 'epoch': 0.07}
+  7%|▋         | 466/6790 [16:13<3:32:32,  2.02s/it]  7%|▋         | 467/6790 [16:15<3:36:52,  2.06s/it]                                                    {'loss': 1.4583, 'learning_rate': 0.00039703718567387313, 'epoch': 0.07}
+  7%|▋         | 467/6790 [16:15<3:36:52,  2.06s/it]  7%|▋         | 468/6790 [16:18<3:37:41,  2.07s/it]                                                    {'loss': 1.7857, 'learning_rate': 0.0003970210578056468, 'epoch': 0.07}
+  7%|▋         | 468/6790 [16:18<3:37:41,  2.07s/it]  7%|▋         | 469/6790 [16:20<3:37:06,  2.06s/it]                                                    {'loss': 1.6099, 'learning_rate': 0.000397004886490385, 'epoch': 0.07}
+  7%|▋         | 469/6790 [16:20<3:37:06,  2.06s/it]  7%|▋         | 470/6790 [16:22<3:38:20,  2.07s/it]                                                    {'loss': 1.5627, 'learning_rate': 0.00039698867173165384, 'epoch': 0.07}
+  7%|▋         | 470/6790 [16:22<3:38:20,  2.07s/it]  7%|▋         | 471/6790 [16:24<3:32:31,  2.02s/it]                                                    {'loss': 1.3948, 'learning_rate': 0.00039697241353302905, 'epoch': 0.07}
+  7%|▋         | 471/6790 [16:24<3:32:31,  2.02s/it]  7%|▋         | 472/6790 [16:26<3:38:38,  2.08s/it]                                                    {'loss': 1.5131, 'learning_rate': 0.00039695611189809573, 'epoch': 0.07}
+  7%|▋         | 472/6790 [16:26<3:38:38,  2.08s/it]  7%|▋         | 473/6790 [16:28<3:50:11,  2.19s/it]                                                    {'loss': 1.5071, 'learning_rate': 0.00039693976683044893, 'epoch': 0.07}
+  7%|▋         | 473/6790 [16:28<3:50:11,  2.19s/it]  7%|▋         | 474/6790 [16:30<3:41:44,  2.11s/it]                                                    {'loss': 1.4996, 'learning_rate': 0.00039692337833369286, 'epoch': 0.07}
+  7%|▋         | 474/6790 [16:30<3:41:44,  2.11s/it]  7%|▋         | 475/6790 [16:32<3:45:41,  2.14s/it]                                                    {'loss': 1.5247, 'learning_rate': 0.00039690694641144155, 'epoch': 0.07}
+  7%|▋         | 475/6790 [16:32<3:45:41,  2.14s/it]  7%|▋         | 476/6790 [16:34<3:44:43,  2.14s/it]                                                    {'loss': 1.6779, 'learning_rate': 0.0003968904710673187, 'epoch': 0.07}
+  7%|▋         | 476/6790 [16:34<3:44:43,  2.14s/it]  7%|▋         | 477/6790 [16:36<3:40:57,  2.10s/it]                                                    {'loss': 1.4853, 'learning_rate': 0.0003968739523049573, 'epoch': 0.07}
+  7%|▋         | 477/6790 [16:36<3:40:57,  2.10s/it]  7%|▋         | 478/6790 [16:39<3:43:03,  2.12s/it]                                                    {'loss': 1.5086, 'learning_rate': 0.00039685739012800013, 'epoch': 0.07}
+  7%|▋         | 478/6790 [16:39<3:43:03,  2.12s/it]  7%|▋         | 479/6790 [16:41<3:36:42,  2.06s/it]                                                    {'loss': 1.4432, 'learning_rate': 0.00039684078454009947, 'epoch': 0.07}
+  7%|▋         | 479/6790 [16:41<3:36:42,  2.06s/it]  7%|▋         | 480/6790 [16:43<3:36:52,  2.06s/it]                                                    {'loss': 1.7621, 'learning_rate': 0.00039682413554491714, 'epoch': 0.07}
+  7%|▋         | 480/6790 [16:43<3:36:52,  2.06s/it]  7%|▋         | 481/6790 [16:45<3:34:34,  2.04s/it]                                                    {'loss': 1.679, 'learning_rate': 0.0003968074431461246, 'epoch': 0.07}
+  7%|▋         | 481/6790 [16:45<3:34:34,  2.04s/it]  7%|▋         | 482/6790 [16:47<3:38:20,  2.08s/it]                                                    {'loss': 1.6102, 'learning_rate': 0.00039679070734740293, 'epoch': 0.07}
+  7%|▋         | 482/6790 [16:47<3:38:20,  2.08s/it]  7%|▋         | 483/6790 [16:49<3:32:34,  2.02s/it]                                                    {'loss': 1.7221, 'learning_rate': 0.0003967739281524426, 'epoch': 0.07}
+  7%|▋         | 483/6790 [16:49<3:32:34,  2.02s/it]  7%|▋         | 484/6790 [16:51<3:41:23,  2.11s/it]                                                    {'loss': 1.6246, 'learning_rate': 0.00039675710556494375, 'epoch': 0.07}
+  7%|▋         | 484/6790 [16:51<3:41:23,  2.11s/it]  7%|▋         | 485/6790 [16:53<3:45:39,  2.15s/it]                                                    {'loss': 1.4506, 'learning_rate': 0.0003967402395886161, 'epoch': 0.07}
+  7%|▋         | 485/6790 [16:53<3:45:39,  2.15s/it]  7%|▋         | 486/6790 [16:56<4:08:55,  2.37s/it]                                                    {'loss': 1.4963, 'learning_rate': 0.0003967233302271791, 'epoch': 0.07}
+  7%|▋         | 486/6790 [16:56<4:08:55,  2.37s/it]  7%|▋         | 487/6790 [16:58<4:06:33,  2.35s/it]                                                    {'loss': 1.5775, 'learning_rate': 0.00039670637748436135, 'epoch': 0.07}
+  7%|▋         | 487/6790 [16:58<4:06:33,  2.35s/it]  7%|▋         | 488/6790 [17:00<3:55:29,  2.24s/it]                                                    {'loss': 1.6431, 'learning_rate': 0.0003966893813639014, 'epoch': 0.07}
+  7%|▋         | 488/6790 [17:00<3:55:29,  2.24s/it]  7%|▋         | 489/6790 [17:02<3:48:54,  2.18s/it]                                                    {'loss': 1.5764, 'learning_rate': 0.0003966723418695472, 'epoch': 0.07}
+  7%|▋         | 489/6790 [17:02<3:48:54,  2.18s/it]  7%|▋         | 490/6790 [17:04<3:40:12,  2.10s/it]                                                    {'loss': 1.4797, 'learning_rate': 0.00039665525900505627, 'epoch': 0.07}
+  7%|▋         | 490/6790 [17:04<3:40:12,  2.10s/it]  7%|▋         | 491/6790 [17:06<3:32:18,  2.02s/it]                                                    {'loss': 1.4832, 'learning_rate': 0.00039663813277419576, 'epoch': 0.07}
+  7%|▋         | 491/6790 [17:06<3:32:18,  2.02s/it]  7%|▋         | 492/6790 [17:08<3:32:30,  2.02s/it]                                                    {'loss': 1.5731, 'learning_rate': 0.00039662096318074234, 'epoch': 0.07}
+  7%|▋         | 492/6790 [17:08<3:32:30,  2.02s/it]  7%|▋         | 493/6790 [17:10<3:29:11,  1.99s/it]                                                    {'loss': 1.5636, 'learning_rate': 0.0003966037502284823, 'epoch': 0.07}
+  7%|▋         | 493/6790 [17:10<3:29:11,  1.99s/it]  7%|▋         | 494/6790 [17:12<3:28:22,  1.99s/it]                                                    {'loss': 1.4426, 'learning_rate': 0.00039658649392121126, 'epoch': 0.07}
+  7%|▋         | 494/6790 [17:12<3:28:22,  1.99s/it]  7%|▋         | 495/6790 [17:14<3:25:24,  1.96s/it]                                                    {'loss': 1.4866, 'learning_rate': 0.00039656919426273474, 'epoch': 0.07}
+  7%|▋         | 495/6790 [17:14<3:25:24,  1.96s/it]  7%|▋         | 496/6790 [17:16<3:26:11,  1.97s/it]                                                    {'loss': 1.5041, 'learning_rate': 0.0003965518512568676, 'epoch': 0.07}
+  7%|▋         | 496/6790 [17:16<3:26:11,  1.97s/it]  7%|▋         | 497/6790 [17:18<3:25:21,  1.96s/it]                                                    {'loss': 1.6363, 'learning_rate': 0.0003965344649074343, 'epoch': 0.07}
+  7%|▋         | 497/6790 [17:18<3:25:21,  1.96s/it]  7%|▋         | 498/6790 [17:20<3:41:29,  2.11s/it]                                                    {'loss': 1.7862, 'learning_rate': 0.00039651703521826893, 'epoch': 0.07}
+  7%|▋         | 498/6790 [17:20<3:41:29,  2.11s/it]  7%|▋         | 499/6790 [17:22<3:32:41,  2.03s/it]                                                    {'loss': 1.601, 'learning_rate': 0.000396499562193215, 'epoch': 0.07}
+  7%|▋         | 499/6790 [17:22<3:32:41,  2.03s/it]  7%|▋         | 500/6790 [17:24<3:34:26,  2.05s/it]                                                    {'loss': 1.7703, 'learning_rate': 0.0003964820458361258, 'epoch': 0.07}
+  7%|▋         | 500/6790 [17:24<3:34:26,  2.05s/it]  7%|▋         | 501/6790 [17:26<3:33:32,  2.04s/it]                                                    {'loss': 1.3512, 'learning_rate': 0.00039646448615086383, 'epoch': 0.07}
+  7%|▋         | 501/6790 [17:26<3:33:32,  2.04s/it]  7%|▋         | 502/6790 [17:28<3:28:40,  1.99s/it]                                                    {'loss': 1.6212, 'learning_rate': 0.00039644688314130147, 'epoch': 0.07}
+  7%|▋         | 502/6790 [17:28<3:28:40,  1.99s/it]  7%|▋         | 503/6790 [17:31<3:40:55,  2.11s/it]                                                    {'loss': 1.5604, 'learning_rate': 0.00039642923681132056, 'epoch': 0.07}
+  7%|▋         | 503/6790 [17:31<3:40:55,  2.11s/it]  7%|▋         | 504/6790 [17:33<3:43:33,  2.13s/it]                                                    {'loss': 1.6653, 'learning_rate': 0.0003964115471648123, 'epoch': 0.07}
+  7%|▋         | 504/6790 [17:33<3:43:33,  2.13s/it]  7%|▋         | 505/6790 [17:35<3:40:34,  2.11s/it]                                                    {'loss': 1.4794, 'learning_rate': 0.00039639381420567785, 'epoch': 0.07}
+  7%|▋         | 505/6790 [17:35<3:40:34,  2.11s/it]  7%|▋         | 506/6790 [17:37<3:39:13,  2.09s/it]                                                    {'loss': 1.6225, 'learning_rate': 0.0003963760379378275, 'epoch': 0.07}
+  7%|▋         | 506/6790 [17:37<3:39:13,  2.09s/it]  7%|▋         | 507/6790 [17:39<3:35:59,  2.06s/it]                                                    {'loss': 1.5677, 'learning_rate': 0.0003963582183651813, 'epoch': 0.07}
+  7%|▋         | 507/6790 [17:39<3:35:59,  2.06s/it]  7%|▋         | 508/6790 [17:41<3:45:39,  2.16s/it]                                                    {'loss': 1.6847, 'learning_rate': 0.0003963403554916689, 'epoch': 0.07}
+  7%|▋         | 508/6790 [17:41<3:45:39,  2.16s/it]  7%|▋         | 509/6790 [17:43<3:27:55,  1.99s/it]                                                    {'loss': 1.3744, 'learning_rate': 0.00039632244932122926, 'epoch': 0.07}
+  7%|▋         | 509/6790 [17:43<3:27:55,  1.99s/it]  8%|▊         | 510/6790 [17:45<3:33:03,  2.04s/it]                                                    {'loss': 1.7241, 'learning_rate': 0.0003963044998578112, 'epoch': 0.08}
+  8%|▊         | 510/6790 [17:45<3:33:03,  2.04s/it]  8%|▊         | 511/6790 [17:47<3:32:20,  2.03s/it]                                                    {'loss': 1.5658, 'learning_rate': 0.00039628650710537286, 'epoch': 0.08}
+  8%|▊         | 511/6790 [17:47<3:32:20,  2.03s/it]  8%|▊         | 512/6790 [17:49<3:30:32,  2.01s/it]                                                    {'loss': 1.4954, 'learning_rate': 0.00039626847106788204, 'epoch': 0.08}
+  8%|▊         | 512/6790 [17:49<3:30:32,  2.01s/it]  8%|▊         | 513/6790 [17:52<3:53:25,  2.23s/it]                                                    {'loss': 1.6087, 'learning_rate': 0.000396250391749316, 'epoch': 0.08}
+  8%|▊         | 513/6790 [17:52<3:53:25,  2.23s/it]  8%|▊         | 514/6790 [17:54<3:48:49,  2.19s/it]                                                    {'loss': 1.7414, 'learning_rate': 0.00039623226915366154, 'epoch': 0.08}
+  8%|▊         | 514/6790 [17:54<3:48:49,  2.19s/it]  8%|▊         | 515/6790 [17:56<3:34:08,  2.05s/it]                                                    {'loss': 1.5169, 'learning_rate': 0.0003962141032849151, 'epoch': 0.08}
+  8%|▊         | 515/6790 [17:56<3:34:08,  2.05s/it]  8%|▊         | 516/6790 [17:58<3:56:00,  2.26s/it]                                                    {'loss': 1.3421, 'learning_rate': 0.00039619589414708267, 'epoch': 0.08}
+  8%|▊         | 516/6790 [17:58<3:56:00,  2.26s/it]  8%|▊         | 517/6790 [18:00<3:38:28,  2.09s/it]                                                    {'loss': 1.5662, 'learning_rate': 0.00039617764174417966, 'epoch': 0.08}
+  8%|▊         | 517/6790 [18:00<3:38:28,  2.09s/it]  8%|▊         | 518/6790 [18:02<3:51:33,  2.22s/it]                                                    {'loss': 1.5684, 'learning_rate': 0.0003961593460802311, 'epoch': 0.08}
+  8%|▊         | 518/6790 [18:02<3:51:33,  2.22s/it]  8%|▊         | 519/6790 [18:05<4:07:23,  2.37s/it]                                                    {'loss': 1.5723, 'learning_rate': 0.0003961410071592716, 'epoch': 0.08}
+  8%|▊         | 519/6790 [18:05<4:07:23,  2.37s/it]  8%|▊         | 520/6790 [18:07<3:49:12,  2.19s/it]                                                    {'loss': 1.5047, 'learning_rate': 0.0003961226249853451, 'epoch': 0.08}
+  8%|▊         | 520/6790 [18:07<3:49:12,  2.19s/it]  8%|▊         | 521/6790 [18:09<3:44:43,  2.15s/it]                                                    {'loss': 1.569, 'learning_rate': 0.00039610419956250534, 'epoch': 0.08}
+  8%|▊         | 521/6790 [18:09<3:44:43,  2.15s/it]  8%|▊         | 522/6790 [18:11<3:38:51,  2.10s/it]                                                    {'loss': 1.5559, 'learning_rate': 0.00039608573089481555, 'epoch': 0.08}
+  8%|▊         | 522/6790 [18:11<3:38:51,  2.10s/it]  8%|▊         | 523/6790 [18:13<3:40:17,  2.11s/it]                                                    {'loss': 1.8505, 'learning_rate': 0.0003960672189863483, 'epoch': 0.08}
+  8%|▊         | 523/6790 [18:13<3:40:17,  2.11s/it]  8%|▊         | 524/6790 [18:15<3:30:09,  2.01s/it]                                                    {'loss': 1.2918, 'learning_rate': 0.00039604866384118593, 'epoch': 0.08}
+  8%|▊         | 524/6790 [18:15<3:30:09,  2.01s/it]  8%|▊         | 525/6790 [18:17<3:24:54,  1.96s/it]                                                    {'loss': 1.5761, 'learning_rate': 0.00039603006546342024, 'epoch': 0.08}
+  8%|▊         | 525/6790 [18:17<3:24:54,  1.96s/it]  8%|▊         | 526/6790 [18:19<3:21:26,  1.93s/it]                                                    {'loss': 1.419, 'learning_rate': 0.00039601142385715243, 'epoch': 0.08}
+  8%|▊         | 526/6790 [18:19<3:21:26,  1.93s/it]  8%|▊         | 527/6790 [18:21<3:21:38,  1.93s/it]                                                    {'loss': 1.4382, 'learning_rate': 0.0003959927390264934, 'epoch': 0.08}
+  8%|▊         | 527/6790 [18:21<3:21:38,  1.93s/it]  8%|▊         | 528/6790 [18:23<3:23:52,  1.95s/it]                                                    {'loss': 1.5256, 'learning_rate': 0.0003959740109755635, 'epoch': 0.08}
+  8%|▊         | 528/6790 [18:23<3:23:52,  1.95s/it]  8%|▊         | 529/6790 [18:25<3:34:26,  2.06s/it]                                                    {'loss': 1.7207, 'learning_rate': 0.00039595523970849267, 'epoch': 0.08}
+  8%|▊         | 529/6790 [18:25<3:34:26,  2.06s/it]  8%|▊         | 530/6790 [18:27<3:27:12,  1.99s/it]                                                    {'loss': 1.4946, 'learning_rate': 0.00039593642522942036, 'epoch': 0.08}
+  8%|▊         | 530/6790 [18:27<3:27:12,  1.99s/it]  8%|▊         | 531/6790 [18:29<3:30:13,  2.02s/it]                                                    {'loss': 1.4288, 'learning_rate': 0.00039591756754249545, 'epoch': 0.08}
+  8%|▊         | 531/6790 [18:29<3:30:13,  2.02s/it]  8%|▊         | 532/6790 [18:31<3:28:34,  2.00s/it]                                                    {'loss': 1.6372, 'learning_rate': 0.0003958986666518765, 'epoch': 0.08}
+  8%|▊         | 532/6790 [18:31<3:28:34,  2.00s/it]  8%|▊         | 533/6790 [18:33<3:31:01,  2.02s/it]                                                    {'loss': 1.586, 'learning_rate': 0.0003958797225617316, 'epoch': 0.08}
+  8%|▊         | 533/6790 [18:33<3:31:01,  2.02s/it]  8%|▊         | 534/6790 [18:35<3:21:35,  1.93s/it]                                                    {'loss': 1.2555, 'learning_rate': 0.0003958607352762381, 'epoch': 0.08}
+  8%|▊         | 534/6790 [18:35<3:21:35,  1.93s/it]  8%|▊         | 535/6790 [18:37<3:24:00,  1.96s/it]                                                    {'loss': 1.7151, 'learning_rate': 0.00039584170479958325, 'epoch': 0.08}
+  8%|▊         | 535/6790 [18:37<3:24:00,  1.96s/it]  8%|▊         | 536/6790 [18:39<3:52:54,  2.23s/it]                                                    {'loss': 1.7707, 'learning_rate': 0.0003958226311359636, 'epoch': 0.08}
+  8%|▊         | 536/6790 [18:39<3:52:54,  2.23s/it]  8%|▊         | 537/6790 [18:41<3:45:05,  2.16s/it]                                                    {'loss': 1.5752, 'learning_rate': 0.0003958035142895852, 'epoch': 0.08}
+  8%|▊         | 537/6790 [18:41<3:45:05,  2.16s/it]  8%|▊         | 538/6790 [18:43<3:39:24,  2.11s/it]                                                    {'loss': 1.5623, 'learning_rate': 0.0003957843542646638, 'epoch': 0.08}
+  8%|▊         | 538/6790 [18:43<3:39:24,  2.11s/it]  8%|▊         | 539/6790 [18:45<3:38:36,  2.10s/it]                                                    {'loss': 1.6971, 'learning_rate': 0.00039576515106542445, 'epoch': 0.08}
+  8%|▊         | 539/6790 [18:45<3:38:36,  2.10s/it]  8%|▊         | 540/6790 [18:48<3:49:53,  2.21s/it]                                                    {'loss': 1.4505, 'learning_rate': 0.0003957459046961019, 'epoch': 0.08}
+  8%|▊         | 540/6790 [18:48<3:49:53,  2.21s/it]  8%|▊         | 541/6790 [18:50<3:42:05,  2.13s/it]                                                    {'loss': 1.4605, 'learning_rate': 0.0003957266151609404, 'epoch': 0.08}
+  8%|▊         | 541/6790 [18:50<3:42:05,  2.13s/it]  8%|▊         | 542/6790 [18:52<3:33:33,  2.05s/it]                                                    {'loss': 1.7238, 'learning_rate': 0.0003957072824641936, 'epoch': 0.08}
+  8%|▊         | 542/6790 [18:52<3:33:33,  2.05s/it]  8%|▊         | 543/6790 [18:54<3:37:47,  2.09s/it]                                                    {'loss': 1.5428, 'learning_rate': 0.00039568790661012474, 'epoch': 0.08}
+  8%|▊         | 543/6790 [18:54<3:37:47,  2.09s/it]  8%|▊         | 544/6790 [18:56<3:47:16,  2.18s/it]                                                    {'loss': 1.5456, 'learning_rate': 0.00039566848760300664, 'epoch': 0.08}
+  8%|▊         | 544/6790 [18:56<3:47:16,  2.18s/it]  8%|▊         | 545/6790 [18:58<3:41:10,  2.13s/it]                                                    {'loss': 1.4786, 'learning_rate': 0.0003956490254471215, 'epoch': 0.08}
+  8%|▊         | 545/6790 [18:58<3:41:10,  2.13s/it]  8%|▊         | 546/6790 [19:00<3:33:33,  2.05s/it]                                                    {'loss': 1.7559, 'learning_rate': 0.00039562952014676116, 'epoch': 0.08}
+  8%|▊         | 546/6790 [19:00<3:33:33,  2.05s/it]  8%|▊         | 547/6790 [19:02<3:36:04,  2.08s/it]                                                    {'loss': 1.772, 'learning_rate': 0.0003956099717062269, 'epoch': 0.08}
+  8%|▊         | 547/6790 [19:02<3:36:04,  2.08s/it]  8%|▊         | 548/6790 [19:05<3:39:24,  2.11s/it]                                                    {'loss': 1.4457, 'learning_rate': 0.00039559038012982955, 'epoch': 0.08}
+  8%|▊         | 548/6790 [19:05<3:39:24,  2.11s/it]  8%|▊         | 549/6790 [19:07<3:41:01,  2.12s/it]                                                    {'loss': 1.5248, 'learning_rate': 0.0003955707454218894, 'epoch': 0.08}
+  8%|▊         | 549/6790 [19:07<3:41:01,  2.12s/it]  8%|▊         | 550/6790 [19:09<3:39:15,  2.11s/it]                                                    {'loss': 1.5311, 'learning_rate': 0.0003955510675867364, 'epoch': 0.08}
+  8%|▊         | 550/6790 [19:09<3:39:15,  2.11s/it]  8%|▊         | 551/6790 [19:11<3:39:45,  2.11s/it]                                                    {'loss': 1.4755, 'learning_rate': 0.0003955313466287098, 'epoch': 0.08}
+  8%|▊         | 551/6790 [19:11<3:39:45,  2.11s/it]  8%|▊         | 552/6790 [19:13<3:33:04,  2.05s/it]                                                    {'loss': 1.4659, 'learning_rate': 0.00039551158255215845, 'epoch': 0.08}
+  8%|▊         | 552/6790 [19:13<3:33:04,  2.05s/it]  8%|▊         | 553/6790 [19:15<3:31:05,  2.03s/it]                                                    {'loss': 1.6177, 'learning_rate': 0.00039549177536144084, 'epoch': 0.08}
+  8%|▊         | 553/6790 [19:15<3:31:05,  2.03s/it]  8%|▊         | 554/6790 [19:18<3:53:17,  2.24s/it]                                                    {'loss': 1.7363, 'learning_rate': 0.0003954719250609247, 'epoch': 0.08}
+  8%|▊         | 554/6790 [19:18<3:53:17,  2.24s/it]  8%|▊         | 555/6790 [19:20<3:50:29,  2.22s/it]                                                    {'loss': 1.7455, 'learning_rate': 0.0003954520316549875, 'epoch': 0.08}
+  8%|▊         | 555/6790 [19:20<3:50:29,  2.22s/it]  8%|▊         | 556/6790 [19:22<3:44:06,  2.16s/it]                                                    {'loss': 1.313, 'learning_rate': 0.0003954320951480161, 'epoch': 0.08}
+  8%|▊         | 556/6790 [19:22<3:44:06,  2.16s/it]  8%|▊         | 557/6790 [19:24<3:41:58,  2.14s/it]                                                    {'loss': 1.589, 'learning_rate': 0.00039541211554440693, 'epoch': 0.08}
+  8%|▊         | 557/6790 [19:24<3:41:58,  2.14s/it]  8%|▊         | 558/6790 [19:26<3:38:03,  2.10s/it]                                                    {'loss': 1.7506, 'learning_rate': 0.00039539209284856586, 'epoch': 0.08}
+  8%|▊         | 558/6790 [19:26<3:38:03,  2.10s/it]  8%|▊         | 559/6790 [19:28<3:38:28,  2.10s/it]                                                    {'loss': 1.5365, 'learning_rate': 0.00039537202706490827, 'epoch': 0.08}
+  8%|▊         | 559/6790 [19:28<3:38:28,  2.10s/it]  8%|▊         | 560/6790 [19:30<3:34:43,  2.07s/it]                                                    {'loss': 1.5052, 'learning_rate': 0.00039535191819785906, 'epoch': 0.08}
+  8%|▊         | 560/6790 [19:30<3:34:43,  2.07s/it]  8%|▊         | 561/6790 [19:32<3:37:49,  2.10s/it]                                                    {'loss': 1.4812, 'learning_rate': 0.00039533176625185267, 'epoch': 0.08}
+  8%|▊         | 561/6790 [19:32<3:37:49,  2.10s/it]  8%|▊         | 562/6790 [19:34<3:30:46,  2.03s/it]                                                    {'loss': 1.503, 'learning_rate': 0.000395311571231333, 'epoch': 0.08}
+  8%|▊         | 562/6790 [19:34<3:30:46,  2.03s/it]  8%|▊         | 563/6790 [19:36<3:29:08,  2.02s/it]                                                    {'loss': 1.6071, 'learning_rate': 0.0003952913331407534, 'epoch': 0.08}
+  8%|▊         | 563/6790 [19:36<3:29:08,  2.02s/it]  8%|▊         | 564/6790 [19:38<3:22:52,  1.96s/it]                                                    {'loss': 1.6373, 'learning_rate': 0.0003952710519845768, 'epoch': 0.08}
+  8%|▊         | 564/6790 [19:38<3:22:52,  1.96s/it]  8%|▊         | 565/6790 [19:40<3:34:19,  2.07s/it]                                                    {'loss': 1.7429, 'learning_rate': 0.0003952507277672757, 'epoch': 0.08}
+  8%|▊         | 565/6790 [19:40<3:34:19,  2.07s/it]  8%|▊         | 566/6790 [19:42<3:44:39,  2.17s/it]                                                    {'loss': 1.6952, 'learning_rate': 0.0003952303604933318, 'epoch': 0.08}
+  8%|▊         | 566/6790 [19:42<3:44:39,  2.17s/it]  8%|▊         | 567/6790 [19:44<3:36:47,  2.09s/it]                                                    {'loss': 1.5997, 'learning_rate': 0.0003952099501672366, 'epoch': 0.08}
+  8%|▊         | 567/6790 [19:44<3:36:47,  2.09s/it]  8%|▊         | 568/6790 [19:47<3:48:15,  2.20s/it]                                                    {'loss': 1.4028, 'learning_rate': 0.00039518949679349095, 'epoch': 0.08}
+  8%|▊         | 568/6790 [19:47<3:48:15,  2.20s/it]  8%|▊         | 569/6790 [19:49<3:43:25,  2.15s/it]                                                    {'loss': 1.3166, 'learning_rate': 0.0003951690003766053, 'epoch': 0.08}
+  8%|▊         | 569/6790 [19:49<3:43:25,  2.15s/it]  8%|▊         | 570/6790 [19:51<3:42:32,  2.15s/it]                                                    {'loss': 1.654, 'learning_rate': 0.00039514846092109936, 'epoch': 0.08}
+  8%|▊         | 570/6790 [19:51<3:42:32,  2.15s/it]  8%|▊         | 571/6790 [19:53<3:33:45,  2.06s/it]                                                    {'loss': 1.5074, 'learning_rate': 0.00039512787843150256, 'epoch': 0.08}
+  8%|▊         | 571/6790 [19:53<3:33:45,  2.06s/it]  8%|▊         | 572/6790 [19:55<3:26:01,  1.99s/it]                                                    {'loss': 1.624, 'learning_rate': 0.00039510725291235383, 'epoch': 0.08}
+  8%|▊         | 572/6790 [19:55<3:26:01,  1.99s/it]  8%|▊         | 573/6790 [19:57<3:21:05,  1.94s/it]                                                    {'loss': 1.4702, 'learning_rate': 0.00039508658436820146, 'epoch': 0.08}
+  8%|▊         | 573/6790 [19:57<3:21:05,  1.94s/it]  8%|▊         | 574/6790 [19:59<3:23:14,  1.96s/it]                                                    {'loss': 1.6578, 'learning_rate': 0.00039506587280360315, 'epoch': 0.08}
+  8%|▊         | 574/6790 [19:59<3:23:14,  1.96s/it]  8%|▊         | 575/6790 [20:01<3:26:08,  1.99s/it]                                                    {'loss': 1.5257, 'learning_rate': 0.00039504511822312634, 'epoch': 0.08}
+  8%|▊         | 575/6790 [20:01<3:26:08,  1.99s/it]  8%|▊         | 576/6790 [20:03<3:28:44,  2.02s/it]                                                    {'loss': 1.6093, 'learning_rate': 0.0003950243206313478, 'epoch': 0.08}
+  8%|▊         | 576/6790 [20:03<3:28:44,  2.02s/it]  8%|▊         | 577/6790 [20:05<3:30:27,  2.03s/it]                                                    {'loss': 1.6823, 'learning_rate': 0.00039500348003285385, 'epoch': 0.08}
+  8%|▊         | 577/6790 [20:05<3:30:27,  2.03s/it]  9%|▊         | 578/6790 [20:07<3:25:09,  1.98s/it]                                                    {'loss': 1.5242, 'learning_rate': 0.00039498259643224007, 'epoch': 0.09}
+  9%|▊         | 578/6790 [20:07<3:25:09,  1.98s/it]  9%|▊         | 579/6790 [20:09<3:33:19,  2.06s/it]                                                    {'loss': 1.6566, 'learning_rate': 0.00039496166983411194, 'epoch': 0.09}
+  9%|▊         | 579/6790 [20:09<3:33:19,  2.06s/it]  9%|▊         | 580/6790 [20:11<3:33:40,  2.06s/it]                                                    {'loss': 1.7802, 'learning_rate': 0.00039494070024308404, 'epoch': 0.09}
+  9%|▊         | 580/6790 [20:11<3:33:40,  2.06s/it]  9%|▊         | 581/6790 [20:13<3:25:40,  1.99s/it]                                                    {'loss': 1.5347, 'learning_rate': 0.00039491968766378066, 'epoch': 0.09}
+  9%|▊         | 581/6790 [20:13<3:25:40,  1.99s/it]  9%|▊         | 582/6790 [20:15<3:22:19,  1.96s/it]                                                    {'loss': 1.5615, 'learning_rate': 0.0003948986321008355, 'epoch': 0.09}
+  9%|▊         | 582/6790 [20:15<3:22:19,  1.96s/it]  9%|▊         | 583/6790 [20:17<3:24:01,  1.97s/it]                                                    {'loss': 1.5319, 'learning_rate': 0.0003948775335588916, 'epoch': 0.09}
+  9%|▊         | 583/6790 [20:17<3:24:01,  1.97s/it]  9%|▊         | 584/6790 [20:19<3:21:57,  1.95s/it]                                                    {'loss': 1.6137, 'learning_rate': 0.0003948563920426017, 'epoch': 0.09}
+  9%|▊         | 584/6790 [20:19<3:21:57,  1.95s/it]  9%|▊         | 585/6790 [20:21<3:32:58,  2.06s/it]                                                    {'loss': 1.4292, 'learning_rate': 0.00039483520755662793, 'epoch': 0.09}
+  9%|▊         | 585/6790 [20:21<3:32:58,  2.06s/it]  9%|▊         | 586/6790 [20:23<3:27:10,  2.00s/it]                                                    {'loss': 1.3204, 'learning_rate': 0.00039481398010564187, 'epoch': 0.09}
+  9%|▊         | 586/6790 [20:23<3:27:10,  2.00s/it]  9%|▊         | 587/6790 [20:25<3:31:55,  2.05s/it]                                                    {'loss': 1.7767, 'learning_rate': 0.00039479270969432456, 'epoch': 0.09}
+  9%|▊         | 587/6790 [20:25<3:31:55,  2.05s/it]  9%|▊         | 588/6790 [20:27<3:26:46,  2.00s/it]                                                    {'loss': 1.4207, 'learning_rate': 0.00039477139632736663, 'epoch': 0.09}
+  9%|▊         | 588/6790 [20:27<3:26:46,  2.00s/it]  9%|▊         | 589/6790 [20:29<3:25:52,  1.99s/it]                                                    {'loss': 1.5523, 'learning_rate': 0.000394750040009468, 'epoch': 0.09}
+  9%|▊         | 589/6790 [20:29<3:25:52,  1.99s/it]  9%|▊         | 590/6790 [20:31<3:35:09,  2.08s/it]                                                    {'loss': 1.7062, 'learning_rate': 0.00039472864074533825, 'epoch': 0.09}
+  9%|▊         | 590/6790 [20:31<3:35:09,  2.08s/it]  9%|▊         | 591/6790 [20:33<3:31:38,  2.05s/it]                                                    {'loss': 1.5417, 'learning_rate': 0.00039470719853969624, 'epoch': 0.09}
+  9%|▊         | 591/6790 [20:33<3:31:38,  2.05s/it]  9%|▊         | 592/6790 [20:35<3:34:49,  2.08s/it]                                                    {'loss': 1.682, 'learning_rate': 0.0003946857133972705, 'epoch': 0.09}
+  9%|▊         | 592/6790 [20:35<3:34:49,  2.08s/it]  9%|▊         | 593/6790 [20:37<3:31:07,  2.04s/it]                                                    {'loss': 1.7556, 'learning_rate': 0.00039466418532279886, 'epoch': 0.09}
+  9%|▊         | 593/6790 [20:37<3:31:07,  2.04s/it]  9%|▊         | 594/6790 [20:39<3:31:30,  2.05s/it]                                                    {'loss': 1.6422, 'learning_rate': 0.0003946426143210287, 'epoch': 0.09}
+  9%|▊         | 594/6790 [20:39<3:31:30,  2.05s/it]  9%|▉         | 595/6790 [20:41<3:30:07,  2.04s/it]                                                    {'loss': 1.5993, 'learning_rate': 0.00039462100039671684, 'epoch': 0.09}
+  9%|▉         | 595/6790 [20:41<3:30:07,  2.04s/it]  9%|▉         | 596/6790 [20:43<3:31:14,  2.05s/it]                                                    {'loss': 1.4091, 'learning_rate': 0.0003945993435546296, 'epoch': 0.09}
+  9%|▉         | 596/6790 [20:43<3:31:14,  2.05s/it]  9%|▉         | 597/6790 [20:45<3:29:54,  2.03s/it]                                                    {'loss': 1.4334, 'learning_rate': 0.0003945776437995428, 'epoch': 0.09}
+  9%|▉         | 597/6790 [20:45<3:29:54,  2.03s/it]  9%|▉         | 598/6790 [20:47<3:35:39,  2.09s/it]                                                    {'loss': 1.5028, 'learning_rate': 0.0003945559011362415, 'epoch': 0.09}
+  9%|▉         | 598/6790 [20:47<3:35:39,  2.09s/it]  9%|▉         | 599/6790 [20:49<3:32:38,  2.06s/it]                                                    {'loss': 1.5019, 'learning_rate': 0.00039453411556952063, 'epoch': 0.09}
+  9%|▉         | 599/6790 [20:49<3:32:38,  2.06s/it]  9%|▉         | 600/6790 [20:52<3:35:58,  2.09s/it]                                                    {'loss': 1.4702, 'learning_rate': 0.0003945122871041841, 'epoch': 0.09}
+  9%|▉         | 600/6790 [20:52<3:35:58,  2.09s/it]  9%|▉         | 601/6790 [20:53<3:28:55,  2.03s/it]                                                    {'loss': 1.3659, 'learning_rate': 0.00039449041574504565, 'epoch': 0.09}
+  9%|▉         | 601/6790 [20:53<3:28:55,  2.03s/it]  9%|▉         | 602/6790 [20:56<3:28:53,  2.03s/it]                                                    {'loss': 1.4598, 'learning_rate': 0.0003944685014969284, 'epoch': 0.09}
+  9%|▉         | 602/6790 [20:56<3:28:53,  2.03s/it]  9%|▉         | 603/6790 [20:58<3:28:56,  2.03s/it]                                                    {'loss': 1.4831, 'learning_rate': 0.0003944465443646647, 'epoch': 0.09}
+  9%|▉         | 603/6790 [20:58<3:28:56,  2.03s/it]  9%|▉         | 604/6790 [21:00<3:48:39,  2.22s/it]                                                    {'loss': 1.5262, 'learning_rate': 0.00039442454435309655, 'epoch': 0.09}
+  9%|▉         | 604/6790 [21:00<3:48:39,  2.22s/it]  9%|▉         | 605/6790 [21:02<3:39:53,  2.13s/it]                                                    {'loss': 1.4696, 'learning_rate': 0.0003944025014670755, 'epoch': 0.09}
+  9%|▉         | 605/6790 [21:02<3:39:53,  2.13s/it]  9%|▉         | 606/6790 [21:04<3:34:39,  2.08s/it]                                                    {'loss': 1.2458, 'learning_rate': 0.0003943804157114625, 'epoch': 0.09}
+  9%|▉         | 606/6790 [21:04<3:34:39,  2.08s/it]  9%|▉         | 607/6790 [21:06<3:31:46,  2.06s/it]                                                    {'loss': 1.5858, 'learning_rate': 0.00039435828709112765, 'epoch': 0.09}
+  9%|▉         | 607/6790 [21:06<3:31:46,  2.06s/it]  9%|▉         | 608/6790 [21:09<3:52:18,  2.25s/it]                                                    {'loss': 1.3698, 'learning_rate': 0.000394336115610951, 'epoch': 0.09}
+  9%|▉         | 608/6790 [21:09<3:52:18,  2.25s/it]  9%|▉         | 609/6790 [21:11<3:48:37,  2.22s/it]                                                    {'loss': 1.6065, 'learning_rate': 0.0003943139012758217, 'epoch': 0.09}
+  9%|▉         | 609/6790 [21:11<3:48:37,  2.22s/it]  9%|▉         | 610/6790 [21:13<3:36:48,  2.10s/it]                                                    {'loss': 1.5268, 'learning_rate': 0.00039429164409063836, 'epoch': 0.09}
+  9%|▉         | 610/6790 [21:13<3:36:48,  2.10s/it]  9%|▉         | 611/6790 [21:15<3:34:51,  2.09s/it]                                                    {'loss': 1.5227, 'learning_rate': 0.00039426934406030926, 'epoch': 0.09}
+  9%|▉         | 611/6790 [21:15<3:34:51,  2.09s/it]  9%|▉         | 612/6790 [21:17<3:25:43,  2.00s/it]                                                    {'loss': 1.6872, 'learning_rate': 0.00039424700118975193, 'epoch': 0.09}
+  9%|▉         | 612/6790 [21:17<3:25:43,  2.00s/it]  9%|▉         | 613/6790 [21:19<3:22:19,  1.97s/it]                                                    {'loss': 1.5023, 'learning_rate': 0.0003942246154838935, 'epoch': 0.09}
+  9%|▉         | 613/6790 [21:19<3:22:19,  1.97s/it]  9%|▉         | 614/6790 [21:20<3:22:16,  1.97s/it]                                                    {'loss': 1.726, 'learning_rate': 0.0003942021869476703, 'epoch': 0.09}
+  9%|▉         | 614/6790 [21:20<3:22:16,  1.97s/it]  9%|▉         | 615/6790 [21:22<3:15:02,  1.90s/it]                                                    {'loss': 1.6059, 'learning_rate': 0.00039417971558602835, 'epoch': 0.09}
+  9%|▉         | 615/6790 [21:22<3:15:02,  1.90s/it]  9%|▉         | 616/6790 [21:24<3:18:36,  1.93s/it]                                                    {'loss': 1.5997, 'learning_rate': 0.0003941572014039231, 'epoch': 0.09}
+  9%|▉         | 616/6790 [21:24<3:18:36,  1.93s/it]  9%|▉         | 617/6790 [21:26<3:24:47,  1.99s/it]                                                    {'loss': 1.8913, 'learning_rate': 0.0003941346444063193, 'epoch': 0.09}
+  9%|▉         | 617/6790 [21:26<3:24:47,  1.99s/it]  9%|▉         | 618/6790 [21:28<3:26:00,  2.00s/it]                                                    {'loss': 1.4707, 'learning_rate': 0.0003941120445981912, 'epoch': 0.09}
+  9%|▉         | 618/6790 [21:28<3:26:00,  2.00s/it]  9%|▉         | 619/6790 [21:30<3:25:22,  2.00s/it]                                                    {'loss': 1.5097, 'learning_rate': 0.0003940894019845225, 'epoch': 0.09}
+  9%|▉         | 619/6790 [21:30<3:25:22,  2.00s/it]  9%|▉         | 620/6790 [21:32<3:21:38,  1.96s/it]                                                    {'loss': 1.698, 'learning_rate': 0.00039406671657030645, 'epoch': 0.09}
+  9%|▉         | 620/6790 [21:32<3:21:38,  1.96s/it]  9%|▉         | 621/6790 [21:35<3:31:09,  2.05s/it]                                                    {'loss': 1.6767, 'learning_rate': 0.00039404398836054543, 'epoch': 0.09}
+  9%|▉         | 621/6790 [21:35<3:31:09,  2.05s/it]  9%|▉         | 622/6790 [21:36<3:25:00,  1.99s/it]                                                    {'loss': 1.5162, 'learning_rate': 0.0003940212173602517, 'epoch': 0.09}
+  9%|▉         | 622/6790 [21:36<3:25:00,  1.99s/it]  9%|▉         | 623/6790 [21:38<3:20:32,  1.95s/it]                                                    {'loss': 1.478, 'learning_rate': 0.00039399840357444654, 'epoch': 0.09}
+  9%|▉         | 623/6790 [21:38<3:20:32,  1.95s/it]  9%|▉         | 624/6790 [21:40<3:18:25,  1.93s/it]                                                    {'loss': 1.4401, 'learning_rate': 0.0003939755470081609, 'epoch': 0.09}
+  9%|▉         | 624/6790 [21:40<3:18:25,  1.93s/it]  9%|▉         | 625/6790 [21:42<3:24:30,  1.99s/it]                                                    {'loss': 1.3641, 'learning_rate': 0.0003939526476664351, 'epoch': 0.09}
+  9%|▉         | 625/6790 [21:42<3:24:30,  1.99s/it]  9%|▉         | 626/6790 [21:44<3:28:53,  2.03s/it]                                                    {'loss': 1.7617, 'learning_rate': 0.0003939297055543189, 'epoch': 0.09}
+  9%|▉         | 626/6790 [21:44<3:28:53,  2.03s/it]  9%|▉         | 627/6790 [21:46<3:29:39,  2.04s/it]                                                    {'loss': 1.6983, 'learning_rate': 0.0003939067206768715, 'epoch': 0.09}
+  9%|▉         | 627/6790 [21:46<3:29:39,  2.04s/it]  9%|▉         | 628/6790 [21:48<3:21:54,  1.97s/it]                                                    {'loss': 1.5936, 'learning_rate': 0.0003938836930391615, 'epoch': 0.09}
+  9%|▉         | 628/6790 [21:48<3:21:54,  1.97s/it]  9%|▉         | 629/6790 [21:50<3:26:43,  2.01s/it]                                                    {'loss': 1.6239, 'learning_rate': 0.00039386062264626696, 'epoch': 0.09}
+  9%|▉         | 629/6790 [21:50<3:26:43,  2.01s/it]  9%|▉         | 630/6790 [21:53<3:31:31,  2.06s/it]                                                    {'loss': 1.7184, 'learning_rate': 0.0003938375095032754, 'epoch': 0.09}
+  9%|▉         | 630/6790 [21:53<3:31:31,  2.06s/it]  9%|▉         | 631/6790 [21:54<3:24:38,  1.99s/it]                                                    {'loss': 1.5136, 'learning_rate': 0.00039381435361528363, 'epoch': 0.09}
+  9%|▉         | 631/6790 [21:54<3:24:38,  1.99s/it]  9%|▉         | 632/6790 [21:56<3:23:27,  1.98s/it]                                                    {'loss': 1.6812, 'learning_rate': 0.000393791154987398, 'epoch': 0.09}
+  9%|▉         | 632/6790 [21:56<3:23:27,  1.98s/it]  9%|▉         | 633/6790 [21:58<3:29:04,  2.04s/it]                                                    {'loss': 1.5531, 'learning_rate': 0.00039376791362473435, 'epoch': 0.09}
+  9%|▉         | 633/6790 [21:58<3:29:04,  2.04s/it]  9%|▉         | 634/6790 [22:01<3:31:30,  2.06s/it]                                                    {'loss': 1.7029, 'learning_rate': 0.00039374462953241775, 'epoch': 0.09}
+  9%|▉         | 634/6790 [22:01<3:31:30,  2.06s/it]  9%|▉         | 635/6790 [22:03<3:27:46,  2.03s/it]                                                    {'loss': 1.3812, 'learning_rate': 0.0003937213027155829, 'epoch': 0.09}
+  9%|▉         | 635/6790 [22:03<3:27:46,  2.03s/it]  9%|▉         | 636/6790 [22:04<3:17:59,  1.93s/it]                                                    {'loss': 1.6323, 'learning_rate': 0.00039369793317937376, 'epoch': 0.09}
+  9%|▉         | 636/6790 [22:04<3:17:59,  1.93s/it]  9%|▉         | 637/6790 [22:06<3:20:59,  1.96s/it]                                                    {'loss': 1.6777, 'learning_rate': 0.0003936745209289438, 'epoch': 0.09}
+  9%|▉         | 637/6790 [22:06<3:20:59,  1.96s/it]  9%|▉         | 638/6790 [22:08<3:22:41,  1.98s/it]                                                    {'loss': 1.5442, 'learning_rate': 0.0003936510659694559, 'epoch': 0.09}
+  9%|▉         | 638/6790 [22:08<3:22:41,  1.98s/it]  9%|▉         | 639/6790 [22:11<3:47:42,  2.22s/it]                                                    {'loss': 1.549, 'learning_rate': 0.0003936275683060823, 'epoch': 0.09}
+  9%|▉         | 639/6790 [22:11<3:47:42,  2.22s/it]  9%|▉         | 640/6790 [22:13<3:52:22,  2.27s/it]                                                    {'loss': 1.4644, 'learning_rate': 0.00039360402794400473, 'epoch': 0.09}
+  9%|▉         | 640/6790 [22:13<3:52:22,  2.27s/it]  9%|▉         | 641/6790 [22:16<3:48:27,  2.23s/it]                                                    {'loss': 1.6107, 'learning_rate': 0.00039358044488841423, 'epoch': 0.09}
+  9%|▉         | 641/6790 [22:16<3:48:27,  2.23s/it]  9%|▉         | 642/6790 [22:18<3:40:51,  2.16s/it]                                                    {'loss': 1.5302, 'learning_rate': 0.0003935568191445115, 'epoch': 0.09}
+  9%|▉         | 642/6790 [22:18<3:40:51,  2.16s/it]  9%|▉         | 643/6790 [22:19<3:32:48,  2.08s/it]                                                    {'loss': 1.749, 'learning_rate': 0.00039353315071750635, 'epoch': 0.09}
+  9%|▉         | 643/6790 [22:19<3:32:48,  2.08s/it]  9%|▉         | 644/6790 [22:21<3:25:43,  2.01s/it]                                                    {'loss': 1.5518, 'learning_rate': 0.0003935094396126181, 'epoch': 0.09}
+  9%|▉         | 644/6790 [22:21<3:25:43,  2.01s/it]  9%|▉         | 645/6790 [22:24<3:32:25,  2.07s/it]                                                    {'loss': 1.672, 'learning_rate': 0.0003934856858350757, 'epoch': 0.09}
+  9%|▉         | 645/6790 [22:24<3:32:25,  2.07s/it] 10%|▉         | 646/6790 [22:26<3:54:46,  2.29s/it]                                                    {'loss': 1.4871, 'learning_rate': 0.00039346188939011706, 'epoch': 0.1}
+ 10%|▉         | 646/6790 [22:26<3:54:46,  2.29s/it] 10%|▉         | 647/6790 [22:28<3:46:32,  2.21s/it]                                                    {'loss': 1.5179, 'learning_rate': 0.00039343805028299003, 'epoch': 0.1}
+ 10%|▉         | 647/6790 [22:28<3:46:32,  2.21s/it] 10%|▉         | 648/6790 [22:31<3:46:52,  2.22s/it]                                                    {'loss': 1.4641, 'learning_rate': 0.0003934141685189514, 'epoch': 0.1}
+ 10%|▉         | 648/6790 [22:31<3:46:52,  2.22s/it] 10%|▉         | 649/6790 [22:32<3:35:41,  2.11s/it]                                                    {'loss': 1.4858, 'learning_rate': 0.0003933902441032677, 'epoch': 0.1}
+ 10%|▉         | 649/6790 [22:32<3:35:41,  2.11s/it] 10%|▉         | 650/6790 [22:34<3:26:31,  2.02s/it]                                                    {'loss': 1.4716, 'learning_rate': 0.0003933662770412147, 'epoch': 0.1}
+ 10%|▉         | 650/6790 [22:34<3:26:31,  2.02s/it] 10%|▉         | 651/6790 [22:36<3:22:10,  1.98s/it]                                                    {'loss': 1.5734, 'learning_rate': 0.00039334226733807765, 'epoch': 0.1}
+ 10%|▉         | 651/6790 [22:36<3:22:10,  1.98s/it] 10%|▉         | 652/6790 [22:38<3:23:10,  1.99s/it]                                                    {'loss': 1.4555, 'learning_rate': 0.00039331821499915106, 'epoch': 0.1}
+ 10%|▉         | 652/6790 [22:38<3:23:10,  1.99s/it] 10%|▉         | 653/6790 [22:40<3:22:18,  1.98s/it]                                                    {'loss': 1.6127, 'learning_rate': 0.000393294120029739, 'epoch': 0.1}
+ 10%|▉         | 653/6790 [22:40<3:22:18,  1.98s/it] 10%|▉         | 654/6790 [22:42<3:26:46,  2.02s/it]                                                    {'loss': 1.498, 'learning_rate': 0.00039326998243515495, 'epoch': 0.1}
+ 10%|▉         | 654/6790 [22:42<3:26:46,  2.02s/it] 10%|▉         | 655/6790 [22:44<3:19:11,  1.95s/it]                                                    {'loss': 1.3582, 'learning_rate': 0.00039324580222072157, 'epoch': 0.1}
+ 10%|▉         | 655/6790 [22:44<3:19:11,  1.95s/it] 10%|▉         | 656/6790 [22:46<3:15:40,  1.91s/it]                                                    {'loss': 1.5743, 'learning_rate': 0.00039322157939177124, 'epoch': 0.1}
+ 10%|▉         | 656/6790 [22:46<3:15:40,  1.91s/it] 10%|▉         | 657/6790 [22:48<3:13:20,  1.89s/it]                                                    {'loss': 1.6453, 'learning_rate': 0.0003931973139536455, 'epoch': 0.1}
+ 10%|▉         | 657/6790 [22:48<3:13:20,  1.89s/it] 10%|▉         | 658/6790 [22:50<3:19:27,  1.95s/it]                                                    {'loss': 1.6836, 'learning_rate': 0.00039317300591169537, 'epoch': 0.1}
+ 10%|▉         | 658/6790 [22:50<3:19:27,  1.95s/it] 10%|▉         | 659/6790 [22:52<3:32:15,  2.08s/it]                                                    {'loss': 1.2926, 'learning_rate': 0.0003931486552712812, 'epoch': 0.1}
+ 10%|▉         | 659/6790 [22:52<3:32:15,  2.08s/it] 10%|▉         | 660/6790 [22:55<3:53:57,  2.29s/it]                                                    {'loss': 1.5307, 'learning_rate': 0.0003931242620377729, 'epoch': 0.1}
+ 10%|▉         | 660/6790 [22:55<3:53:57,  2.29s/it] 10%|▉         | 661/6790 [22:57<3:38:04,  2.13s/it]                                                    {'loss': 1.4516, 'learning_rate': 0.00039309982621654955, 'epoch': 0.1}
+ 10%|▉         | 661/6790 [22:57<3:38:04,  2.13s/it] 10%|▉         | 662/6790 [22:59<3:40:15,  2.16s/it]                                                    {'loss': 1.6667, 'learning_rate': 0.0003930753478129998, 'epoch': 0.1}
+ 10%|▉         | 662/6790 [22:59<3:40:15,  2.16s/it] 10%|▉         | 663/6790 [23:01<3:35:12,  2.11s/it]                                                    {'loss': 1.529, 'learning_rate': 0.0003930508268325216, 'epoch': 0.1}
+ 10%|▉         | 663/6790 [23:01<3:35:12,  2.11s/it] 10%|▉         | 664/6790 [23:04<3:59:52,  2.35s/it]                                                    {'loss': 1.4201, 'learning_rate': 0.00039302626328052237, 'epoch': 0.1}
+ 10%|▉         | 664/6790 [23:04<3:59:52,  2.35s/it] 10%|▉         | 665/6790 [23:06<3:55:59,  2.31s/it]                                                    {'loss': 1.3482, 'learning_rate': 0.00039300165716241864, 'epoch': 0.1}
+ 10%|▉         | 665/6790 [23:06<3:55:59,  2.31s/it] 10%|▉         | 666/6790 [23:08<3:47:38,  2.23s/it]                                                    {'loss': 1.6872, 'learning_rate': 0.00039297700848363684, 'epoch': 0.1}
+ 10%|▉         | 666/6790 [23:08<3:47:38,  2.23s/it] 10%|▉         | 667/6790 [23:11<3:53:42,  2.29s/it]                                                    {'loss': 1.4205, 'learning_rate': 0.0003929523172496123, 'epoch': 0.1}
+ 10%|▉         | 667/6790 [23:11<3:53:42,  2.29s/it] 10%|▉         | 668/6790 [23:13<3:53:47,  2.29s/it]                                                    {'loss': 1.4811, 'learning_rate': 0.00039292758346579, 'epoch': 0.1}
+ 10%|▉         | 668/6790 [23:13<3:53:47,  2.29s/it] 10%|▉         | 669/6790 [23:15<3:35:41,  2.11s/it]                                                    {'loss': 1.5839, 'learning_rate': 0.0003929028071376242, 'epoch': 0.1}
+ 10%|▉         | 669/6790 [23:15<3:35:41,  2.11s/it] 10%|▉         | 670/6790 [23:16<3:30:54,  2.07s/it]                                                    {'loss': 1.693, 'learning_rate': 0.0003928779882705785, 'epoch': 0.1}
+ 10%|▉         | 670/6790 [23:16<3:30:54,  2.07s/it] 10%|▉         | 671/6790 [23:19<3:33:42,  2.10s/it]                                                    {'loss': 1.535, 'learning_rate': 0.0003928531268701261, 'epoch': 0.1}
+ 10%|▉         | 671/6790 [23:19<3:33:42,  2.10s/it] 10%|▉         | 672/6790 [23:21<3:42:38,  2.18s/it]                                                    {'loss': 1.542, 'learning_rate': 0.00039282822294174933, 'epoch': 0.1}
+ 10%|▉         | 672/6790 [23:21<3:42:38,  2.18s/it] 10%|▉         | 673/6790 [23:23<3:50:49,  2.26s/it]                                                    {'loss': 1.5841, 'learning_rate': 0.00039280327649094006, 'epoch': 0.1}
+ 10%|▉         | 673/6790 [23:23<3:50:49,  2.26s/it] 10%|▉         | 674/6790 [23:26<3:45:48,  2.22s/it]                                                    {'loss': 1.5136, 'learning_rate': 0.0003927782875231994, 'epoch': 0.1}
+ 10%|▉         | 674/6790 [23:26<3:45:48,  2.22s/it] 10%|▉         | 675/6790 [23:28<3:44:54,  2.21s/it]                                                    {'loss': 1.5974, 'learning_rate': 0.000392753256044038, 'epoch': 0.1}
+ 10%|▉         | 675/6790 [23:28<3:44:54,  2.21s/it] 10%|▉         | 676/6790 [23:30<3:33:45,  2.10s/it]                                                    {'loss': 1.5085, 'learning_rate': 0.0003927281820589757, 'epoch': 0.1}
+ 10%|▉         | 676/6790 [23:30<3:33:45,  2.10s/it] 10%|▉         | 677/6790 [23:31<3:21:38,  1.98s/it]                                                    {'loss': 1.6081, 'learning_rate': 0.0003927030655735418, 'epoch': 0.1}
+ 10%|▉         | 677/6790 [23:31<3:21:38,  1.98s/it] 10%|▉         | 678/6790 [23:33<3:18:18,  1.95s/it]                                                    {'loss': 1.5931, 'learning_rate': 0.0003926779065932752, 'epoch': 0.1}
+ 10%|▉         | 678/6790 [23:33<3:18:18,  1.95s/it] 10%|█         | 679/6790 [23:35<3:19:59,  1.96s/it]                                                    {'loss': 1.3269, 'learning_rate': 0.00039265270512372363, 'epoch': 0.1}
+ 10%|█         | 679/6790 [23:35<3:19:59,  1.96s/it] 10%|█         | 680/6790 [23:37<3:22:25,  1.99s/it]                                                    {'loss': 1.4248, 'learning_rate': 0.00039262746117044476, 'epoch': 0.1}
+ 10%|█         | 680/6790 [23:37<3:22:25,  1.99s/it] 10%|█         | 681/6790 [23:39<3:21:33,  1.98s/it]                                                    {'loss': 1.5001, 'learning_rate': 0.00039260217473900525, 'epoch': 0.1}
+ 10%|█         | 681/6790 [23:39<3:21:33,  1.98s/it] 10%|█         | 682/6790 [23:41<3:18:30,  1.95s/it]                                                    {'loss': 1.5468, 'learning_rate': 0.0003925768458349813, 'epoch': 0.1}
+ 10%|█         | 682/6790 [23:41<3:18:30,  1.95s/it] 10%|█         | 683/6790 [23:43<3:29:38,  2.06s/it]                                                    {'loss': 1.5619, 'learning_rate': 0.00039255147446395845, 'epoch': 0.1}
+ 10%|█         | 683/6790 [23:43<3:29:38,  2.06s/it] 10%|█         | 684/6790 [23:45<3:20:11,  1.97s/it]                                                    {'loss': 1.6709, 'learning_rate': 0.00039252606063153156, 'epoch': 0.1}
+ 10%|█         | 684/6790 [23:45<3:20:11,  1.97s/it] 10%|█         | 685/6790 [23:48<3:37:23,  2.14s/it]                                                    {'loss': 1.4961, 'learning_rate': 0.0003925006043433049, 'epoch': 0.1}
+ 10%|█         | 685/6790 [23:48<3:37:23,  2.14s/it] 10%|█         | 686/6790 [23:49<3:25:04,  2.02s/it]                                                    {'loss': 1.4908, 'learning_rate': 0.0003924751056048921, 'epoch': 0.1}
+ 10%|█         | 686/6790 [23:49<3:25:04,  2.02s/it] 10%|█         | 687/6790 [23:51<3:23:50,  2.00s/it]                                                    {'loss': 1.5729, 'learning_rate': 0.00039244956442191606, 'epoch': 0.1}
+ 10%|█         | 687/6790 [23:51<3:23:50,  2.00s/it] 10%|█         | 688/6790 [23:53<3:23:22,  2.00s/it]                                                    {'loss': 1.3864, 'learning_rate': 0.00039242398080000917, 'epoch': 0.1}
+ 10%|█         | 688/6790 [23:53<3:23:22,  2.00s/it] 10%|█         | 689/6790 [23:56<3:30:43,  2.07s/it]                                                    {'loss': 1.6019, 'learning_rate': 0.0003923983547448132, 'epoch': 0.1}
+ 10%|█         | 689/6790 [23:56<3:30:43,  2.07s/it] 10%|█         | 690/6790 [23:58<3:31:29,  2.08s/it]                                                    {'loss': 1.5368, 'learning_rate': 0.00039237268626197904, 'epoch': 0.1}
+ 10%|█         | 690/6790 [23:58<3:31:29,  2.08s/it] 10%|█         | 691/6790 [23:59<3:21:34,  1.98s/it]                                                    {'loss': 1.5732, 'learning_rate': 0.0003923469753571672, 'epoch': 0.1}
+ 10%|█         | 691/6790 [23:59<3:21:34,  1.98s/it] 10%|█         | 692/6790 [24:01<3:19:48,  1.97s/it]                                                    {'loss': 1.7633, 'learning_rate': 0.0003923212220360474, 'epoch': 0.1}
+ 10%|█         | 692/6790 [24:01<3:19:48,  1.97s/it] 10%|█         | 693/6790 [24:03<3:15:05,  1.92s/it]                                                    {'loss': 1.6119, 'learning_rate': 0.00039229542630429885, 'epoch': 0.1}
+ 10%|█         | 693/6790 [24:03<3:15:05,  1.92s/it] 10%|█         | 694/6790 [24:05<3:13:53,  1.91s/it]                                                    {'loss': 1.7213, 'learning_rate': 0.00039226958816760993, 'epoch': 0.1}
+ 10%|█         | 694/6790 [24:05<3:13:53,  1.91s/it] 10%|█         | 695/6790 [24:07<3:23:24,  2.00s/it]                                                    {'loss': 1.5098, 'learning_rate': 0.0003922437076316785, 'epoch': 0.1}
+ 10%|█         | 695/6790 [24:07<3:23:24,  2.00s/it] 10%|█         | 696/6790 [24:09<3:26:03,  2.03s/it]                                                    {'loss': 1.609, 'learning_rate': 0.0003922177847022116, 'epoch': 0.1}
+ 10%|█         | 696/6790 [24:09<3:26:03,  2.03s/it] 10%|█         | 697/6790 [24:11<3:20:52,  1.98s/it]                                                    {'loss': 1.4105, 'learning_rate': 0.0003921918193849259, 'epoch': 0.1}
+ 10%|█         | 697/6790 [24:11<3:20:52,  1.98s/it] 10%|█         | 698/6790 [24:13<3:13:21,  1.90s/it]                                                    {'loss': 1.568, 'learning_rate': 0.0003921658116855473, 'epoch': 0.1}
+ 10%|█         | 698/6790 [24:13<3:13:21,  1.90s/it] 10%|█         | 699/6790 [24:15<3:17:03,  1.94s/it]                                                    {'loss': 1.6352, 'learning_rate': 0.00039213976160981087, 'epoch': 0.1}
+ 10%|█         | 699/6790 [24:15<3:17:03,  1.94s/it] 10%|█         | 700/6790 [24:17<3:11:13,  1.88s/it]                                                    {'loss': 1.3287, 'learning_rate': 0.0003921136691634612, 'epoch': 0.1}
+ 10%|█         | 700/6790 [24:17<3:11:13,  1.88s/it] 10%|█         | 701/6790 [24:19<3:26:09,  2.03s/it]                                                    {'loss': 1.4389, 'learning_rate': 0.0003920875343522523, 'epoch': 0.1}
+ 10%|█         | 701/6790 [24:19<3:26:09,  2.03s/it] 10%|█         | 702/6790 [24:21<3:20:51,  1.98s/it]                                                    {'loss': 1.3886, 'learning_rate': 0.00039206135718194724, 'epoch': 0.1}
+ 10%|█         | 702/6790 [24:21<3:20:51,  1.98s/it] 10%|█         | 703/6790 [24:23<3:18:06,  1.95s/it]                                                    {'loss': 1.5077, 'learning_rate': 0.0003920351376583187, 'epoch': 0.1}
+ 10%|█         | 703/6790 [24:23<3:18:06,  1.95s/it] 10%|█         | 704/6790 [24:25<3:19:00,  1.96s/it]                                                    {'loss': 1.6164, 'learning_rate': 0.0003920088757871487, 'epoch': 0.1}
+ 10%|█         | 704/6790 [24:25<3:19:00,  1.96s/it] 10%|█         | 705/6790 [24:27<3:22:51,  2.00s/it]                                                    {'loss': 1.5735, 'learning_rate': 0.0003919825715742283, 'epoch': 0.1}
+ 10%|█         | 705/6790 [24:27<3:22:51,  2.00s/it] 10%|█         | 706/6790 [24:29<3:28:04,  2.05s/it]                                                    {'loss': 1.7722, 'learning_rate': 0.00039195622502535826, 'epoch': 0.1}
+ 10%|█         | 706/6790 [24:29<3:28:04,  2.05s/it] 10%|█         | 707/6790 [24:31<3:31:17,  2.08s/it]                                                    {'loss': 1.7663, 'learning_rate': 0.00039192983614634835, 'epoch': 0.1}
+ 10%|█         | 707/6790 [24:31<3:31:17,  2.08s/it] 10%|█         | 708/6790 [24:33<3:32:15,  2.09s/it]                                                    {'loss': 1.7443, 'learning_rate': 0.00039190340494301806, 'epoch': 0.1}
+ 10%|█         | 708/6790 [24:33<3:32:15,  2.09s/it] 10%|█         | 709/6790 [24:36<3:43:11,  2.20s/it]                                                    {'loss': 1.6344, 'learning_rate': 0.0003918769314211958, 'epoch': 0.1}
+ 10%|█         | 709/6790 [24:36<3:43:11,  2.20s/it] 10%|█         | 710/6790 [24:38<3:46:41,  2.24s/it]                                                    {'loss': 1.5701, 'learning_rate': 0.0003918504155867196, 'epoch': 0.1}
+ 10%|█         | 710/6790 [24:38<3:46:41,  2.24s/it] 10%|█         | 711/6790 [24:40<3:33:48,  2.11s/it]                                                    {'loss': 1.7835, 'learning_rate': 0.0003918238574454367, 'epoch': 0.1}
+ 10%|█         | 711/6790 [24:40<3:33:48,  2.11s/it] 10%|█         | 712/6790 [24:42<3:39:53,  2.17s/it]                                                    {'loss': 1.5671, 'learning_rate': 0.0003917972570032037, 'epoch': 0.1}
+ 10%|█         | 712/6790 [24:42<3:39:53,  2.17s/it] 11%|█         | 713/6790 [24:44<3:40:13,  2.17s/it]                                                    {'loss': 1.5934, 'learning_rate': 0.0003917706142658865, 'epoch': 0.11}
+ 11%|█         | 713/6790 [24:44<3:40:13,  2.17s/it] 11%|█         | 714/6790 [24:47<3:35:52,  2.13s/it]                                                    {'loss': 1.7197, 'learning_rate': 0.00039174392923936043, 'epoch': 0.11}
+ 11%|█         | 714/6790 [24:47<3:35:52,  2.13s/it] 11%|█         | 715/6790 [24:49<3:32:01,  2.09s/it]                                                    {'loss': 1.5164, 'learning_rate': 0.00039171720192951, 'epoch': 0.11}
+ 11%|█         | 715/6790 [24:49<3:32:01,  2.09s/it] 11%|█         | 716/6790 [24:51<3:32:35,  2.10s/it]                                                    {'loss': 1.7022, 'learning_rate': 0.00039169043234222906, 'epoch': 0.11}
+ 11%|█         | 716/6790 [24:51<3:32:35,  2.10s/it] 11%|█         | 717/6790 [24:53<3:30:08,  2.08s/it]                                                    {'loss': 1.4995, 'learning_rate': 0.0003916636204834209, 'epoch': 0.11}
+ 11%|█         | 717/6790 [24:53<3:30:08,  2.08s/it] 11%|█         | 718/6790 [24:55<3:23:24,  2.01s/it]                                                    {'loss': 1.3458, 'learning_rate': 0.0003916367663589981, 'epoch': 0.11}
+ 11%|█         | 718/6790 [24:55<3:23:24,  2.01s/it] 11%|█         | 719/6790 [24:57<3:26:20,  2.04s/it]                                                    {'loss': 1.6065, 'learning_rate': 0.0003916098699748824, 'epoch': 0.11}
+ 11%|█         | 719/6790 [24:57<3:26:20,  2.04s/it] 11%|█         | 720/6790 [24:59<3:25:06,  2.03s/it]                                                    {'loss': 1.4139, 'learning_rate': 0.00039158293133700504, 'epoch': 0.11}
+ 11%|█         | 720/6790 [24:59<3:25:06,  2.03s/it] 11%|█         | 721/6790 [25:01<3:22:09,  2.00s/it]                                                    {'loss': 1.6033, 'learning_rate': 0.0003915559504513066, 'epoch': 0.11}
+ 11%|█         | 721/6790 [25:01<3:22:09,  2.00s/it] 11%|█         | 722/6790 [25:03<3:38:43,  2.16s/it]                                                    {'loss': 1.487, 'learning_rate': 0.0003915289273237369, 'epoch': 0.11}
+ 11%|█         | 722/6790 [25:03<3:38:43,  2.16s/it] 11%|█         | 723/6790 [25:05<3:29:48,  2.07s/it]                                                    {'loss': 1.4691, 'learning_rate': 0.00039150186196025495, 'epoch': 0.11}
+ 11%|█         | 723/6790 [25:05<3:29:48,  2.07s/it] 11%|█         | 724/6790 [25:07<3:19:18,  1.97s/it]                                                    {'loss': 1.408, 'learning_rate': 0.0003914747543668293, 'epoch': 0.11}
+ 11%|█         | 724/6790 [25:07<3:19:18,  1.97s/it] 11%|█         | 725/6790 [25:09<3:18:59,  1.97s/it]                                                    {'loss': 1.5066, 'learning_rate': 0.0003914476045494376, 'epoch': 0.11}
+ 11%|█         | 725/6790 [25:09<3:18:59,  1.97s/it] 11%|█         | 726/6790 [25:11<3:20:25,  1.98s/it]                                                    {'loss': 1.6618, 'learning_rate': 0.0003914204125140671, 'epoch': 0.11}
+ 11%|█         | 726/6790 [25:11<3:20:25,  1.98s/it] 11%|█         | 727/6790 [25:13<3:17:01,  1.95s/it]                                                    {'loss': 1.5172, 'learning_rate': 0.000391393178266714, 'epoch': 0.11}
+ 11%|█         | 727/6790 [25:13<3:17:01,  1.95s/it] 11%|█         | 728/6790 [25:15<3:17:07,  1.95s/it]                                                    {'loss': 1.6508, 'learning_rate': 0.0003913659018133841, 'epoch': 0.11}
+ 11%|█         | 728/6790 [25:15<3:17:07,  1.95s/it] 11%|█         | 729/6790 [25:17<3:28:46,  2.07s/it]                                                    {'loss': 1.4165, 'learning_rate': 0.00039133858316009235, 'epoch': 0.11}
+ 11%|█         | 729/6790 [25:17<3:28:46,  2.07s/it] 11%|█         | 730/6790 [25:19<3:24:55,  2.03s/it]                                                    {'loss': 1.6862, 'learning_rate': 0.00039131122231286303, 'epoch': 0.11}
+ 11%|█         | 730/6790 [25:19<3:24:55,  2.03s/it] 11%|█         | 731/6790 [25:21<3:25:21,  2.03s/it]                                                    {'loss': 1.5169, 'learning_rate': 0.00039128381927772983, 'epoch': 0.11}
+ 11%|█         | 731/6790 [25:21<3:25:21,  2.03s/it] 11%|█         | 732/6790 [25:23<3:26:12,  2.04s/it]                                                    {'loss': 1.7404, 'learning_rate': 0.00039125637406073555, 'epoch': 0.11}
+ 11%|█         | 732/6790 [25:23<3:26:12,  2.04s/it] 11%|█         | 733/6790 [25:25<3:26:56,  2.05s/it]                                                    {'loss': 1.6038, 'learning_rate': 0.0003912288866679325, 'epoch': 0.11}
+ 11%|█         | 733/6790 [25:25<3:26:56,  2.05s/it] 11%|█         | 734/6790 [25:27<3:18:50,  1.97s/it]                                                    {'loss': 1.5247, 'learning_rate': 0.0003912013571053822, 'epoch': 0.11}
+ 11%|█         | 734/6790 [25:27<3:18:50,  1.97s/it] 11%|█         | 735/6790 [25:29<3:23:51,  2.02s/it]                                                    {'loss': 1.5959, 'learning_rate': 0.00039117378537915535, 'epoch': 0.11}
+ 11%|█         | 735/6790 [25:29<3:23:51,  2.02s/it] 11%|█         | 736/6790 [25:31<3:20:42,  1.99s/it]                                                    {'loss': 1.3927, 'learning_rate': 0.0003911461714953322, 'epoch': 0.11}
+ 11%|█         | 736/6790 [25:31<3:20:42,  1.99s/it] 11%|█         | 737/6790 [25:33<3:18:54,  1.97s/it]                                                    {'loss': 1.6331, 'learning_rate': 0.0003911185154600021, 'epoch': 0.11}
+ 11%|█         | 737/6790 [25:33<3:18:54,  1.97s/it] 11%|█         | 738/6790 [25:35<3:12:55,  1.91s/it]                                                    {'loss': 1.347, 'learning_rate': 0.00039109081727926366, 'epoch': 0.11}
+ 11%|█         | 738/6790 [25:35<3:12:55,  1.91s/it] 11%|█         | 739/6790 [25:36<3:10:15,  1.89s/it]                                                    {'loss': 1.5514, 'learning_rate': 0.00039106307695922494, 'epoch': 0.11}
+ 11%|█         | 739/6790 [25:36<3:10:15,  1.89s/it] 11%|█         | 740/6790 [25:39<3:20:00,  1.98s/it]                                                    {'loss': 1.6877, 'learning_rate': 0.0003910352945060033, 'epoch': 0.11}
+ 11%|█         | 740/6790 [25:39<3:20:00,  1.98s/it] 11%|█         | 741/6790 [25:41<3:23:01,  2.01s/it]                                                    {'loss': 1.6682, 'learning_rate': 0.00039100746992572525, 'epoch': 0.11}
+ 11%|█         | 741/6790 [25:41<3:23:01,  2.01s/it] 11%|█         | 742/6790 [25:42<3:15:48,  1.94s/it]                                                    {'loss': 1.6385, 'learning_rate': 0.0003909796032245267, 'epoch': 0.11}
+ 11%|█         | 742/6790 [25:42<3:15:48,  1.94s/it] 11%|█         | 743/6790 [25:44<3:17:37,  1.96s/it]                                                    {'loss': 1.4982, 'learning_rate': 0.00039095169440855275, 'epoch': 0.11}
+ 11%|█         | 743/6790 [25:44<3:17:37,  1.96s/it] 11%|█         | 744/6790 [25:46<3:20:32,  1.99s/it]                                                    {'loss': 1.5717, 'learning_rate': 0.0003909237434839579, 'epoch': 0.11}
+ 11%|█         | 744/6790 [25:46<3:20:32,  1.99s/it] 11%|█         | 745/6790 [25:48<3:17:46,  1.96s/it]                                                    {'loss': 1.7718, 'learning_rate': 0.0003908957504569058, 'epoch': 0.11}
+ 11%|█         | 745/6790 [25:48<3:17:46,  1.96s/it] 11%|█         | 746/6790 [25:50<3:18:49,  1.97s/it]                                                    {'loss': 1.5193, 'learning_rate': 0.0003908677153335696, 'epoch': 0.11}
+ 11%|█         | 746/6790 [25:50<3:18:49,  1.97s/it] 11%|█         | 747/6790 [25:52<3:20:58,  2.00s/it]                                                    {'loss': 1.4813, 'learning_rate': 0.00039083963812013147, 'epoch': 0.11}
+ 11%|█         | 747/6790 [25:52<3:20:58,  2.00s/it] 11%|█         | 748/6790 [25:54<3:20:57,  2.00s/it]                                                    {'loss': 1.522, 'learning_rate': 0.0003908115188227831, 'epoch': 0.11}
+ 11%|█         | 748/6790 [25:54<3:20:57,  2.00s/it] 11%|█         | 749/6790 [25:56<3:19:26,  1.98s/it]                                                    {'loss': 1.4607, 'learning_rate': 0.00039078335744772524, 'epoch': 0.11}
+ 11%|█         | 749/6790 [25:56<3:19:26,  1.98s/it] 11%|█         | 750/6790 [25:58<3:17:50,  1.97s/it]                                                    {'loss': 1.5857, 'learning_rate': 0.00039075515400116805, 'epoch': 0.11}
+ 11%|█         | 750/6790 [25:58<3:17:50,  1.97s/it] 11%|█         | 751/6790 [26:00<3:17:01,  1.96s/it]                                                    {'loss': 1.5042, 'learning_rate': 0.00039072690848933106, 'epoch': 0.11}
+ 11%|█         | 751/6790 [26:00<3:17:01,  1.96s/it] 11%|█         | 752/6790 [26:02<3:20:36,  1.99s/it]                                                    {'loss': 1.3573, 'learning_rate': 0.00039069862091844283, 'epoch': 0.11}
+ 11%|█         | 752/6790 [26:02<3:20:36,  1.99s/it] 11%|█         | 753/6790 [26:04<3:25:07,  2.04s/it]                                                    {'loss': 1.5034, 'learning_rate': 0.0003906702912947414, 'epoch': 0.11}
+ 11%|█         | 753/6790 [26:04<3:25:07,  2.04s/it] 11%|█         | 754/6790 [26:06<3:22:02,  2.01s/it]                                                    {'loss': 1.4025, 'learning_rate': 0.000390641919624474, 'epoch': 0.11}
+ 11%|█         | 754/6790 [26:06<3:22:02,  2.01s/it] 11%|█         | 755/6790 [26:08<3:24:01,  2.03s/it]                                                    {'loss': 1.5555, 'learning_rate': 0.00039061350591389714, 'epoch': 0.11}
+ 11%|█         | 755/6790 [26:08<3:24:01,  2.03s/it] 11%|█         | 756/6790 [26:11<3:33:48,  2.13s/it]                                                    {'loss': 1.4453, 'learning_rate': 0.0003905850501692766, 'epoch': 0.11}
+ 11%|█         | 756/6790 [26:11<3:33:48,  2.13s/it] 11%|█         | 757/6790 [26:13<3:24:27,  2.03s/it]                                                    {'loss': 1.5924, 'learning_rate': 0.0003905565523968874, 'epoch': 0.11}
+ 11%|█         | 757/6790 [26:13<3:24:27,  2.03s/it] 11%|█         | 758/6790 [26:15<3:27:39,  2.07s/it]                                                    {'loss': 1.5903, 'learning_rate': 0.00039052801260301397, 'epoch': 0.11}
+ 11%|█         | 758/6790 [26:15<3:27:39,  2.07s/it] 11%|█         | 759/6790 [26:17<3:32:15,  2.11s/it]                                                    {'loss': 1.7131, 'learning_rate': 0.00039049943079394976, 'epoch': 0.11}
+ 11%|█         | 759/6790 [26:17<3:32:15,  2.11s/it] 11%|█         | 760/6790 [26:19<3:26:24,  2.05s/it]                                                    {'loss': 1.3069, 'learning_rate': 0.0003904708069759977, 'epoch': 0.11}
+ 11%|█         | 760/6790 [26:19<3:26:24,  2.05s/it] 11%|█         | 761/6790 [26:21<3:33:47,  2.13s/it]                                                    {'loss': 1.4272, 'learning_rate': 0.0003904421411554699, 'epoch': 0.11}
+ 11%|█         | 761/6790 [26:21<3:33:47,  2.13s/it] 11%|█         | 762/6790 [26:23<3:22:41,  2.02s/it]                                                    {'loss': 1.6243, 'learning_rate': 0.00039041343333868773, 'epoch': 0.11}
+ 11%|█         | 762/6790 [26:23<3:22:41,  2.02s/it] 11%|█         | 763/6790 [26:26<3:38:32,  2.18s/it]                                                    {'loss': 1.5816, 'learning_rate': 0.00039038468353198185, 'epoch': 0.11}
+ 11%|█         | 763/6790 [26:26<3:38:32,  2.18s/it] 11%|█▏        | 764/6790 [26:28<3:44:04,  2.23s/it]                                                    {'loss': 1.6701, 'learning_rate': 0.00039035589174169215, 'epoch': 0.11}
+ 11%|█▏        | 764/6790 [26:28<3:44:04,  2.23s/it] 11%|█▏        | 765/6790 [26:30<3:40:00,  2.19s/it]                                                    {'loss': 1.8287, 'learning_rate': 0.0003903270579741678, 'epoch': 0.11}
+ 11%|█▏        | 765/6790 [26:30<3:40:00,  2.19s/it] 11%|█▏        | 766/6790 [26:32<3:35:03,  2.14s/it]                                                    {'loss': 1.6725, 'learning_rate': 0.00039029818223576714, 'epoch': 0.11}
+ 11%|█▏        | 766/6790 [26:32<3:35:03,  2.14s/it] 11%|█▏        | 767/6790 [26:34<3:33:40,  2.13s/it]                                                    {'loss': 1.4517, 'learning_rate': 0.0003902692645328579, 'epoch': 0.11}
+ 11%|█▏        | 767/6790 [26:34<3:33:40,  2.13s/it] 11%|█▏        | 768/6790 [26:36<3:23:12,  2.02s/it]                                                    {'loss': 1.5178, 'learning_rate': 0.00039024030487181706, 'epoch': 0.11}
+ 11%|█▏        | 768/6790 [26:36<3:23:12,  2.02s/it] 11%|█▏        | 769/6790 [26:38<3:25:20,  2.05s/it]                                                    {'loss': 1.4759, 'learning_rate': 0.00039021130325903074, 'epoch': 0.11}
+ 11%|█▏        | 769/6790 [26:38<3:25:20,  2.05s/it] 11%|█▏        | 770/6790 [26:40<3:29:22,  2.09s/it]                                                    {'loss': 1.6269, 'learning_rate': 0.00039018225970089435, 'epoch': 0.11}
+ 11%|█▏        | 770/6790 [26:40<3:29:22,  2.09s/it] 11%|█▏        | 771/6790 [26:42<3:23:07,  2.02s/it]                                                    {'loss': 1.524, 'learning_rate': 0.00039015317420381263, 'epoch': 0.11}
+ 11%|█▏        | 771/6790 [26:42<3:23:07,  2.02s/it] 11%|█▏        | 772/6790 [26:45<3:42:10,  2.22s/it]                                                    {'loss': 1.4536, 'learning_rate': 0.0003901240467741994, 'epoch': 0.11}
+ 11%|█▏        | 772/6790 [26:45<3:42:10,  2.22s/it] 11%|█▏        | 773/6790 [26:47<3:50:25,  2.30s/it]                                                    {'loss': 1.6024, 'learning_rate': 0.00039009487741847794, 'epoch': 0.11}
+ 11%|█▏        | 773/6790 [26:47<3:50:25,  2.30s/it] 11%|█▏        | 774/6790 [26:50<3:57:48,  2.37s/it]                                                    {'loss': 1.4983, 'learning_rate': 0.0003900656661430806, 'epoch': 0.11}
+ 11%|█▏        | 774/6790 [26:50<3:57:48,  2.37s/it] 11%|█▏        | 775/6790 [26:52<3:46:36,  2.26s/it]                                                    {'loss': 1.4915, 'learning_rate': 0.00039003641295444914, 'epoch': 0.11}
+ 11%|█▏        | 775/6790 [26:52<3:46:36,  2.26s/it] 11%|█▏        | 776/6790 [26:54<3:46:38,  2.26s/it]                                                    {'loss': 1.429, 'learning_rate': 0.0003900071178590343, 'epoch': 0.11}
+ 11%|█▏        | 776/6790 [26:54<3:46:38,  2.26s/it] 11%|█▏        | 777/6790 [26:56<3:52:41,  2.32s/it]                                                    {'loss': 1.5219, 'learning_rate': 0.00038997778086329645, 'epoch': 0.11}
+ 11%|█▏        | 777/6790 [26:56<3:52:41,  2.32s/it] 11%|█▏        | 778/6790 [26:59<3:46:19,  2.26s/it]                                                    {'loss': 1.5938, 'learning_rate': 0.0003899484019737048, 'epoch': 0.11}
+ 11%|█▏        | 778/6790 [26:59<3:46:19,  2.26s/it] 11%|█▏        | 779/6790 [27:00<3:33:19,  2.13s/it]                                                    {'loss': 1.5891, 'learning_rate': 0.00038991898119673796, 'epoch': 0.11}
+ 11%|█▏        | 779/6790 [27:00<3:33:19,  2.13s/it] 11%|█▏        | 780/6790 [27:02<3:27:52,  2.08s/it]                                                    {'loss': 1.4167, 'learning_rate': 0.0003898895185388839, 'epoch': 0.11}
+ 11%|█▏        | 780/6790 [27:02<3:27:52,  2.08s/it] 12%|█▏        | 781/6790 [27:04<3:27:03,  2.07s/it]                                                    {'loss': 1.3507, 'learning_rate': 0.0003898600140066397, 'epoch': 0.12}
+ 12%|█▏        | 781/6790 [27:04<3:27:03,  2.07s/it] 12%|█▏        | 782/6790 [27:06<3:22:27,  2.02s/it]                                                    {'loss': 1.6376, 'learning_rate': 0.00038983046760651175, 'epoch': 0.12}
+ 12%|█▏        | 782/6790 [27:06<3:22:27,  2.02s/it] 12%|█▏        | 783/6790 [27:08<3:15:40,  1.95s/it]                                                    {'loss': 1.4203, 'learning_rate': 0.0003898008793450154, 'epoch': 0.12}
+ 12%|█▏        | 783/6790 [27:08<3:15:40,  1.95s/it] 12%|█▏        | 784/6790 [27:10<3:12:26,  1.92s/it]                                                    {'loss': 1.3416, 'learning_rate': 0.0003897712492286757, 'epoch': 0.12}
+ 12%|█▏        | 784/6790 [27:10<3:12:26,  1.92s/it] 12%|█▏        | 785/6790 [27:12<3:09:34,  1.89s/it]                                                    {'loss': 1.3448, 'learning_rate': 0.00038974157726402644, 'epoch': 0.12}
+ 12%|█▏        | 785/6790 [27:12<3:09:34,  1.89s/it] 12%|█▏        | 786/6790 [27:14<3:09:09,  1.89s/it]                                                    {'loss': 1.2945, 'learning_rate': 0.00038971186345761107, 'epoch': 0.12}
+ 12%|█▏        | 786/6790 [27:14<3:09:09,  1.89s/it] 12%|█▏        | 787/6790 [27:16<3:08:47,  1.89s/it]                                                    {'loss': 1.4655, 'learning_rate': 0.00038968210781598197, 'epoch': 0.12}
+ 12%|█▏        | 787/6790 [27:16<3:08:47,  1.89s/it] 12%|█▏        | 788/6790 [27:17<3:07:34,  1.88s/it]                                                    {'loss': 1.4959, 'learning_rate': 0.00038965231034570084, 'epoch': 0.12}
+ 12%|█▏        | 788/6790 [27:17<3:07:34,  1.88s/it] 12%|█▏        | 789/6790 [27:19<3:05:02,  1.85s/it]                                                    {'loss': 1.5594, 'learning_rate': 0.0003896224710533387, 'epoch': 0.12}
+ 12%|█▏        | 789/6790 [27:19<3:05:02,  1.85s/it] 12%|█▏        | 790/6790 [27:21<3:07:06,  1.87s/it]                                                    {'loss': 1.5035, 'learning_rate': 0.00038959258994547563, 'epoch': 0.12}
+ 12%|█▏        | 790/6790 [27:21<3:07:06,  1.87s/it] 12%|█▏        | 791/6790 [27:23<3:08:02,  1.88s/it]                                                    {'loss': 1.5386, 'learning_rate': 0.000389562667028701, 'epoch': 0.12}
+ 12%|█▏        | 791/6790 [27:23<3:08:02,  1.88s/it] 12%|█▏        | 792/6790 [27:25<3:18:39,  1.99s/it]                                                    {'loss': 1.663, 'learning_rate': 0.0003895327023096135, 'epoch': 0.12}
+ 12%|█▏        | 792/6790 [27:25<3:18:39,  1.99s/it] 12%|█▏        | 793/6790 [27:27<3:22:44,  2.03s/it]                                                    {'loss': 1.5536, 'learning_rate': 0.00038950269579482075, 'epoch': 0.12}
+ 12%|█▏        | 793/6790 [27:27<3:22:44,  2.03s/it] 12%|█▏        | 794/6790 [27:29<3:20:21,  2.00s/it]                                                    {'loss': 1.5191, 'learning_rate': 0.00038947264749094, 'epoch': 0.12}
+ 12%|█▏        | 794/6790 [27:29<3:20:21,  2.00s/it] 12%|█▏        | 795/6790 [27:32<3:28:12,  2.08s/it]                                                    {'loss': 1.5997, 'learning_rate': 0.00038944255740459735, 'epoch': 0.12}
+ 12%|█▏        | 795/6790 [27:32<3:28:12,  2.08s/it] 12%|█▏        | 796/6790 [27:34<3:27:18,  2.08s/it]                                                    {'loss': 1.5596, 'learning_rate': 0.0003894124255424283, 'epoch': 0.12}
+ 12%|█▏        | 796/6790 [27:34<3:27:18,  2.08s/it] 12%|█▏        | 797/6790 [27:36<3:24:09,  2.04s/it]                                                    {'loss': 1.5056, 'learning_rate': 0.0003893822519110775, 'epoch': 0.12}
+ 12%|█▏        | 797/6790 [27:36<3:24:09,  2.04s/it] 12%|█▏        | 798/6790 [27:38<3:28:05,  2.08s/it]                                                    {'loss': 1.5979, 'learning_rate': 0.0003893520365171989, 'epoch': 0.12}
+ 12%|█▏        | 798/6790 [27:38<3:28:05,  2.08s/it] 12%|█▏        | 799/6790 [27:40<3:22:33,  2.03s/it]                                                    {'loss': 1.5391, 'learning_rate': 0.0003893217793674555, 'epoch': 0.12}
+ 12%|█▏        | 799/6790 [27:40<3:22:33,  2.03s/it] 12%|█▏        | 800/6790 [27:42<3:28:03,  2.08s/it]                                                    {'loss': 1.4412, 'learning_rate': 0.0003892914804685197, 'epoch': 0.12}
+ 12%|█▏        | 800/6790 [27:42<3:28:03,  2.08s/it] 12%|█▏        | 801/6790 [27:44<3:25:34,  2.06s/it]                                                    {'loss': 1.4203, 'learning_rate': 0.00038926113982707284, 'epoch': 0.12}
+ 12%|█▏        | 801/6790 [27:44<3:25:34,  2.06s/it] 12%|█▏        | 802/6790 [27:46<3:20:49,  2.01s/it]                                                    {'loss': 1.6794, 'learning_rate': 0.00038923075744980585, 'epoch': 0.12}
+ 12%|█▏        | 802/6790 [27:46<3:20:49,  2.01s/it] 12%|█▏        | 803/6790 [27:48<3:16:59,  1.97s/it]                                                    {'loss': 1.4631, 'learning_rate': 0.0003892003333434185, 'epoch': 0.12}
+ 12%|█▏        | 803/6790 [27:48<3:16:59,  1.97s/it] 12%|█▏        | 804/6790 [27:50<3:24:30,  2.05s/it]                                                    {'loss': 1.7884, 'learning_rate': 0.0003891698675146199, 'epoch': 0.12}
+ 12%|█▏        | 804/6790 [27:50<3:24:30,  2.05s/it] 12%|█▏        | 805/6790 [27:53<3:43:28,  2.24s/it]                                                    {'loss': 1.6744, 'learning_rate': 0.0003891393599701284, 'epoch': 0.12}
+ 12%|█▏        | 805/6790 [27:53<3:43:28,  2.24s/it] 12%|█▏        | 806/6790 [27:55<3:48:39,  2.29s/it]                                                    {'loss': 1.6197, 'learning_rate': 0.0003891088107166716, 'epoch': 0.12}
+ 12%|█▏        | 806/6790 [27:55<3:48:39,  2.29s/it] 12%|█▏        | 807/6790 [27:58<3:57:57,  2.39s/it]                                                    {'loss': 1.604, 'learning_rate': 0.0003890782197609861, 'epoch': 0.12}
+ 12%|█▏        | 807/6790 [27:58<3:57:57,  2.39s/it] 12%|█▏        | 808/6790 [28:00<4:01:36,  2.42s/it]                                                    {'loss': 1.6152, 'learning_rate': 0.0003890475871098178, 'epoch': 0.12}
+ 12%|█▏        | 808/6790 [28:00<4:01:36,  2.42s/it] 12%|█▏        | 809/6790 [28:02<3:52:25,  2.33s/it]                                                    {'loss': 1.4371, 'learning_rate': 0.00038901691276992193, 'epoch': 0.12}
+ 12%|█▏        | 809/6790 [28:02<3:52:25,  2.33s/it] 12%|█▏        | 810/6790 [28:04<3:38:58,  2.20s/it]                                                    {'loss': 1.5547, 'learning_rate': 0.00038898619674806274, 'epoch': 0.12}
+ 12%|█▏        | 810/6790 [28:04<3:38:58,  2.20s/it] 12%|█▏        | 811/6790 [28:06<3:26:59,  2.08s/it]                                                    {'loss': 1.5128, 'learning_rate': 0.0003889554390510136, 'epoch': 0.12}
+ 12%|█▏        | 811/6790 [28:06<3:26:59,  2.08s/it] 12%|█▏        | 812/6790 [28:08<3:18:13,  1.99s/it]                                                    {'loss': 1.6002, 'learning_rate': 0.00038892463968555726, 'epoch': 0.12}
+ 12%|█▏        | 812/6790 [28:08<3:18:13,  1.99s/it] 12%|█▏        | 813/6790 [28:10<3:13:00,  1.94s/it]                                                    {'loss': 1.6069, 'learning_rate': 0.0003888937986584857, 'epoch': 0.12}
+ 12%|█▏        | 813/6790 [28:10<3:13:00,  1.94s/it] 12%|█▏        | 814/6790 [28:11<3:13:24,  1.94s/it]                                                    {'loss': 1.6332, 'learning_rate': 0.0003888629159765998, 'epoch': 0.12}
+ 12%|█▏        | 814/6790 [28:11<3:13:24,  1.94s/it] 12%|█▏        | 815/6790 [28:14<3:32:45,  2.14s/it]                                                    {'loss': 1.434, 'learning_rate': 0.00038883199164670997, 'epoch': 0.12}
+ 12%|█▏        | 815/6790 [28:14<3:32:45,  2.14s/it] 12%|█▏        | 816/6790 [28:16<3:29:43,  2.11s/it]                                                    {'loss': 1.3753, 'learning_rate': 0.0003888010256756355, 'epoch': 0.12}
+ 12%|█▏        | 816/6790 [28:16<3:29:43,  2.11s/it] 12%|█▏        | 817/6790 [28:18<3:20:59,  2.02s/it]                                                    {'loss': 1.3606, 'learning_rate': 0.00038877001807020503, 'epoch': 0.12}
+ 12%|█▏        | 817/6790 [28:18<3:20:59,  2.02s/it] 12%|█▏        | 818/6790 [28:20<3:20:45,  2.02s/it]                                                    {'loss': 1.4982, 'learning_rate': 0.0003887389688372564, 'epoch': 0.12}
+ 12%|█▏        | 818/6790 [28:20<3:20:45,  2.02s/it] 12%|█▏        | 819/6790 [28:22<3:25:06,  2.06s/it]                                                    {'loss': 1.6248, 'learning_rate': 0.00038870787798363655, 'epoch': 0.12}
+ 12%|█▏        | 819/6790 [28:22<3:25:06,  2.06s/it] 12%|█▏        | 820/6790 [28:24<3:18:26,  1.99s/it]                                                    {'loss': 1.5323, 'learning_rate': 0.00038867674551620163, 'epoch': 0.12}
+ 12%|█▏        | 820/6790 [28:24<3:18:26,  1.99s/it] 12%|█▏        | 821/6790 [28:26<3:14:49,  1.96s/it]                                                    {'loss': 1.5982, 'learning_rate': 0.00038864557144181695, 'epoch': 0.12}
+ 12%|█▏        | 821/6790 [28:26<3:14:49,  1.96s/it] 12%|█▏        | 822/6790 [28:28<3:21:10,  2.02s/it]                                                    {'loss': 1.4366, 'learning_rate': 0.00038861435576735705, 'epoch': 0.12}
+ 12%|█▏        | 822/6790 [28:28<3:21:10,  2.02s/it] 12%|█▏        | 823/6790 [28:30<3:19:21,  2.00s/it]                                                    {'loss': 1.6845, 'learning_rate': 0.00038858309849970553, 'epoch': 0.12}
+ 12%|█▏        | 823/6790 [28:30<3:19:21,  2.00s/it] 12%|█▏        | 824/6790 [28:32<3:32:46,  2.14s/it]                                                    {'loss': 1.7337, 'learning_rate': 0.00038855179964575527, 'epoch': 0.12}
+ 12%|█▏        | 824/6790 [28:32<3:32:46,  2.14s/it] 12%|█▏        | 825/6790 [28:35<3:36:19,  2.18s/it]                                                    {'loss': 1.5676, 'learning_rate': 0.00038852045921240833, 'epoch': 0.12}
+ 12%|█▏        | 825/6790 [28:35<3:36:19,  2.18s/it] 12%|█▏        | 826/6790 [28:37<3:33:09,  2.14s/it]                                                    {'loss': 1.6004, 'learning_rate': 0.0003884890772065759, 'epoch': 0.12}
+ 12%|█▏        | 826/6790 [28:37<3:33:09,  2.14s/it] 12%|█▏        | 827/6790 [28:39<3:30:39,  2.12s/it]                                                    {'loss': 1.5673, 'learning_rate': 0.00038845765363517814, 'epoch': 0.12}
+ 12%|█▏        | 827/6790 [28:39<3:30:39,  2.12s/it] 12%|█▏        | 828/6790 [28:41<3:29:41,  2.11s/it]                                                    {'loss': 1.6041, 'learning_rate': 0.00038842618850514485, 'epoch': 0.12}
+ 12%|█▏        | 828/6790 [28:41<3:29:41,  2.11s/it] 12%|█▏        | 829/6790 [28:43<3:22:59,  2.04s/it]                                                    {'loss': 1.5175, 'learning_rate': 0.0003883946818234145, 'epoch': 0.12}
+ 12%|█▏        | 829/6790 [28:43<3:22:59,  2.04s/it] 12%|█▏        | 830/6790 [28:44<3:12:45,  1.94s/it]                                                    {'loss': 1.3728, 'learning_rate': 0.0003883631335969351, 'epoch': 0.12}
+ 12%|█▏        | 830/6790 [28:44<3:12:45,  1.94s/it] 12%|█▏        | 831/6790 [28:46<3:14:03,  1.95s/it]                                                    {'loss': 1.6565, 'learning_rate': 0.0003883315438326635, 'epoch': 0.12}
+ 12%|█▏        | 831/6790 [28:46<3:14:03,  1.95s/it] 12%|█▏        | 832/6790 [28:49<3:24:19,  2.06s/it]                                                    {'loss': 1.4714, 'learning_rate': 0.00038829991253756595, 'epoch': 0.12}
+ 12%|█▏        | 832/6790 [28:49<3:24:19,  2.06s/it] 12%|█▏        | 833/6790 [28:51<3:29:39,  2.11s/it]                                                    {'loss': 1.5541, 'learning_rate': 0.0003882682397186178, 'epoch': 0.12}
+ 12%|█▏        | 833/6790 [28:51<3:29:39,  2.11s/it] 12%|█▏        | 834/6790 [28:53<3:28:51,  2.10s/it]                                                    {'loss': 1.6213, 'learning_rate': 0.0003882365253828035, 'epoch': 0.12}
+ 12%|█▏        | 834/6790 [28:53<3:28:51,  2.10s/it] 12%|█▏        | 835/6790 [28:55<3:26:53,  2.08s/it]                                                    {'loss': 1.7237, 'learning_rate': 0.0003882047695371166, 'epoch': 0.12}
+ 12%|█▏        | 835/6790 [28:55<3:26:53,  2.08s/it] 12%|█▏        | 836/6790 [28:57<3:34:03,  2.16s/it]                                                    {'loss': 1.7124, 'learning_rate': 0.00038817297218856007, 'epoch': 0.12}
+ 12%|█▏        | 836/6790 [28:57<3:34:03,  2.16s/it] 12%|█▏        | 837/6790 [29:00<3:32:10,  2.14s/it]                                                    {'loss': 1.3732, 'learning_rate': 0.0003881411333441458, 'epoch': 0.12}
+ 12%|█▏        | 837/6790 [29:00<3:32:10,  2.14s/it] 12%|█▏        | 838/6790 [29:02<3:30:48,  2.13s/it]                                                    {'loss': 1.5546, 'learning_rate': 0.0003881092530108947, 'epoch': 0.12}
+ 12%|█▏        | 838/6790 [29:02<3:30:48,  2.13s/it] 12%|█▏        | 839/6790 [29:04<3:28:51,  2.11s/it]                                                    {'loss': 1.4159, 'learning_rate': 0.00038807733119583727, 'epoch': 0.12}
+ 12%|█▏        | 839/6790 [29:04<3:28:51,  2.11s/it] 12%|█▏        | 840/6790 [29:06<3:31:17,  2.13s/it]                                                    {'loss': 1.3383, 'learning_rate': 0.00038804536790601273, 'epoch': 0.12}
+ 12%|█▏        | 840/6790 [29:06<3:31:17,  2.13s/it] 12%|█▏        | 841/6790 [29:08<3:24:43,  2.06s/it]                                                    {'loss': 1.4674, 'learning_rate': 0.0003880133631484697, 'epoch': 0.12}
+ 12%|█▏        | 841/6790 [29:08<3:24:43,  2.06s/it] 12%|█▏        | 842/6790 [29:10<3:35:52,  2.18s/it]                                                    {'loss': 1.4851, 'learning_rate': 0.00038798131693026586, 'epoch': 0.12}
+ 12%|█▏        | 842/6790 [29:10<3:35:52,  2.18s/it] 12%|█▏        | 843/6790 [29:12<3:27:37,  2.09s/it]                                                    {'loss': 1.4487, 'learning_rate': 0.000387949229258468, 'epoch': 0.12}
+ 12%|█▏        | 843/6790 [29:12<3:27:37,  2.09s/it] 12%|█▏        | 844/6790 [29:14<3:26:25,  2.08s/it]                                                    {'loss': 1.5378, 'learning_rate': 0.00038791710014015213, 'epoch': 0.12}
+ 12%|█▏        | 844/6790 [29:14<3:26:25,  2.08s/it] 12%|█▏        | 845/6790 [29:16<3:16:52,  1.99s/it]                                                    {'loss': 1.5824, 'learning_rate': 0.00038788492958240326, 'epoch': 0.12}
+ 12%|█▏        | 845/6790 [29:16<3:16:52,  1.99s/it] 12%|█▏        | 846/6790 [29:18<3:25:46,  2.08s/it]                                                    {'loss': 1.7137, 'learning_rate': 0.0003878527175923157, 'epoch': 0.12}
+ 12%|█▏        | 846/6790 [29:18<3:25:46,  2.08s/it] 12%|█▏        | 847/6790 [29:20<3:22:29,  2.04s/it]                                                    {'loss': 1.5453, 'learning_rate': 0.0003878204641769929, 'epoch': 0.12}
+ 12%|█▏        | 847/6790 [29:20<3:22:29,  2.04s/it] 12%|█▏        | 848/6790 [29:23<3:45:03,  2.27s/it]                                                    {'loss': 1.3204, 'learning_rate': 0.00038778816934354724, 'epoch': 0.12}
+ 12%|█▏        | 848/6790 [29:23<3:45:03,  2.27s/it] 13%|█▎        | 849/6790 [29:26<4:05:00,  2.47s/it]                                                    {'loss': 1.6232, 'learning_rate': 0.00038775583309910044, 'epoch': 0.13}
+ 13%|█▎        | 849/6790 [29:26<4:05:00,  2.47s/it] 13%|█▎        | 850/6790 [29:28<3:52:03,  2.34s/it]                                                    {'loss': 1.5974, 'learning_rate': 0.00038772345545078324, 'epoch': 0.13}
+ 13%|█▎        | 850/6790 [29:28<3:52:03,  2.34s/it] 13%|█▎        | 851/6790 [29:30<3:53:49,  2.36s/it]                                                    {'loss': 1.5142, 'learning_rate': 0.0003876910364057356, 'epoch': 0.13}
+ 13%|█▎        | 851/6790 [29:30<3:53:49,  2.36s/it] 13%|█▎        | 852/6790 [29:32<3:41:39,  2.24s/it]                                                    {'loss': 1.5733, 'learning_rate': 0.00038765857597110656, 'epoch': 0.13}
+ 13%|█▎        | 852/6790 [29:32<3:41:39,  2.24s/it] 13%|█▎        | 853/6790 [29:35<3:40:08,  2.22s/it]                                                    {'loss': 1.5103, 'learning_rate': 0.0003876260741540543, 'epoch': 0.13}
+ 13%|█▎        | 853/6790 [29:35<3:40:08,  2.22s/it] 13%|█▎        | 854/6790 [29:37<3:35:09,  2.17s/it]                                                    {'loss': 1.7963, 'learning_rate': 0.000387593530961746, 'epoch': 0.13}
+ 13%|█▎        | 854/6790 [29:37<3:35:09,  2.17s/it] 13%|█▎        | 855/6790 [29:39<3:53:02,  2.36s/it]                                                    {'loss': 1.5783, 'learning_rate': 0.0003875609464013582, 'epoch': 0.13}
+ 13%|█▎        | 855/6790 [29:39<3:53:02,  2.36s/it] 13%|█▎        | 856/6790 [29:41<3:42:33,  2.25s/it]                                                    {'loss': 1.6528, 'learning_rate': 0.0003875283204800764, 'epoch': 0.13}
+ 13%|█▎        | 856/6790 [29:41<3:42:33,  2.25s/it] 13%|█▎        | 857/6790 [29:43<3:31:02,  2.13s/it]                                                    {'loss': 1.4332, 'learning_rate': 0.0003874956532050953, 'epoch': 0.13}
+ 13%|█▎        | 857/6790 [29:43<3:31:02,  2.13s/it] 13%|█▎        | 858/6790 [29:45<3:21:20,  2.04s/it]                                                    {'loss': 1.4903, 'learning_rate': 0.00038746294458361856, 'epoch': 0.13}
+ 13%|█▎        | 858/6790 [29:45<3:21:20,  2.04s/it] 13%|█▎        | 859/6790 [29:48<3:41:34,  2.24s/it]                                                    {'loss': 1.4795, 'learning_rate': 0.0003874301946228592, 'epoch': 0.13}
+ 13%|█▎        | 859/6790 [29:48<3:41:34,  2.24s/it] 13%|█▎        | 860/6790 [29:50<3:33:31,  2.16s/it]                                                    {'loss': 1.5938, 'learning_rate': 0.00038739740333003917, 'epoch': 0.13}
+ 13%|█▎        | 860/6790 [29:50<3:33:31,  2.16s/it] 13%|█▎        | 861/6790 [29:52<3:23:15,  2.06s/it]                                                    {'loss': 1.4803, 'learning_rate': 0.00038736457071238963, 'epoch': 0.13}
+ 13%|█▎        | 861/6790 [29:52<3:23:15,  2.06s/it] 13%|█▎        | 862/6790 [29:54<3:27:47,  2.10s/it]                                                    {'loss': 1.5879, 'learning_rate': 0.00038733169677715077, 'epoch': 0.13}
+ 13%|█▎        | 862/6790 [29:54<3:27:47,  2.10s/it] 13%|█▎        | 863/6790 [29:56<3:34:57,  2.18s/it]                                                    {'loss': 1.5241, 'learning_rate': 0.000387298781531572, 'epoch': 0.13}
+ 13%|█▎        | 863/6790 [29:56<3:34:57,  2.18s/it] 13%|█▎        | 864/6790 [29:58<3:34:48,  2.17s/it]                                                    {'loss': 1.548, 'learning_rate': 0.0003872658249829118, 'epoch': 0.13}
+ 13%|█▎        | 864/6790 [29:58<3:34:48,  2.17s/it] 13%|█▎        | 865/6790 [30:00<3:28:20,  2.11s/it]                                                    {'loss': 1.4887, 'learning_rate': 0.00038723282713843765, 'epoch': 0.13}
+ 13%|█▎        | 865/6790 [30:00<3:28:20,  2.11s/it] 13%|█▎        | 866/6790 [30:02<3:29:15,  2.12s/it]                                                    {'loss': 1.5601, 'learning_rate': 0.0003871997880054263, 'epoch': 0.13}
+ 13%|█▎        | 866/6790 [30:02<3:29:15,  2.12s/it] 13%|█▎        | 867/6790 [30:04<3:20:29,  2.03s/it]                                                    {'loss': 1.3767, 'learning_rate': 0.0003871667075911635, 'epoch': 0.13}
+ 13%|█▎        | 867/6790 [30:04<3:20:29,  2.03s/it] 13%|█▎        | 868/6790 [30:06<3:25:23,  2.08s/it]                                                    {'loss': 1.5917, 'learning_rate': 0.00038713358590294417, 'epoch': 0.13}
+ 13%|█▎        | 868/6790 [30:06<3:25:23,  2.08s/it] 13%|█▎        | 869/6790 [30:08<3:22:37,  2.05s/it]                                                    {'loss': 1.5008, 'learning_rate': 0.0003871004229480722, 'epoch': 0.13}
+ 13%|█▎        | 869/6790 [30:08<3:22:37,  2.05s/it] 13%|█▎        | 870/6790 [30:10<3:17:14,  2.00s/it]                                                    {'loss': 1.5287, 'learning_rate': 0.00038706721873386083, 'epoch': 0.13}
+ 13%|█▎        | 870/6790 [30:10<3:17:14,  2.00s/it] 13%|█▎        | 871/6790 [30:12<3:23:33,  2.06s/it]                                                    {'loss': 1.4225, 'learning_rate': 0.00038703397326763213, 'epoch': 0.13}
+ 13%|█▎        | 871/6790 [30:12<3:23:33,  2.06s/it] 13%|█▎        | 872/6790 [30:14<3:21:00,  2.04s/it]                                                    {'loss': 1.5645, 'learning_rate': 0.0003870006865567174, 'epoch': 0.13}
+ 13%|█▎        | 872/6790 [30:14<3:21:00,  2.04s/it] 13%|█▎        | 873/6790 [30:16<3:16:57,  2.00s/it]                                                    {'loss': 1.6548, 'learning_rate': 0.000386967358608457, 'epoch': 0.13}
+ 13%|█▎        | 873/6790 [30:16<3:16:57,  2.00s/it] 13%|█▎        | 874/6790 [30:19<3:36:02,  2.19s/it]                                                    {'loss': 1.584, 'learning_rate': 0.00038693398943020053, 'epoch': 0.13}
+ 13%|█▎        | 874/6790 [30:19<3:36:02,  2.19s/it] 13%|█▎        | 875/6790 [30:21<3:43:50,  2.27s/it]                                                    {'loss': 1.5301, 'learning_rate': 0.00038690057902930635, 'epoch': 0.13}
+ 13%|█▎        | 875/6790 [30:21<3:43:50,  2.27s/it] 13%|█▎        | 876/6790 [30:23<3:33:47,  2.17s/it]                                                    {'loss': 1.3553, 'learning_rate': 0.0003868671274131423, 'epoch': 0.13}
+ 13%|█▎        | 876/6790 [30:23<3:33:47,  2.17s/it] 13%|█▎        | 877/6790 [30:25<3:22:43,  2.06s/it]                                                    {'loss': 1.5386, 'learning_rate': 0.000386833634589085, 'epoch': 0.13}
+ 13%|█▎        | 877/6790 [30:25<3:22:43,  2.06s/it] 13%|█▎        | 878/6790 [30:27<3:22:19,  2.05s/it]                                                    {'loss': 1.395, 'learning_rate': 0.00038680010056452033, 'epoch': 0.13}
+ 13%|█▎        | 878/6790 [30:27<3:22:19,  2.05s/it] 13%|█▎        | 879/6790 [30:29<3:22:40,  2.06s/it]                                                    {'loss': 1.3854, 'learning_rate': 0.0003867665253468432, 'epoch': 0.13}
+ 13%|█▎        | 879/6790 [30:29<3:22:40,  2.06s/it] 13%|█▎        | 880/6790 [30:31<3:21:40,  2.05s/it]                                                    {'loss': 1.5661, 'learning_rate': 0.0003867329089434576, 'epoch': 0.13}
+ 13%|█▎        | 880/6790 [30:31<3:21:40,  2.05s/it] 13%|█▎        | 881/6790 [30:34<3:26:03,  2.09s/it]                                                    {'loss': 1.7218, 'learning_rate': 0.0003866992513617766, 'epoch': 0.13}
+ 13%|█▎        | 881/6790 [30:34<3:26:03,  2.09s/it] 13%|█▎        | 882/6790 [30:36<3:26:33,  2.10s/it]                                                    {'loss': 1.5151, 'learning_rate': 0.0003866655526092224, 'epoch': 0.13}
+ 13%|█▎        | 882/6790 [30:36<3:26:33,  2.10s/it] 13%|█▎        | 883/6790 [30:38<3:24:27,  2.08s/it]                                                    {'loss': 1.5566, 'learning_rate': 0.0003866318126932262, 'epoch': 0.13}
+ 13%|█▎        | 883/6790 [30:38<3:24:27,  2.08s/it] 13%|█▎        | 884/6790 [30:40<3:31:34,  2.15s/it]                                                    {'loss': 1.4699, 'learning_rate': 0.00038659803162122836, 'epoch': 0.13}
+ 13%|█▎        | 884/6790 [30:40<3:31:34,  2.15s/it] 13%|█▎        | 885/6790 [30:42<3:22:05,  2.05s/it]                                                    {'loss': 1.5088, 'learning_rate': 0.0003865642094006782, 'epoch': 0.13}
+ 13%|█▎        | 885/6790 [30:42<3:22:05,  2.05s/it] 13%|█▎        | 886/6790 [30:44<3:29:26,  2.13s/it]                                                    {'loss': 1.6382, 'learning_rate': 0.00038653034603903434, 'epoch': 0.13}
+ 13%|█▎        | 886/6790 [30:44<3:29:26,  2.13s/it] 13%|█▎        | 887/6790 [30:46<3:34:57,  2.18s/it]                                                    {'loss': 1.7748, 'learning_rate': 0.0003864964415437641, 'epoch': 0.13}
+ 13%|█▎        | 887/6790 [30:46<3:34:57,  2.18s/it] 13%|█▎        | 888/6790 [30:49<3:33:22,  2.17s/it]                                                    {'loss': 1.5273, 'learning_rate': 0.00038646249592234433, 'epoch': 0.13}
+ 13%|█▎        | 888/6790 [30:49<3:33:22,  2.17s/it] 13%|█▎        | 889/6790 [30:51<3:32:37,  2.16s/it]                                                    {'loss': 1.6275, 'learning_rate': 0.00038642850918226045, 'epoch': 0.13}
+ 13%|█▎        | 889/6790 [30:51<3:32:37,  2.16s/it] 13%|█▎        | 890/6790 [30:53<3:25:35,  2.09s/it]                                                    {'loss': 1.4923, 'learning_rate': 0.00038639448133100747, 'epoch': 0.13}
+ 13%|█▎        | 890/6790 [30:53<3:25:35,  2.09s/it] 13%|█▎        | 891/6790 [30:55<3:28:49,  2.12s/it]                                                    {'loss': 1.6912, 'learning_rate': 0.00038636041237608904, 'epoch': 0.13}
+ 13%|█▎        | 891/6790 [30:55<3:28:49,  2.12s/it] 13%|█▎        | 892/6790 [30:57<3:25:08,  2.09s/it]                                                    {'loss': 1.3766, 'learning_rate': 0.00038632630232501803, 'epoch': 0.13}
+ 13%|█▎        | 892/6790 [30:57<3:25:08,  2.09s/it] 13%|█▎        | 893/6790 [30:59<3:26:56,  2.11s/it]                                                    {'loss': 1.555, 'learning_rate': 0.00038629215118531643, 'epoch': 0.13}
+ 13%|█▎        | 893/6790 [30:59<3:26:56,  2.11s/it] 13%|█▎        | 894/6790 [31:01<3:20:05,  2.04s/it]                                                    {'loss': 1.3095, 'learning_rate': 0.00038625795896451526, 'epoch': 0.13}
+ 13%|█▎        | 894/6790 [31:01<3:20:05,  2.04s/it] 13%|█▎        | 895/6790 [31:03<3:17:20,  2.01s/it]                                                    {'loss': 1.4821, 'learning_rate': 0.0003862237256701546, 'epoch': 0.13}
+ 13%|█▎        | 895/6790 [31:03<3:17:20,  2.01s/it] 13%|█▎        | 896/6790 [31:05<3:11:10,  1.95s/it]                                                    {'loss': 1.3768, 'learning_rate': 0.00038618945130978343, 'epoch': 0.13}
+ 13%|█▎        | 896/6790 [31:05<3:11:10,  1.95s/it] 13%|█▎        | 897/6790 [31:06<3:06:55,  1.90s/it]                                                    {'loss': 1.7245, 'learning_rate': 0.0003861551358909601, 'epoch': 0.13}
+ 13%|█▎        | 897/6790 [31:06<3:06:55,  1.90s/it] 13%|█▎        | 898/6790 [31:09<3:14:35,  1.98s/it]                                                    {'loss': 1.5492, 'learning_rate': 0.00038612077942125177, 'epoch': 0.13}
+ 13%|█▎        | 898/6790 [31:09<3:14:35,  1.98s/it] 13%|█▎        | 899/6790 [31:11<3:21:19,  2.05s/it]                                                    {'loss': 1.1945, 'learning_rate': 0.0003860863819082347, 'epoch': 0.13}
+ 13%|█▎        | 899/6790 [31:11<3:21:19,  2.05s/it] 13%|█▎        | 900/6790 [31:13<3:12:08,  1.96s/it]                                                    {'loss': 1.3454, 'learning_rate': 0.00038605194335949414, 'epoch': 0.13}
+ 13%|█▎        | 900/6790 [31:13<3:12:08,  1.96s/it] 13%|█▎        | 901/6790 [31:15<3:13:44,  1.97s/it]                                                    {'loss': 1.5728, 'learning_rate': 0.00038601746378262466, 'epoch': 0.13}
+ 13%|█▎        | 901/6790 [31:15<3:13:44,  1.97s/it] 13%|█▎        | 902/6790 [31:17<3:18:28,  2.02s/it]                                                    {'loss': 1.6285, 'learning_rate': 0.00038598294318522956, 'epoch': 0.13}
+ 13%|█▎        | 902/6790 [31:17<3:18:28,  2.02s/it] 13%|█▎        | 903/6790 [31:19<3:14:19,  1.98s/it]                                                    {'loss': 1.4612, 'learning_rate': 0.00038594838157492134, 'epoch': 0.13}
+ 13%|█▎        | 903/6790 [31:19<3:14:19,  1.98s/it] 13%|█▎        | 904/6790 [31:21<3:25:37,  2.10s/it]                                                    {'loss': 1.7561, 'learning_rate': 0.00038591377895932146, 'epoch': 0.13}
+ 13%|█▎        | 904/6790 [31:21<3:25:37,  2.10s/it] 13%|█▎        | 905/6790 [31:23<3:24:09,  2.08s/it]                                                    {'loss': 1.6683, 'learning_rate': 0.0003858791353460606, 'epoch': 0.13}
+ 13%|█▎        | 905/6790 [31:23<3:24:09,  2.08s/it] 13%|█▎        | 906/6790 [31:25<3:26:17,  2.10s/it]                                                    {'loss': 1.6568, 'learning_rate': 0.0003858444507427783, 'epoch': 0.13}
+ 13%|█▎        | 906/6790 [31:25<3:26:17,  2.10s/it] 13%|█▎        | 907/6790 [31:27<3:21:26,  2.05s/it]                                                    {'loss': 1.4502, 'learning_rate': 0.0003858097251571232, 'epoch': 0.13}
+ 13%|█▎        | 907/6790 [31:27<3:21:26,  2.05s/it] 13%|█▎        | 908/6790 [31:29<3:22:25,  2.06s/it]                                                    {'loss': 1.3934, 'learning_rate': 0.00038577495859675294, 'epoch': 0.13}
+ 13%|█▎        | 908/6790 [31:29<3:22:25,  2.06s/it] 13%|█▎        | 909/6790 [31:31<3:22:59,  2.07s/it]                                                    {'loss': 1.4471, 'learning_rate': 0.0003857401510693343, 'epoch': 0.13}
+ 13%|█▎        | 909/6790 [31:31<3:22:59,  2.07s/it] 13%|█▎        | 910/6790 [31:33<3:18:52,  2.03s/it]                                                    {'loss': 1.4266, 'learning_rate': 0.00038570530258254303, 'epoch': 0.13}
+ 13%|█▎        | 910/6790 [31:33<3:18:52,  2.03s/it] 13%|█▎        | 911/6790 [31:35<3:11:04,  1.95s/it]                                                    {'loss': 1.3095, 'learning_rate': 0.00038567041314406384, 'epoch': 0.13}
+ 13%|█▎        | 911/6790 [31:35<3:11:04,  1.95s/it] 13%|█▎        | 912/6790 [31:37<3:17:45,  2.02s/it]                                                    {'loss': 1.8519, 'learning_rate': 0.0003856354827615905, 'epoch': 0.13}
+ 13%|█▎        | 912/6790 [31:37<3:17:45,  2.02s/it] 13%|█▎        | 913/6790 [31:39<3:19:26,  2.04s/it]                                                    {'loss': 1.5989, 'learning_rate': 0.00038560051144282607, 'epoch': 0.13}
+ 13%|█▎        | 913/6790 [31:39<3:19:26,  2.04s/it] 13%|█▎        | 914/6790 [31:41<3:12:57,  1.97s/it]                                                    {'loss': 1.7732, 'learning_rate': 0.0003855654991954822, 'epoch': 0.13}
+ 13%|█▎        | 914/6790 [31:41<3:12:57,  1.97s/it] 13%|█▎        | 915/6790 [31:43<3:12:38,  1.97s/it]                                                    {'loss': 1.7127, 'learning_rate': 0.0003855304460272799, 'epoch': 0.13}
+ 13%|█▎        | 915/6790 [31:43<3:12:38,  1.97s/it] 13%|█▎        | 916/6790 [31:45<3:12:53,  1.97s/it]                                                    {'loss': 1.506, 'learning_rate': 0.00038549535194594897, 'epoch': 0.13}
+ 13%|█▎        | 916/6790 [31:45<3:12:53,  1.97s/it] 14%|█▎        | 917/6790 [31:47<3:19:12,  2.04s/it]                                                    {'loss': 1.7999, 'learning_rate': 0.00038546021695922854, 'epoch': 0.14}
+ 14%|█▎        | 917/6790 [31:47<3:19:12,  2.04s/it] 14%|█▎        | 918/6790 [31:49<3:17:10,  2.01s/it]                                                    {'loss': 1.3227, 'learning_rate': 0.00038542504107486633, 'epoch': 0.14}
+ 14%|█▎        | 918/6790 [31:49<3:17:10,  2.01s/it] 14%|█▎        | 919/6790 [31:51<3:16:15,  2.01s/it]                                                    {'loss': 1.5, 'learning_rate': 0.0003853898243006195, 'epoch': 0.14}
+ 14%|█▎        | 919/6790 [31:51<3:16:15,  2.01s/it] 14%|█▎        | 920/6790 [31:53<3:19:50,  2.04s/it]                                                    {'loss': 1.5511, 'learning_rate': 0.000385354566644254, 'epoch': 0.14}
+ 14%|█▎        | 920/6790 [31:53<3:19:50,  2.04s/it] 14%|█▎        | 921/6790 [31:55<3:24:41,  2.09s/it]                                                    {'loss': 1.7017, 'learning_rate': 0.0003853192681135448, 'epoch': 0.14}
+ 14%|█▎        | 921/6790 [31:55<3:24:41,  2.09s/it] 14%|█▎        | 922/6790 [31:57<3:17:58,  2.02s/it]                                                    {'loss': 1.5159, 'learning_rate': 0.0003852839287162759, 'epoch': 0.14}
+ 14%|█▎        | 922/6790 [31:57<3:17:58,  2.02s/it] 14%|█▎        | 923/6790 [31:59<3:19:41,  2.04s/it]                                                    {'loss': 1.3174, 'learning_rate': 0.0003852485484602404, 'epoch': 0.14}
+ 14%|█▎        | 923/6790 [31:59<3:19:41,  2.04s/it] 14%|█▎        | 924/6790 [32:01<3:13:55,  1.98s/it]                                                    {'loss': 1.3017, 'learning_rate': 0.00038521312735324034, 'epoch': 0.14}
+ 14%|█▎        | 924/6790 [32:01<3:13:55,  1.98s/it] 14%|█▎        | 925/6790 [32:03<3:18:35,  2.03s/it]                                                    {'loss': 1.543, 'learning_rate': 0.0003851776654030868, 'epoch': 0.14}
+ 14%|█▎        | 925/6790 [32:03<3:18:35,  2.03s/it] 14%|█▎        | 926/6790 [32:05<3:10:41,  1.95s/it]                                                    {'loss': 1.3168, 'learning_rate': 0.00038514216261759977, 'epoch': 0.14}
+ 14%|█▎        | 926/6790 [32:05<3:10:41,  1.95s/it] 14%|█▎        | 927/6790 [32:08<3:30:19,  2.15s/it]                                                    {'loss': 1.6602, 'learning_rate': 0.00038510661900460834, 'epoch': 0.14}
+ 14%|█▎        | 927/6790 [32:08<3:30:19,  2.15s/it] 14%|█▎        | 928/6790 [32:10<3:20:44,  2.05s/it]                                                    {'loss': 1.496, 'learning_rate': 0.00038507103457195057, 'epoch': 0.14}
+ 14%|█▎        | 928/6790 [32:10<3:20:44,  2.05s/it] 14%|█▎        | 929/6790 [32:12<3:19:43,  2.04s/it]                                                    {'loss': 1.763, 'learning_rate': 0.0003850354093274735, 'epoch': 0.14}
+ 14%|█▎        | 929/6790 [32:12<3:19:43,  2.04s/it] 14%|█▎        | 930/6790 [32:14<3:33:36,  2.19s/it]                                                    {'loss': 1.6829, 'learning_rate': 0.00038499974327903334, 'epoch': 0.14}
+ 14%|█▎        | 930/6790 [32:14<3:33:36,  2.19s/it] 14%|█▎        | 931/6790 [32:16<3:32:06,  2.17s/it]                                                    {'loss': 1.6362, 'learning_rate': 0.00038496403643449497, 'epoch': 0.14}
+ 14%|█▎        | 931/6790 [32:16<3:32:06,  2.17s/it] 14%|█▎        | 932/6790 [32:18<3:28:26,  2.13s/it]                                                    {'loss': 1.749, 'learning_rate': 0.0003849282888017327, 'epoch': 0.14}
+ 14%|█▎        | 932/6790 [32:18<3:28:26,  2.13s/it] 14%|█▎        | 933/6790 [32:20<3:26:52,  2.12s/it]                                                    {'loss': 1.4259, 'learning_rate': 0.00038489250038862925, 'epoch': 0.14}
+ 14%|█▎        | 933/6790 [32:20<3:26:52,  2.12s/it] 14%|█▍        | 934/6790 [32:22<3:20:31,  2.05s/it]                                                    {'loss': 1.678, 'learning_rate': 0.000384856671203077, 'epoch': 0.14}
+ 14%|█▍        | 934/6790 [32:22<3:20:31,  2.05s/it] 14%|█▍        | 935/6790 [32:25<3:26:29,  2.12s/it]                                                    {'loss': 1.6668, 'learning_rate': 0.0003848208012529768, 'epoch': 0.14}
+ 14%|█▍        | 935/6790 [32:25<3:26:29,  2.12s/it] 14%|█▍        | 936/6790 [32:26<3:15:58,  2.01s/it]                                                    {'loss': 1.5049, 'learning_rate': 0.00038478489054623874, 'epoch': 0.14}
+ 14%|█▍        | 936/6790 [32:26<3:15:58,  2.01s/it] 14%|█▍        | 937/6790 [32:28<3:18:39,  2.04s/it]                                                    {'loss': 1.5108, 'learning_rate': 0.00038474893909078183, 'epoch': 0.14}
+ 14%|█▍        | 937/6790 [32:28<3:18:39,  2.04s/it] 14%|█▍        | 938/6790 [32:31<3:23:03,  2.08s/it]                                                    {'loss': 1.5255, 'learning_rate': 0.0003847129468945341, 'epoch': 0.14}
+ 14%|█▍        | 938/6790 [32:31<3:23:03,  2.08s/it] 14%|█▍        | 939/6790 [32:33<3:24:03,  2.09s/it]                                                    {'loss': 1.5504, 'learning_rate': 0.0003846769139654325, 'epoch': 0.14}
+ 14%|█▍        | 939/6790 [32:33<3:24:03,  2.09s/it] 14%|█▍        | 940/6790 [32:34<3:13:56,  1.99s/it]                                                    {'loss': 1.7083, 'learning_rate': 0.00038464084031142304, 'epoch': 0.14}
+ 14%|█▍        | 940/6790 [32:34<3:13:56,  1.99s/it] 14%|█▍        | 941/6790 [32:36<3:10:36,  1.96s/it]                                                    {'loss': 1.6054, 'learning_rate': 0.00038460472594046066, 'epoch': 0.14}
+ 14%|█▍        | 941/6790 [32:36<3:10:36,  1.96s/it] 14%|█▍        | 942/6790 [32:38<3:07:11,  1.92s/it]                                                    {'loss': 1.7159, 'learning_rate': 0.00038456857086050926, 'epoch': 0.14}
+ 14%|█▍        | 942/6790 [32:38<3:07:11,  1.92s/it] 14%|█▍        | 943/6790 [32:40<3:07:04,  1.92s/it]                                                    {'loss': 1.6767, 'learning_rate': 0.0003845323750795418, 'epoch': 0.14}
+ 14%|█▍        | 943/6790 [32:40<3:07:04,  1.92s/it] 14%|█▍        | 944/6790 [32:42<3:07:53,  1.93s/it]                                                    {'loss': 1.5226, 'learning_rate': 0.00038449613860554014, 'epoch': 0.14}
+ 14%|█▍        | 944/6790 [32:42<3:07:53,  1.93s/it] 14%|█▍        | 945/6790 [32:44<3:07:43,  1.93s/it]                                                    {'loss': 1.5709, 'learning_rate': 0.00038445986144649516, 'epoch': 0.14}
+ 14%|█▍        | 945/6790 [32:44<3:07:43,  1.93s/it] 14%|█▍        | 946/6790 [32:46<3:02:23,  1.87s/it]                                                    {'loss': 1.4384, 'learning_rate': 0.00038442354361040664, 'epoch': 0.14}
+ 14%|█▍        | 946/6790 [32:46<3:02:23,  1.87s/it] 14%|█▍        | 947/6790 [32:48<3:08:10,  1.93s/it]                                                    {'loss': 1.636, 'learning_rate': 0.00038438718510528345, 'epoch': 0.14}
+ 14%|█▍        | 947/6790 [32:48<3:08:10,  1.93s/it] 14%|█▍        | 948/6790 [32:50<3:18:27,  2.04s/it]                                                    {'loss': 1.7387, 'learning_rate': 0.0003843507859391433, 'epoch': 0.14}
+ 14%|█▍        | 948/6790 [32:50<3:18:27,  2.04s/it] 14%|█▍        | 949/6790 [32:52<3:21:36,  2.07s/it]                                                    {'loss': 1.6422, 'learning_rate': 0.00038431434612001293, 'epoch': 0.14}
+ 14%|█▍        | 949/6790 [32:52<3:21:36,  2.07s/it] 14%|█▍        | 950/6790 [32:54<3:10:32,  1.96s/it]                                                    {'loss': 1.3665, 'learning_rate': 0.0003842778656559281, 'epoch': 0.14}
+ 14%|█▍        | 950/6790 [32:54<3:10:32,  1.96s/it] 14%|█▍        | 951/6790 [32:56<3:16:39,  2.02s/it]                                                    {'loss': 1.6488, 'learning_rate': 0.0003842413445549334, 'epoch': 0.14}
+ 14%|█▍        | 951/6790 [32:56<3:16:39,  2.02s/it] 14%|█▍        | 952/6790 [32:59<3:33:04,  2.19s/it]                                                    {'loss': 1.3922, 'learning_rate': 0.00038420478282508256, 'epoch': 0.14}
+ 14%|█▍        | 952/6790 [32:59<3:33:04,  2.19s/it] 14%|█▍        | 953/6790 [33:01<3:30:27,  2.16s/it]                                                    {'loss': 1.5908, 'learning_rate': 0.000384168180474438, 'epoch': 0.14}
+ 14%|█▍        | 953/6790 [33:01<3:30:27,  2.16s/it] 14%|█▍        | 954/6790 [33:03<3:26:55,  2.13s/it]                                                    {'loss': 1.6259, 'learning_rate': 0.0003841315375110713, 'epoch': 0.14}
+ 14%|█▍        | 954/6790 [33:03<3:26:55,  2.13s/it] 14%|█▍        | 955/6790 [33:05<3:21:19,  2.07s/it]                                                    {'loss': 1.5613, 'learning_rate': 0.0003840948539430631, 'epoch': 0.14}
+ 14%|█▍        | 955/6790 [33:05<3:21:19,  2.07s/it] 14%|█▍        | 956/6790 [33:07<3:26:15,  2.12s/it]                                                    {'loss': 1.6568, 'learning_rate': 0.0003840581297785028, 'epoch': 0.14}
+ 14%|█▍        | 956/6790 [33:07<3:26:15,  2.12s/it] 14%|█▍        | 957/6790 [33:10<3:38:55,  2.25s/it]                                                    {'loss': 1.6794, 'learning_rate': 0.0003840213650254887, 'epoch': 0.14}
+ 14%|█▍        | 957/6790 [33:10<3:38:55,  2.25s/it] 14%|█▍        | 958/6790 [33:11<3:29:53,  2.16s/it]                                                    {'loss': 1.5772, 'learning_rate': 0.0003839845596921282, 'epoch': 0.14}
+ 14%|█▍        | 958/6790 [33:11<3:29:53,  2.16s/it] 14%|█▍        | 959/6790 [33:13<3:24:09,  2.10s/it]                                                    {'loss': 1.5506, 'learning_rate': 0.0003839477137865376, 'epoch': 0.14}
+ 14%|█▍        | 959/6790 [33:13<3:24:09,  2.10s/it] 14%|█▍        | 960/6790 [33:16<3:26:02,  2.12s/it]                                                    {'loss': 1.7379, 'learning_rate': 0.0003839108273168422, 'epoch': 0.14}
+ 14%|█▍        | 960/6790 [33:16<3:26:02,  2.12s/it] 14%|█▍        | 961/6790 [33:18<3:22:56,  2.09s/it]                                                    {'loss': 1.5639, 'learning_rate': 0.0003838739002911762, 'epoch': 0.14}
+ 14%|█▍        | 961/6790 [33:18<3:22:56,  2.09s/it] 14%|█▍        | 962/6790 [33:20<3:26:17,  2.12s/it]                                                    {'loss': 1.6277, 'learning_rate': 0.00038383693271768263, 'epoch': 0.14}
+ 14%|█▍        | 962/6790 [33:20<3:26:17,  2.12s/it] 14%|█▍        | 963/6790 [33:22<3:25:39,  2.12s/it]                                                    {'loss': 1.4198, 'learning_rate': 0.0003837999246045137, 'epoch': 0.14}
+ 14%|█▍        | 963/6790 [33:22<3:25:39,  2.12s/it] 14%|█▍        | 964/6790 [33:24<3:20:34,  2.07s/it]                                                    {'loss': 1.3602, 'learning_rate': 0.0003837628759598304, 'epoch': 0.14}
+ 14%|█▍        | 964/6790 [33:24<3:20:34,  2.07s/it] 14%|█▍        | 965/6790 [33:26<3:16:48,  2.03s/it]                                                    {'loss': 1.5063, 'learning_rate': 0.0003837257867918026, 'epoch': 0.14}
+ 14%|█▍        | 965/6790 [33:26<3:16:48,  2.03s/it] 14%|█▍        | 966/6790 [33:28<3:17:45,  2.04s/it]                                                    {'loss': 1.4172, 'learning_rate': 0.0003836886571086093, 'epoch': 0.14}
+ 14%|█▍        | 966/6790 [33:28<3:17:45,  2.04s/it] 14%|█▍        | 967/6790 [33:31<3:43:48,  2.31s/it]                                                    {'loss': 1.4566, 'learning_rate': 0.0003836514869184383, 'epoch': 0.14}
+ 14%|█▍        | 967/6790 [33:31<3:43:48,  2.31s/it] 14%|█▍        | 968/6790 [33:33<3:37:30,  2.24s/it]                                                    {'loss': 1.6195, 'learning_rate': 0.0003836142762294863, 'epoch': 0.14}
+ 14%|█▍        | 968/6790 [33:33<3:37:30,  2.24s/it] 14%|█▍        | 969/6790 [33:35<3:26:05,  2.12s/it]                                                    {'loss': 1.6053, 'learning_rate': 0.00038357702504995903, 'epoch': 0.14}
+ 14%|█▍        | 969/6790 [33:35<3:26:05,  2.12s/it] 14%|█▍        | 970/6790 [33:37<3:28:34,  2.15s/it]                                                    {'loss': 1.5727, 'learning_rate': 0.0003835397333880711, 'epoch': 0.14}
+ 14%|█▍        | 970/6790 [33:37<3:28:34,  2.15s/it] 14%|█▍        | 971/6790 [33:39<3:31:25,  2.18s/it]                                                    {'loss': 1.4643, 'learning_rate': 0.00038350240125204616, 'epoch': 0.14}
+ 14%|█▍        | 971/6790 [33:39<3:31:25,  2.18s/it] 14%|█▍        | 972/6790 [33:42<3:36:42,  2.23s/it]                                                    {'loss': 1.3032, 'learning_rate': 0.00038346502865011656, 'epoch': 0.14}
+ 14%|█▍        | 972/6790 [33:42<3:36:42,  2.23s/it] 14%|█▍        | 973/6790 [33:44<3:34:25,  2.21s/it]                                                    {'loss': 1.4967, 'learning_rate': 0.00038342761559052375, 'epoch': 0.14}
+ 14%|█▍        | 973/6790 [33:44<3:34:25,  2.21s/it] 14%|█▍        | 974/6790 [33:46<3:38:59,  2.26s/it]                                                    {'loss': 1.4863, 'learning_rate': 0.00038339016208151797, 'epoch': 0.14}
+ 14%|█▍        | 974/6790 [33:46<3:38:59,  2.26s/it] 14%|█▍        | 975/6790 [33:48<3:34:35,  2.21s/it]                                                    {'loss': 1.5244, 'learning_rate': 0.0003833526681313586, 'epoch': 0.14}
+ 14%|█▍        | 975/6790 [33:48<3:34:35,  2.21s/it] 14%|█▍        | 976/6790 [33:50<3:22:59,  2.09s/it]                                                    {'loss': 1.4189, 'learning_rate': 0.0003833151337483137, 'epoch': 0.14}
+ 14%|█▍        | 976/6790 [33:50<3:22:59,  2.09s/it] 14%|█▍        | 977/6790 [33:52<3:23:11,  2.10s/it]                                                    {'loss': 1.5719, 'learning_rate': 0.00038327755894066037, 'epoch': 0.14}
+ 14%|█▍        | 977/6790 [33:52<3:23:11,  2.10s/it] 14%|█▍        | 978/6790 [33:55<3:32:10,  2.19s/it]                                                    {'loss': 1.4684, 'learning_rate': 0.00038323994371668456, 'epoch': 0.14}
+ 14%|█▍        | 978/6790 [33:55<3:32:10,  2.19s/it] 14%|█▍        | 979/6790 [33:56<3:18:57,  2.05s/it]                                                    {'loss': 1.4409, 'learning_rate': 0.0003832022880846813, 'epoch': 0.14}
+ 14%|█▍        | 979/6790 [33:56<3:18:57,  2.05s/it] 14%|█▍        | 980/6790 [33:58<3:17:38,  2.04s/it]                                                    {'loss': 1.5544, 'learning_rate': 0.00038316459205295415, 'epoch': 0.14}
+ 14%|█▍        | 980/6790 [33:58<3:17:38,  2.04s/it] 14%|█▍        | 981/6790 [34:00<3:14:26,  2.01s/it]                                                    {'loss': 1.4396, 'learning_rate': 0.0003831268556298161, 'epoch': 0.14}
+ 14%|█▍        | 981/6790 [34:00<3:14:26,  2.01s/it] 14%|█▍        | 982/6790 [34:02<3:12:38,  1.99s/it]                                                    {'loss': 1.5764, 'learning_rate': 0.00038308907882358864, 'epoch': 0.14}
+ 14%|█▍        | 982/6790 [34:02<3:12:38,  1.99s/it] 14%|█▍        | 983/6790 [34:05<3:26:45,  2.14s/it]                                                    {'loss': 1.5976, 'learning_rate': 0.0003830512616426023, 'epoch': 0.14}
+ 14%|█▍        | 983/6790 [34:05<3:26:45,  2.14s/it] 14%|█▍        | 984/6790 [34:07<3:21:00,  2.08s/it]                                                    {'loss': 1.4563, 'learning_rate': 0.00038301340409519657, 'epoch': 0.14}
+ 14%|█▍        | 984/6790 [34:07<3:21:00,  2.08s/it] 15%|█▍        | 985/6790 [34:09<3:29:41,  2.17s/it]                                                    {'loss': 1.6701, 'learning_rate': 0.00038297550618971967, 'epoch': 0.15}
+ 15%|█▍        | 985/6790 [34:09<3:29:41,  2.17s/it] 15%|█▍        | 986/6790 [34:11<3:27:15,  2.14s/it]                                                    {'loss': 1.7124, 'learning_rate': 0.000382937567934529, 'epoch': 0.15}
+ 15%|█▍        | 986/6790 [34:11<3:27:15,  2.14s/it] 15%|█▍        | 987/6790 [34:13<3:26:43,  2.14s/it]                                                    {'loss': 1.4785, 'learning_rate': 0.0003828995893379906, 'epoch': 0.15}
+ 15%|█▍        | 987/6790 [34:13<3:26:43,  2.14s/it] 15%|█▍        | 988/6790 [34:15<3:20:52,  2.08s/it]                                                    {'loss': 1.3263, 'learning_rate': 0.00038286157040847953, 'epoch': 0.15}
+ 15%|█▍        | 988/6790 [34:15<3:20:52,  2.08s/it] 15%|█▍        | 989/6790 [34:17<3:11:40,  1.98s/it]                                                    {'loss': 1.4567, 'learning_rate': 0.0003828235111543797, 'epoch': 0.15}
+ 15%|█▍        | 989/6790 [34:17<3:11:40,  1.98s/it] 15%|█▍        | 990/6790 [34:19<3:17:54,  2.05s/it]                                                    {'loss': 1.6926, 'learning_rate': 0.0003827854115840839, 'epoch': 0.15}
+ 15%|█▍        | 990/6790 [34:19<3:17:54,  2.05s/it] 15%|█▍        | 991/6790 [34:21<3:16:53,  2.04s/it]                                                    {'loss': 1.4308, 'learning_rate': 0.00038274727170599387, 'epoch': 0.15}
+ 15%|█▍        | 991/6790 [34:21<3:16:53,  2.04s/it] 15%|█▍        | 992/6790 [34:23<3:12:25,  1.99s/it]                                                    {'loss': 1.4724, 'learning_rate': 0.0003827090915285202, 'epoch': 0.15}
+ 15%|█▍        | 992/6790 [34:23<3:12:25,  1.99s/it] 15%|█▍        | 993/6790 [34:25<3:09:07,  1.96s/it]                                                    {'loss': 1.5799, 'learning_rate': 0.00038267087106008235, 'epoch': 0.15}
+ 15%|█▍        | 993/6790 [34:25<3:09:07,  1.96s/it] 15%|█▍        | 994/6790 [34:27<3:12:32,  1.99s/it]                                                    {'loss': 1.7164, 'learning_rate': 0.0003826326103091088, 'epoch': 0.15}
+ 15%|█▍        | 994/6790 [34:27<3:12:32,  1.99s/it] 15%|█▍        | 995/6790 [34:29<3:16:39,  2.04s/it]                                                    {'loss': 1.4576, 'learning_rate': 0.00038259430928403663, 'epoch': 0.15}
+ 15%|█▍        | 995/6790 [34:29<3:16:39,  2.04s/it] 15%|█▍        | 996/6790 [34:32<3:30:53,  2.18s/it]                                                    {'loss': 1.5785, 'learning_rate': 0.0003825559679933121, 'epoch': 0.15}
+ 15%|█▍        | 996/6790 [34:32<3:30:53,  2.18s/it] 15%|█▍        | 997/6790 [34:33<3:20:23,  2.08s/it]                                                    {'loss': 1.5316, 'learning_rate': 0.0003825175864453902, 'epoch': 0.15}
+ 15%|█▍        | 997/6790 [34:33<3:20:23,  2.08s/it] 15%|█▍        | 998/6790 [34:36<3:32:11,  2.20s/it]                                                    {'loss': 1.4658, 'learning_rate': 0.00038247916464873477, 'epoch': 0.15}
+ 15%|█▍        | 998/6790 [34:36<3:32:11,  2.20s/it] 15%|█▍        | 999/6790 [34:38<3:27:39,  2.15s/it]                                                    {'loss': 1.6844, 'learning_rate': 0.0003824407026118186, 'epoch': 0.15}
+ 15%|█▍        | 999/6790 [34:38<3:27:39,  2.15s/it] 15%|█▍        | 1000/6790 [34:41<3:41:56,  2.30s/it]                                                     {'loss': 1.5687, 'learning_rate': 0.0003824022003431234, 'epoch': 0.15}
+ 15%|█▍        | 1000/6790 [34:41<3:41:56,  2.30s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 15%|█▍        | 1001/6790 [34:43<3:47:50,  2.36s/it]                                                     {'loss': 1.6936, 'learning_rate': 0.0003823636578511396, 'epoch': 0.15}
+ 15%|█▍        | 1001/6790 [34:43<3:47:50,  2.36s/it] 15%|█▍        | 1002/6790 [34:45<3:32:05,  2.20s/it]                                                     {'loss': 1.5446, 'learning_rate': 0.00038232507514436657, 'epoch': 0.15}
+ 15%|█▍        | 1002/6790 [34:45<3:32:05,  2.20s/it] 15%|█▍        | 1003/6790 [34:47<3:26:39,  2.14s/it]                                                     {'loss': 1.4437, 'learning_rate': 0.00038228645223131253, 'epoch': 0.15}
+ 15%|█▍        | 1003/6790 [34:47<3:26:39,  2.14s/it] 15%|█▍        | 1004/6790 [34:50<3:41:08,  2.29s/it]                                                     {'loss': 1.7204, 'learning_rate': 0.00038224778912049475, 'epoch': 0.15}
+ 15%|█▍        | 1004/6790 [34:50<3:41:08,  2.29s/it] 15%|█▍        | 1005/6790 [34:51<3:28:05,  2.16s/it]                                                     {'loss': 1.6179, 'learning_rate': 0.0003822090858204391, 'epoch': 0.15}
+ 15%|█▍        | 1005/6790 [34:51<3:28:05,  2.16s/it] 15%|█▍        | 1006/6790 [34:54<3:29:04,  2.17s/it]                                                     {'loss': 1.617, 'learning_rate': 0.00038217034233968035, 'epoch': 0.15}
+ 15%|█▍        | 1006/6790 [34:54<3:29:04,  2.17s/it] 15%|█▍        | 1007/6790 [34:56<3:21:43,  2.09s/it]                                                     {'loss': 1.6622, 'learning_rate': 0.00038213155868676234, 'epoch': 0.15}
+ 15%|█▍        | 1007/6790 [34:56<3:21:43,  2.09s/it] 15%|█▍        | 1008/6790 [34:57<3:12:09,  1.99s/it]                                                     {'loss': 1.4657, 'learning_rate': 0.0003820927348702376, 'epoch': 0.15}
+ 15%|█▍        | 1008/6790 [34:57<3:12:09,  1.99s/it] 15%|█▍        | 1009/6790 [34:59<3:15:07,  2.03s/it]                                                     {'loss': 1.3275, 'learning_rate': 0.0003820538708986675, 'epoch': 0.15}
+ 15%|█▍        | 1009/6790 [34:59<3:15:07,  2.03s/it] 15%|█▍        | 1010/6790 [35:01<3:13:31,  2.01s/it]                                                     {'loss': 1.5408, 'learning_rate': 0.00038201496678062227, 'epoch': 0.15}
+ 15%|█▍        | 1010/6790 [35:01<3:13:31,  2.01s/it] 15%|█▍        | 1011/6790 [35:03<3:15:35,  2.03s/it]                                                     {'loss': 1.721, 'learning_rate': 0.0003819760225246812, 'epoch': 0.15}
+ 15%|█▍        | 1011/6790 [35:03<3:15:35,  2.03s/it] 15%|█▍        | 1012/6790 [35:05<3:08:29,  1.96s/it]                                                     {'loss': 1.5027, 'learning_rate': 0.0003819370381394322, 'epoch': 0.15}
+ 15%|█▍        | 1012/6790 [35:05<3:08:29,  1.96s/it] 15%|█▍        | 1013/6790 [35:07<3:06:17,  1.93s/it]                                                     {'loss': 1.55, 'learning_rate': 0.00038189801363347194, 'epoch': 0.15}
+ 15%|█▍        | 1013/6790 [35:07<3:06:17,  1.93s/it] 15%|█▍        | 1014/6790 [35:09<3:14:15,  2.02s/it]                                                     {'loss': 1.4115, 'learning_rate': 0.00038185894901540636, 'epoch': 0.15}
+ 15%|█▍        | 1014/6790 [35:09<3:14:15,  2.02s/it] 15%|█▍        | 1015/6790 [35:12<3:34:52,  2.23s/it]                                                     {'loss': 1.6737, 'learning_rate': 0.00038181984429384977, 'epoch': 0.15}
+ 15%|█▍        | 1015/6790 [35:12<3:34:52,  2.23s/it] 15%|█▍        | 1016/6790 [35:14<3:38:29,  2.27s/it]                                                     {'loss': 1.6877, 'learning_rate': 0.0003817806994774256, 'epoch': 0.15}
+ 15%|█▍        | 1016/6790 [35:14<3:38:29,  2.27s/it] 15%|█▍        | 1017/6790 [35:16<3:27:23,  2.16s/it]                                                     {'loss': 1.6392, 'learning_rate': 0.00038174151457476616, 'epoch': 0.15}
+ 15%|█▍        | 1017/6790 [35:16<3:27:23,  2.16s/it] 15%|█▍        | 1018/6790 [35:18<3:28:44,  2.17s/it]                                                     {'loss': 1.4671, 'learning_rate': 0.0003817022895945123, 'epoch': 0.15}
+ 15%|█▍        | 1018/6790 [35:19<3:28:44,  2.17s/it] 15%|█▌        | 1019/6790 [35:20<3:21:49,  2.10s/it]                                                     {'loss': 1.4058, 'learning_rate': 0.00038166302454531405, 'epoch': 0.15}
+ 15%|█▌        | 1019/6790 [35:20<3:21:49,  2.10s/it] 15%|█▌        | 1020/6790 [35:23<3:31:53,  2.20s/it]                                                     {'loss': 1.5628, 'learning_rate': 0.00038162371943583007, 'epoch': 0.15}
+ 15%|█▌        | 1020/6790 [35:23<3:31:53,  2.20s/it] 15%|█▌        | 1021/6790 [35:25<3:19:27,  2.07s/it]                                                     {'loss': 1.6404, 'learning_rate': 0.00038158437427472793, 'epoch': 0.15}
+ 15%|█▌        | 1021/6790 [35:25<3:19:27,  2.07s/it] 15%|█▌        | 1022/6790 [35:27<3:31:10,  2.20s/it]                                                     {'loss': 1.4427, 'learning_rate': 0.000381544989070684, 'epoch': 0.15}
+ 15%|█▌        | 1022/6790 [35:27<3:31:10,  2.20s/it] 15%|█▌        | 1023/6790 [35:29<3:26:03,  2.14s/it]                                                     {'loss': 1.5979, 'learning_rate': 0.0003815055638323835, 'epoch': 0.15}
+ 15%|█▌        | 1023/6790 [35:29<3:26:03,  2.14s/it] 15%|█▌        | 1024/6790 [35:31<3:13:41,  2.02s/it]                                                     {'loss': 1.4039, 'learning_rate': 0.0003814660985685205, 'epoch': 0.15}
+ 15%|█▌        | 1024/6790 [35:31<3:13:41,  2.02s/it] 15%|█▌        | 1025/6790 [35:33<3:09:22,  1.97s/it]                                                     {'loss': 1.472, 'learning_rate': 0.0003814265932877978, 'epoch': 0.15}
+ 15%|█▌        | 1025/6790 [35:33<3:09:22,  1.97s/it] 15%|█▌        | 1026/6790 [35:35<3:15:05,  2.03s/it]                                                     {'loss': 1.7841, 'learning_rate': 0.0003813870479989273, 'epoch': 0.15}
+ 15%|█▌        | 1026/6790 [35:35<3:15:05,  2.03s/it] 15%|█▌        | 1027/6790 [35:37<3:15:52,  2.04s/it]                                                     {'loss': 1.6543, 'learning_rate': 0.0003813474627106292, 'epoch': 0.15}
+ 15%|█▌        | 1027/6790 [35:37<3:15:52,  2.04s/it] 15%|█▌        | 1028/6790 [35:39<3:12:48,  2.01s/it]                                                     {'loss': 1.6881, 'learning_rate': 0.0003813078374316331, 'epoch': 0.15}
+ 15%|█▌        | 1028/6790 [35:39<3:12:48,  2.01s/it] 15%|█▌        | 1029/6790 [35:41<3:16:55,  2.05s/it]                                                     {'loss': 1.5648, 'learning_rate': 0.00038126817217067695, 'epoch': 0.15}
+ 15%|█▌        | 1029/6790 [35:41<3:16:55,  2.05s/it] 15%|█▌        | 1030/6790 [35:43<3:16:05,  2.04s/it]                                                     {'loss': 1.6453, 'learning_rate': 0.0003812284669365079, 'epoch': 0.15}
+ 15%|█▌        | 1030/6790 [35:43<3:16:05,  2.04s/it] 15%|█▌        | 1031/6790 [35:45<3:19:55,  2.08s/it]                                                     {'loss': 1.8837, 'learning_rate': 0.00038118872173788167, 'epoch': 0.15}
+ 15%|█▌        | 1031/6790 [35:45<3:19:55,  2.08s/it] 15%|█▌        | 1032/6790 [35:47<3:21:22,  2.10s/it]                                                     {'loss': 1.6244, 'learning_rate': 0.00038114893658356287, 'epoch': 0.15}
+ 15%|█▌        | 1032/6790 [35:47<3:21:22,  2.10s/it] 15%|█▌        | 1033/6790 [35:49<3:20:23,  2.09s/it]                                                     {'loss': 1.3797, 'learning_rate': 0.00038110911148232486, 'epoch': 0.15}
+ 15%|█▌        | 1033/6790 [35:49<3:20:23,  2.09s/it] 15%|█▌        | 1034/6790 [35:51<3:13:38,  2.02s/it]                                                     {'loss': 1.5755, 'learning_rate': 0.00038106924644294997, 'epoch': 0.15}
+ 15%|█▌        | 1034/6790 [35:51<3:13:38,  2.02s/it] 15%|█▌        | 1035/6790 [35:53<3:11:40,  2.00s/it]                                                     {'loss': 1.4411, 'learning_rate': 0.0003810293414742291, 'epoch': 0.15}
+ 15%|█▌        | 1035/6790 [35:53<3:11:40,  2.00s/it] 15%|█▌        | 1036/6790 [35:55<3:09:12,  1.97s/it]                                                     {'loss': 1.6374, 'learning_rate': 0.00038098939658496217, 'epoch': 0.15}
+ 15%|█▌        | 1036/6790 [35:55<3:09:12,  1.97s/it] 15%|█▌        | 1037/6790 [35:57<3:08:02,  1.96s/it]                                                     {'loss': 1.486, 'learning_rate': 0.00038094941178395784, 'epoch': 0.15}
+ 15%|█▌        | 1037/6790 [35:57<3:08:02,  1.96s/it] 15%|█▌        | 1038/6790 [35:59<3:10:19,  1.99s/it]                                                     {'loss': 1.5887, 'learning_rate': 0.0003809093870800334, 'epoch': 0.15}
+ 15%|█▌        | 1038/6790 [35:59<3:10:19,  1.99s/it] 15%|█▌        | 1039/6790 [36:01<3:14:47,  2.03s/it]                                                     {'loss': 1.5433, 'learning_rate': 0.00038086932248201526, 'epoch': 0.15}
+ 15%|█▌        | 1039/6790 [36:01<3:14:47,  2.03s/it] 15%|█▌        | 1040/6790 [36:03<3:13:43,  2.02s/it]                                                     {'loss': 1.4956, 'learning_rate': 0.00038082921799873843, 'epoch': 0.15}
+ 15%|█▌        | 1040/6790 [36:03<3:13:43,  2.02s/it] 15%|█▌        | 1041/6790 [36:06<3:25:41,  2.15s/it]                                                     {'loss': 1.7396, 'learning_rate': 0.0003807890736390466, 'epoch': 0.15}
+ 15%|█▌        | 1041/6790 [36:06<3:25:41,  2.15s/it] 15%|█▌        | 1042/6790 [36:08<3:25:30,  2.15s/it]                                                     {'loss': 1.7505, 'learning_rate': 0.00038074888941179257, 'epoch': 0.15}
+ 15%|█▌        | 1042/6790 [36:08<3:25:30,  2.15s/it] 15%|█▌        | 1043/6790 [36:10<3:21:09,  2.10s/it]                                                     {'loss': 1.6796, 'learning_rate': 0.00038070866532583766, 'epoch': 0.15}
+ 15%|█▌        | 1043/6790 [36:10<3:21:09,  2.10s/it] 15%|█▌        | 1044/6790 [36:12<3:13:21,  2.02s/it]                                                     {'loss': 1.456, 'learning_rate': 0.0003806684013900521, 'epoch': 0.15}
+ 15%|█▌        | 1044/6790 [36:12<3:13:21,  2.02s/it] 15%|█▌        | 1045/6790 [36:14<3:07:39,  1.96s/it]                                                     {'loss': 1.3975, 'learning_rate': 0.00038062809761331477, 'epoch': 0.15}
+ 15%|█▌        | 1045/6790 [36:14<3:07:39,  1.96s/it] 15%|█▌        | 1046/6790 [36:16<3:21:10,  2.10s/it]                                                     {'loss': 1.6633, 'learning_rate': 0.0003805877540045137, 'epoch': 0.15}
+ 15%|█▌        | 1046/6790 [36:16<3:21:10,  2.10s/it] 15%|█▌        | 1047/6790 [36:18<3:26:39,  2.16s/it]                                                     {'loss': 1.6674, 'learning_rate': 0.00038054737057254527, 'epoch': 0.15}
+ 15%|█▌        | 1047/6790 [36:18<3:26:39,  2.16s/it] 15%|█▌        | 1048/6790 [36:20<3:28:10,  2.18s/it]                                                     {'loss': 1.4519, 'learning_rate': 0.00038050694732631485, 'epoch': 0.15}
+ 15%|█▌        | 1048/6790 [36:20<3:28:10,  2.18s/it] 15%|█▌        | 1049/6790 [36:22<3:17:54,  2.07s/it]                                                     {'loss': 1.6183, 'learning_rate': 0.0003804664842747365, 'epoch': 0.15}
+ 15%|█▌        | 1049/6790 [36:22<3:17:54,  2.07s/it] 15%|█▌        | 1050/6790 [36:24<3:17:52,  2.07s/it]                                                     {'loss': 1.6019, 'learning_rate': 0.0003804259814267333, 'epoch': 0.15}
+ 15%|█▌        | 1050/6790 [36:24<3:17:52,  2.07s/it] 15%|█▌        | 1051/6790 [36:26<3:14:19,  2.03s/it]                                                     {'loss': 1.6785, 'learning_rate': 0.0003803854387912368, 'epoch': 0.15}
+ 15%|█▌        | 1051/6790 [36:26<3:14:19,  2.03s/it] 15%|█▌        | 1052/6790 [36:29<3:24:31,  2.14s/it]                                                     {'loss': 1.6016, 'learning_rate': 0.0003803448563771875, 'epoch': 0.15}
+ 15%|█▌        | 1052/6790 [36:29<3:24:31,  2.14s/it] 16%|█▌        | 1053/6790 [36:31<3:37:56,  2.28s/it]                                                     {'loss': 1.5112, 'learning_rate': 0.00038030423419353456, 'epoch': 0.16}
+ 16%|█▌        | 1053/6790 [36:31<3:37:56,  2.28s/it] 16%|█▌        | 1054/6790 [36:34<3:48:01,  2.39s/it]                                                     {'loss': 1.5265, 'learning_rate': 0.0003802635722492361, 'epoch': 0.16}
+ 16%|█▌        | 1054/6790 [36:34<3:48:01,  2.39s/it] 16%|█▌        | 1055/6790 [36:36<3:33:24,  2.23s/it]                                                     {'loss': 1.3899, 'learning_rate': 0.0003802228705532587, 'epoch': 0.16}
+ 16%|█▌        | 1055/6790 [36:36<3:33:24,  2.23s/it] 16%|█▌        | 1056/6790 [36:38<3:29:39,  2.19s/it]                                                     {'loss': 1.5856, 'learning_rate': 0.000380182129114578, 'epoch': 0.16}
+ 16%|█▌        | 1056/6790 [36:38<3:29:39,  2.19s/it] 16%|█▌        | 1057/6790 [36:40<3:21:22,  2.11s/it]                                                     {'loss': 1.655, 'learning_rate': 0.00038014134794217834, 'epoch': 0.16}
+ 16%|█▌        | 1057/6790 [36:40<3:21:22,  2.11s/it] 16%|█▌        | 1058/6790 [36:42<3:25:55,  2.16s/it]                                                     {'loss': 1.5073, 'learning_rate': 0.0003801005270450527, 'epoch': 0.16}
+ 16%|█▌        | 1058/6790 [36:42<3:25:55,  2.16s/it] 16%|█▌        | 1059/6790 [36:44<3:15:56,  2.05s/it]                                                     {'loss': 1.3617, 'learning_rate': 0.00038005966643220285, 'epoch': 0.16}
+ 16%|█▌        | 1059/6790 [36:44<3:15:56,  2.05s/it] 16%|█▌        | 1060/6790 [36:46<3:10:59,  2.00s/it]                                                     {'loss': 1.4509, 'learning_rate': 0.0003800187661126395, 'epoch': 0.16}
+ 16%|█▌        | 1060/6790 [36:46<3:10:59,  2.00s/it] 16%|█▌        | 1061/6790 [36:48<3:10:44,  2.00s/it]                                                     {'loss': 1.4197, 'learning_rate': 0.00037997782609538186, 'epoch': 0.16}
+ 16%|█▌        | 1061/6790 [36:48<3:10:44,  2.00s/it] 16%|█▌        | 1062/6790 [36:50<3:07:46,  1.97s/it]                                                     {'loss': 1.46, 'learning_rate': 0.0003799368463894581, 'epoch': 0.16}
+ 16%|█▌        | 1062/6790 [36:50<3:07:46,  1.97s/it] 16%|█▌        | 1063/6790 [36:52<3:12:41,  2.02s/it]                                                     {'loss': 1.4538, 'learning_rate': 0.0003798958270039049, 'epoch': 0.16}
+ 16%|█▌        | 1063/6790 [36:52<3:12:41,  2.02s/it] 16%|█▌        | 1064/6790 [36:54<3:10:37,  2.00s/it]                                                     {'loss': 1.6198, 'learning_rate': 0.00037985476794776804, 'epoch': 0.16}
+ 16%|█▌        | 1064/6790 [36:54<3:10:37,  2.00s/it] 16%|█▌        | 1065/6790 [36:56<3:09:00,  1.98s/it]                                                     {'loss': 1.4197, 'learning_rate': 0.00037981366923010173, 'epoch': 0.16}
+ 16%|█▌        | 1065/6790 [36:56<3:09:00,  1.98s/it] 16%|█▌        | 1066/6790 [36:58<3:10:21,  2.00s/it]                                                     {'loss': 1.6124, 'learning_rate': 0.00037977253085996906, 'epoch': 0.16}
+ 16%|█▌        | 1066/6790 [36:58<3:10:21,  2.00s/it] 16%|█▌        | 1067/6790 [37:00<3:14:06,  2.04s/it]                                                     {'loss': 1.4463, 'learning_rate': 0.00037973135284644197, 'epoch': 0.16}
+ 16%|█▌        | 1067/6790 [37:00<3:14:06,  2.04s/it] 16%|█▌        | 1068/6790 [37:02<3:09:31,  1.99s/it]                                                     {'loss': 1.6527, 'learning_rate': 0.00037969013519860087, 'epoch': 0.16}
+ 16%|█▌        | 1068/6790 [37:02<3:09:31,  1.99s/it] 16%|█▌        | 1069/6790 [37:04<3:05:16,  1.94s/it]                                                     {'loss': 1.5935, 'learning_rate': 0.0003796488779255351, 'epoch': 0.16}
+ 16%|█▌        | 1069/6790 [37:04<3:05:16,  1.94s/it] 16%|█▌        | 1070/6790 [37:06<3:10:18,  2.00s/it]                                                     {'loss': 1.5764, 'learning_rate': 0.00037960758103634275, 'epoch': 0.16}
+ 16%|█▌        | 1070/6790 [37:06<3:10:18,  2.00s/it] 16%|█▌        | 1071/6790 [37:08<3:10:19,  2.00s/it]                                                     {'loss': 1.4519, 'learning_rate': 0.0003795662445401306, 'epoch': 0.16}
+ 16%|█▌        | 1071/6790 [37:08<3:10:19,  2.00s/it] 16%|█▌        | 1072/6790 [37:10<3:08:32,  1.98s/it]                                                     {'loss': 1.4869, 'learning_rate': 0.00037952486844601416, 'epoch': 0.16}
+ 16%|█▌        | 1072/6790 [37:10<3:08:32,  1.98s/it] 16%|█▌        | 1073/6790 [37:12<3:08:33,  1.98s/it]                                                     {'loss': 1.5615, 'learning_rate': 0.0003794834527631176, 'epoch': 0.16}
+ 16%|█▌        | 1073/6790 [37:12<3:08:33,  1.98s/it] 16%|█▌        | 1074/6790 [37:18<5:14:34,  3.30s/it]                                                     {'loss': 1.6667, 'learning_rate': 0.00037944199750057406, 'epoch': 0.16}
+ 16%|█▌        | 1074/6790 [37:18<5:14:34,  3.30s/it] 16%|█▌        | 1075/6790 [37:20<4:46:58,  3.01s/it]                                                     {'loss': 1.5409, 'learning_rate': 0.00037940050266752507, 'epoch': 0.16}
+ 16%|█▌        | 1075/6790 [37:20<4:46:58,  3.01s/it] 16%|█▌        | 1076/6790 [37:22<4:18:28,  2.71s/it]                                                     {'loss': 1.5145, 'learning_rate': 0.00037935896827312113, 'epoch': 0.16}
+ 16%|█▌        | 1076/6790 [37:22<4:18:28,  2.71s/it] 16%|█▌        | 1077/6790 [37:24<3:56:21,  2.48s/it]                                                     {'loss': 1.6259, 'learning_rate': 0.0003793173943265214, 'epoch': 0.16}
+ 16%|█▌        | 1077/6790 [37:24<3:56:21,  2.48s/it] 16%|█▌        | 1078/6790 [37:26<3:42:18,  2.34s/it]                                                     {'loss': 1.502, 'learning_rate': 0.0003792757808368938, 'epoch': 0.16}
+ 16%|█▌        | 1078/6790 [37:26<3:42:18,  2.34s/it] 16%|█▌        | 1079/6790 [37:29<3:48:02,  2.40s/it]                                                     {'loss': 1.4892, 'learning_rate': 0.00037923412781341485, 'epoch': 0.16}
+ 16%|█▌        | 1079/6790 [37:29<3:48:02,  2.40s/it] 16%|█▌        | 1080/6790 [37:31<3:40:43,  2.32s/it]                                                     {'loss': 1.6301, 'learning_rate': 0.0003791924352652699, 'epoch': 0.16}
+ 16%|█▌        | 1080/6790 [37:31<3:40:43,  2.32s/it] 16%|█▌        | 1081/6790 [37:33<3:32:21,  2.23s/it]                                                     {'loss': 1.7832, 'learning_rate': 0.0003791507032016529, 'epoch': 0.16}
+ 16%|█▌        | 1081/6790 [37:33<3:32:21,  2.23s/it] 16%|█▌        | 1082/6790 [37:35<3:31:16,  2.22s/it]                                                     {'loss': 1.5723, 'learning_rate': 0.00037910893163176676, 'epoch': 0.16}
+ 16%|█▌        | 1082/6790 [37:35<3:31:16,  2.22s/it] 16%|█▌        | 1083/6790 [37:37<3:27:44,  2.18s/it]                                                     {'loss': 1.5799, 'learning_rate': 0.0003790671205648228, 'epoch': 0.16}
+ 16%|█▌        | 1083/6790 [37:37<3:27:44,  2.18s/it] 16%|█▌        | 1084/6790 [37:40<3:33:36,  2.25s/it]                                                     {'loss': 1.54, 'learning_rate': 0.0003790252700100413, 'epoch': 0.16}
+ 16%|█▌        | 1084/6790 [37:40<3:33:36,  2.25s/it] 16%|█▌        | 1085/6790 [37:42<3:30:25,  2.21s/it]                                                     {'loss': 1.6316, 'learning_rate': 0.000378983379976651, 'epoch': 0.16}
+ 16%|█▌        | 1085/6790 [37:42<3:30:25,  2.21s/it] 16%|█▌        | 1086/6790 [37:44<3:21:20,  2.12s/it]                                                     {'loss': 1.6247, 'learning_rate': 0.0003789414504738896, 'epoch': 0.16}
+ 16%|█▌        | 1086/6790 [37:44<3:21:20,  2.12s/it] 16%|█▌        | 1087/6790 [37:46<3:30:03,  2.21s/it]                                                     {'loss': 1.623, 'learning_rate': 0.00037889948151100325, 'epoch': 0.16}
+ 16%|█▌        | 1087/6790 [37:46<3:30:03,  2.21s/it] 16%|█▌        | 1088/6790 [37:48<3:32:38,  2.24s/it]                                                     {'loss': 1.69, 'learning_rate': 0.0003788574730972471, 'epoch': 0.16}
+ 16%|█▌        | 1088/6790 [37:48<3:32:38,  2.24s/it] 16%|█▌        | 1089/6790 [37:50<3:28:26,  2.19s/it]                                                     {'loss': 1.4626, 'learning_rate': 0.00037881542524188474, 'epoch': 0.16}
+ 16%|█▌        | 1089/6790 [37:51<3:28:26,  2.19s/it] 16%|█▌        | 1090/6790 [37:53<3:29:35,  2.21s/it]                                                     {'loss': 1.487, 'learning_rate': 0.0003787733379541885, 'epoch': 0.16}
+ 16%|█▌        | 1090/6790 [37:53<3:29:35,  2.21s/it] 16%|█▌        | 1091/6790 [37:55<3:28:43,  2.20s/it]                                                     {'loss': 1.4927, 'learning_rate': 0.0003787312112434395, 'epoch': 0.16}
+ 16%|█▌        | 1091/6790 [37:55<3:28:43,  2.20s/it] 16%|█▌        | 1092/6790 [37:57<3:18:02,  2.09s/it]                                                     {'loss': 1.6588, 'learning_rate': 0.00037868904511892767, 'epoch': 0.16}
+ 16%|█▌        | 1092/6790 [37:57<3:18:02,  2.09s/it] 16%|█▌        | 1093/6790 [37:59<3:27:43,  2.19s/it]                                                     {'loss': 1.6543, 'learning_rate': 0.0003786468395899513, 'epoch': 0.16}
+ 16%|█▌        | 1093/6790 [37:59<3:27:43,  2.19s/it] 16%|█▌        | 1094/6790 [38:01<3:17:06,  2.08s/it]                                                     {'loss': 1.387, 'learning_rate': 0.0003786045946658175, 'epoch': 0.16}
+ 16%|█▌        | 1094/6790 [38:01<3:17:06,  2.08s/it] 16%|█▌        | 1095/6790 [38:03<3:16:46,  2.07s/it]                                                     {'loss': 1.5381, 'learning_rate': 0.0003785623103558422, 'epoch': 0.16}
+ 16%|█▌        | 1095/6790 [38:03<3:16:46,  2.07s/it] 16%|█▌        | 1096/6790 [38:05<3:25:20,  2.16s/it]                                                     {'loss': 1.4175, 'learning_rate': 0.00037851998666934997, 'epoch': 0.16}
+ 16%|█▌        | 1096/6790 [38:05<3:25:20,  2.16s/it] 16%|█▌        | 1097/6790 [38:07<3:22:48,  2.14s/it]                                                     {'loss': 1.5178, 'learning_rate': 0.00037847762361567397, 'epoch': 0.16}
+ 16%|█▌        | 1097/6790 [38:07<3:22:48,  2.14s/it] 16%|█▌        | 1098/6790 [38:10<3:28:19,  2.20s/it]                                                     {'loss': 1.3961, 'learning_rate': 0.00037843522120415606, 'epoch': 0.16}
+ 16%|█▌        | 1098/6790 [38:10<3:28:19,  2.20s/it] 16%|█▌        | 1099/6790 [38:12<3:21:34,  2.13s/it]                                                     {'loss': 1.7324, 'learning_rate': 0.00037839277944414683, 'epoch': 0.16}
+ 16%|█▌        | 1099/6790 [38:12<3:21:34,  2.13s/it] 16%|█▌        | 1100/6790 [38:14<3:19:53,  2.11s/it]                                                     {'loss': 1.7115, 'learning_rate': 0.0003783502983450055, 'epoch': 0.16}
+ 16%|█▌        | 1100/6790 [38:14<3:19:53,  2.11s/it] 16%|█▌        | 1101/6790 [38:16<3:15:47,  2.06s/it]                                                     {'loss': 1.5103, 'learning_rate': 0.00037830777791610006, 'epoch': 0.16}
+ 16%|█▌        | 1101/6790 [38:16<3:15:47,  2.06s/it] 16%|█▌        | 1102/6790 [38:18<3:16:06,  2.07s/it]                                                     {'loss': 1.3496, 'learning_rate': 0.00037826521816680713, 'epoch': 0.16}
+ 16%|█▌        | 1102/6790 [38:18<3:16:06,  2.07s/it] 16%|█▌        | 1103/6790 [38:20<3:22:31,  2.14s/it]                                                     {'loss': 1.4635, 'learning_rate': 0.0003782226191065118, 'epoch': 0.16}
+ 16%|█▌        | 1103/6790 [38:20<3:22:31,  2.14s/it] 16%|█▋        | 1104/6790 [38:22<3:13:16,  2.04s/it]                                                     {'loss': 1.5867, 'learning_rate': 0.0003781799807446082, 'epoch': 0.16}
+ 16%|█▋        | 1104/6790 [38:22<3:13:16,  2.04s/it] 16%|█▋        | 1105/6790 [38:25<3:29:11,  2.21s/it]                                                     {'loss': 1.495, 'learning_rate': 0.00037813730309049884, 'epoch': 0.16}
+ 16%|█▋        | 1105/6790 [38:25<3:29:11,  2.21s/it] 16%|█▋        | 1106/6790 [38:28<3:49:02,  2.42s/it]                                                     {'loss': 1.4524, 'learning_rate': 0.00037809458615359494, 'epoch': 0.16}
+ 16%|█▋        | 1106/6790 [38:28<3:49:02,  2.42s/it] 16%|█▋        | 1107/6790 [38:30<3:40:25,  2.33s/it]                                                     {'loss': 1.6328, 'learning_rate': 0.00037805182994331656, 'epoch': 0.16}
+ 16%|█▋        | 1107/6790 [38:30<3:40:25,  2.33s/it] 16%|█▋        | 1108/6790 [38:32<3:30:22,  2.22s/it]                                                     {'loss': 1.5589, 'learning_rate': 0.00037800903446909214, 'epoch': 0.16}
+ 16%|█▋        | 1108/6790 [38:32<3:30:22,  2.22s/it] 16%|█▋        | 1109/6790 [38:34<3:25:08,  2.17s/it]                                                     {'loss': 1.6192, 'learning_rate': 0.000377966199740359, 'epoch': 0.16}
+ 16%|█▋        | 1109/6790 [38:34<3:25:08,  2.17s/it] 16%|█▋        | 1110/6790 [38:36<3:23:15,  2.15s/it]                                                     {'loss': 1.4888, 'learning_rate': 0.0003779233257665631, 'epoch': 0.16}
+ 16%|█▋        | 1110/6790 [38:36<3:23:15,  2.15s/it] 16%|█▋        | 1111/6790 [38:38<3:23:32,  2.15s/it]                                                     {'loss': 1.7047, 'learning_rate': 0.0003778804125571589, 'epoch': 0.16}
+ 16%|█▋        | 1111/6790 [38:38<3:23:32,  2.15s/it] 16%|█▋        | 1112/6790 [38:40<3:15:02,  2.06s/it]                                                     {'loss': 1.4217, 'learning_rate': 0.00037783746012160966, 'epoch': 0.16}
+ 16%|█▋        | 1112/6790 [38:40<3:15:02,  2.06s/it] 16%|█▋        | 1113/6790 [38:42<3:11:16,  2.02s/it]                                                     {'loss': 1.5148, 'learning_rate': 0.00037779446846938723, 'epoch': 0.16}
+ 16%|█▋        | 1113/6790 [38:42<3:11:16,  2.02s/it] 16%|█▋        | 1114/6790 [38:44<3:10:43,  2.02s/it]                                                     {'loss': 1.5127, 'learning_rate': 0.00037775143760997214, 'epoch': 0.16}
+ 16%|█▋        | 1114/6790 [38:44<3:10:43,  2.02s/it] 16%|█▋        | 1115/6790 [38:45<3:02:47,  1.93s/it]                                                     {'loss': 1.5641, 'learning_rate': 0.0003777083675528535, 'epoch': 0.16}
+ 16%|█▋        | 1115/6790 [38:45<3:02:47,  1.93s/it] 16%|█▋        | 1116/6790 [38:48<3:16:48,  2.08s/it]                                                     {'loss': 1.5974, 'learning_rate': 0.0003776652583075292, 'epoch': 0.16}
+ 16%|█▋        | 1116/6790 [38:48<3:16:48,  2.08s/it] 16%|█▋        | 1117/6790 [38:50<3:18:22,  2.10s/it]                                                     {'loss': 1.5172, 'learning_rate': 0.00037762210988350554, 'epoch': 0.16}
+ 16%|█▋        | 1117/6790 [38:50<3:18:22,  2.10s/it] 16%|█▋        | 1118/6790 [38:52<3:10:23,  2.01s/it]                                                     {'loss': 1.7894, 'learning_rate': 0.0003775789222902977, 'epoch': 0.16}
+ 16%|█▋        | 1118/6790 [38:52<3:10:23,  2.01s/it] 16%|█▋        | 1119/6790 [38:54<3:07:35,  1.98s/it]                                                     {'loss': 1.5603, 'learning_rate': 0.0003775356955374294, 'epoch': 0.16}
+ 16%|█▋        | 1119/6790 [38:54<3:07:35,  1.98s/it] 16%|█▋        | 1120/6790 [38:56<3:09:24,  2.00s/it]                                                     {'loss': 1.5561, 'learning_rate': 0.0003774924296344329, 'epoch': 0.16}
+ 16%|█▋        | 1120/6790 [38:56<3:09:24,  2.00s/it] 17%|█▋        | 1121/6790 [38:58<3:14:13,  2.06s/it]                                                     {'loss': 1.5745, 'learning_rate': 0.00037744912459084927, 'epoch': 0.17}
+ 17%|█▋        | 1121/6790 [38:58<3:14:13,  2.06s/it] 17%|█▋        | 1122/6790 [39:00<3:20:44,  2.13s/it]                                                     {'loss': 1.5125, 'learning_rate': 0.0003774057804162281, 'epoch': 0.17}
+ 17%|█▋        | 1122/6790 [39:00<3:20:44,  2.13s/it] 17%|█▋        | 1123/6790 [39:02<3:10:25,  2.02s/it]                                                     {'loss': 1.5103, 'learning_rate': 0.00037736239712012764, 'epoch': 0.17}
+ 17%|█▋        | 1123/6790 [39:02<3:10:25,  2.02s/it] 17%|█▋        | 1124/6790 [39:04<3:07:28,  1.99s/it]                                                     {'loss': 1.3298, 'learning_rate': 0.00037731897471211486, 'epoch': 0.17}
+ 17%|█▋        | 1124/6790 [39:04<3:07:28,  1.99s/it] 17%|█▋        | 1125/6790 [39:06<3:16:06,  2.08s/it]                                                     {'loss': 1.6215, 'learning_rate': 0.00037727551320176515, 'epoch': 0.17}
+ 17%|█▋        | 1125/6790 [39:06<3:16:06,  2.08s/it] 17%|█▋        | 1126/6790 [39:08<3:19:37,  2.11s/it]                                                     {'loss': 1.2994, 'learning_rate': 0.00037723201259866253, 'epoch': 0.17}
+ 17%|█▋        | 1126/6790 [39:08<3:19:37,  2.11s/it] 17%|█▋        | 1127/6790 [39:11<3:26:05,  2.18s/it]                                                     {'loss': 1.3822, 'learning_rate': 0.0003771884729124, 'epoch': 0.17}
+ 17%|█▋        | 1127/6790 [39:11<3:26:05,  2.18s/it] 17%|█▋        | 1128/6790 [39:13<3:17:40,  2.09s/it]                                                     {'loss': 1.4761, 'learning_rate': 0.0003771448941525787, 'epoch': 0.17}
+ 17%|█▋        | 1128/6790 [39:13<3:17:40,  2.09s/it] 17%|█▋        | 1129/6790 [39:15<3:15:14,  2.07s/it]                                                     {'loss': 1.6481, 'learning_rate': 0.0003771012763288087, 'epoch': 0.17}
+ 17%|█▋        | 1129/6790 [39:15<3:15:14,  2.07s/it] 17%|█▋        | 1130/6790 [39:16<3:07:07,  1.98s/it]                                                     {'loss': 1.4232, 'learning_rate': 0.00037705761945070864, 'epoch': 0.17}
+ 17%|█▋        | 1130/6790 [39:16<3:07:07,  1.98s/it] 17%|█▋        | 1131/6790 [39:19<3:26:52,  2.19s/it]                                                     {'loss': 1.3731, 'learning_rate': 0.00037701392352790556, 'epoch': 0.17}
+ 17%|█▋        | 1131/6790 [39:19<3:26:52,  2.19s/it] 17%|█▋        | 1132/6790 [39:21<3:16:04,  2.08s/it]                                                     {'loss': 1.2586, 'learning_rate': 0.00037697018857003547, 'epoch': 0.17}
+ 17%|█▋        | 1132/6790 [39:21<3:16:04,  2.08s/it] 17%|█▋        | 1133/6790 [39:23<3:21:07,  2.13s/it]                                                     {'loss': 1.5202, 'learning_rate': 0.0003769264145867426, 'epoch': 0.17}
+ 17%|█▋        | 1133/6790 [39:23<3:21:07,  2.13s/it] 17%|█▋        | 1134/6790 [39:25<3:16:31,  2.08s/it]                                                     {'loss': 1.9012, 'learning_rate': 0.0003768826015876802, 'epoch': 0.17}
+ 17%|█▋        | 1134/6790 [39:25<3:16:31,  2.08s/it] 17%|█▋        | 1135/6790 [39:27<3:20:23,  2.13s/it]                                                     {'loss': 1.6034, 'learning_rate': 0.0003768387495825098, 'epoch': 0.17}
+ 17%|█▋        | 1135/6790 [39:27<3:20:23,  2.13s/it] 17%|█▋        | 1136/6790 [39:30<3:28:47,  2.22s/it]                                                     {'loss': 1.5443, 'learning_rate': 0.00037679485858090154, 'epoch': 0.17}
+ 17%|█▋        | 1136/6790 [39:30<3:28:47,  2.22s/it] 17%|█▋        | 1137/6790 [39:32<3:19:35,  2.12s/it]                                                     {'loss': 1.4899, 'learning_rate': 0.0003767509285925344, 'epoch': 0.17}
+ 17%|█▋        | 1137/6790 [39:32<3:19:35,  2.12s/it] 17%|█▋        | 1138/6790 [39:34<3:17:11,  2.09s/it]                                                     {'loss': 1.5964, 'learning_rate': 0.00037670695962709565, 'epoch': 0.17}
+ 17%|█▋        | 1138/6790 [39:34<3:17:11,  2.09s/it] 17%|█▋        | 1139/6790 [39:36<3:10:37,  2.02s/it]                                                     {'loss': 1.3956, 'learning_rate': 0.0003766629516942814, 'epoch': 0.17}
+ 17%|█▋        | 1139/6790 [39:36<3:10:37,  2.02s/it] 17%|█▋        | 1140/6790 [39:38<3:17:52,  2.10s/it]                                                     {'loss': 1.559, 'learning_rate': 0.00037661890480379634, 'epoch': 0.17}
+ 17%|█▋        | 1140/6790 [39:38<3:17:52,  2.10s/it] 17%|█▋        | 1141/6790 [39:40<3:24:15,  2.17s/it]                                                     {'loss': 1.5645, 'learning_rate': 0.00037657481896535356, 'epoch': 0.17}
+ 17%|█▋        | 1141/6790 [39:40<3:24:15,  2.17s/it] 17%|█▋        | 1142/6790 [39:42<3:17:35,  2.10s/it]                                                     {'loss': 1.4451, 'learning_rate': 0.00037653069418867494, 'epoch': 0.17}
+ 17%|█▋        | 1142/6790 [39:42<3:17:35,  2.10s/it] 17%|█▋        | 1143/6790 [39:44<3:13:59,  2.06s/it]                                                     {'loss': 1.5922, 'learning_rate': 0.00037648653048349083, 'epoch': 0.17}
+ 17%|█▋        | 1143/6790 [39:44<3:13:59,  2.06s/it] 17%|█▋        | 1144/6790 [39:46<3:12:19,  2.04s/it]                                                     {'loss': 1.6469, 'learning_rate': 0.00037644232785954024, 'epoch': 0.17}
+ 17%|█▋        | 1144/6790 [39:46<3:12:19,  2.04s/it] 17%|█▋        | 1145/6790 [39:48<3:17:38,  2.10s/it]                                                     {'loss': 1.4667, 'learning_rate': 0.00037639808632657063, 'epoch': 0.17}
+ 17%|█▋        | 1145/6790 [39:48<3:17:38,  2.10s/it] 17%|█▋        | 1146/6790 [39:50<3:16:39,  2.09s/it]                                                     {'loss': 1.6246, 'learning_rate': 0.00037635380589433825, 'epoch': 0.17}
+ 17%|█▋        | 1146/6790 [39:50<3:16:39,  2.09s/it] 17%|█▋        | 1147/6790 [39:52<3:11:57,  2.04s/it]                                                     {'loss': 1.4398, 'learning_rate': 0.00037630948657260774, 'epoch': 0.17}
+ 17%|█▋        | 1147/6790 [39:52<3:11:57,  2.04s/it] 17%|█▋        | 1148/6790 [39:54<3:12:36,  2.05s/it]                                                     {'loss': 1.6503, 'learning_rate': 0.00037626512837115233, 'epoch': 0.17}
+ 17%|█▋        | 1148/6790 [39:54<3:12:36,  2.05s/it] 17%|█▋        | 1149/6790 [39:57<3:18:51,  2.12s/it]                                                     {'loss': 1.7182, 'learning_rate': 0.000376220731299754, 'epoch': 0.17}
+ 17%|█▋        | 1149/6790 [39:57<3:18:51,  2.12s/it] 17%|█▋        | 1150/6790 [39:59<3:26:13,  2.19s/it]                                                     {'loss': 1.6444, 'learning_rate': 0.00037617629536820313, 'epoch': 0.17}
+ 17%|█▋        | 1150/6790 [39:59<3:26:13,  2.19s/it] 17%|█▋        | 1151/6790 [40:01<3:27:27,  2.21s/it]                                                     {'loss': 1.4967, 'learning_rate': 0.00037613182058629865, 'epoch': 0.17}
+ 17%|█▋        | 1151/6790 [40:01<3:27:27,  2.21s/it] 17%|█▋        | 1152/6790 [40:03<3:22:51,  2.16s/it]                                                     {'loss': 1.5361, 'learning_rate': 0.00037608730696384827, 'epoch': 0.17}
+ 17%|█▋        | 1152/6790 [40:03<3:22:51,  2.16s/it] 17%|█▋        | 1153/6790 [40:06<3:23:46,  2.17s/it]                                                     {'loss': 1.512, 'learning_rate': 0.000376042754510668, 'epoch': 0.17}
+ 17%|█▋        | 1153/6790 [40:06<3:23:46,  2.17s/it] 17%|█▋        | 1154/6790 [40:07<3:17:59,  2.11s/it]                                                     {'loss': 1.4509, 'learning_rate': 0.0003759981632365826, 'epoch': 0.17}
+ 17%|█▋        | 1154/6790 [40:07<3:17:59,  2.11s/it] 17%|█▋        | 1155/6790 [40:09<3:11:48,  2.04s/it]                                                     {'loss': 1.5315, 'learning_rate': 0.0003759535331514254, 'epoch': 0.17}
+ 17%|█▋        | 1155/6790 [40:09<3:11:48,  2.04s/it] 17%|█▋        | 1156/6790 [40:11<3:11:01,  2.03s/it]                                                     {'loss': 1.4581, 'learning_rate': 0.00037590886426503806, 'epoch': 0.17}
+ 17%|█▋        | 1156/6790 [40:11<3:11:01,  2.03s/it] 17%|█▋        | 1157/6790 [40:14<3:14:49,  2.08s/it]                                                     {'loss': 1.5873, 'learning_rate': 0.000375864156587271, 'epoch': 0.17}
+ 17%|█▋        | 1157/6790 [40:14<3:14:49,  2.08s/it] 17%|█▋        | 1158/6790 [40:16<3:18:02,  2.11s/it]                                                     {'loss': 1.5601, 'learning_rate': 0.0003758194101279831, 'epoch': 0.17}
+ 17%|█▋        | 1158/6790 [40:16<3:18:02,  2.11s/it] 17%|█▋        | 1159/6790 [40:18<3:20:52,  2.14s/it]                                                     {'loss': 1.3178, 'learning_rate': 0.00037577462489704204, 'epoch': 0.17}
+ 17%|█▋        | 1159/6790 [40:18<3:20:52,  2.14s/it] 17%|█▋        | 1160/6790 [40:20<3:15:11,  2.08s/it]                                                     {'loss': 1.4627, 'learning_rate': 0.00037572980090432365, 'epoch': 0.17}
+ 17%|█▋        | 1160/6790 [40:20<3:15:11,  2.08s/it] 17%|█▋        | 1161/6790 [40:22<3:15:24,  2.08s/it]                                                     {'loss': 1.4805, 'learning_rate': 0.00037568493815971256, 'epoch': 0.17}
+ 17%|█▋        | 1161/6790 [40:22<3:15:24,  2.08s/it] 17%|█▋        | 1162/6790 [40:24<3:13:16,  2.06s/it]                                                     {'loss': 1.6381, 'learning_rate': 0.00037564003667310195, 'epoch': 0.17}
+ 17%|█▋        | 1162/6790 [40:24<3:13:16,  2.06s/it] 17%|█▋        | 1163/6790 [40:26<3:09:12,  2.02s/it]                                                     {'loss': 1.6207, 'learning_rate': 0.00037559509645439335, 'epoch': 0.17}
+ 17%|█▋        | 1163/6790 [40:26<3:09:12,  2.02s/it] 17%|█▋        | 1164/6790 [40:28<3:18:22,  2.12s/it]                                                     {'loss': 1.4092, 'learning_rate': 0.00037555011751349714, 'epoch': 0.17}
+ 17%|█▋        | 1164/6790 [40:28<3:18:22,  2.12s/it] 17%|█▋        | 1165/6790 [40:30<3:20:19,  2.14s/it]                                                     {'loss': 1.5416, 'learning_rate': 0.0003755050998603319, 'epoch': 0.17}
+ 17%|█▋        | 1165/6790 [40:30<3:20:19,  2.14s/it] 17%|█▋        | 1166/6790 [40:33<3:18:31,  2.12s/it]                                                     {'loss': 1.6204, 'learning_rate': 0.000375460043504825, 'epoch': 0.17}
+ 17%|█▋        | 1166/6790 [40:33<3:18:31,  2.12s/it] 17%|█▋        | 1167/6790 [40:34<3:13:20,  2.06s/it]                                                     {'loss': 1.5336, 'learning_rate': 0.00037541494845691226, 'epoch': 0.17}
+ 17%|█▋        | 1167/6790 [40:34<3:13:20,  2.06s/it] 17%|█▋        | 1168/6790 [40:36<3:12:25,  2.05s/it]                                                     {'loss': 1.6359, 'learning_rate': 0.000375369814726538, 'epoch': 0.17}
+ 17%|█▋        | 1168/6790 [40:37<3:12:25,  2.05s/it] 17%|█▋        | 1169/6790 [40:38<3:08:38,  2.01s/it]                                                     {'loss': 1.7406, 'learning_rate': 0.0003753246423236551, 'epoch': 0.17}
+ 17%|█▋        | 1169/6790 [40:38<3:08:38,  2.01s/it] 17%|█▋        | 1170/6790 [40:40<3:06:59,  2.00s/it]                                                     {'loss': 1.478, 'learning_rate': 0.000375279431258225, 'epoch': 0.17}
+ 17%|█▋        | 1170/6790 [40:40<3:06:59,  2.00s/it] 17%|█▋        | 1171/6790 [40:42<3:00:10,  1.92s/it]                                                     {'loss': 1.5098, 'learning_rate': 0.00037523418154021765, 'epoch': 0.17}
+ 17%|█▋        | 1171/6790 [40:42<3:00:10,  1.92s/it] 17%|█▋        | 1172/6790 [40:44<3:01:42,  1.94s/it]                                                     {'loss': 1.6203, 'learning_rate': 0.0003751888931796114, 'epoch': 0.17}
+ 17%|█▋        | 1172/6790 [40:44<3:01:42,  1.94s/it] 17%|█▋        | 1173/6790 [40:46<3:00:26,  1.93s/it]                                                     {'loss': 1.5906, 'learning_rate': 0.0003751435661863933, 'epoch': 0.17}
+ 17%|█▋        | 1173/6790 [40:46<3:00:26,  1.93s/it] 17%|█▋        | 1174/6790 [40:48<3:04:54,  1.98s/it]                                                     {'loss': 1.4676, 'learning_rate': 0.0003750982005705589, 'epoch': 0.17}
+ 17%|█▋        | 1174/6790 [40:48<3:04:54,  1.98s/it] 17%|█▋        | 1175/6790 [40:50<3:06:04,  1.99s/it]                                                     {'loss': 1.4966, 'learning_rate': 0.0003750527963421121, 'epoch': 0.17}
+ 17%|█▋        | 1175/6790 [40:50<3:06:04,  1.99s/it] 17%|█▋        | 1176/6790 [40:52<3:14:26,  2.08s/it]                                                     {'loss': 1.4652, 'learning_rate': 0.00037500735351106554, 'epoch': 0.17}
+ 17%|█▋        | 1176/6790 [40:52<3:14:26,  2.08s/it] 17%|█▋        | 1177/6790 [40:54<3:05:52,  1.99s/it]                                                     {'loss': 1.5825, 'learning_rate': 0.0003749618720874402, 'epoch': 0.17}
+ 17%|█▋        | 1177/6790 [40:54<3:05:52,  1.99s/it] 17%|█▋        | 1178/6790 [40:56<3:04:28,  1.97s/it]                                                     {'loss': 1.3793, 'learning_rate': 0.0003749163520812656, 'epoch': 0.17}
+ 17%|█▋        | 1178/6790 [40:56<3:04:28,  1.97s/it] 17%|█▋        | 1179/6790 [40:58<3:02:39,  1.95s/it]                                                     {'loss': 1.5097, 'learning_rate': 0.00037487079350257985, 'epoch': 0.17}
+ 17%|█▋        | 1179/6790 [40:58<3:02:39,  1.95s/it] 17%|█▋        | 1180/6790 [41:00<2:57:16,  1.90s/it]                                                     {'loss': 1.4421, 'learning_rate': 0.0003748251963614296, 'epoch': 0.17}
+ 17%|█▋        | 1180/6790 [41:00<2:57:16,  1.90s/it] 17%|█▋        | 1181/6790 [41:02<3:02:22,  1.95s/it]                                                     {'loss': 1.4073, 'learning_rate': 0.0003747795606678697, 'epoch': 0.17}
+ 17%|█▋        | 1181/6790 [41:02<3:02:22,  1.95s/it] 17%|█▋        | 1182/6790 [41:04<3:05:11,  1.98s/it]                                                     {'loss': 1.447, 'learning_rate': 0.00037473388643196394, 'epoch': 0.17}
+ 17%|█▋        | 1182/6790 [41:04<3:05:11,  1.98s/it] 17%|█▋        | 1183/6790 [41:06<3:02:41,  1.95s/it]                                                     {'loss': 1.6815, 'learning_rate': 0.0003746881736637843, 'epoch': 0.17}
+ 17%|█▋        | 1183/6790 [41:06<3:02:41,  1.95s/it] 17%|█▋        | 1184/6790 [41:08<3:08:38,  2.02s/it]                                                     {'loss': 1.5083, 'learning_rate': 0.0003746424223734113, 'epoch': 0.17}
+ 17%|█▋        | 1184/6790 [41:08<3:08:38,  2.02s/it] 17%|█▋        | 1185/6790 [41:10<3:07:49,  2.01s/it]                                                     {'loss': 1.6192, 'learning_rate': 0.00037459663257093405, 'epoch': 0.17}
+ 17%|█▋        | 1185/6790 [41:10<3:07:49,  2.01s/it] 17%|█▋        | 1186/6790 [41:12<3:10:45,  2.04s/it]                                                     {'loss': 1.7711, 'learning_rate': 0.0003745508042664502, 'epoch': 0.17}
+ 17%|█▋        | 1186/6790 [41:12<3:10:45,  2.04s/it] 17%|█▋        | 1187/6790 [41:14<3:11:57,  2.06s/it]                                                     {'loss': 1.5947, 'learning_rate': 0.0003745049374700656, 'epoch': 0.17}
+ 17%|█▋        | 1187/6790 [41:14<3:11:57,  2.06s/it] 17%|█▋        | 1188/6790 [41:16<3:16:11,  2.10s/it]                                                     {'loss': 1.4428, 'learning_rate': 0.00037445903219189493, 'epoch': 0.17}
+ 17%|█▋        | 1188/6790 [41:16<3:16:11,  2.10s/it] 18%|█▊        | 1189/6790 [41:19<3:19:12,  2.13s/it]                                                     {'loss': 1.6238, 'learning_rate': 0.0003744130884420612, 'epoch': 0.18}
+ 18%|█▊        | 1189/6790 [41:19<3:19:12,  2.13s/it] 18%|█▊        | 1190/6790 [41:21<3:14:18,  2.08s/it]                                                     {'loss': 1.6346, 'learning_rate': 0.00037436710623069586, 'epoch': 0.18}
+ 18%|█▊        | 1190/6790 [41:21<3:14:18,  2.08s/it] 18%|█▊        | 1191/6790 [41:23<3:15:43,  2.10s/it]                                                     {'loss': 1.597, 'learning_rate': 0.00037432108556793896, 'epoch': 0.18}
+ 18%|█▊        | 1191/6790 [41:23<3:15:43,  2.10s/it] 18%|█▊        | 1192/6790 [41:25<3:15:19,  2.09s/it]                                                     {'loss': 1.6644, 'learning_rate': 0.00037427502646393887, 'epoch': 0.18}
+ 18%|█▊        | 1192/6790 [41:25<3:15:19,  2.09s/it] 18%|█▊        | 1193/6790 [41:27<3:11:39,  2.05s/it]                                                     {'loss': 1.3509, 'learning_rate': 0.00037422892892885267, 'epoch': 0.18}
+ 18%|█▊        | 1193/6790 [41:27<3:11:39,  2.05s/it] 18%|█▊        | 1194/6790 [41:29<3:09:57,  2.04s/it]                                                     {'loss': 1.5146, 'learning_rate': 0.0003741827929728456, 'epoch': 0.18}
+ 18%|█▊        | 1194/6790 [41:29<3:09:57,  2.04s/it] 18%|█▊        | 1195/6790 [41:31<3:07:25,  2.01s/it]                                                     {'loss': 1.4539, 'learning_rate': 0.0003741366186060917, 'epoch': 0.18}
+ 18%|█▊        | 1195/6790 [41:31<3:07:25,  2.01s/it] 18%|█▊        | 1196/6790 [41:33<3:05:25,  1.99s/it]                                                     {'loss': 1.4886, 'learning_rate': 0.00037409040583877333, 'epoch': 0.18}
+ 18%|█▊        | 1196/6790 [41:33<3:05:25,  1.99s/it] 18%|█▊        | 1197/6790 [41:34<2:59:39,  1.93s/it]                                                     {'loss': 1.6293, 'learning_rate': 0.00037404415468108123, 'epoch': 0.18}
+ 18%|█▊        | 1197/6790 [41:34<2:59:39,  1.93s/it] 18%|█▊        | 1198/6790 [41:37<3:04:57,  1.98s/it]                                                     {'loss': 1.7132, 'learning_rate': 0.0003739978651432147, 'epoch': 0.18}
+ 18%|█▊        | 1198/6790 [41:37<3:04:57,  1.98s/it] 18%|█▊        | 1199/6790 [41:38<3:02:05,  1.95s/it]                                                     {'loss': 1.3669, 'learning_rate': 0.00037395153723538153, 'epoch': 0.18}
+ 18%|█▊        | 1199/6790 [41:38<3:02:05,  1.95s/it] 18%|█▊        | 1200/6790 [41:40<3:05:10,  1.99s/it]                                                     {'loss': 1.595, 'learning_rate': 0.000373905170967798, 'epoch': 0.18}
+ 18%|█▊        | 1200/6790 [41:40<3:05:10,  1.99s/it] 18%|█▊        | 1201/6790 [41:44<3:38:33,  2.35s/it]                                                     {'loss': 1.4819, 'learning_rate': 0.00037385876635068866, 'epoch': 0.18}
+ 18%|█▊        | 1201/6790 [41:44<3:38:33,  2.35s/it] 18%|█▊        | 1202/6790 [41:46<3:30:18,  2.26s/it]                                                     {'loss': 1.5423, 'learning_rate': 0.00037381232339428667, 'epoch': 0.18}
+ 18%|█▊        | 1202/6790 [41:46<3:30:18,  2.26s/it] 18%|█▊        | 1203/6790 [41:48<3:33:58,  2.30s/it]                                                     {'loss': 1.524, 'learning_rate': 0.00037376584210883375, 'epoch': 0.18}
+ 18%|█▊        | 1203/6790 [41:48<3:33:58,  2.30s/it] 18%|█▊        | 1204/6790 [41:50<3:28:21,  2.24s/it]                                                     {'loss': 1.6132, 'learning_rate': 0.0003737193225045798, 'epoch': 0.18}
+ 18%|█▊        | 1204/6790 [41:50<3:28:21,  2.24s/it] 18%|█▊        | 1205/6790 [41:52<3:21:09,  2.16s/it]                                                     {'loss': 1.7726, 'learning_rate': 0.00037367276459178336, 'epoch': 0.18}
+ 18%|█▊        | 1205/6790 [41:52<3:21:09,  2.16s/it] 18%|█▊        | 1206/6790 [41:54<3:06:50,  2.01s/it]                                                     {'loss': 1.4751, 'learning_rate': 0.0003736261683807114, 'epoch': 0.18}
+ 18%|█▊        | 1206/6790 [41:54<3:06:50,  2.01s/it] 18%|█▊        | 1207/6790 [41:56<3:01:11,  1.95s/it]                                                     {'loss': 1.544, 'learning_rate': 0.0003735795338816393, 'epoch': 0.18}
+ 18%|█▊        | 1207/6790 [41:56<3:01:11,  1.95s/it] 18%|█▊        | 1208/6790 [41:58<3:22:03,  2.17s/it]                                                     {'loss': 1.7398, 'learning_rate': 0.00037353286110485077, 'epoch': 0.18}
+ 18%|█▊        | 1208/6790 [41:58<3:22:03,  2.17s/it] 18%|█▊        | 1209/6790 [42:00<3:15:34,  2.10s/it]                                                     {'loss': 1.6588, 'learning_rate': 0.00037348615006063825, 'epoch': 0.18}
+ 18%|█▊        | 1209/6790 [42:00<3:15:34,  2.10s/it] 18%|█▊        | 1210/6790 [42:02<3:15:42,  2.10s/it]                                                     {'loss': 1.7667, 'learning_rate': 0.00037343940075930236, 'epoch': 0.18}
+ 18%|█▊        | 1210/6790 [42:02<3:15:42,  2.10s/it] 18%|█▊        | 1211/6790 [42:06<3:45:04,  2.42s/it]                                                     {'loss': 1.7481, 'learning_rate': 0.00037339261321115227, 'epoch': 0.18}
+ 18%|█▊        | 1211/6790 [42:06<3:45:04,  2.42s/it] 18%|█▊        | 1212/6790 [42:08<3:37:36,  2.34s/it]                                                     {'loss': 1.766, 'learning_rate': 0.00037334578742650553, 'epoch': 0.18}
+ 18%|█▊        | 1212/6790 [42:08<3:37:36,  2.34s/it] 18%|█▊        | 1213/6790 [42:10<3:33:57,  2.30s/it]                                                     {'loss': 1.4553, 'learning_rate': 0.00037329892341568814, 'epoch': 0.18}
+ 18%|█▊        | 1213/6790 [42:10<3:33:57,  2.30s/it] 18%|█▊        | 1214/6790 [42:12<3:23:07,  2.19s/it]                                                     {'loss': 1.729, 'learning_rate': 0.00037325202118903465, 'epoch': 0.18}
+ 18%|█▊        | 1214/6790 [42:12<3:23:07,  2.19s/it] 18%|█▊        | 1215/6790 [42:14<3:14:52,  2.10s/it]                                                     {'loss': 1.6388, 'learning_rate': 0.00037320508075688776, 'epoch': 0.18}
+ 18%|█▊        | 1215/6790 [42:14<3:14:52,  2.10s/it] 18%|█▊        | 1216/6790 [42:16<3:09:33,  2.04s/it]                                                     {'loss': 1.5526, 'learning_rate': 0.00037315810212959884, 'epoch': 0.18}
+ 18%|█▊        | 1216/6790 [42:16<3:09:33,  2.04s/it] 18%|█▊        | 1217/6790 [42:18<3:07:17,  2.02s/it]                                                     {'loss': 1.5791, 'learning_rate': 0.00037311108531752765, 'epoch': 0.18}
+ 18%|█▊        | 1217/6790 [42:18<3:07:17,  2.02s/it] 18%|█▊        | 1218/6790 [42:20<3:09:16,  2.04s/it]                                                     {'loss': 1.5116, 'learning_rate': 0.0003730640303310423, 'epoch': 0.18}
+ 18%|█▊        | 1218/6790 [42:20<3:09:16,  2.04s/it] 18%|█▊        | 1219/6790 [42:21<3:02:20,  1.96s/it]                                                     {'loss': 1.4654, 'learning_rate': 0.00037301693718051933, 'epoch': 0.18}
+ 18%|█▊        | 1219/6790 [42:21<3:02:20,  1.96s/it] 18%|█▊        | 1220/6790 [42:23<3:02:18,  1.96s/it]                                                     {'loss': 1.4998, 'learning_rate': 0.0003729698058763437, 'epoch': 0.18}
+ 18%|█▊        | 1220/6790 [42:23<3:02:18,  1.96s/it] 18%|█▊        | 1221/6790 [42:26<3:06:11,  2.01s/it]                                                     {'loss': 1.4402, 'learning_rate': 0.0003729226364289088, 'epoch': 0.18}
+ 18%|█▊        | 1221/6790 [42:26<3:06:11,  2.01s/it] 18%|█▊        | 1222/6790 [42:28<3:14:18,  2.09s/it]                                                     {'loss': 1.5967, 'learning_rate': 0.00037287542884861645, 'epoch': 0.18}
+ 18%|█▊        | 1222/6790 [42:28<3:14:18,  2.09s/it] 18%|█▊        | 1223/6790 [42:30<3:21:55,  2.18s/it]                                                     {'loss': 1.421, 'learning_rate': 0.0003728281831458768, 'epoch': 0.18}
+ 18%|█▊        | 1223/6790 [42:30<3:21:55,  2.18s/it] 18%|█▊        | 1224/6790 [42:32<3:19:42,  2.15s/it]                                                     {'loss': 1.5213, 'learning_rate': 0.00037278089933110846, 'epoch': 0.18}
+ 18%|█▊        | 1224/6790 [42:32<3:19:42,  2.15s/it] 18%|█▊        | 1225/6790 [42:34<3:13:07,  2.08s/it]                                                     {'loss': 1.4941, 'learning_rate': 0.00037273357741473857, 'epoch': 0.18}
+ 18%|█▊        | 1225/6790 [42:34<3:13:07,  2.08s/it] 18%|█▊        | 1226/6790 [42:36<3:10:21,  2.05s/it]                                                     {'loss': 1.3927, 'learning_rate': 0.00037268621740720243, 'epoch': 0.18}
+ 18%|█▊        | 1226/6790 [42:36<3:10:21,  2.05s/it] 18%|█▊        | 1227/6790 [42:38<3:02:43,  1.97s/it]                                                     {'loss': 1.5854, 'learning_rate': 0.0003726388193189439, 'epoch': 0.18}
+ 18%|█▊        | 1227/6790 [42:38<3:02:43,  1.97s/it] 18%|█▊        | 1228/6790 [42:40<3:08:05,  2.03s/it]                                                     {'loss': 1.5014, 'learning_rate': 0.00037259138316041515, 'epoch': 0.18}
+ 18%|█▊        | 1228/6790 [42:40<3:08:05,  2.03s/it] 18%|█▊        | 1229/6790 [42:42<3:10:27,  2.05s/it]                                                     {'loss': 1.5268, 'learning_rate': 0.0003725439089420768, 'epoch': 0.18}
+ 18%|█▊        | 1229/6790 [42:42<3:10:27,  2.05s/it] 18%|█▊        | 1230/6790 [42:45<3:31:54,  2.29s/it]                                                     {'loss': 1.6163, 'learning_rate': 0.0003724963966743979, 'epoch': 0.18}
+ 18%|█▊        | 1230/6790 [42:45<3:31:54,  2.29s/it] 18%|█▊        | 1231/6790 [42:47<3:29:45,  2.26s/it]                                                     {'loss': 1.7086, 'learning_rate': 0.0003724488463678558, 'epoch': 0.18}
+ 18%|█▊        | 1231/6790 [42:47<3:29:45,  2.26s/it] 18%|█▊        | 1232/6790 [42:49<3:23:13,  2.19s/it]                                                     {'loss': 1.4929, 'learning_rate': 0.00037240125803293634, 'epoch': 0.18}
+ 18%|█▊        | 1232/6790 [42:49<3:23:13,  2.19s/it] 18%|█▊        | 1233/6790 [42:51<3:18:54,  2.15s/it]                                                     {'loss': 1.8659, 'learning_rate': 0.0003723536316801336, 'epoch': 0.18}
+ 18%|█▊        | 1233/6790 [42:51<3:18:54,  2.15s/it] 18%|█▊        | 1234/6790 [42:53<3:13:17,  2.09s/it]                                                     {'loss': 1.6829, 'learning_rate': 0.00037230596731995024, 'epoch': 0.18}
+ 18%|█▊        | 1234/6790 [42:53<3:13:17,  2.09s/it] 18%|█▊        | 1235/6790 [42:55<3:02:03,  1.97s/it]                                                     {'loss': 1.556, 'learning_rate': 0.00037225826496289704, 'epoch': 0.18}
+ 18%|█▊        | 1235/6790 [42:55<3:02:03,  1.97s/it] 18%|█▊        | 1236/6790 [42:57<3:02:30,  1.97s/it]                                                     {'loss': 1.6121, 'learning_rate': 0.0003722105246194935, 'epoch': 0.18}
+ 18%|█▊        | 1236/6790 [42:57<3:02:30,  1.97s/it] 18%|█▊        | 1237/6790 [42:59<3:02:33,  1.97s/it]                                                     {'loss': 1.388, 'learning_rate': 0.0003721627463002672, 'epoch': 0.18}
+ 18%|█▊        | 1237/6790 [42:59<3:02:33,  1.97s/it] 18%|█▊        | 1238/6790 [43:01<2:55:49,  1.90s/it]                                                     {'loss': 1.4163, 'learning_rate': 0.00037211493001575413, 'epoch': 0.18}
+ 18%|█▊        | 1238/6790 [43:01<2:55:49,  1.90s/it] 18%|█▊        | 1239/6790 [43:02<2:49:52,  1.84s/it]                                                     {'loss': 1.5268, 'learning_rate': 0.00037206707577649886, 'epoch': 0.18}
+ 18%|█▊        | 1239/6790 [43:02<2:49:52,  1.84s/it] 18%|█▊        | 1240/6790 [43:04<2:51:27,  1.85s/it]                                                     {'loss': 1.6322, 'learning_rate': 0.0003720191835930542, 'epoch': 0.18}
+ 18%|█▊        | 1240/6790 [43:04<2:51:27,  1.85s/it] 18%|█▊        | 1241/6790 [43:06<2:51:24,  1.85s/it]                                                     {'loss': 1.6626, 'learning_rate': 0.0003719712534759812, 'epoch': 0.18}
+ 18%|█▊        | 1241/6790 [43:06<2:51:24,  1.85s/it] 18%|█▊        | 1242/6790 [43:08<2:52:35,  1.87s/it]                                                     {'loss': 1.6476, 'learning_rate': 0.0003719232854358495, 'epoch': 0.18}
+ 18%|█▊        | 1242/6790 [43:08<2:52:35,  1.87s/it] 18%|█▊        | 1243/6790 [43:10<2:58:13,  1.93s/it]                                                     {'loss': 1.6349, 'learning_rate': 0.00037187527948323693, 'epoch': 0.18}
+ 18%|█▊        | 1243/6790 [43:10<2:58:13,  1.93s/it] 18%|█▊        | 1244/6790 [43:12<3:03:50,  1.99s/it]                                                     {'loss': 1.5598, 'learning_rate': 0.00037182723562872983, 'epoch': 0.18}
+ 18%|█▊        | 1244/6790 [43:12<3:03:50,  1.99s/it] 18%|█▊        | 1245/6790 [43:14<2:59:50,  1.95s/it]                                                     {'loss': 1.72, 'learning_rate': 0.00037177915388292277, 'epoch': 0.18}
+ 18%|█▊        | 1245/6790 [43:14<2:59:50,  1.95s/it] 18%|█▊        | 1246/6790 [43:16<3:05:01,  2.00s/it]                                                     {'loss': 1.4893, 'learning_rate': 0.00037173103425641876, 'epoch': 0.18}
+ 18%|█▊        | 1246/6790 [43:16<3:05:01,  2.00s/it] 18%|█▊        | 1247/6790 [43:18<2:59:35,  1.94s/it]                                                     {'loss': 1.7027, 'learning_rate': 0.00037168287675982904, 'epoch': 0.18}
+ 18%|█▊        | 1247/6790 [43:18<2:59:35,  1.94s/it] 18%|█▊        | 1248/6790 [43:21<3:15:58,  2.12s/it]                                                     {'loss': 1.5054, 'learning_rate': 0.00037163468140377333, 'epoch': 0.18}
+ 18%|█▊        | 1248/6790 [43:21<3:15:58,  2.12s/it] 18%|█▊        | 1249/6790 [43:22<3:09:29,  2.05s/it]                                                     {'loss': 1.6118, 'learning_rate': 0.00037158644819887973, 'epoch': 0.18}
+ 18%|█▊        | 1249/6790 [43:22<3:09:29,  2.05s/it] 18%|█▊        | 1250/6790 [43:24<3:08:53,  2.05s/it]                                                     {'loss': 1.4623, 'learning_rate': 0.0003715381771557846, 'epoch': 0.18}
+ 18%|█▊        | 1250/6790 [43:24<3:08:53,  2.05s/it] 18%|█▊        | 1251/6790 [43:26<3:04:46,  2.00s/it]                                                     {'loss': 1.3675, 'learning_rate': 0.00037148986828513256, 'epoch': 0.18}
+ 18%|█▊        | 1251/6790 [43:26<3:04:46,  2.00s/it] 18%|█▊        | 1252/6790 [43:28<2:56:04,  1.91s/it]                                                     {'loss': 1.4767, 'learning_rate': 0.0003714415215975767, 'epoch': 0.18}
+ 18%|█▊        | 1252/6790 [43:28<2:56:04,  1.91s/it] 18%|█▊        | 1253/6790 [43:30<3:06:47,  2.02s/it]                                                     {'loss': 1.3789, 'learning_rate': 0.0003713931371037785, 'epoch': 0.18}
+ 18%|█▊        | 1253/6790 [43:30<3:06:47,  2.02s/it] 18%|█▊        | 1254/6790 [43:32<3:09:58,  2.06s/it]                                                     {'loss': 1.516, 'learning_rate': 0.00037134471481440766, 'epoch': 0.18}
+ 18%|█▊        | 1254/6790 [43:32<3:09:58,  2.06s/it] 18%|█▊        | 1255/6790 [43:35<3:22:00,  2.19s/it]                                                     {'loss': 1.5761, 'learning_rate': 0.00037129625474014225, 'epoch': 0.18}
+ 18%|█▊        | 1255/6790 [43:35<3:22:00,  2.19s/it] 18%|█▊        | 1256/6790 [43:37<3:20:58,  2.18s/it]                                                     {'loss': 1.7002, 'learning_rate': 0.0003712477568916686, 'epoch': 0.18}
+ 18%|█▊        | 1256/6790 [43:37<3:20:58,  2.18s/it] 19%|█▊        | 1257/6790 [43:39<3:21:41,  2.19s/it]                                                     {'loss': 1.6042, 'learning_rate': 0.00037119922127968154, 'epoch': 0.19}
+ 19%|█▊        | 1257/6790 [43:39<3:21:41,  2.19s/it] 19%|█▊        | 1258/6790 [43:42<3:33:54,  2.32s/it]                                                     {'loss': 1.7997, 'learning_rate': 0.0003711506479148841, 'epoch': 0.19}
+ 19%|█▊        | 1258/6790 [43:42<3:33:54,  2.32s/it] 19%|█▊        | 1259/6790 [43:44<3:29:30,  2.27s/it]                                                     {'loss': 1.706, 'learning_rate': 0.00037110203680798765, 'epoch': 0.19}
+ 19%|█▊        | 1259/6790 [43:44<3:29:30,  2.27s/it] 19%|█▊        | 1260/6790 [43:46<3:26:56,  2.25s/it]                                                     {'loss': 1.6641, 'learning_rate': 0.00037105338796971195, 'epoch': 0.19}
+ 19%|█▊        | 1260/6790 [43:46<3:26:56,  2.25s/it] 19%|█▊        | 1261/6790 [43:48<3:18:51,  2.16s/it]                                                     {'loss': 1.8492, 'learning_rate': 0.00037100470141078495, 'epoch': 0.19}
+ 19%|█▊        | 1261/6790 [43:48<3:18:51,  2.16s/it] 19%|█▊        | 1262/6790 [43:50<3:08:11,  2.04s/it]                                                     {'loss': 1.6639, 'learning_rate': 0.00037095597714194306, 'epoch': 0.19}
+ 19%|█▊        | 1262/6790 [43:50<3:08:11,  2.04s/it] 19%|█▊        | 1263/6790 [43:52<3:07:57,  2.04s/it]                                                     {'loss': 1.4025, 'learning_rate': 0.00037090721517393094, 'epoch': 0.19}
+ 19%|█▊        | 1263/6790 [43:52<3:07:57,  2.04s/it] 19%|█▊        | 1264/6790 [43:54<3:05:10,  2.01s/it]                                                     {'loss': 1.5787, 'learning_rate': 0.00037085841551750154, 'epoch': 0.19}
+ 19%|█▊        | 1264/6790 [43:54<3:05:10,  2.01s/it] 19%|█▊        | 1265/6790 [43:56<3:06:17,  2.02s/it]                                                     {'loss': 1.7868, 'learning_rate': 0.0003708095781834162, 'epoch': 0.19}
+ 19%|█▊        | 1265/6790 [43:56<3:06:17,  2.02s/it] 19%|█▊        | 1266/6790 [43:58<3:09:41,  2.06s/it]                                                     {'loss': 1.6314, 'learning_rate': 0.0003707607031824444, 'epoch': 0.19}
+ 19%|█▊        | 1266/6790 [43:58<3:09:41,  2.06s/it] 19%|█▊        | 1267/6790 [44:00<3:02:21,  1.98s/it]                                                     {'loss': 1.4819, 'learning_rate': 0.00037071179052536416, 'epoch': 0.19}
+ 19%|█▊        | 1267/6790 [44:00<3:02:21,  1.98s/it] 19%|█▊        | 1268/6790 [44:02<3:04:45,  2.01s/it]                                                     {'loss': 1.7012, 'learning_rate': 0.00037066284022296164, 'epoch': 0.19}
+ 19%|█▊        | 1268/6790 [44:02<3:04:45,  2.01s/it] 19%|█▊        | 1269/6790 [44:04<3:09:21,  2.06s/it]                                                     {'loss': 1.7116, 'learning_rate': 0.00037061385228603135, 'epoch': 0.19}
+ 19%|█▊        | 1269/6790 [44:04<3:09:21,  2.06s/it] 19%|█▊        | 1270/6790 [44:06<3:09:03,  2.05s/it]                                                     {'loss': 1.6364, 'learning_rate': 0.0003705648267253762, 'epoch': 0.19}
+ 19%|█▊        | 1270/6790 [44:06<3:09:03,  2.05s/it] 19%|█▊        | 1271/6790 [44:08<3:11:05,  2.08s/it]                                                     {'loss': 1.5436, 'learning_rate': 0.00037051576355180704, 'epoch': 0.19}
+ 19%|█▊        | 1271/6790 [44:08<3:11:05,  2.08s/it] 19%|█▊        | 1272/6790 [44:10<3:06:25,  2.03s/it]                                                     {'loss': 1.6093, 'learning_rate': 0.00037046666277614355, 'epoch': 0.19}
+ 19%|█▊        | 1272/6790 [44:10<3:06:25,  2.03s/it] 19%|█▊        | 1273/6790 [44:12<3:08:29,  2.05s/it]                                                     {'loss': 1.5463, 'learning_rate': 0.00037041752440921327, 'epoch': 0.19}
+ 19%|█▊        | 1273/6790 [44:12<3:08:29,  2.05s/it] 19%|█▉        | 1274/6790 [44:14<3:06:10,  2.03s/it]                                                     {'loss': 1.3867, 'learning_rate': 0.0003703683484618522, 'epoch': 0.19}
+ 19%|█▉        | 1274/6790 [44:14<3:06:10,  2.03s/it] 19%|█▉        | 1275/6790 [44:17<3:09:21,  2.06s/it]                                                     {'loss': 1.6792, 'learning_rate': 0.0003703191349449046, 'epoch': 0.19}
+ 19%|█▉        | 1275/6790 [44:17<3:09:21,  2.06s/it] 19%|█▉        | 1276/6790 [44:19<3:08:39,  2.05s/it]                                                     {'loss': 1.4267, 'learning_rate': 0.00037026988386922304, 'epoch': 0.19}
+ 19%|█▉        | 1276/6790 [44:19<3:08:39,  2.05s/it] 19%|█▉        | 1277/6790 [44:21<3:15:52,  2.13s/it]                                                     {'loss': 1.408, 'learning_rate': 0.0003702205952456684, 'epoch': 0.19}
+ 19%|█▉        | 1277/6790 [44:21<3:15:52,  2.13s/it] 19%|█▉        | 1278/6790 [44:23<3:22:40,  2.21s/it]                                                     {'loss': 1.3557, 'learning_rate': 0.0003701712690851097, 'epoch': 0.19}
+ 19%|█▉        | 1278/6790 [44:23<3:22:40,  2.21s/it] 19%|█▉        | 1279/6790 [44:25<3:20:21,  2.18s/it]                                                     {'loss': 1.548, 'learning_rate': 0.0003701219053984244, 'epoch': 0.19}
+ 19%|█▉        | 1279/6790 [44:25<3:20:21,  2.18s/it] 19%|█▉        | 1280/6790 [44:27<3:11:38,  2.09s/it]                                                     {'loss': 1.3556, 'learning_rate': 0.00037007250419649813, 'epoch': 0.19}
+ 19%|█▉        | 1280/6790 [44:27<3:11:38,  2.09s/it] 19%|█▉        | 1281/6790 [44:29<3:07:21,  2.04s/it]                                                     {'loss': 1.6956, 'learning_rate': 0.00037002306549022493, 'epoch': 0.19}
+ 19%|█▉        | 1281/6790 [44:29<3:07:21,  2.04s/it] 19%|█▉        | 1282/6790 [44:31<2:58:35,  1.95s/it]                                                     {'loss': 1.3649, 'learning_rate': 0.00036997358929050686, 'epoch': 0.19}
+ 19%|█▉        | 1282/6790 [44:31<2:58:35,  1.95s/it] 19%|█▉        | 1283/6790 [44:33<2:51:18,  1.87s/it]                                                     {'loss': 1.3267, 'learning_rate': 0.0003699240756082545, 'epoch': 0.19}
+ 19%|█▉        | 1283/6790 [44:33<2:51:18,  1.87s/it] 19%|█▉        | 1284/6790 [44:35<2:54:42,  1.90s/it]                                                     {'loss': 1.5276, 'learning_rate': 0.0003698745244543866, 'epoch': 0.19}
+ 19%|█▉        | 1284/6790 [44:35<2:54:42,  1.90s/it] 19%|█▉        | 1285/6790 [44:37<2:55:59,  1.92s/it]                                                     {'loss': 1.5458, 'learning_rate': 0.00036982493583983004, 'epoch': 0.19}
+ 19%|█▉        | 1285/6790 [44:37<2:55:59,  1.92s/it] 19%|█▉        | 1286/6790 [44:39<3:06:06,  2.03s/it]                                                     {'loss': 1.8774, 'learning_rate': 0.00036977530977552026, 'epoch': 0.19}
+ 19%|█▉        | 1286/6790 [44:39<3:06:06,  2.03s/it] 19%|█▉        | 1287/6790 [44:41<3:06:00,  2.03s/it]                                                     {'loss': 1.5676, 'learning_rate': 0.0003697256462724007, 'epoch': 0.19}
+ 19%|█▉        | 1287/6790 [44:41<3:06:00,  2.03s/it] 19%|█▉        | 1288/6790 [44:43<3:04:08,  2.01s/it]                                                     {'loss': 1.5357, 'learning_rate': 0.0003696759453414232, 'epoch': 0.19}
+ 19%|█▉        | 1288/6790 [44:43<3:04:08,  2.01s/it] 19%|█▉        | 1289/6790 [44:45<3:11:12,  2.09s/it]                                                     {'loss': 1.434, 'learning_rate': 0.0003696262069935477, 'epoch': 0.19}
+ 19%|█▉        | 1289/6790 [44:45<3:11:12,  2.09s/it] 19%|█▉        | 1290/6790 [44:47<3:04:10,  2.01s/it]                                                     {'loss': 1.2697, 'learning_rate': 0.0003695764312397426, 'epoch': 0.19}
+ 19%|█▉        | 1290/6790 [44:47<3:04:10,  2.01s/it] 19%|█▉        | 1291/6790 [44:49<3:04:19,  2.01s/it]                                                     {'loss': 1.4826, 'learning_rate': 0.00036952661809098433, 'epoch': 0.19}
+ 19%|█▉        | 1291/6790 [44:49<3:04:19,  2.01s/it] 19%|█▉        | 1292/6790 [44:51<3:09:57,  2.07s/it]                                                     {'loss': 1.4385, 'learning_rate': 0.0003694767675582577, 'epoch': 0.19}
+ 19%|█▉        | 1292/6790 [44:51<3:09:57,  2.07s/it] 19%|█▉        | 1293/6790 [44:54<3:27:50,  2.27s/it]                                                     {'loss': 1.5539, 'learning_rate': 0.0003694268796525559, 'epoch': 0.19}
+ 19%|█▉        | 1293/6790 [44:54<3:27:50,  2.27s/it] 19%|█▉        | 1294/6790 [44:56<3:25:12,  2.24s/it]                                                     {'loss': 1.4703, 'learning_rate': 0.00036937695438487986, 'epoch': 0.19}
+ 19%|█▉        | 1294/6790 [44:56<3:25:12,  2.24s/it] 19%|█▉        | 1295/6790 [44:58<3:12:42,  2.10s/it]                                                     {'loss': 1.674, 'learning_rate': 0.0003693269917662394, 'epoch': 0.19}
+ 19%|█▉        | 1295/6790 [44:58<3:12:42,  2.10s/it] 19%|█▉        | 1296/6790 [45:00<3:19:07,  2.17s/it]                                                     {'loss': 1.3136, 'learning_rate': 0.0003692769918076522, 'epoch': 0.19}
+ 19%|█▉        | 1296/6790 [45:00<3:19:07,  2.17s/it] 19%|█▉        | 1297/6790 [45:03<3:26:16,  2.25s/it]                                                     {'loss': 1.4451, 'learning_rate': 0.0003692269545201441, 'epoch': 0.19}
+ 19%|█▉        | 1297/6790 [45:03<3:26:16,  2.25s/it] 19%|█▉        | 1298/6790 [45:05<3:23:15,  2.22s/it]                                                     {'loss': 1.6257, 'learning_rate': 0.00036917687991474944, 'epoch': 0.19}
+ 19%|█▉        | 1298/6790 [45:05<3:23:15,  2.22s/it] 19%|█▉        | 1299/6790 [45:07<3:19:41,  2.18s/it]                                                     {'loss': 1.6366, 'learning_rate': 0.0003691267680025106, 'epoch': 0.19}
+ 19%|█▉        | 1299/6790 [45:07<3:19:41,  2.18s/it] 19%|█▉        | 1300/6790 [45:09<3:13:46,  2.12s/it]                                                     {'loss': 1.6149, 'learning_rate': 0.00036907661879447825, 'epoch': 0.19}
+ 19%|█▉        | 1300/6790 [45:09<3:13:46,  2.12s/it] 19%|█▉        | 1301/6790 [45:11<3:06:18,  2.04s/it]                                                     {'loss': 1.592, 'learning_rate': 0.00036902643230171136, 'epoch': 0.19}
+ 19%|█▉        | 1301/6790 [45:11<3:06:18,  2.04s/it] 19%|█▉        | 1302/6790 [45:13<3:13:58,  2.12s/it]                                                     {'loss': 1.7654, 'learning_rate': 0.00036897620853527696, 'epoch': 0.19}
+ 19%|█▉        | 1302/6790 [45:13<3:13:58,  2.12s/it] 19%|█▉        | 1303/6790 [45:15<3:17:57,  2.16s/it]                                                     {'loss': 1.4664, 'learning_rate': 0.0003689259475062503, 'epoch': 0.19}
+ 19%|█▉        | 1303/6790 [45:15<3:17:57,  2.16s/it] 19%|█▉        | 1304/6790 [45:17<3:18:23,  2.17s/it]                                                     {'loss': 1.6115, 'learning_rate': 0.0003688756492257152, 'epoch': 0.19}
+ 19%|█▉        | 1304/6790 [45:17<3:18:23,  2.17s/it] 19%|█▉        | 1305/6790 [45:19<3:10:46,  2.09s/it]                                                     {'loss': 1.4684, 'learning_rate': 0.00036882531370476316, 'epoch': 0.19}
+ 19%|█▉        | 1305/6790 [45:19<3:10:46,  2.09s/it] 19%|█▉        | 1306/6790 [45:21<3:01:46,  1.99s/it]                                                     {'loss': 1.4256, 'learning_rate': 0.00036877494095449427, 'epoch': 0.19}
+ 19%|█▉        | 1306/6790 [45:21<3:01:46,  1.99s/it] 19%|█▉        | 1307/6790 [45:23<2:57:01,  1.94s/it]                                                     {'loss': 1.7153, 'learning_rate': 0.0003687245309860167, 'epoch': 0.19}
+ 19%|█▉        | 1307/6790 [45:23<2:57:01,  1.94s/it] 19%|█▉        | 1308/6790 [45:25<2:54:59,  1.92s/it]                                                     {'loss': 1.5289, 'learning_rate': 0.0003686740838104469, 'epoch': 0.19}
+ 19%|█▉        | 1308/6790 [45:25<2:54:59,  1.92s/it] 19%|█▉        | 1309/6790 [45:27<2:57:25,  1.94s/it]                                                     {'loss': 1.3527, 'learning_rate': 0.0003686235994389093, 'epoch': 0.19}
+ 19%|█▉        | 1309/6790 [45:27<2:57:25,  1.94s/it] 19%|█▉        | 1310/6790 [45:29<3:02:10,  1.99s/it]                                                     {'loss': 1.4315, 'learning_rate': 0.0003685730778825369, 'epoch': 0.19}
+ 19%|█▉        | 1310/6790 [45:29<3:02:10,  1.99s/it] 19%|█▉        | 1311/6790 [45:31<2:57:17,  1.94s/it]                                                     {'loss': 1.6948, 'learning_rate': 0.0003685225191524706, 'epoch': 0.19}
+ 19%|█▉        | 1311/6790 [45:31<2:57:17,  1.94s/it] 19%|█▉        | 1312/6790 [45:33<3:01:11,  1.98s/it]                                                     {'loss': 1.5163, 'learning_rate': 0.0003684719232598596, 'epoch': 0.19}
+ 19%|█▉        | 1312/6790 [45:33<3:01:11,  1.98s/it] 19%|█▉        | 1313/6790 [45:35<3:09:28,  2.08s/it]                                                     {'loss': 1.4228, 'learning_rate': 0.00036842129021586134, 'epoch': 0.19}
+ 19%|█▉        | 1313/6790 [45:35<3:09:28,  2.08s/it] 19%|█▉        | 1314/6790 [45:37<3:08:05,  2.06s/it]                                                     {'loss': 1.6637, 'learning_rate': 0.0003683706200316414, 'epoch': 0.19}
+ 19%|█▉        | 1314/6790 [45:37<3:08:05,  2.06s/it] 19%|█▉        | 1315/6790 [45:39<3:05:18,  2.03s/it]                                                     {'loss': 1.5528, 'learning_rate': 0.0003683199127183735, 'epoch': 0.19}
+ 19%|█▉        | 1315/6790 [45:39<3:05:18,  2.03s/it] 19%|█▉        | 1316/6790 [45:41<3:06:04,  2.04s/it]                                                     {'loss': 1.4112, 'learning_rate': 0.0003682691682872396, 'epoch': 0.19}
+ 19%|█▉        | 1316/6790 [45:41<3:06:04,  2.04s/it] 19%|█▉        | 1317/6790 [45:43<3:08:18,  2.06s/it]                                                     {'loss': 1.4752, 'learning_rate': 0.0003682183867494299, 'epoch': 0.19}
+ 19%|█▉        | 1317/6790 [45:43<3:08:18,  2.06s/it] 19%|█▉        | 1318/6790 [45:45<3:07:15,  2.05s/it]                                                     {'loss': 1.3504, 'learning_rate': 0.00036816756811614275, 'epoch': 0.19}
+ 19%|█▉        | 1318/6790 [45:45<3:07:15,  2.05s/it] 19%|█▉        | 1319/6790 [45:47<3:11:06,  2.10s/it]                                                     {'loss': 1.7084, 'learning_rate': 0.0003681167123985846, 'epoch': 0.19}
+ 19%|█▉        | 1319/6790 [45:47<3:11:06,  2.10s/it] 19%|█▉        | 1320/6790 [45:49<3:08:46,  2.07s/it]                                                     {'loss': 1.3865, 'learning_rate': 0.00036806581960797025, 'epoch': 0.19}
+ 19%|█▉        | 1320/6790 [45:49<3:08:46,  2.07s/it] 19%|█▉        | 1321/6790 [45:51<3:06:26,  2.05s/it]                                                     {'loss': 1.5428, 'learning_rate': 0.0003680148897555224, 'epoch': 0.19}
+ 19%|█▉        | 1321/6790 [45:51<3:06:26,  2.05s/it] 19%|█▉        | 1322/6790 [45:53<3:04:49,  2.03s/it]                                                     {'loss': 1.6284, 'learning_rate': 0.0003679639228524722, 'epoch': 0.19}
+ 19%|█▉        | 1322/6790 [45:53<3:04:49,  2.03s/it] 19%|█▉        | 1323/6790 [45:56<3:10:53,  2.09s/it]                                                     {'loss': 1.7597, 'learning_rate': 0.00036791291891005885, 'epoch': 0.19}
+ 19%|█▉        | 1323/6790 [45:56<3:10:53,  2.09s/it] 19%|█▉        | 1324/6790 [45:58<3:08:24,  2.07s/it]                                                     {'loss': 1.7886, 'learning_rate': 0.0003678618779395297, 'epoch': 0.19}
+ 19%|█▉        | 1324/6790 [45:58<3:08:24,  2.07s/it] 20%|█▉        | 1325/6790 [46:00<3:06:37,  2.05s/it]                                                     {'loss': 1.5232, 'learning_rate': 0.00036781079995214027, 'epoch': 0.2}
+ 20%|█▉        | 1325/6790 [46:00<3:06:37,  2.05s/it] 20%|█▉        | 1326/6790 [46:02<3:08:25,  2.07s/it]                                                     {'loss': 1.5284, 'learning_rate': 0.00036775968495915434, 'epoch': 0.2}
+ 20%|█▉        | 1326/6790 [46:02<3:08:25,  2.07s/it] 20%|█▉        | 1327/6790 [46:04<3:03:02,  2.01s/it]                                                     {'loss': 1.6027, 'learning_rate': 0.00036770853297184375, 'epoch': 0.2}
+ 20%|█▉        | 1327/6790 [46:04<3:03:02,  2.01s/it] 20%|█▉        | 1328/6790 [46:06<3:04:51,  2.03s/it]                                                     {'loss': 1.5724, 'learning_rate': 0.00036765734400148845, 'epoch': 0.2}
+ 20%|█▉        | 1328/6790 [46:06<3:04:51,  2.03s/it] 20%|█▉        | 1329/6790 [46:08<3:15:44,  2.15s/it]                                                     {'loss': 1.4172, 'learning_rate': 0.00036760611805937676, 'epoch': 0.2}
+ 20%|█▉        | 1329/6790 [46:08<3:15:44,  2.15s/it] 20%|█▉        | 1330/6790 [46:10<3:07:51,  2.06s/it]                                                     {'loss': 1.5565, 'learning_rate': 0.0003675548551568049, 'epoch': 0.2}
+ 20%|█▉        | 1330/6790 [46:10<3:07:51,  2.06s/it] 20%|█▉        | 1331/6790 [46:12<2:59:52,  1.98s/it]                                                     {'loss': 1.3935, 'learning_rate': 0.00036750355530507735, 'epoch': 0.2}
+ 20%|█▉        | 1331/6790 [46:12<2:59:52,  1.98s/it] 20%|█▉        | 1332/6790 [46:14<3:07:59,  2.07s/it]                                                     {'loss': 1.6847, 'learning_rate': 0.0003674522185155068, 'epoch': 0.2}
+ 20%|█▉        | 1332/6790 [46:14<3:07:59,  2.07s/it] 20%|█▉        | 1333/6790 [46:16<3:10:37,  2.10s/it]                                                     {'loss': 1.5088, 'learning_rate': 0.000367400844799414, 'epoch': 0.2}
+ 20%|█▉        | 1333/6790 [46:16<3:10:37,  2.10s/it] 20%|█▉        | 1334/6790 [46:18<3:03:07,  2.01s/it]                                                     {'loss': 1.3365, 'learning_rate': 0.0003673494341681279, 'epoch': 0.2}
+ 20%|█▉        | 1334/6790 [46:18<3:03:07,  2.01s/it] 20%|█▉        | 1335/6790 [46:20<3:11:46,  2.11s/it]                                                     {'loss': 1.6474, 'learning_rate': 0.0003672979866329854, 'epoch': 0.2}
+ 20%|█▉        | 1335/6790 [46:20<3:11:46,  2.11s/it] 20%|█▉        | 1336/6790 [46:23<3:10:25,  2.09s/it]                                                     {'loss': 1.5749, 'learning_rate': 0.00036724650220533195, 'epoch': 0.2}
+ 20%|█▉        | 1336/6790 [46:23<3:10:25,  2.09s/it] 20%|█▉        | 1337/6790 [46:24<3:05:31,  2.04s/it]                                                     {'loss': 1.4968, 'learning_rate': 0.00036719498089652074, 'epoch': 0.2}
+ 20%|█▉        | 1337/6790 [46:24<3:05:31,  2.04s/it] 20%|█▉        | 1338/6790 [46:27<3:13:56,  2.13s/it]                                                     {'loss': 1.6377, 'learning_rate': 0.00036714342271791325, 'epoch': 0.2}
+ 20%|█▉        | 1338/6790 [46:27<3:13:56,  2.13s/it] 20%|█▉        | 1339/6790 [46:29<3:05:26,  2.04s/it]                                                     {'loss': 1.5236, 'learning_rate': 0.00036709182768087913, 'epoch': 0.2}
+ 20%|█▉        | 1339/6790 [46:29<3:05:26,  2.04s/it] 20%|█▉        | 1340/6790 [46:31<3:11:16,  2.11s/it]                                                     {'loss': 1.6009, 'learning_rate': 0.000367040195796796, 'epoch': 0.2}
+ 20%|█▉        | 1340/6790 [46:31<3:11:16,  2.11s/it] 20%|█▉        | 1341/6790 [46:33<3:13:22,  2.13s/it]                                                     {'loss': 1.5603, 'learning_rate': 0.00036698852707704976, 'epoch': 0.2}
+ 20%|█▉        | 1341/6790 [46:33<3:13:22,  2.13s/it] 20%|█▉        | 1342/6790 [46:35<3:14:44,  2.14s/it]                                                     {'loss': 1.5035, 'learning_rate': 0.0003669368215330344, 'epoch': 0.2}
+ 20%|█▉        | 1342/6790 [46:35<3:14:44,  2.14s/it] 20%|█▉        | 1343/6790 [46:37<3:10:19,  2.10s/it]                                                     {'loss': 1.4445, 'learning_rate': 0.000366885079176152, 'epoch': 0.2}
+ 20%|█▉        | 1343/6790 [46:37<3:10:19,  2.10s/it] 20%|█▉        | 1344/6790 [46:39<3:08:10,  2.07s/it]                                                     {'loss': 1.4949, 'learning_rate': 0.00036683330001781284, 'epoch': 0.2}
+ 20%|█▉        | 1344/6790 [46:39<3:08:10,  2.07s/it] 20%|█▉        | 1345/6790 [46:41<3:08:09,  2.07s/it]                                                     {'loss': 1.5313, 'learning_rate': 0.00036678148406943514, 'epoch': 0.2}
+ 20%|█▉        | 1345/6790 [46:41<3:08:09,  2.07s/it] 20%|█▉        | 1346/6790 [46:43<3:03:57,  2.03s/it]                                                     {'loss': 1.4307, 'learning_rate': 0.0003667296313424454, 'epoch': 0.2}
+ 20%|█▉        | 1346/6790 [46:43<3:03:57,  2.03s/it] 20%|█▉        | 1347/6790 [46:45<2:55:36,  1.94s/it]                                                     {'loss': 1.3752, 'learning_rate': 0.00036667774184827816, 'epoch': 0.2}
+ 20%|█▉        | 1347/6790 [46:45<2:55:36,  1.94s/it] 20%|█▉        | 1348/6790 [46:47<2:58:37,  1.97s/it]                                                     {'loss': 1.5763, 'learning_rate': 0.00036662581559837603, 'epoch': 0.2}
+ 20%|█▉        | 1348/6790 [46:47<2:58:37,  1.97s/it] 20%|█▉        | 1349/6790 [46:49<2:56:56,  1.95s/it]                                                     {'loss': 1.4529, 'learning_rate': 0.00036657385260418986, 'epoch': 0.2}
+ 20%|█▉        | 1349/6790 [46:49<2:56:56,  1.95s/it] 20%|█▉        | 1350/6790 [46:51<2:56:42,  1.95s/it]                                                     {'loss': 1.3905, 'learning_rate': 0.00036652185287717846, 'epoch': 0.2}
+ 20%|█▉        | 1350/6790 [46:51<2:56:42,  1.95s/it] 20%|█▉        | 1351/6790 [46:53<2:56:01,  1.94s/it]                                                     {'loss': 1.5014, 'learning_rate': 0.00036646981642880885, 'epoch': 0.2}
+ 20%|█▉        | 1351/6790 [46:53<2:56:01,  1.94s/it] 20%|█▉        | 1352/6790 [46:55<2:59:28,  1.98s/it]                                                     {'loss': 1.5917, 'learning_rate': 0.000366417743270556, 'epoch': 0.2}
+ 20%|█▉        | 1352/6790 [46:55<2:59:28,  1.98s/it] 20%|█▉        | 1353/6790 [46:57<3:01:24,  2.00s/it]                                                     {'loss': 1.5419, 'learning_rate': 0.00036636563341390315, 'epoch': 0.2}
+ 20%|█▉        | 1353/6790 [46:57<3:01:24,  2.00s/it] 20%|█▉        | 1354/6790 [46:59<3:03:17,  2.02s/it]                                                     {'loss': 1.3758, 'learning_rate': 0.00036631348687034157, 'epoch': 0.2}
+ 20%|█▉        | 1354/6790 [46:59<3:03:17,  2.02s/it] 20%|█▉        | 1355/6790 [47:01<3:05:53,  2.05s/it]                                                     {'loss': 1.596, 'learning_rate': 0.00036626130365137054, 'epoch': 0.2}
+ 20%|█▉        | 1355/6790 [47:01<3:05:53,  2.05s/it] 20%|█▉        | 1356/6790 [47:03<3:07:30,  2.07s/it]                                                     {'loss': 1.4872, 'learning_rate': 0.0003662090837684975, 'epoch': 0.2}
+ 20%|█▉        | 1356/6790 [47:03<3:07:30,  2.07s/it] 20%|█▉        | 1357/6790 [47:05<3:07:25,  2.07s/it]                                                     {'loss': 1.5407, 'learning_rate': 0.000366156827233238, 'epoch': 0.2}
+ 20%|█▉        | 1357/6790 [47:05<3:07:25,  2.07s/it] 20%|██        | 1358/6790 [47:07<3:04:57,  2.04s/it]                                                     {'loss': 1.4841, 'learning_rate': 0.0003661045340571156, 'epoch': 0.2}
+ 20%|██        | 1358/6790 [47:07<3:04:57,  2.04s/it] 20%|██        | 1359/6790 [47:09<3:03:56,  2.03s/it]                                                     {'loss': 1.474, 'learning_rate': 0.000366052204251662, 'epoch': 0.2}
+ 20%|██        | 1359/6790 [47:09<3:03:56,  2.03s/it] 20%|██        | 1360/6790 [47:11<3:04:05,  2.03s/it]                                                     {'loss': 1.3717, 'learning_rate': 0.00036599983782841693, 'epoch': 0.2}
+ 20%|██        | 1360/6790 [47:11<3:04:05,  2.03s/it] 20%|██        | 1361/6790 [47:13<3:08:48,  2.09s/it]                                                     {'loss': 1.4846, 'learning_rate': 0.0003659474347989283, 'epoch': 0.2}
+ 20%|██        | 1361/6790 [47:14<3:08:48,  2.09s/it] 20%|██        | 1362/6790 [47:16<3:06:33,  2.06s/it]                                                     {'loss': 1.7095, 'learning_rate': 0.0003658949951747519, 'epoch': 0.2}
+ 20%|██        | 1362/6790 [47:16<3:06:33,  2.06s/it] 20%|██        | 1363/6790 [47:18<3:05:32,  2.05s/it]                                                     {'loss': 1.591, 'learning_rate': 0.0003658425189674518, 'epoch': 0.2}
+ 20%|██        | 1363/6790 [47:18<3:05:32,  2.05s/it] 20%|██        | 1364/6790 [47:19<3:02:33,  2.02s/it]                                                     {'loss': 1.6589, 'learning_rate': 0.00036579000618860004, 'epoch': 0.2}
+ 20%|██        | 1364/6790 [47:19<3:02:33,  2.02s/it] 20%|██        | 1365/6790 [47:22<3:11:42,  2.12s/it]                                                     {'loss': 1.5751, 'learning_rate': 0.00036573745684977664, 'epoch': 0.2}
+ 20%|██        | 1365/6790 [47:22<3:11:42,  2.12s/it] 20%|██        | 1366/6790 [47:24<3:07:57,  2.08s/it]                                                     {'loss': 1.4897, 'learning_rate': 0.00036568487096256977, 'epoch': 0.2}
+ 20%|██        | 1366/6790 [47:24<3:07:57,  2.08s/it] 20%|██        | 1367/6790 [47:26<3:02:29,  2.02s/it]                                                     {'loss': 1.4634, 'learning_rate': 0.00036563224853857575, 'epoch': 0.2}
+ 20%|██        | 1367/6790 [47:26<3:02:29,  2.02s/it] 20%|██        | 1368/6790 [47:28<3:01:02,  2.00s/it]                                                     {'loss': 1.5914, 'learning_rate': 0.0003655795895893988, 'epoch': 0.2}
+ 20%|██        | 1368/6790 [47:28<3:01:02,  2.00s/it] 20%|██        | 1369/6790 [47:30<3:07:08,  2.07s/it]                                                     {'loss': 1.5381, 'learning_rate': 0.00036552689412665127, 'epoch': 0.2}
+ 20%|██        | 1369/6790 [47:30<3:07:08,  2.07s/it] 20%|██        | 1370/6790 [47:32<3:02:25,  2.02s/it]                                                     {'loss': 1.5515, 'learning_rate': 0.00036547416216195353, 'epoch': 0.2}
+ 20%|██        | 1370/6790 [47:32<3:02:25,  2.02s/it] 20%|██        | 1371/6790 [47:34<3:00:28,  2.00s/it]                                                     {'loss': 1.6621, 'learning_rate': 0.0003654213937069341, 'epoch': 0.2}
+ 20%|██        | 1371/6790 [47:34<3:00:28,  2.00s/it] 20%|██        | 1372/6790 [47:36<2:58:53,  1.98s/it]                                                     {'loss': 1.5009, 'learning_rate': 0.00036536858877322936, 'epoch': 0.2}
+ 20%|██        | 1372/6790 [47:36<2:58:53,  1.98s/it] 20%|██        | 1373/6790 [47:38<3:02:19,  2.02s/it]                                                     {'loss': 1.453, 'learning_rate': 0.00036531574737248395, 'epoch': 0.2}
+ 20%|██        | 1373/6790 [47:38<3:02:19,  2.02s/it] 20%|██        | 1374/6790 [47:40<3:06:44,  2.07s/it]                                                     {'loss': 1.4643, 'learning_rate': 0.0003652628695163503, 'epoch': 0.2}
+ 20%|██        | 1374/6790 [47:40<3:06:44,  2.07s/it] 20%|██        | 1375/6790 [47:42<3:01:43,  2.01s/it]                                                     {'loss': 1.7492, 'learning_rate': 0.00036520995521648915, 'epoch': 0.2}
+ 20%|██        | 1375/6790 [47:42<3:01:43,  2.01s/it] 20%|██        | 1376/6790 [47:44<3:01:14,  2.01s/it]                                                     {'loss': 1.6593, 'learning_rate': 0.00036515700448456914, 'epoch': 0.2}
+ 20%|██        | 1376/6790 [47:44<3:01:14,  2.01s/it] 20%|██        | 1377/6790 [47:46<3:04:24,  2.04s/it]                                                     {'loss': 1.4553, 'learning_rate': 0.0003651040173322669, 'epoch': 0.2}
+ 20%|██        | 1377/6790 [47:46<3:04:24,  2.04s/it] 20%|██        | 1378/6790 [47:48<3:00:42,  2.00s/it]                                                     {'loss': 1.2812, 'learning_rate': 0.0003650509937712671, 'epoch': 0.2}
+ 20%|██        | 1378/6790 [47:48<3:00:42,  2.00s/it] 20%|██        | 1379/6790 [47:50<3:00:03,  2.00s/it]                                                     {'loss': 1.5073, 'learning_rate': 0.0003649979338132626, 'epoch': 0.2}
+ 20%|██        | 1379/6790 [47:50<3:00:03,  2.00s/it] 20%|██        | 1380/6790 [47:52<3:03:07,  2.03s/it]                                                     {'loss': 1.4487, 'learning_rate': 0.00036494483746995414, 'epoch': 0.2}
+ 20%|██        | 1380/6790 [47:52<3:03:07,  2.03s/it] 20%|██        | 1381/6790 [47:54<3:10:56,  2.12s/it]                                                     {'loss': 1.6077, 'learning_rate': 0.0003648917047530504, 'epoch': 0.2}
+ 20%|██        | 1381/6790 [47:54<3:10:56,  2.12s/it] 20%|██        | 1382/6790 [47:56<3:04:08,  2.04s/it]                                                     {'loss': 1.5845, 'learning_rate': 0.0003648385356742683, 'epoch': 0.2}
+ 20%|██        | 1382/6790 [47:56<3:04:08,  2.04s/it] 20%|██        | 1383/6790 [47:58<3:07:09,  2.08s/it]                                                     {'loss': 1.6772, 'learning_rate': 0.0003647853302453327, 'epoch': 0.2}
+ 20%|██        | 1383/6790 [47:58<3:07:09,  2.08s/it] 20%|██        | 1384/6790 [48:00<3:04:40,  2.05s/it]                                                     {'loss': 1.5248, 'learning_rate': 0.0003647320884779764, 'epoch': 0.2}
+ 20%|██        | 1384/6790 [48:00<3:04:40,  2.05s/it] 20%|██        | 1385/6790 [48:02<3:05:59,  2.06s/it]                                                     {'loss': 1.5761, 'learning_rate': 0.0003646788103839402, 'epoch': 0.2}
+ 20%|██        | 1385/6790 [48:02<3:05:59,  2.06s/it] 20%|██        | 1386/6790 [48:04<3:03:10,  2.03s/it]                                                     {'loss': 1.4917, 'learning_rate': 0.0003646254959749731, 'epoch': 0.2}
+ 20%|██        | 1386/6790 [48:04<3:03:10,  2.03s/it] 20%|██        | 1387/6790 [48:07<3:07:18,  2.08s/it]                                                     {'loss': 1.6257, 'learning_rate': 0.00036457214526283184, 'epoch': 0.2}
+ 20%|██        | 1387/6790 [48:07<3:07:18,  2.08s/it] 20%|██        | 1388/6790 [48:09<3:08:03,  2.09s/it]                                                     {'loss': 1.4558, 'learning_rate': 0.00036451875825928146, 'epoch': 0.2}
+ 20%|██        | 1388/6790 [48:09<3:08:03,  2.09s/it] 20%|██        | 1389/6790 [48:11<3:05:24,  2.06s/it]                                                     {'loss': 1.5365, 'learning_rate': 0.00036446533497609473, 'epoch': 0.2}
+ 20%|██        | 1389/6790 [48:11<3:05:24,  2.06s/it] 20%|██        | 1390/6790 [48:13<3:06:30,  2.07s/it]                                                     {'loss': 1.5197, 'learning_rate': 0.0003644118754250526, 'epoch': 0.2}
+ 20%|██        | 1390/6790 [48:13<3:06:30,  2.07s/it] 20%|██        | 1391/6790 [48:15<2:59:40,  2.00s/it]                                                     {'loss': 1.4971, 'learning_rate': 0.00036435837961794386, 'epoch': 0.2}
+ 20%|██        | 1391/6790 [48:15<2:59:40,  2.00s/it] 21%|██        | 1392/6790 [48:17<3:11:42,  2.13s/it]                                                     {'loss': 1.3175, 'learning_rate': 0.0003643048475665655, 'epoch': 0.21}
+ 21%|██        | 1392/6790 [48:17<3:11:42,  2.13s/it] 21%|██        | 1393/6790 [48:19<3:12:27,  2.14s/it]                                                     {'loss': 1.6886, 'learning_rate': 0.0003642512792827224, 'epoch': 0.21}
+ 21%|██        | 1393/6790 [48:19<3:12:27,  2.14s/it] 21%|██        | 1394/6790 [48:21<3:05:43,  2.07s/it]                                                     {'loss': 1.3147, 'learning_rate': 0.00036419767477822735, 'epoch': 0.21}
+ 21%|██        | 1394/6790 [48:21<3:05:43,  2.07s/it] 21%|██        | 1395/6790 [48:23<3:01:36,  2.02s/it]                                                     {'loss': 1.6847, 'learning_rate': 0.00036414403406490124, 'epoch': 0.21}
+ 21%|██        | 1395/6790 [48:23<3:01:36,  2.02s/it] 21%|██        | 1396/6790 [48:25<3:00:34,  2.01s/it]                                                     {'loss': 1.498, 'learning_rate': 0.0003640903571545729, 'epoch': 0.21}
+ 21%|██        | 1396/6790 [48:25<3:00:34,  2.01s/it] 21%|██        | 1397/6790 [48:27<2:59:26,  2.00s/it]                                                     {'loss': 1.206, 'learning_rate': 0.0003640366440590792, 'epoch': 0.21}
+ 21%|██        | 1397/6790 [48:27<2:59:26,  2.00s/it] 21%|██        | 1398/6790 [48:29<3:00:27,  2.01s/it]                                                     {'loss': 1.6808, 'learning_rate': 0.0003639828947902649, 'epoch': 0.21}
+ 21%|██        | 1398/6790 [48:29<3:00:27,  2.01s/it] 21%|██        | 1399/6790 [48:31<2:57:33,  1.98s/it]                                                     {'loss': 1.4894, 'learning_rate': 0.00036392910935998274, 'epoch': 0.21}
+ 21%|██        | 1399/6790 [48:31<2:57:33,  1.98s/it] 21%|██        | 1400/6790 [48:33<2:57:59,  1.98s/it]                                                     {'loss': 1.5661, 'learning_rate': 0.0003638752877800935, 'epoch': 0.21}
+ 21%|██        | 1400/6790 [48:33<2:57:59,  1.98s/it] 21%|██        | 1401/6790 [48:35<2:59:57,  2.00s/it]                                                     {'loss': 1.451, 'learning_rate': 0.00036382143006246585, 'epoch': 0.21}
+ 21%|██        | 1401/6790 [48:35<2:59:57,  2.00s/it] 21%|██        | 1402/6790 [48:37<3:05:18,  2.06s/it]                                                     {'loss': 1.5288, 'learning_rate': 0.0003637675362189766, 'epoch': 0.21}
+ 21%|██        | 1402/6790 [48:37<3:05:18,  2.06s/it] 21%|██        | 1403/6790 [48:39<3:02:27,  2.03s/it]                                                     {'loss': 1.54, 'learning_rate': 0.00036371360626151033, 'epoch': 0.21}
+ 21%|██        | 1403/6790 [48:39<3:02:27,  2.03s/it] 21%|██        | 1404/6790 [48:41<2:56:26,  1.97s/it]                                                     {'loss': 1.3027, 'learning_rate': 0.00036365964020195965, 'epoch': 0.21}
+ 21%|██        | 1404/6790 [48:41<2:56:26,  1.97s/it] 21%|██        | 1405/6790 [48:43<3:12:53,  2.15s/it]                                                     {'loss': 1.6833, 'learning_rate': 0.0003636056380522252, 'epoch': 0.21}
+ 21%|██        | 1405/6790 [48:43<3:12:53,  2.15s/it] 21%|██        | 1406/6790 [48:46<3:20:09,  2.23s/it]                                                     {'loss': 1.5676, 'learning_rate': 0.0003635515998242154, 'epoch': 0.21}
+ 21%|██        | 1406/6790 [48:46<3:20:09,  2.23s/it] 21%|██        | 1407/6790 [48:49<3:39:27,  2.45s/it]                                                     {'loss': 1.6928, 'learning_rate': 0.00036349752552984686, 'epoch': 0.21}
+ 21%|██        | 1407/6790 [48:49<3:39:27,  2.45s/it] 21%|██        | 1408/6790 [48:52<3:45:04,  2.51s/it]                                                     {'loss': 1.324, 'learning_rate': 0.0003634434151810441, 'epoch': 0.21}
+ 21%|██        | 1408/6790 [48:52<3:45:04,  2.51s/it] 21%|██        | 1409/6790 [48:54<3:33:48,  2.38s/it]                                                     {'loss': 1.3747, 'learning_rate': 0.0003633892687897393, 'epoch': 0.21}
+ 21%|██        | 1409/6790 [48:54<3:33:48,  2.38s/it] 21%|██        | 1410/6790 [48:56<3:27:21,  2.31s/it]                                                     {'loss': 1.6444, 'learning_rate': 0.000363335086367873, 'epoch': 0.21}
+ 21%|██        | 1410/6790 [48:56<3:27:21,  2.31s/it] 21%|██        | 1411/6790 [48:58<3:16:05,  2.19s/it]                                                     {'loss': 1.5322, 'learning_rate': 0.00036328086792739337, 'epoch': 0.21}
+ 21%|██        | 1411/6790 [48:58<3:16:05,  2.19s/it] 21%|██        | 1412/6790 [49:00<3:26:22,  2.30s/it]                                                     {'loss': 1.4855, 'learning_rate': 0.0003632266134802567, 'epoch': 0.21}
+ 21%|██        | 1412/6790 [49:00<3:26:22,  2.30s/it] 21%|██        | 1413/6790 [49:02<3:15:15,  2.18s/it]                                                     {'loss': 1.4397, 'learning_rate': 0.0003631723230384272, 'epoch': 0.21}
+ 21%|██        | 1413/6790 [49:02<3:15:15,  2.18s/it] 21%|██        | 1414/6790 [49:04<3:16:03,  2.19s/it]                                                     {'loss': 1.4325, 'learning_rate': 0.00036311799661387697, 'epoch': 0.21}
+ 21%|██        | 1414/6790 [49:04<3:16:03,  2.19s/it] 21%|██        | 1415/6790 [49:06<3:14:56,  2.18s/it]                                                     {'loss': 1.5131, 'learning_rate': 0.000363063634218586, 'epoch': 0.21}
+ 21%|██        | 1415/6790 [49:06<3:14:56,  2.18s/it] 21%|██        | 1416/6790 [49:09<3:16:10,  2.19s/it]                                                     {'loss': 1.5603, 'learning_rate': 0.00036300923586454233, 'epoch': 0.21}
+ 21%|██        | 1416/6790 [49:09<3:16:10,  2.19s/it] 21%|██        | 1417/6790 [49:11<3:14:43,  2.17s/it]                                                     {'loss': 1.5425, 'learning_rate': 0.00036295480156374184, 'epoch': 0.21}
+ 21%|██        | 1417/6790 [49:11<3:14:43,  2.17s/it] 21%|██        | 1418/6790 [49:13<3:09:32,  2.12s/it]                                                     {'loss': 1.4944, 'learning_rate': 0.0003629003313281884, 'epoch': 0.21}
+ 21%|██        | 1418/6790 [49:13<3:09:32,  2.12s/it] 21%|██        | 1419/6790 [49:15<3:05:55,  2.08s/it]                                                     {'loss': 1.6622, 'learning_rate': 0.0003628458251698938, 'epoch': 0.21}
+ 21%|██        | 1419/6790 [49:15<3:05:55,  2.08s/it] 21%|██        | 1420/6790 [49:17<3:14:45,  2.18s/it]                                                     {'loss': 1.6588, 'learning_rate': 0.0003627912831008777, 'epoch': 0.21}
+ 21%|██        | 1420/6790 [49:17<3:14:45,  2.18s/it] 21%|█��        | 1421/6790 [49:19<3:15:26,  2.18s/it]                                                     {'loss': 1.7931, 'learning_rate': 0.00036273670513316757, 'epoch': 0.21}
+ 21%|██        | 1421/6790 [49:19<3:15:26,  2.18s/it] 21%|██        | 1422/6790 [49:21<3:09:33,  2.12s/it]                                                     {'loss': 1.4835, 'learning_rate': 0.00036268209127879916, 'epoch': 0.21}
+ 21%|██        | 1422/6790 [49:21<3:09:33,  2.12s/it] 21%|██        | 1423/6790 [49:23<3:07:34,  2.10s/it]                                                     {'loss': 1.628, 'learning_rate': 0.0003626274415498157, 'epoch': 0.21}
+ 21%|██        | 1423/6790 [49:23<3:07:34,  2.10s/it] 21%|██        | 1424/6790 [49:25<3:00:59,  2.02s/it]                                                     {'loss': 1.4252, 'learning_rate': 0.0003625727559582687, 'epoch': 0.21}
+ 21%|██        | 1424/6790 [49:25<3:00:59,  2.02s/it] 21%|██        | 1425/6790 [49:27<3:00:03,  2.01s/it]                                                     {'loss': 1.5651, 'learning_rate': 0.0003625180345162173, 'epoch': 0.21}
+ 21%|██        | 1425/6790 [49:27<3:00:03,  2.01s/it] 21%|██        | 1426/6790 [49:29<2:53:55,  1.95s/it]                                                     {'loss': 1.7534, 'learning_rate': 0.0003624632772357287, 'epoch': 0.21}
+ 21%|██        | 1426/6790 [49:29<2:53:55,  1.95s/it] 21%|██        | 1427/6790 [49:31<3:03:59,  2.06s/it]                                                     {'loss': 1.4569, 'learning_rate': 0.000362408484128878, 'epoch': 0.21}
+ 21%|██        | 1427/6790 [49:31<3:03:59,  2.06s/it] 21%|██        | 1428/6790 [49:33<3:05:08,  2.07s/it]                                                     {'loss': 1.4717, 'learning_rate': 0.0003623536552077481, 'epoch': 0.21}
+ 21%|██        | 1428/6790 [49:33<3:05:08,  2.07s/it] 21%|██        | 1429/6790 [49:36<3:08:38,  2.11s/it]                                                     {'loss': 1.6428, 'learning_rate': 0.00036229879048442986, 'epoch': 0.21}
+ 21%|██        | 1429/6790 [49:36<3:08:38,  2.11s/it] 21%|██        | 1430/6790 [49:38<3:05:42,  2.08s/it]                                                     {'loss': 1.7727, 'learning_rate': 0.0003622438899710221, 'epoch': 0.21}
+ 21%|██        | 1430/6790 [49:38<3:05:42,  2.08s/it] 21%|██        | 1431/6790 [49:40<3:01:22,  2.03s/it]                                                     {'loss': 1.478, 'learning_rate': 0.00036218895367963136, 'epoch': 0.21}
+ 21%|██        | 1431/6790 [49:40<3:01:22,  2.03s/it] 21%|██        | 1432/6790 [49:41<2:56:36,  1.98s/it]                                                     {'loss': 1.3538, 'learning_rate': 0.0003621339816223723, 'epoch': 0.21}
+ 21%|██        | 1432/6790 [49:41<2:56:36,  1.98s/it] 21%|██        | 1433/6790 [49:44<3:02:17,  2.04s/it]                                                     {'loss': 1.6538, 'learning_rate': 0.00036207897381136726, 'epoch': 0.21}
+ 21%|██        | 1433/6790 [49:44<3:02:17,  2.04s/it] 21%|██        | 1434/6790 [49:46<3:10:57,  2.14s/it]                                                     {'loss': 1.4319, 'learning_rate': 0.0003620239302587466, 'epoch': 0.21}
+ 21%|██        | 1434/6790 [49:46<3:10:57,  2.14s/it] 21%|██        | 1435/6790 [49:48<3:08:28,  2.11s/it]                                                     {'loss': 1.5597, 'learning_rate': 0.0003619688509766485, 'epoch': 0.21}
+ 21%|██        | 1435/6790 [49:48<3:08:28,  2.11s/it] 21%|██        | 1436/6790 [49:50<3:04:23,  2.07s/it]                                                     {'loss': 1.6915, 'learning_rate': 0.000361913735977219, 'epoch': 0.21}
+ 21%|██        | 1436/6790 [49:50<3:04:23,  2.07s/it] 21%|██        | 1437/6790 [49:52<2:59:33,  2.01s/it]                                                     {'loss': 1.5267, 'learning_rate': 0.00036185858527261206, 'epoch': 0.21}
+ 21%|██        | 1437/6790 [49:52<2:59:33,  2.01s/it] 21%|██        | 1438/6790 [49:55<3:36:45,  2.43s/it]                                                     {'loss': 1.3813, 'learning_rate': 0.0003618033988749895, 'epoch': 0.21}
+ 21%|██        | 1438/6790 [49:55<3:36:45,  2.43s/it] 21%|██        | 1439/6790 [49:57<3:29:21,  2.35s/it]                                                     {'loss': 1.6244, 'learning_rate': 0.00036174817679652106, 'epoch': 0.21}
+ 21%|██        | 1439/6790 [49:57<3:29:21,  2.35s/it] 21%|██        | 1440/6790 [49:59<3:15:39,  2.19s/it]                                                     {'loss': 1.441, 'learning_rate': 0.0003616929190493842, 'epoch': 0.21}
+ 21%|██        | 1440/6790 [49:59<3:15:39,  2.19s/it] 21%|██        | 1441/6790 [50:02<3:16:27,  2.20s/it]                                                     {'loss': 1.6571, 'learning_rate': 0.0003616376256457644, 'epoch': 0.21}
+ 21%|██        | 1441/6790 [50:02<3:16:27,  2.20s/it] 21%|██        | 1442/6790 [50:03<3:04:47,  2.07s/it]                                                     {'loss': 1.253, 'learning_rate': 0.00036158229659785494, 'epoch': 0.21}
+ 21%|██        | 1442/6790 [50:03<3:04:47,  2.07s/it] 21%|██▏       | 1443/6790 [50:05<3:05:48,  2.09s/it]                                                     {'loss': 1.6449, 'learning_rate': 0.00036152693191785705, 'epoch': 0.21}
+ 21%|██▏       | 1443/6790 [50:05<3:05:48,  2.09s/it] 21%|██▏       | 1444/6790 [50:07<3:05:22,  2.08s/it]                                                     {'loss': 1.4165, 'learning_rate': 0.0003614715316179796, 'epoch': 0.21}
+ 21%|██▏       | 1444/6790 [50:07<3:05:22,  2.08s/it] 21%|██▏       | 1445/6790 [50:10<3:05:31,  2.08s/it]                                                     {'loss': 1.6168, 'learning_rate': 0.0003614160957104395, 'epoch': 0.21}
+ 21%|██▏       | 1445/6790 [50:10<3:05:31,  2.08s/it] 21%|██▏       | 1446/6790 [50:11<2:58:01,  2.00s/it]                                                     {'loss': 1.6726, 'learning_rate': 0.00036136062420746146, 'epoch': 0.21}
+ 21%|██▏       | 1446/6790 [50:11<2:58:01,  2.00s/it] 21%|██▏       | 1447/6790 [50:13<2:59:11,  2.01s/it]                                                     {'loss': 1.6476, 'learning_rate': 0.00036130511712127814, 'epoch': 0.21}
+ 21%|██▏       | 1447/6790 [50:13<2:59:11,  2.01s/it] 21%|██▏       | 1448/6790 [50:15<2:53:03,  1.94s/it]                                                     {'loss': 1.6158, 'learning_rate': 0.0003612495744641298, 'epoch': 0.21}
+ 21%|██▏       | 1448/6790 [50:15<2:53:03,  1.94s/it] 21%|██▏       | 1449/6790 [50:19<3:39:58,  2.47s/it]                                                     {'loss': 1.2528, 'learning_rate': 0.0003611939962482648, 'epoch': 0.21}
+ 21%|██▏       | 1449/6790 [50:19<3:39:58,  2.47s/it] 21%|██▏       | 1450/6790 [50:21<3:33:14,  2.40s/it]                                                     {'loss': 1.7357, 'learning_rate': 0.0003611383824859392, 'epoch': 0.21}
+ 21%|██▏       | 1450/6790 [50:21<3:33:14,  2.40s/it] 21%|██▏       | 1451/6790 [50:23<3:23:42,  2.29s/it]                                                     {'loss': 1.7235, 'learning_rate': 0.0003610827331894168, 'epoch': 0.21}
+ 21%|██▏       | 1451/6790 [50:23<3:23:42,  2.29s/it] 21%|██▏       | 1452/6790 [50:25<3:16:22,  2.21s/it]                                                     {'loss': 1.6628, 'learning_rate': 0.00036102704837096965, 'epoch': 0.21}
+ 21%|██▏       | 1452/6790 [50:25<3:16:22,  2.21s/it] 21%|██▏       | 1453/6790 [50:27<3:04:57,  2.08s/it]                                                     {'loss': 1.5961, 'learning_rate': 0.0003609713280428771, 'epoch': 0.21}
+ 21%|██▏       | 1453/6790 [50:27<3:04:57,  2.08s/it] 21%|██▏       | 1454/6790 [50:29<2:57:38,  2.00s/it]                                                     {'loss': 1.497, 'learning_rate': 0.00036091557221742677, 'epoch': 0.21}
+ 21%|██▏       | 1454/6790 [50:29<2:57:38,  2.00s/it] 21%|██▏       | 1455/6790 [50:31<2:53:15,  1.95s/it]                                                     {'loss': 1.6637, 'learning_rate': 0.0003608597809069138, 'epoch': 0.21}
+ 21%|██▏       | 1455/6790 [50:31<2:53:15,  1.95s/it] 21%|██▏       | 1456/6790 [50:33<3:01:35,  2.04s/it]                                                     {'loss': 1.5318, 'learning_rate': 0.0003608039541236412, 'epoch': 0.21}
+ 21%|██▏       | 1456/6790 [50:33<3:01:35,  2.04s/it] 21%|██▏       | 1457/6790 [50:35<3:00:34,  2.03s/it]                                                     {'loss': 1.4441, 'learning_rate': 0.0003607480918799201, 'epoch': 0.21}
+ 21%|██▏       | 1457/6790 [50:35<3:00:34,  2.03s/it] 21%|██▏       | 1458/6790 [50:37<2:55:42,  1.98s/it]                                                     {'loss': 1.5102, 'learning_rate': 0.0003606921941880691, 'epoch': 0.21}
+ 21%|██▏       | 1458/6790 [50:37<2:55:42,  1.98s/it] 21%|██▏       | 1459/6790 [50:39<3:07:32,  2.11s/it]                                                     {'loss': 1.5917, 'learning_rate': 0.0003606362610604148, 'epoch': 0.21}
+ 21%|██▏       | 1459/6790 [50:39<3:07:32,  2.11s/it] 22%|██▏       | 1460/6790 [50:41<3:01:52,  2.05s/it]                                                     {'loss': 1.5366, 'learning_rate': 0.0003605802925092914, 'epoch': 0.22}
+ 22%|██▏       | 1460/6790 [50:41<3:01:52,  2.05s/it] 22%|██▏       | 1461/6790 [50:43<3:03:59,  2.07s/it]                                                     {'loss': 1.1791, 'learning_rate': 0.00036052428854704133, 'epoch': 0.22}
+ 22%|██▏       | 1461/6790 [50:43<3:03:59,  2.07s/it] 22%|██▏       | 1462/6790 [50:45<2:57:00,  1.99s/it]                                                     {'loss': 1.4302, 'learning_rate': 0.00036046824918601434, 'epoch': 0.22}
+ 22%|██▏       | 1462/6790 [50:45<2:57:00,  1.99s/it] 22%|██▏       | 1463/6790 [50:47<2:52:14,  1.94s/it]                                                     {'loss': 1.4127, 'learning_rate': 0.0003604121744385683, 'epoch': 0.22}
+ 22%|██▏       | 1463/6790 [50:47<2:52:14,  1.94s/it] 22%|██▏       | 1464/6790 [50:49<3:05:26,  2.09s/it]                                                     {'loss': 1.4103, 'learning_rate': 0.0003603560643170688, 'epoch': 0.22}
+ 22%|██▏       | 1464/6790 [50:49<3:05:26,  2.09s/it] 22%|██▏       | 1465/6790 [50:51<3:03:39,  2.07s/it]                                                     {'loss': 1.5212, 'learning_rate': 0.00036029991883388936, 'epoch': 0.22}
+ 22%|██▏       | 1465/6790 [50:51<3:03:39,  2.07s/it] 22%|██▏       | 1466/6790 [50:53<3:01:57,  2.05s/it]                                                     {'loss': 1.4421, 'learning_rate': 0.00036024373800141096, 'epoch': 0.22}
+ 22%|██▏       | 1466/6790 [50:53<3:01:57,  2.05s/it] 22%|██▏       | 1467/6790 [50:56<3:13:39,  2.18s/it]                                                     {'loss': 1.5084, 'learning_rate': 0.0003601875218320227, 'epoch': 0.22}
+ 22%|██▏       | 1467/6790 [50:56<3:13:39,  2.18s/it] 22%|██▏       | 1468/6790 [50:58<3:03:55,  2.07s/it]                                                     {'loss': 1.5023, 'learning_rate': 0.00036013127033812127, 'epoch': 0.22}
+ 22%|██▏       | 1468/6790 [50:58<3:03:55,  2.07s/it] 22%|██▏       | 1469/6790 [50:59<2:59:31,  2.02s/it]                                                     {'loss': 1.328, 'learning_rate': 0.0003600749835321113, 'epoch': 0.22}
+ 22%|██▏       | 1469/6790 [50:59<2:59:31,  2.02s/it] 22%|██▏       | 1470/6790 [51:01<2:54:21,  1.97s/it]                                                     {'loss': 1.6686, 'learning_rate': 0.00036001866142640516, 'epoch': 0.22}
+ 22%|██▏       | 1470/6790 [51:01<2:54:21,  1.97s/it] 22%|██▏       | 1471/6790 [51:03<2:58:00,  2.01s/it]                                                     {'loss': 1.7626, 'learning_rate': 0.00035996230403342297, 'epoch': 0.22}
+ 22%|██▏       | 1471/6790 [51:03<2:58:00,  2.01s/it] 22%|██▏       | 1472/6790 [51:06<3:12:22,  2.17s/it]                                                     {'loss': 1.7084, 'learning_rate': 0.00035990591136559263, 'epoch': 0.22}
+ 22%|██▏       | 1472/6790 [51:06<3:12:22,  2.17s/it] 22%|██▏       | 1473/6790 [51:08<3:22:12,  2.28s/it]                                                     {'loss': 1.6233, 'learning_rate': 0.00035984948343534983, 'epoch': 0.22}
+ 22%|██▏       | 1473/6790 [51:08<3:22:12,  2.28s/it] 22%|██▏       | 1474/6790 [51:10<3:13:06,  2.18s/it]                                                     {'loss': 1.5975, 'learning_rate': 0.0003597930202551381, 'epoch': 0.22}
+ 22%|██▏       | 1474/6790 [51:10<3:13:06,  2.18s/it] 22%|██▏       | 1475/6790 [51:12<3:06:09,  2.10s/it]                                                     {'loss': 1.5874, 'learning_rate': 0.0003597365218374086, 'epoch': 0.22}
+ 22%|██▏       | 1475/6790 [51:12<3:06:09,  2.10s/it] 22%|██▏       | 1476/6790 [51:14<3:03:25,  2.07s/it]                                                     {'loss': 1.4551, 'learning_rate': 0.00035967998819462044, 'epoch': 0.22}
+ 22%|██▏       | 1476/6790 [51:14<3:03:25,  2.07s/it] 22%|██▏       | 1477/6790 [51:16<3:05:01,  2.09s/it]                                                     {'loss': 1.7407, 'learning_rate': 0.00035962341933924025, 'epoch': 0.22}
+ 22%|██▏       | 1477/6790 [51:16<3:05:01,  2.09s/it] 22%|██▏       | 1478/6790 [51:18<2:59:59,  2.03s/it]                                                     {'loss': 1.3905, 'learning_rate': 0.0003595668152837428, 'epoch': 0.22}
+ 22%|██▏       | 1478/6790 [51:18<2:59:59,  2.03s/it] 22%|██▏       | 1479/6790 [51:21<3:09:04,  2.14s/it]                                                     {'loss': 1.214, 'learning_rate': 0.00035951017604061026, 'epoch': 0.22}
+ 22%|██▏       | 1479/6790 [51:21<3:09:04,  2.14s/it] 22%|██▏       | 1480/6790 [51:23<3:10:20,  2.15s/it]                                                     {'loss': 1.9179, 'learning_rate': 0.00035945350162233273, 'epoch': 0.22}
+ 22%|██▏       | 1480/6790 [51:23<3:10:20,  2.15s/it] 22%|██▏       | 1481/6790 [51:25<3:02:45,  2.07s/it]                                                     {'loss': 1.6771, 'learning_rate': 0.00035939679204140805, 'epoch': 0.22}
+ 22%|██▏       | 1481/6790 [51:25<3:02:45,  2.07s/it] 22%|██▏       | 1482/6790 [51:27<3:04:01,  2.08s/it]                                                     {'loss': 1.3751, 'learning_rate': 0.00035934004731034177, 'epoch': 0.22}
+ 22%|██▏       | 1482/6790 [51:27<3:04:01,  2.08s/it] 22%|██▏       | 1483/6790 [51:30<3:23:20,  2.30s/it]                                                     {'loss': 1.5973, 'learning_rate': 0.0003592832674416473, 'epoch': 0.22}
+ 22%|██▏       | 1483/6790 [51:30<3:23:20,  2.30s/it] 22%|██▏       | 1484/6790 [51:32<3:12:59,  2.18s/it]                                                     {'loss': 1.6484, 'learning_rate': 0.0003592264524478456, 'epoch': 0.22}
+ 22%|██▏       | 1484/6790 [51:32<3:12:59,  2.18s/it] 22%|██▏       | 1485/6790 [51:34<3:07:14,  2.12s/it]                                                     {'loss': 1.6412, 'learning_rate': 0.0003591696023414656, 'epoch': 0.22}
+ 22%|██▏       | 1485/6790 [51:34<3:07:14,  2.12s/it] 22%|██▏       | 1486/6790 [51:36<3:03:55,  2.08s/it]                                                     {'loss': 1.5407, 'learning_rate': 0.00035911271713504387, 'epoch': 0.22}
+ 22%|██▏       | 1486/6790 [51:36<3:03:55,  2.08s/it] 22%|██▏       | 1487/6790 [51:37<2:58:50,  2.02s/it]                                                     {'loss': 1.7071, 'learning_rate': 0.0003590557968411247, 'epoch': 0.22}
+ 22%|██▏       | 1487/6790 [51:38<2:58:50,  2.02s/it] 22%|██▏       | 1488/6790 [51:39<2:55:04,  1.98s/it]                                                     {'loss': 1.1601, 'learning_rate': 0.00035899884147226006, 'epoch': 0.22}
+ 22%|██▏       | 1488/6790 [51:39<2:55:04,  1.98s/it] 22%|██▏       | 1489/6790 [51:41<2:58:20,  2.02s/it]                                                     {'loss': 1.7678, 'learning_rate': 0.00035894185104100984, 'epoch': 0.22}
+ 22%|██▏       | 1489/6790 [51:41<2:58:20,  2.02s/it] 22%|██▏       | 1490/6790 [51:43<2:52:27,  1.95s/it]                                                     {'loss': 1.5909, 'learning_rate': 0.00035888482555994155, 'epoch': 0.22}
+ 22%|██▏       | 1490/6790 [51:43<2:52:27,  1.95s/it] 22%|██▏       | 1491/6790 [51:45<2:56:54,  2.00s/it]                                                     {'loss': 1.6193, 'learning_rate': 0.0003588277650416304, 'epoch': 0.22}
+ 22%|██▏       | 1491/6790 [51:45<2:56:54,  2.00s/it] 22%|██▏       | 1492/6790 [51:47<2:54:21,  1.97s/it]                                                     {'loss': 1.6676, 'learning_rate': 0.0003587706694986594, 'epoch': 0.22}
+ 22%|██▏       | 1492/6790 [51:47<2:54:21,  1.97s/it] 22%|██▏       | 1493/6790 [51:49<2:51:32,  1.94s/it]                                                     {'loss': 1.3086, 'learning_rate': 0.0003587135389436192, 'epoch': 0.22}
+ 22%|██▏       | 1493/6790 [51:49<2:51:32,  1.94s/it] 22%|██▏       | 1494/6790 [51:51<2:53:51,  1.97s/it]                                                     {'loss': 1.7121, 'learning_rate': 0.0003586563733891082, 'epoch': 0.22}
+ 22%|██▏       | 1494/6790 [51:51<2:53:51,  1.97s/it] 22%|██▏       | 1495/6790 [51:53<2:57:21,  2.01s/it]                                                     {'loss': 1.5212, 'learning_rate': 0.0003585991728477326, 'epoch': 0.22}
+ 22%|██▏       | 1495/6790 [51:53<2:57:21,  2.01s/it] 22%|██▏       | 1496/6790 [51:55<2:52:51,  1.96s/it]                                                     {'loss': 1.4815, 'learning_rate': 0.0003585419373321062, 'epoch': 0.22}
+ 22%|██▏       | 1496/6790 [51:55<2:52:51,  1.96s/it] 22%|██▏       | 1497/6790 [51:57<2:48:52,  1.91s/it]                                                     {'loss': 1.6279, 'learning_rate': 0.00035848466685485053, 'epoch': 0.22}
+ 22%|██▏       | 1497/6790 [51:57<2:48:52,  1.91s/it] 22%|██▏       | 1498/6790 [51:59<2:55:17,  1.99s/it]                                                     {'loss': 1.5513, 'learning_rate': 0.00035842736142859493, 'epoch': 0.22}
+ 22%|██▏       | 1498/6790 [51:59<2:55:17,  1.99s/it] 22%|██▏       | 1499/6790 [52:01<2:57:06,  2.01s/it]                                                     {'loss': 1.6999, 'learning_rate': 0.0003583700210659764, 'epoch': 0.22}
+ 22%|██▏       | 1499/6790 [52:01<2:57:06,  2.01s/it] 22%|██▏       | 1500/6790 [52:03<2:47:54,  1.90s/it]                                                     {'loss': 1.4316, 'learning_rate': 0.00035831264577963957, 'epoch': 0.22}
+ 22%|██▏       | 1500/6790 [52:03<2:47:54,  1.90s/it] 22%|██▏       | 1501/6790 [52:05<3:00:14,  2.04s/it]                                                     {'loss': 1.4251, 'learning_rate': 0.0003582552355822368, 'epoch': 0.22}
+ 22%|██▏       | 1501/6790 [52:05<3:00:14,  2.04s/it] 22%|██▏       | 1502/6790 [52:07<2:55:33,  1.99s/it]                                                     {'loss': 1.6289, 'learning_rate': 0.00035819779048642825, 'epoch': 0.22}
+ 22%|██▏       | 1502/6790 [52:07<2:55:33,  1.99s/it] 22%|██▏       | 1503/6790 [52:09<2:56:00,  2.00s/it]                                                     {'loss': 1.2918, 'learning_rate': 0.0003581403105048816, 'epoch': 0.22}
+ 22%|██▏       | 1503/6790 [52:09<2:56:00,  2.00s/it] 22%|██▏       | 1504/6790 [52:11<3:03:52,  2.09s/it]                                                     {'loss': 1.3252, 'learning_rate': 0.00035808279565027236, 'epoch': 0.22}
+ 22%|██▏       | 1504/6790 [52:11<3:03:52,  2.09s/it] 22%|██▏       | 1505/6790 [52:13<2:57:26,  2.01s/it]                                                     {'loss': 1.4776, 'learning_rate': 0.0003580252459352838, 'epoch': 0.22}
+ 22%|██▏       | 1505/6790 [52:13<2:57:26,  2.01s/it] 22%|██▏       | 1506/6790 [52:15<2:55:36,  1.99s/it]                                                     {'loss': 1.4631, 'learning_rate': 0.0003579676613726066, 'epoch': 0.22}
+ 22%|██▏       | 1506/6790 [52:15<2:55:36,  1.99s/it] 22%|██▏       | 1507/6790 [52:17<2:55:24,  1.99s/it]                                                     {'loss': 1.3759, 'learning_rate': 0.0003579100419749394, 'epoch': 0.22}
+ 22%|██▏       | 1507/6790 [52:17<2:55:24,  1.99s/it] 22%|██▏       | 1508/6790 [52:19<2:58:16,  2.03s/it]                                                     {'loss': 1.5311, 'learning_rate': 0.0003578523877549884, 'epoch': 0.22}
+ 22%|██▏       | 1508/6790 [52:19<2:58:16,  2.03s/it] 22%|██▏       | 1509/6790 [52:21<3:00:52,  2.05s/it]                                                     {'loss': 1.3931, 'learning_rate': 0.00035779469872546744, 'epoch': 0.22}
+ 22%|██▏       | 1509/6790 [52:21<3:00:52,  2.05s/it] 22%|██▏       | 1510/6790 [52:23<2:53:55,  1.98s/it]                                                     {'loss': 1.4935, 'learning_rate': 0.0003577369748990982, 'epoch': 0.22}
+ 22%|██▏       | 1510/6790 [52:23<2:53:55,  1.98s/it] 22%|██▏       | 1511/6790 [52:25<2:52:26,  1.96s/it]                                                     {'loss': 1.5862, 'learning_rate': 0.0003576792162886098, 'epoch': 0.22}
+ 22%|██▏       | 1511/6790 [52:25<2:52:26,  1.96s/it] 22%|██▏       | 1512/6790 [52:27<2:55:02,  1.99s/it]                                                     {'loss': 1.5305, 'learning_rate': 0.0003576214229067392, 'epoch': 0.22}
+ 22%|██▏       | 1512/6790 [52:27<2:55:02,  1.99s/it] 22%|██▏       | 1513/6790 [52:29<2:55:07,  1.99s/it]                                                     {'loss': 1.4863, 'learning_rate': 0.00035756359476623104, 'epoch': 0.22}
+ 22%|██▏       | 1513/6790 [52:29<2:55:07,  1.99s/it] 22%|██▏       | 1514/6790 [52:31<2:57:34,  2.02s/it]                                                     {'loss': 1.5922, 'learning_rate': 0.0003575057318798375, 'epoch': 0.22}
+ 22%|██▏       | 1514/6790 [52:31<2:57:34,  2.02s/it] 22%|██▏       | 1515/6790 [52:33<2:57:11,  2.02s/it]                                                     {'loss': 1.7416, 'learning_rate': 0.0003574478342603185, 'epoch': 0.22}
+ 22%|██▏       | 1515/6790 [52:33<2:57:11,  2.02s/it] 22%|██▏       | 1516/6790 [52:35<2:55:59,  2.00s/it]                                                     {'loss': 1.4416, 'learning_rate': 0.0003573899019204416, 'epoch': 0.22}
+ 22%|██▏       | 1516/6790 [52:35<2:55:59,  2.00s/it] 22%|██▏       | 1517/6790 [52:37<2:54:29,  1.99s/it]                                                     {'loss': 1.4921, 'learning_rate': 0.0003573319348729821, 'epoch': 0.22}
+ 22%|██▏       | 1517/6790 [52:37<2:54:29,  1.99s/it] 22%|██▏       | 1518/6790 [52:39<2:55:31,  2.00s/it]                                                     {'loss': 1.6682, 'learning_rate': 0.0003572739331307227, 'epoch': 0.22}
+ 22%|██▏       | 1518/6790 [52:39<2:55:31,  2.00s/it] 22%|██▏       | 1519/6790 [52:42<3:05:18,  2.11s/it]                                                     {'loss': 1.4448, 'learning_rate': 0.0003572158967064542, 'epoch': 0.22}
+ 22%|██▏       | 1519/6790 [52:42<3:05:18,  2.11s/it] 22%|██▏       | 1520/6790 [52:44<3:00:38,  2.06s/it]                                                     {'loss': 1.6473, 'learning_rate': 0.00035715782561297456, 'epoch': 0.22}
+ 22%|██▏       | 1520/6790 [52:44<3:00:38,  2.06s/it] 22%|██▏       | 1521/6790 [52:45<2:55:23,  2.00s/it]                                                     {'loss': 1.6352, 'learning_rate': 0.0003570997198630897, 'epoch': 0.22}
+ 22%|██▏       | 1521/6790 [52:45<2:55:23,  2.00s/it] 22%|██▏       | 1522/6790 [52:47<2:56:30,  2.01s/it]                                                     {'loss': 1.4473, 'learning_rate': 0.000357041579469613, 'epoch': 0.22}
+ 22%|██▏       | 1522/6790 [52:47<2:56:30,  2.01s/it] 22%|██▏       | 1523/6790 [52:50<2:59:36,  2.05s/it]                                                     {'loss': 1.4846, 'learning_rate': 0.0003569834044453657, 'epoch': 0.22}
+ 22%|██▏       | 1523/6790 [52:50<2:59:36,  2.05s/it] 22%|██▏       | 1524/6790 [52:52<2:58:33,  2.03s/it]                                                     {'loss': 1.7282, 'learning_rate': 0.00035692519480317637, 'epoch': 0.22}
+ 22%|██▏       | 1524/6790 [52:52<2:58:33,  2.03s/it] 22%|██▏       | 1525/6790 [52:54<3:02:37,  2.08s/it]                                                     {'loss': 1.4984, 'learning_rate': 0.00035686695055588163, 'epoch': 0.22}
+ 22%|██▏       | 1525/6790 [52:54<3:02:37,  2.08s/it] 22%|██▏       | 1526/6790 [52:56<3:03:06,  2.09s/it]                                                     {'loss': 1.701, 'learning_rate': 0.00035680867171632527, 'epoch': 0.22}
+ 22%|██▏       | 1526/6790 [52:56<3:03:06,  2.09s/it] 22%|██▏       | 1527/6790 [52:58<2:55:23,  2.00s/it]                                                     {'loss': 1.5605, 'learning_rate': 0.00035675035829735893, 'epoch': 0.22}
+ 22%|██▏       | 1527/6790 [52:58<2:55:23,  2.00s/it] 23%|██▎       | 1528/6790 [53:00<3:00:34,  2.06s/it]                                                     {'loss': 1.5343, 'learning_rate': 0.000356692010311842, 'epoch': 0.23}
+ 23%|██▎       | 1528/6790 [53:00<3:00:34,  2.06s/it] 23%|██▎       | 1529/6790 [53:02<3:01:40,  2.07s/it]                                                     {'loss': 1.3996, 'learning_rate': 0.0003566336277726413, 'epoch': 0.23}
+ 23%|██▎       | 1529/6790 [53:02<3:01:40,  2.07s/it] 23%|██▎       | 1530/6790 [53:04<2:57:37,  2.03s/it]                                                     {'loss': 1.585, 'learning_rate': 0.0003565752106926313, 'epoch': 0.23}
+ 23%|██▎       | 1530/6790 [53:04<2:57:37,  2.03s/it] 23%|██▎       | 1531/6790 [53:06<3:01:12,  2.07s/it]                                                     {'loss': 1.6988, 'learning_rate': 0.0003565167590846942, 'epoch': 0.23}
+ 23%|██▎       | 1531/6790 [53:06<3:01:12,  2.07s/it] 23%|██▎       | 1532/6790 [53:08<2:54:46,  1.99s/it]                                                     {'loss': 1.7247, 'learning_rate': 0.00035645827296171967, 'epoch': 0.23}
+ 23%|██▎       | 1532/6790 [53:08<2:54:46,  1.99s/it] 23%|██▎       | 1533/6790 [53:10<2:52:09,  1.96s/it]                                                     {'loss': 1.5498, 'learning_rate': 0.0003563997523366051, 'epoch': 0.23}
+ 23%|██▎       | 1533/6790 [53:10<2:52:09,  1.96s/it] 23%|██▎       | 1534/6790 [53:12<2:53:33,  1.98s/it]                                                     {'loss': 1.3093, 'learning_rate': 0.0003563411972222554, 'epoch': 0.23}
+ 23%|██▎       | 1534/6790 [53:12<2:53:33,  1.98s/it] 23%|██▎       | 1535/6790 [53:14<2:48:05,  1.92s/it]                                                     {'loss': 1.6277, 'learning_rate': 0.0003562826076315831, 'epoch': 0.23}
+ 23%|██▎       | 1535/6790 [53:14<2:48:05,  1.92s/it] 23%|██▎       | 1536/6790 [53:16<2:58:44,  2.04s/it]                                                     {'loss': 1.4609, 'learning_rate': 0.0003562239835775084, 'epoch': 0.23}
+ 23%|██▎       | 1536/6790 [53:16<2:58:44,  2.04s/it] 23%|██▎       | 1537/6790 [53:18<3:13:11,  2.21s/it]                                                     {'loss': 1.5788, 'learning_rate': 0.00035616532507295914, 'epoch': 0.23}
+ 23%|██▎       | 1537/6790 [53:18<3:13:11,  2.21s/it] 23%|██▎       | 1538/6790 [53:20<3:07:12,  2.14s/it]                                                     {'loss': 1.646, 'learning_rate': 0.00035610663213087057, 'epoch': 0.23}
+ 23%|██▎       | 1538/6790 [53:20<3:07:12,  2.14s/it] 23%|██▎       | 1539/6790 [53:23<3:23:39,  2.33s/it]                                                     {'loss': 1.6064, 'learning_rate': 0.00035604790476418573, 'epoch': 0.23}
+ 23%|██▎       | 1539/6790 [53:23<3:23:39,  2.33s/it] 23%|██▎       | 1540/6790 [53:25<3:16:58,  2.25s/it]                                                     {'loss': 1.6924, 'learning_rate': 0.00035598914298585506, 'epoch': 0.23}
+ 23%|██▎       | 1540/6790 [53:25<3:16:58,  2.25s/it] 23%|██▎       | 1541/6790 [53:27<3:07:20,  2.14s/it]                                                     {'loss': 1.6157, 'learning_rate': 0.0003559303468088368, 'epoch': 0.23}
+ 23%|██▎       | 1541/6790 [53:27<3:07:20,  2.14s/it] 23%|██▎       | 1542/6790 [53:29<3:04:45,  2.11s/it]                                                     {'loss': 1.4356, 'learning_rate': 0.0003558715162460966, 'epoch': 0.23}
+ 23%|██▎       | 1542/6790 [53:29<3:04:45,  2.11s/it] 23%|██▎       | 1543/6790 [53:31<3:02:06,  2.08s/it]                                                     {'loss': 1.4179, 'learning_rate': 0.00035581265131060777, 'epoch': 0.23}
+ 23%|██▎       | 1543/6790 [53:31<3:02:06,  2.08s/it] 23%|██▎       | 1544/6790 [53:34<3:33:39,  2.44s/it]                                                     {'loss': 1.2381, 'learning_rate': 0.00035575375201535124, 'epoch': 0.23}
+ 23%|██▎       | 1544/6790 [53:35<3:33:39,  2.44s/it] 23%|██▎       | 1545/6790 [53:37<3:25:49,  2.35s/it]                                                     {'loss': 1.5064, 'learning_rate': 0.00035569481837331534, 'epoch': 0.23}
+ 23%|██▎       | 1545/6790 [53:37<3:25:49,  2.35s/it] 23%|██▎       | 1546/6790 [53:39<3:21:25,  2.30s/it]                                                     {'loss': 1.6213, 'learning_rate': 0.00035563585039749627, 'epoch': 0.23}
+ 23%|██▎       | 1546/6790 [53:39<3:21:25,  2.30s/it] 23%|██▎       | 1547/6790 [53:41<3:12:37,  2.20s/it]                                                     {'loss': 1.8705, 'learning_rate': 0.00035557684810089753, 'epoch': 0.23}
+ 23%|██▎       | 1547/6790 [53:41<3:12:37,  2.20s/it] 23%|██▎       | 1548/6790 [53:43<3:05:21,  2.12s/it]                                                     {'loss': 1.3392, 'learning_rate': 0.0003555178114965303, 'epoch': 0.23}
+ 23%|██▎       | 1548/6790 [53:43<3:05:21,  2.12s/it] 23%|██▎       | 1549/6790 [53:45<3:06:46,  2.14s/it]                                                     {'loss': 1.5244, 'learning_rate': 0.00035545874059741343, 'epoch': 0.23}
+ 23%|██▎       | 1549/6790 [53:45<3:06:46,  2.14s/it] 23%|██▎       | 1550/6790 [53:47<3:05:12,  2.12s/it]                                                     {'loss': 1.6012, 'learning_rate': 0.00035539963541657304, 'epoch': 0.23}
+ 23%|██▎       | 1550/6790 [53:47<3:05:12,  2.12s/it] 23%|██▎       | 1551/6790 [53:49<3:04:40,  2.12s/it]                                                     {'loss': 1.6012, 'learning_rate': 0.0003553404959670431, 'epoch': 0.23}
+ 23%|██▎       | 1551/6790 [53:49<3:04:40,  2.12s/it] 23%|██▎       | 1552/6790 [53:51<2:59:11,  2.05s/it]                                                     {'loss': 1.416, 'learning_rate': 0.00035528132226186497, 'epoch': 0.23}
+ 23%|██▎       | 1552/6790 [53:51<2:59:11,  2.05s/it] 23%|██▎       | 1553/6790 [53:54<3:25:52,  2.36s/it]                                                     {'loss': 1.442, 'learning_rate': 0.00035522211431408764, 'epoch': 0.23}
+ 23%|██▎       | 1553/6790 [53:54<3:25:52,  2.36s/it] 23%|██▎       | 1554/6790 [53:57<3:33:46,  2.45s/it]                                                     {'loss': 1.5589, 'learning_rate': 0.0003551628721367677, 'epoch': 0.23}
+ 23%|██▎       | 1554/6790 [53:57<3:33:46,  2.45s/it] 23%|██▎       | 1555/6790 [53:59<3:16:30,  2.25s/it]                                                     {'loss': 1.3046, 'learning_rate': 0.0003551035957429692, 'epoch': 0.23}
+ 23%|██▎       | 1555/6790 [53:59<3:16:30,  2.25s/it] 23%|██▎       | 1556/6790 [54:01<3:17:29,  2.26s/it]                                                     {'loss': 1.5733, 'learning_rate': 0.00035504428514576366, 'epoch': 0.23}
+ 23%|██▎       | 1556/6790 [54:01<3:17:29,  2.26s/it] 23%|██▎       | 1557/6790 [54:03<3:04:57,  2.12s/it]                                                     {'loss': 1.411, 'learning_rate': 0.0003549849403582303, 'epoch': 0.23}
+ 23%|██▎       | 1557/6790 [54:03<3:04:57,  2.12s/it] 23%|██▎       | 1558/6790 [54:05<3:00:54,  2.07s/it]                                                     {'loss': 1.646, 'learning_rate': 0.00035492556139345583, 'epoch': 0.23}
+ 23%|██▎       | 1558/6790 [54:05<3:00:54,  2.07s/it] 23%|██▎       | 1559/6790 [54:07<3:01:50,  2.09s/it]                                                     {'loss': 1.5568, 'learning_rate': 0.0003548661482645345, 'epoch': 0.23}
+ 23%|██▎       | 1559/6790 [54:07<3:01:50,  2.09s/it] 23%|██▎       | 1560/6790 [54:09<2:57:26,  2.04s/it]                                                     {'loss': 1.6618, 'learning_rate': 0.000354806700984568, 'epoch': 0.23}
+ 23%|██▎       | 1560/6790 [54:09<2:57:26,  2.04s/it] 23%|██▎       | 1561/6790 [54:11<3:06:23,  2.14s/it]                                                     {'loss': 1.5664, 'learning_rate': 0.0003547472195666657, 'epoch': 0.23}
+ 23%|██▎       | 1561/6790 [54:11<3:06:23,  2.14s/it] 23%|██▎       | 1562/6790 [54:13<3:01:58,  2.09s/it]                                                     {'loss': 1.5612, 'learning_rate': 0.0003546877040239444, 'epoch': 0.23}
+ 23%|██▎       | 1562/6790 [54:13<3:01:58,  2.09s/it] 23%|██▎       | 1563/6790 [54:15<2:56:32,  2.03s/it]                                                     {'loss': 1.6628, 'learning_rate': 0.0003546281543695285, 'epoch': 0.23}
+ 23%|██▎       | 1563/6790 [54:15<2:56:32,  2.03s/it] 23%|██▎       | 1564/6790 [54:17<2:54:26,  2.00s/it]                                                     {'loss': 1.4588, 'learning_rate': 0.00035456857061654987, 'epoch': 0.23}
+ 23%|██▎       | 1564/6790 [54:17<2:54:26,  2.00s/it] 23%|██▎       | 1565/6790 [54:19<2:49:03,  1.94s/it]                                                     {'loss': 1.4426, 'learning_rate': 0.00035450895277814784, 'epoch': 0.23}
+ 23%|██▎       | 1565/6790 [54:19<2:49:03,  1.94s/it] 23%|██▎       | 1566/6790 [54:21<2:48:52,  1.94s/it]                                                     {'loss': 1.4924, 'learning_rate': 0.0003544493008674693, 'epoch': 0.23}
+ 23%|██▎       | 1566/6790 [54:21<2:48:52,  1.94s/it] 23%|██▎       | 1567/6790 [54:22<2:41:44,  1.86s/it]                                                     {'loss': 1.4002, 'learning_rate': 0.00035438961489766874, 'epoch': 0.23}
+ 23%|██▎       | 1567/6790 [54:22<2:41:44,  1.86s/it] 23%|██▎       | 1568/6790 [54:25<2:58:36,  2.05s/it]                                                     {'loss': 1.3243, 'learning_rate': 0.0003543298948819081, 'epoch': 0.23}
+ 23%|██▎       | 1568/6790 [54:25<2:58:36,  2.05s/it] 23%|██▎       | 1569/6790 [54:27<2:59:33,  2.06s/it]                                                     {'loss': 1.4432, 'learning_rate': 0.0003542701408333568, 'epoch': 0.23}
+ 23%|██▎       | 1569/6790 [54:27<2:59:33,  2.06s/it] 23%|██▎       | 1570/6790 [54:29<2:54:36,  2.01s/it]                                                     {'loss': 1.5187, 'learning_rate': 0.0003542103527651918, 'epoch': 0.23}
+ 23%|██▎       | 1570/6790 [54:29<2:54:36,  2.01s/it] 23%|██▎       | 1571/6790 [54:31<2:55:31,  2.02s/it]                                                     {'loss': 1.3144, 'learning_rate': 0.0003541505306905976, 'epoch': 0.23}
+ 23%|██▎       | 1571/6790 [54:31<2:55:31,  2.02s/it] 23%|██▎       | 1572/6790 [54:33<2:50:35,  1.96s/it]                                                     {'loss': 1.5468, 'learning_rate': 0.00035409067462276606, 'epoch': 0.23}
+ 23%|██▎       | 1572/6790 [54:33<2:50:35,  1.96s/it] 23%|██▎       | 1573/6790 [54:35<2:55:50,  2.02s/it]                                                     {'loss': 1.4624, 'learning_rate': 0.00035403078457489667, 'epoch': 0.23}
+ 23%|██▎       | 1573/6790 [54:35<2:55:50,  2.02s/it] 23%|██▎       | 1574/6790 [54:37<3:01:01,  2.08s/it]                                                     {'loss': 1.7317, 'learning_rate': 0.00035397086056019624, 'epoch': 0.23}
+ 23%|██▎       | 1574/6790 [54:37<3:01:01,  2.08s/it] 23%|██▎       | 1575/6790 [54:39<2:51:37,  1.97s/it]                                                     {'loss': 1.3581, 'learning_rate': 0.00035391090259187947, 'epoch': 0.23}
+ 23%|██▎       | 1575/6790 [54:39<2:51:37,  1.97s/it] 23%|██▎       | 1576/6790 [54:40<2:48:07,  1.93s/it]                                                     {'loss': 1.5833, 'learning_rate': 0.0003538509106831681, 'epoch': 0.23}
+ 23%|██▎       | 1576/6790 [54:40<2:48:07,  1.93s/it] 23%|██▎       | 1577/6790 [54:43<2:55:09,  2.02s/it]                                                     {'loss': 1.6044, 'learning_rate': 0.0003537908848472915, 'epoch': 0.23}
+ 23%|██▎       | 1577/6790 [54:43<2:55:09,  2.02s/it] 23%|██▎       | 1578/6790 [54:45<2:59:13,  2.06s/it]                                                     {'loss': 1.4853, 'learning_rate': 0.0003537308250974866, 'epoch': 0.23}
+ 23%|██▎       | 1578/6790 [54:45<2:59:13,  2.06s/it] 23%|██▎       | 1579/6790 [54:47<3:00:21,  2.08s/it]                                                     {'loss': 1.6634, 'learning_rate': 0.0003536707314469978, 'epoch': 0.23}
+ 23%|██▎       | 1579/6790 [54:47<3:00:21,  2.08s/it] 23%|██▎       | 1580/6790 [54:49<2:56:42,  2.04s/it]                                                     {'loss': 1.5139, 'learning_rate': 0.0003536106039090769, 'epoch': 0.23}
+ 23%|██▎       | 1580/6790 [54:49<2:56:42,  2.04s/it] 23%|██▎       | 1581/6790 [54:51<3:01:10,  2.09s/it]                                                     {'loss': 1.5716, 'learning_rate': 0.00035355044249698323, 'epoch': 0.23}
+ 23%|██▎       | 1581/6790 [54:51<3:01:10,  2.09s/it] 23%|██▎       | 1582/6790 [54:53<2:59:58,  2.07s/it]                                                     {'loss': 1.4208, 'learning_rate': 0.00035349024722398356, 'epoch': 0.23}
+ 23%|██▎       | 1582/6790 [54:53<2:59:58,  2.07s/it] 23%|██▎       | 1583/6790 [54:55<3:00:58,  2.09s/it]                                                     {'loss': 1.7618, 'learning_rate': 0.0003534300181033521, 'epoch': 0.23}
+ 23%|██▎       | 1583/6790 [54:55<3:00:58,  2.09s/it] 23%|██▎       | 1584/6790 [54:57<2:58:14,  2.05s/it]                                                     {'loss': 1.681, 'learning_rate': 0.0003533697551483706, 'epoch': 0.23}
+ 23%|██▎       | 1584/6790 [54:57<2:58:14,  2.05s/it] 23%|██▎       | 1585/6790 [54:59<2:59:41,  2.07s/it]                                                     {'loss': 1.6482, 'learning_rate': 0.00035330945837232827, 'epoch': 0.23}
+ 23%|██▎       | 1585/6790 [54:59<2:59:41,  2.07s/it] 23%|██▎       | 1586/6790 [55:01<3:00:58,  2.09s/it]                                                     {'loss': 1.493, 'learning_rate': 0.00035324912778852166, 'epoch': 0.23}
+ 23%|██▎       | 1586/6790 [55:01<3:00:58,  2.09s/it] 23%|██▎       | 1587/6790 [55:04<3:07:13,  2.16s/it]                                                     {'loss': 1.4973, 'learning_rate': 0.0003531887634102549, 'epoch': 0.23}
+ 23%|██▎       | 1587/6790 [55:04<3:07:13,  2.16s/it] 23%|██▎       | 1588/6790 [55:06<3:00:31,  2.08s/it]                                                     {'loss': 1.6617, 'learning_rate': 0.0003531283652508395, 'epoch': 0.23}
+ 23%|██▎       | 1588/6790 [55:06<3:00:31,  2.08s/it] 23%|██▎       | 1589/6790 [55:08<3:17:07,  2.27s/it]                                                     {'loss': 1.4895, 'learning_rate': 0.0003530679333235945, 'epoch': 0.23}
+ 23%|██▎       | 1589/6790 [55:08<3:17:07,  2.27s/it] 23%|██▎       | 1590/6790 [55:10<3:08:37,  2.18s/it]                                                     {'loss': 1.5347, 'learning_rate': 0.00035300746764184627, 'epoch': 0.23}
+ 23%|██▎       | 1590/6790 [55:10<3:08:37,  2.18s/it] 23%|██▎       | 1591/6790 [55:12<3:03:26,  2.12s/it]                                                     {'loss': 1.5876, 'learning_rate': 0.00035294696821892873, 'epoch': 0.23}
+ 23%|██▎       | 1591/6790 [55:12<3:03:26,  2.12s/it] 23%|██▎       | 1592/6790 [55:14<2:53:42,  2.01s/it]                                                     {'loss': 1.183, 'learning_rate': 0.0003528864350681832, 'epoch': 0.23}
+ 23%|██▎       | 1592/6790 [55:14<2:53:42,  2.01s/it] 23%|██▎       | 1593/6790 [55:16<2:55:57,  2.03s/it]                                                     {'loss': 1.5403, 'learning_rate': 0.00035282586820295844, 'epoch': 0.23}
+ 23%|██▎       | 1593/6790 [55:16<2:55:57,  2.03s/it] 23%|██▎       | 1594/6790 [55:18<3:01:26,  2.10s/it]                                                     {'loss': 1.3928, 'learning_rate': 0.0003527652676366106, 'epoch': 0.23}
+ 23%|██▎       | 1594/6790 [55:18<3:01:26,  2.10s/it] 23%|██▎       | 1595/6790 [55:20<2:56:24,  2.04s/it]                                                     {'loss': 1.2938, 'learning_rate': 0.0003527046333825033, 'epoch': 0.23}
+ 23%|██▎       | 1595/6790 [55:20<2:56:24,  2.04s/it] 24%|██▎       | 1596/6790 [55:22<2:55:26,  2.03s/it]                                                     {'loss': 1.443, 'learning_rate': 0.0003526439654540076, 'epoch': 0.24}
+ 24%|██▎       | 1596/6790 [55:22<2:55:26,  2.03s/it] 24%|██▎       | 1597/6790 [55:25<3:01:33,  2.10s/it]                                                     {'loss': 1.5921, 'learning_rate': 0.00035258326386450203, 'epoch': 0.24}
+ 24%|██▎       | 1597/6790 [55:25<3:01:33,  2.10s/it] 24%|██▎       | 1598/6790 [55:27<2:56:18,  2.04s/it]                                                     {'loss': 1.522, 'learning_rate': 0.0003525225286273725, 'epoch': 0.24}
+ 24%|██▎       | 1598/6790 [55:27<2:56:18,  2.04s/it] 24%|██▎       | 1599/6790 [55:29<2:59:33,  2.08s/it]                                                     {'loss': 1.623, 'learning_rate': 0.00035246175975601216, 'epoch': 0.24}
+ 24%|██▎       | 1599/6790 [55:29<2:59:33,  2.08s/it] 24%|██▎       | 1600/6790 [55:31<2:59:21,  2.07s/it]                                                     {'loss': 1.6044, 'learning_rate': 0.000352400957263822, 'epoch': 0.24}
+ 24%|██▎       | 1600/6790 [55:31<2:59:21,  2.07s/it] 24%|██▎       | 1601/6790 [55:33<2:59:12,  2.07s/it]                                                     {'loss': 1.5946, 'learning_rate': 0.00035234012116420994, 'epoch': 0.24}
+ 24%|██▎       | 1601/6790 [55:33<2:59:12,  2.07s/it] 24%|██▎       | 1602/6790 [55:35<3:01:17,  2.10s/it]                                                     {'loss': 1.5455, 'learning_rate': 0.0003522792514705917, 'epoch': 0.24}
+ 24%|██▎       | 1602/6790 [55:35<3:01:17,  2.10s/it] 24%|██▎       | 1603/6790 [55:37<2:53:33,  2.01s/it]                                                     {'loss': 1.4014, 'learning_rate': 0.0003522183481963901, 'epoch': 0.24}
+ 24%|██▎       | 1603/6790 [55:37<2:53:33,  2.01s/it] 24%|██▎       | 1604/6790 [55:39<2:56:40,  2.04s/it]                                                     {'loss': 1.5627, 'learning_rate': 0.0003521574113550357, 'epoch': 0.24}
+ 24%|██▎       | 1604/6790 [55:39<2:56:40,  2.04s/it] 24%|██▎       | 1605/6790 [55:41<3:01:55,  2.11s/it]                                                     {'loss': 1.5244, 'learning_rate': 0.0003520964409599661, 'epoch': 0.24}
+ 24%|██▎       | 1605/6790 [55:41<3:01:55,  2.11s/it] 24%|██▎       | 1606/6790 [55:43<2:56:14,  2.04s/it]                                                     {'loss': 1.4357, 'learning_rate': 0.00035203543702462666, 'epoch': 0.24}
+ 24%|██▎       | 1606/6790 [55:43<2:56:14,  2.04s/it] 24%|██▎       | 1607/6790 [55:46<3:08:50,  2.19s/it]                                                     {'loss': 1.4674, 'learning_rate': 0.00035197439956246977, 'epoch': 0.24}
+ 24%|██▎       | 1607/6790 [55:46<3:08:50,  2.19s/it] 24%|██▎       | 1608/6790 [55:47<3:02:36,  2.11s/it]                                                     {'loss': 1.2138, 'learning_rate': 0.00035191332858695547, 'epoch': 0.24}
+ 24%|██▎       | 1608/6790 [55:48<3:02:36,  2.11s/it] 24%|██▎       | 1609/6790 [55:49<2:59:29,  2.08s/it]                                                     {'loss': 1.6656, 'learning_rate': 0.0003518522241115512, 'epoch': 0.24}
+ 24%|██▎       | 1609/6790 [55:49<2:59:29,  2.08s/it] 24%|██▎       | 1610/6790 [55:52<3:09:45,  2.20s/it]                                                     {'loss': 1.3703, 'learning_rate': 0.0003517910861497316, 'epoch': 0.24}
+ 24%|██▎       | 1610/6790 [55:52<3:09:45,  2.20s/it] 24%|██▎       | 1611/6790 [55:54<3:09:34,  2.20s/it]                                                     {'loss': 1.5371, 'learning_rate': 0.0003517299147149788, 'epoch': 0.24}
+ 24%|██▎       | 1611/6790 [55:54<3:09:34,  2.20s/it] 24%|██▎       | 1612/6790 [55:56<2:59:48,  2.08s/it]                                                     {'loss': 1.4421, 'learning_rate': 0.0003516687098207824, 'epoch': 0.24}
+ 24%|██▎       | 1612/6790 [55:56<2:59:48,  2.08s/it] 24%|██▍       | 1613/6790 [55:58<2:54:07,  2.02s/it]                                                     {'loss': 1.4229, 'learning_rate': 0.0003516074714806392, 'epoch': 0.24}
+ 24%|██▍       | 1613/6790 [55:58<2:54:07,  2.02s/it] 24%|██▍       | 1614/6790 [56:00<2:52:32,  2.00s/it]                                                     {'loss': 1.6234, 'learning_rate': 0.0003515461997080534, 'epoch': 0.24}
+ 24%|██▍       | 1614/6790 [56:00<2:52:32,  2.00s/it] 24%|██▍       | 1615/6790 [56:02<2:52:42,  2.00s/it]                                                     {'loss': 1.5507, 'learning_rate': 0.0003514848945165368, 'epoch': 0.24}
+ 24%|██▍       | 1615/6790 [56:02<2:52:42,  2.00s/it] 24%|██▍       | 1616/6790 [56:04<3:06:19,  2.16s/it]                                                     {'loss': 1.4377, 'learning_rate': 0.0003514235559196084, 'epoch': 0.24}
+ 24%|██▍       | 1616/6790 [56:04<3:06:19,  2.16s/it] 24%|██▍       | 1617/6790 [56:07<3:14:47,  2.26s/it]                                                     {'loss': 1.5035, 'learning_rate': 0.0003513621839307944, 'epoch': 0.24}
+ 24%|██▍       | 1617/6790 [56:07<3:14:47,  2.26s/it] 24%|██▍       | 1618/6790 [56:09<3:04:52,  2.14s/it]                                                     {'loss': 1.3674, 'learning_rate': 0.0003513007785636287, 'epoch': 0.24}
+ 24%|██▍       | 1618/6790 [56:09<3:04:52,  2.14s/it] 24%|██▍       | 1619/6790 [56:11<3:06:00,  2.16s/it]                                                     {'loss': 1.5867, 'learning_rate': 0.00035123933983165223, 'epoch': 0.24}
+ 24%|██▍       | 1619/6790 [56:11<3:06:00,  2.16s/it] 24%|██▍       | 1620/6790 [56:13<2:58:45,  2.07s/it]                                                     {'loss': 1.5246, 'learning_rate': 0.00035117786774841364, 'epoch': 0.24}
+ 24%|██▍       | 1620/6790 [56:13<2:58:45,  2.07s/it] 24%|██▍       | 1621/6790 [56:15<3:02:35,  2.12s/it]                                                     {'loss': 1.6199, 'learning_rate': 0.00035111636232746865, 'epoch': 0.24}
+ 24%|██▍       | 1621/6790 [56:15<3:02:35,  2.12s/it] 24%|██▍       | 1622/6790 [56:18<3:28:43,  2.42s/it]                                                     {'loss': 1.5454, 'learning_rate': 0.0003510548235823804, 'epoch': 0.24}
+ 24%|██▍       | 1622/6790 [56:18<3:28:43,  2.42s/it] 24%|██▍       | 1623/6790 [56:20<3:23:39,  2.36s/it]                                                     {'loss': 1.6928, 'learning_rate': 0.00035099325152671945, 'epoch': 0.24}
+ 24%|██▍       | 1623/6790 [56:20<3:23:39,  2.36s/it] 24%|██▍       | 1624/6790 [56:22<3:13:30,  2.25s/it]                                                     {'loss': 1.7949, 'learning_rate': 0.0003509316461740636, 'epoch': 0.24}
+ 24%|██▍       | 1624/6790 [56:22<3:13:30,  2.25s/it] 24%|██▍       | 1625/6790 [56:24<3:07:06,  2.17s/it]                                                     {'loss': 1.382, 'learning_rate': 0.00035087000753799804, 'epoch': 0.24}
+ 24%|██▍       | 1625/6790 [56:24<3:07:06,  2.17s/it] 24%|██▍       | 1626/6790 [56:26<2:59:43,  2.09s/it]                                                     {'loss': 1.5548, 'learning_rate': 0.0003508083356321154, 'epoch': 0.24}
+ 24%|██▍       | 1626/6790 [56:26<2:59:43,  2.09s/it] 24%|██▍       | 1627/6790 [56:28<3:00:16,  2.10s/it]                                                     {'loss': 1.6625, 'learning_rate': 0.0003507466304700154, 'epoch': 0.24}
+ 24%|██▍       | 1627/6790 [56:28<3:00:16,  2.10s/it] 24%|██▍       | 1628/6790 [56:31<3:04:36,  2.15s/it]                                                     {'loss': 1.618, 'learning_rate': 0.0003506848920653054, 'epoch': 0.24}
+ 24%|██▍       | 1628/6790 [56:31<3:04:36,  2.15s/it] 24%|██▍       | 1629/6790 [56:33<3:00:33,  2.10s/it]                                                     {'loss': 1.4813, 'learning_rate': 0.00035062312043159985, 'epoch': 0.24}
+ 24%|██▍       | 1629/6790 [56:33<3:00:33,  2.10s/it] 24%|██▍       | 1630/6790 [56:35<3:04:20,  2.14s/it]                                                     {'loss': 1.4544, 'learning_rate': 0.00035056131558252067, 'epoch': 0.24}
+ 24%|██▍       | 1630/6790 [56:35<3:04:20,  2.14s/it] 24%|██▍       | 1631/6790 [56:37<2:52:53,  2.01s/it]                                                     {'loss': 1.2933, 'learning_rate': 0.000350499477531697, 'epoch': 0.24}
+ 24%|██▍       | 1631/6790 [56:37<2:52:53,  2.01s/it] 24%|██▍       | 1632/6790 [56:38<2:50:55,  1.99s/it]                                                     {'loss': 1.4137, 'learning_rate': 0.0003504376062927654, 'epoch': 0.24}
+ 24%|██▍       | 1632/6790 [56:38<2:50:55,  1.99s/it] 24%|██▍       | 1633/6790 [56:40<2:49:43,  1.97s/it]                                                     {'loss': 1.4273, 'learning_rate': 0.00035037570187936967, 'epoch': 0.24}
+ 24%|██▍       | 1633/6790 [56:40<2:49:43,  1.97s/it] 24%|██▍       | 1634/6790 [56:42<2:51:36,  2.00s/it]                                                     {'loss': 1.6605, 'learning_rate': 0.00035031376430516093, 'epoch': 0.24}
+ 24%|██▍       | 1634/6790 [56:42<2:51:36,  2.00s/it] 24%|██▍       | 1635/6790 [56:44<2:47:15,  1.95s/it]                                                     {'loss': 1.6065, 'learning_rate': 0.00035025179358379773, 'epoch': 0.24}
+ 24%|██▍       | 1635/6790 [56:44<2:47:15,  1.95s/it] 24%|██▍       | 1636/6790 [56:46<2:52:51,  2.01s/it]                                                     {'loss': 1.5249, 'learning_rate': 0.0003501897897289457, 'epoch': 0.24}
+ 24%|██▍       | 1636/6790 [56:46<2:52:51,  2.01s/it] 24%|██▍       | 1637/6790 [56:48<2:52:53,  2.01s/it]                                                     {'loss': 1.2874, 'learning_rate': 0.000350127752754278, 'epoch': 0.24}
+ 24%|██▍       | 1637/6790 [56:48<2:52:53,  2.01s/it] 24%|██▍       | 1638/6790 [56:51<2:57:20,  2.07s/it]                                                     {'loss': 1.5029, 'learning_rate': 0.00035006568267347503, 'epoch': 0.24}
+ 24%|██▍       | 1638/6790 [56:51<2:57:20,  2.07s/it] 24%|██▍       | 1639/6790 [56:53<2:52:29,  2.01s/it]                                                     {'loss': 1.4532, 'learning_rate': 0.0003500035795002245, 'epoch': 0.24}
+ 24%|██▍       | 1639/6790 [56:53<2:52:29,  2.01s/it] 24%|██▍       | 1640/6790 [56:55<2:53:46,  2.02s/it]                                                     {'loss': 1.3737, 'learning_rate': 0.0003499414432482212, 'epoch': 0.24}
+ 24%|██▍       | 1640/6790 [56:55<2:53:46,  2.02s/it] 24%|██▍       | 1641/6790 [56:57<3:06:25,  2.17s/it]                                                     {'loss': 1.5215, 'learning_rate': 0.0003498792739311676, 'epoch': 0.24}
+ 24%|██▍       | 1641/6790 [56:57<3:06:25,  2.17s/it] 24%|██▍       | 1642/6790 [56:59<2:57:25,  2.07s/it]                                                     {'loss': 1.5084, 'learning_rate': 0.00034981707156277317, 'epoch': 0.24}
+ 24%|██▍       | 1642/6790 [56:59<2:57:25,  2.07s/it] 24%|██▍       | 1643/6790 [57:01<3:00:28,  2.10s/it]                                                     {'loss': 1.4566, 'learning_rate': 0.00034975483615675476, 'epoch': 0.24}
+ 24%|██▍       | 1643/6790 [57:01<3:00:28,  2.10s/it] 24%|██▍       | 1644/6790 [57:04<3:07:58,  2.19s/it]                                                     {'loss': 1.4416, 'learning_rate': 0.0003496925677268366, 'epoch': 0.24}
+ 24%|██▍       | 1644/6790 [57:04<3:07:58,  2.19s/it] 24%|██▍       | 1645/6790 [57:05<3:01:16,  2.11s/it]                                                     {'loss': 1.5368, 'learning_rate': 0.00034963026628675, 'epoch': 0.24}
+ 24%|██▍       | 1645/6790 [57:05<3:01:16,  2.11s/it] 24%|██▍       | 1646/6790 [57:07<2:57:09,  2.07s/it]                                                     {'loss': 1.4982, 'learning_rate': 0.00034956793185023365, 'epoch': 0.24}
+ 24%|██▍       | 1646/6790 [57:07<2:57:09,  2.07s/it] 24%|██▍       | 1647/6790 [57:09<2:50:44,  1.99s/it]                                                     {'loss': 1.409, 'learning_rate': 0.00034950556443103366, 'epoch': 0.24}
+ 24%|██▍       | 1647/6790 [57:09<2:50:44,  1.99s/it] 24%|██▍       | 1648/6790 [57:11<2:49:56,  1.98s/it]                                                     {'loss': 1.5985, 'learning_rate': 0.00034944316404290313, 'epoch': 0.24}
+ 24%|██▍       | 1648/6790 [57:11<2:49:56,  1.98s/it] 24%|██▍       | 1649/6790 [57:13<2:56:05,  2.06s/it]                                                     {'loss': 1.4939, 'learning_rate': 0.00034938073069960265, 'epoch': 0.24}
+ 24%|██▍       | 1649/6790 [57:13<2:56:05,  2.06s/it] 24%|██▍       | 1650/6790 [57:15<2:54:27,  2.04s/it]                                                     {'loss': 1.5296, 'learning_rate': 0.00034931826441489996, 'epoch': 0.24}
+ 24%|██▍       | 1650/6790 [57:15<2:54:27,  2.04s/it] 24%|██▍       | 1651/6790 [57:17<2:52:50,  2.02s/it]                                                     {'loss': 1.5045, 'learning_rate': 0.0003492557652025702, 'epoch': 0.24}
+ 24%|██▍       | 1651/6790 [57:17<2:52:50,  2.02s/it] 24%|██▍       | 1652/6790 [57:20<3:04:01,  2.15s/it]                                                     {'loss': 1.543, 'learning_rate': 0.0003491932330763955, 'epoch': 0.24}
+ 24%|██▍       | 1652/6790 [57:20<3:04:01,  2.15s/it] 24%|██▍       | 1653/6790 [57:22<2:59:43,  2.10s/it]                                                     {'loss': 1.4482, 'learning_rate': 0.00034913066805016566, 'epoch': 0.24}
+ 24%|██▍       | 1653/6790 [57:22<2:59:43,  2.10s/it] 24%|██▍       | 1654/6790 [57:24<2:56:39,  2.06s/it]                                                     {'loss': 1.5277, 'learning_rate': 0.0003490680701376774, 'epoch': 0.24}
+ 24%|██▍       | 1654/6790 [57:24<2:56:39,  2.06s/it] 24%|██▍       | 1655/6790 [57:26<2:53:47,  2.03s/it]                                                     {'loss': 1.5821, 'learning_rate': 0.00034900543935273475, 'epoch': 0.24}
+ 24%|██▍       | 1655/6790 [57:26<2:53:47,  2.03s/it] 24%|██▍       | 1656/6790 [57:28<2:49:09,  1.98s/it]                                                     {'loss': 1.5155, 'learning_rate': 0.00034894277570914913, 'epoch': 0.24}
+ 24%|██▍       | 1656/6790 [57:28<2:49:09,  1.98s/it] 24%|██▍       | 1657/6790 [57:30<2:47:51,  1.96s/it]                                                     {'loss': 1.4621, 'learning_rate': 0.000348880079220739, 'epoch': 0.24}
+ 24%|██▍       | 1657/6790 [57:30<2:47:51,  1.96s/it] 24%|██▍       | 1658/6790 [57:32<2:50:00,  1.99s/it]                                                     {'loss': 1.464, 'learning_rate': 0.0003488173499013302, 'epoch': 0.24}
+ 24%|██▍       | 1658/6790 [57:32<2:50:00,  1.99s/it] 24%|██▍       | 1659/6790 [57:33<2:46:18,  1.94s/it]                                                     {'loss': 1.4326, 'learning_rate': 0.0003487545877647559, 'epoch': 0.24}
+ 24%|██▍       | 1659/6790 [57:33<2:46:18,  1.94s/it] 24%|██▍       | 1660/6790 [57:36<2:50:03,  1.99s/it]                                                     {'loss': 1.6773, 'learning_rate': 0.00034869179282485626, 'epoch': 0.24}
+ 24%|██▍       | 1660/6790 [57:36<2:50:03,  1.99s/it] 24%|██▍       | 1661/6790 [57:37<2:49:36,  1.98s/it]                                                     {'loss': 1.5418, 'learning_rate': 0.00034862896509547887, 'epoch': 0.24}
+ 24%|██▍       | 1661/6790 [57:37<2:49:36,  1.98s/it] 24%|██▍       | 1662/6790 [57:39<2:44:49,  1.93s/it]                                                     {'loss': 1.5901, 'learning_rate': 0.00034856610459047845, 'epoch': 0.24}
+ 24%|██▍       | 1662/6790 [57:39<2:44:49,  1.93s/it] 24%|██▍       | 1663/6790 [57:41<2:44:38,  1.93s/it]                                                     {'loss': 1.5318, 'learning_rate': 0.00034850321132371705, 'epoch': 0.24}
+ 24%|██▍       | 1663/6790 [57:41<2:44:38,  1.93s/it] 25%|██▍       | 1664/6790 [57:43<2:42:33,  1.90s/it]                                                     {'loss': 1.6494, 'learning_rate': 0.00034844028530906375, 'epoch': 0.25}
+ 25%|██▍       | 1664/6790 [57:43<2:42:33,  1.90s/it] 25%|██▍       | 1665/6790 [57:45<2:41:37,  1.89s/it]                                                     {'loss': 1.4763, 'learning_rate': 0.0003483773265603952, 'epoch': 0.25}
+ 25%|██▍       | 1665/6790 [57:45<2:41:37,  1.89s/it] 25%|██▍       | 1666/6790 [57:47<2:51:39,  2.01s/it]                                                     {'loss': 1.3801, 'learning_rate': 0.00034831433509159473, 'epoch': 0.25}
+ 25%|██▍       | 1666/6790 [57:47<2:51:39,  2.01s/it] 25%|██▍       | 1667/6790 [57:49<2:48:11,  1.97s/it]                                                     {'loss': 1.7758, 'learning_rate': 0.00034825131091655346, 'epoch': 0.25}
+ 25%|██▍       | 1667/6790 [57:49<2:48:11,  1.97s/it] 25%|██▍       | 1668/6790 [57:51<2:57:18,  2.08s/it]                                                     {'loss': 1.399, 'learning_rate': 0.0003481882540491694, 'epoch': 0.25}
+ 25%|██▍       | 1668/6790 [57:51<2:57:18,  2.08s/it] 25%|██▍       | 1669/6790 [57:54<3:11:32,  2.24s/it]                                                     {'loss': 1.3298, 'learning_rate': 0.00034812516450334776, 'epoch': 0.25}
+ 25%|██▍       | 1669/6790 [57:54<3:11:32,  2.24s/it] 25%|██▍       | 1670/6790 [57:56<3:02:33,  2.14s/it]                                                     {'loss': 1.5803, 'learning_rate': 0.0003480620422930012, 'epoch': 0.25}
+ 25%|██▍       | 1670/6790 [57:56<3:02:33,  2.14s/it] 25%|██▍       | 1671/6790 [57:58<2:56:03,  2.06s/it]                                                     {'loss': 1.6093, 'learning_rate': 0.0003479988874320492, 'epoch': 0.25}
+ 25%|██▍       | 1671/6790 [57:58<2:56:03,  2.06s/it] 25%|██▍       | 1672/6790 [58:00<3:05:45,  2.18s/it]                                                     {'loss': 1.5617, 'learning_rate': 0.0003479356999344188, 'epoch': 0.25}
+ 25%|██▍       | 1672/6790 [58:00<3:05:45,  2.18s/it] 25%|██▍       | 1673/6790 [58:02<3:01:30,  2.13s/it]                                                     {'loss': 1.7235, 'learning_rate': 0.00034787247981404407, 'epoch': 0.25}
+ 25%|██▍       | 1673/6790 [58:02<3:01:30,  2.13s/it] 25%|██▍       | 1674/6790 [58:04<2:50:10,  2.00s/it]                                                     {'loss': 1.2456, 'learning_rate': 0.0003478092270848663, 'epoch': 0.25}
+ 25%|██▍       | 1674/6790 [58:04<2:50:10,  2.00s/it] 25%|██▍       | 1675/6790 [58:06<2:56:55,  2.08s/it]                                                     {'loss': 1.4445, 'learning_rate': 0.00034774594176083387, 'epoch': 0.25}
+ 25%|██▍       | 1675/6790 [58:06<2:56:55,  2.08s/it] 25%|██▍       | 1676/6790 [58:08<3:00:33,  2.12s/it]                                                     {'loss': 1.3905, 'learning_rate': 0.0003476826238559026, 'epoch': 0.25}
+ 25%|██▍       | 1676/6790 [58:08<3:00:33,  2.12s/it] 25%|██▍       | 1677/6790 [58:11<3:05:00,  2.17s/it]                                                     {'loss': 1.3644, 'learning_rate': 0.00034761927338403516, 'epoch': 0.25}
+ 25%|██▍       | 1677/6790 [58:11<3:05:00,  2.17s/it] 25%|██▍       | 1678/6790 [58:13<3:03:34,  2.15s/it]                                                     {'loss': 1.5775, 'learning_rate': 0.0003475558903592018, 'epoch': 0.25}
+ 25%|██▍       | 1678/6790 [58:13<3:03:34,  2.15s/it] 25%|██▍       | 1679/6790 [58:15<3:11:21,  2.25s/it]                                                     {'loss': 1.3307, 'learning_rate': 0.00034749247479537947, 'epoch': 0.25}
+ 25%|██▍       | 1679/6790 [58:15<3:11:21,  2.25s/it] 25%|██▍       | 1680/6790 [58:17<3:06:12,  2.19s/it]                                                     {'loss': 1.5949, 'learning_rate': 0.0003474290267065528, 'epoch': 0.25}
+ 25%|██▍       | 1680/6790 [58:17<3:06:12,  2.19s/it] 25%|██▍       | 1681/6790 [58:20<3:16:27,  2.31s/it]                                                     {'loss': 1.5934, 'learning_rate': 0.00034736554610671316, 'epoch': 0.25}
+ 25%|██▍       | 1681/6790 [58:20<3:16:27,  2.31s/it] 25%|██▍       | 1682/6790 [58:22<3:07:12,  2.20s/it]                                                     {'loss': 1.4341, 'learning_rate': 0.0003473020330098594, 'epoch': 0.25}
+ 25%|██▍       | 1682/6790 [58:22<3:07:12,  2.20s/it] 25%|██▍       | 1683/6790 [58:24<3:02:41,  2.15s/it]                                                     {'loss': 1.5465, 'learning_rate': 0.00034723848742999734, 'epoch': 0.25}
+ 25%|██▍       | 1683/6790 [58:24<3:02:41,  2.15s/it] 25%|██▍       | 1684/6790 [58:26<2:59:06,  2.10s/it]                                                     {'loss': 1.6415, 'learning_rate': 0.00034717490938114006, 'epoch': 0.25}
+ 25%|██▍       | 1684/6790 [58:26<2:59:06,  2.10s/it] 25%|██▍       | 1685/6790 [58:28<3:00:18,  2.12s/it]                                                     {'loss': 1.4616, 'learning_rate': 0.0003471112988773078, 'epoch': 0.25}
+ 25%|██▍       | 1685/6790 [58:28<3:00:18,  2.12s/it] 25%|██▍       | 1686/6790 [58:30<2:56:51,  2.08s/it]                                                     {'loss': 1.3289, 'learning_rate': 0.0003470476559325279, 'epoch': 0.25}
+ 25%|██▍       | 1686/6790 [58:30<2:56:51,  2.08s/it] 25%|██▍       | 1687/6790 [58:33<3:07:38,  2.21s/it]                                                     {'loss': 1.3665, 'learning_rate': 0.00034698398056083493, 'epoch': 0.25}
+ 25%|██▍       | 1687/6790 [58:33<3:07:38,  2.21s/it] 25%|██▍       | 1688/6790 [58:35<3:02:04,  2.14s/it]                                                     {'loss': 1.4824, 'learning_rate': 0.00034692027277627056, 'epoch': 0.25}
+ 25%|██▍       | 1688/6790 [58:35<3:02:04,  2.14s/it] 25%|██▍       | 1689/6790 [58:37<3:03:47,  2.16s/it]                                                     {'loss': 1.534, 'learning_rate': 0.0003468565325928835, 'epoch': 0.25}
+ 25%|██▍       | 1689/6790 [58:37<3:03:47,  2.16s/it] 25%|██▍       | 1690/6790 [58:39<3:02:09,  2.14s/it]                                                     {'loss': 1.4131, 'learning_rate': 0.00034679276002472985, 'epoch': 0.25}
+ 25%|██▍       | 1690/6790 [58:39<3:02:09,  2.14s/it] 25%|██▍       | 1691/6790 [58:41<2:56:46,  2.08s/it]                                                     {'loss': 1.6499, 'learning_rate': 0.00034672895508587267, 'epoch': 0.25}
+ 25%|██▍       | 1691/6790 [58:41<2:56:46,  2.08s/it] 25%|██▍       | 1692/6790 [58:43<2:52:42,  2.03s/it]                                                     {'loss': 1.7237, 'learning_rate': 0.00034666511779038223, 'epoch': 0.25}
+ 25%|██▍       | 1692/6790 [58:43<2:52:42,  2.03s/it] 25%|██▍       | 1693/6790 [58:45<2:50:19,  2.01s/it]                                                     {'loss': 1.691, 'learning_rate': 0.0003466012481523359, 'epoch': 0.25}
+ 25%|██▍       | 1693/6790 [58:45<2:50:19,  2.01s/it] 25%|██▍       | 1694/6790 [58:47<2:52:22,  2.03s/it]                                                     {'loss': 1.3484, 'learning_rate': 0.00034653734618581824, 'epoch': 0.25}
+ 25%|██▍       | 1694/6790 [58:47<2:52:22,  2.03s/it] 25%|██▍       | 1695/6790 [58:49<2:48:52,  1.99s/it]                                                     {'loss': 1.5892, 'learning_rate': 0.0003464734119049208, 'epoch': 0.25}
+ 25%|██▍       | 1695/6790 [58:49<2:48:52,  1.99s/it] 25%|██▍       | 1696/6790 [58:51<2:51:33,  2.02s/it]                                                     {'loss': 1.5904, 'learning_rate': 0.0003464094453237425, 'epoch': 0.25}
+ 25%|██▍       | 1696/6790 [58:51<2:51:33,  2.02s/it] 25%|██▍       | 1697/6790 [58:53<2:56:26,  2.08s/it]                                                     {'loss': 1.6487, 'learning_rate': 0.000346345446456389, 'epoch': 0.25}
+ 25%|██▍       | 1697/6790 [58:53<2:56:26,  2.08s/it] 25%|██▌       | 1698/6790 [58:55<2:58:33,  2.10s/it]                                                     {'loss': 1.5618, 'learning_rate': 0.0003462814153169736, 'epoch': 0.25}
+ 25%|██▌       | 1698/6790 [58:55<2:58:33,  2.10s/it] 25%|██▌       | 1699/6790 [58:57<2:55:48,  2.07s/it]                                                     {'loss': 1.7691, 'learning_rate': 0.00034621735191961623, 'epoch': 0.25}
+ 25%|██▌       | 1699/6790 [58:57<2:55:48,  2.07s/it] 25%|██▌       | 1700/6790 [58:59<2:50:15,  2.01s/it]                                                     {'loss': 1.6181, 'learning_rate': 0.0003461532562784442, 'epoch': 0.25}
+ 25%|██▌       | 1700/6790 [58:59<2:50:15,  2.01s/it] 25%|██▌       | 1701/6790 [59:01<2:44:45,  1.94s/it]                                                     {'loss': 1.3831, 'learning_rate': 0.00034608912840759185, 'epoch': 0.25}
+ 25%|██▌       | 1701/6790 [59:01<2:44:45,  1.94s/it] 25%|██▌       | 1702/6790 [59:03<2:43:07,  1.92s/it]                                                     {'loss': 1.5588, 'learning_rate': 0.0003460249683212006, 'epoch': 0.25}
+ 25%|██▌       | 1702/6790 [59:03<2:43:07,  1.92s/it] 25%|██▌       | 1703/6790 [59:05<2:47:49,  1.98s/it]                                                     {'loss': 1.6367, 'learning_rate': 0.00034596077603341925, 'epoch': 0.25}
+ 25%|██▌       | 1703/6790 [59:05<2:47:49,  1.98s/it] 25%|██▌       | 1704/6790 [59:07<2:44:55,  1.95s/it]                                                     {'loss': 1.4548, 'learning_rate': 0.0003458965515584031, 'epoch': 0.25}
+ 25%|██▌       | 1704/6790 [59:07<2:44:55,  1.95s/it] 25%|██▌       | 1705/6790 [59:09<2:44:40,  1.94s/it]                                                     {'loss': 1.6076, 'learning_rate': 0.0003458322949103152, 'epoch': 0.25}
+ 25%|██▌       | 1705/6790 [59:09<2:44:40,  1.94s/it] 25%|██▌       | 1706/6790 [59:11<2:46:31,  1.97s/it]                                                     {'loss': 1.5576, 'learning_rate': 0.0003457680061033253, 'epoch': 0.25}
+ 25%|██▌       | 1706/6790 [59:11<2:46:31,  1.97s/it] 25%|██▌       | 1707/6790 [59:13<2:50:53,  2.02s/it]                                                     {'loss': 1.3367, 'learning_rate': 0.00034570368515161035, 'epoch': 0.25}
+ 25%|██▌       | 1707/6790 [59:13<2:50:53,  2.02s/it] 25%|██▌       | 1708/6790 [59:15<2:56:09,  2.08s/it]                                                     {'loss': 1.5485, 'learning_rate': 0.0003456393320693544, 'epoch': 0.25}
+ 25%|██▌       | 1708/6790 [59:15<2:56:09,  2.08s/it] 25%|██▌       | 1709/6790 [59:17<2:58:54,  2.11s/it]                                                     {'loss': 1.638, 'learning_rate': 0.0003455749468707486, 'epoch': 0.25}
+ 25%|██▌       | 1709/6790 [59:17<2:58:54,  2.11s/it] 25%|██▌       | 1710/6790 [59:19<3:02:06,  2.15s/it]                                                     {'loss': 1.4263, 'learning_rate': 0.0003455105295699911, 'epoch': 0.25}
+ 25%|██▌       | 1710/6790 [59:19<3:02:06,  2.15s/it] 25%|██▌       | 1711/6790 [59:22<3:02:15,  2.15s/it]                                                     {'loss': 1.5742, 'learning_rate': 0.00034544608018128724, 'epoch': 0.25}
+ 25%|██▌       | 1711/6790 [59:22<3:02:15,  2.15s/it] 25%|██▌       | 1712/6790 [59:24<2:59:48,  2.12s/it]                                                     {'loss': 1.7887, 'learning_rate': 0.0003453815987188494, 'epoch': 0.25}
+ 25%|██▌       | 1712/6790 [59:24<2:59:48,  2.12s/it] 25%|██▌       | 1713/6790 [59:26<3:01:33,  2.15s/it]                                                     {'loss': 1.6948, 'learning_rate': 0.000345317085196897, 'epoch': 0.25}
+ 25%|██▌       | 1713/6790 [59:26<3:01:33,  2.15s/it] 25%|██▌       | 1714/6790 [59:28<2:57:44,  2.10s/it]                                                     {'loss': 1.511, 'learning_rate': 0.0003452525396296565, 'epoch': 0.25}
+ 25%|██▌       | 1714/6790 [59:28<2:57:44,  2.10s/it] 25%|██▌       | 1715/6790 [59:30<2:53:57,  2.06s/it]                                                     {'loss': 1.6722, 'learning_rate': 0.00034518796203136153, 'epoch': 0.25}
+ 25%|██▌       | 1715/6790 [59:30<2:53:57,  2.06s/it] 25%|██▌       | 1716/6790 [59:32<2:51:52,  2.03s/it]                                                     {'loss': 1.7141, 'learning_rate': 0.00034512335241625267, 'epoch': 0.25}
+ 25%|██▌       | 1716/6790 [59:32<2:51:52,  2.03s/it] 25%|██▌       | 1717/6790 [59:34<2:51:30,  2.03s/it]                                                     {'loss': 1.6575, 'learning_rate': 0.00034505871079857763, 'epoch': 0.25}
+ 25%|██▌       | 1717/6790 [59:34<2:51:30,  2.03s/it] 25%|██▌       | 1718/6790 [59:36<2:58:53,  2.12s/it]                                                     {'loss': 1.479, 'learning_rate': 0.00034499403719259123, 'epoch': 0.25}
+ 25%|██▌       | 1718/6790 [59:36<2:58:53,  2.12s/it] 25%|██▌       | 1719/6790 [59:38<2:52:25,  2.04s/it]                                                     {'loss': 1.5659, 'learning_rate': 0.0003449293316125552, 'epoch': 0.25}
+ 25%|██▌       | 1719/6790 [59:38<2:52:25,  2.04s/it] 25%|██▌       | 1720/6790 [59:40<2:57:34,  2.10s/it]                                                     {'loss': 1.4676, 'learning_rate': 0.00034486459407273844, 'epoch': 0.25}
+ 25%|██▌       | 1720/6790 [59:40<2:57:34,  2.10s/it] 25%|██▌       | 1721/6790 [59:42<2:54:41,  2.07s/it]                                                     {'loss': 1.4995, 'learning_rate': 0.00034479982458741687, 'epoch': 0.25}
+ 25%|██▌       | 1721/6790 [59:42<2:54:41,  2.07s/it] 25%|██▌       | 1722/6790 [59:44<2:59:06,  2.12s/it]                                                     {'loss': 1.3403, 'learning_rate': 0.0003447350231708734, 'epoch': 0.25}
+ 25%|██▌       | 1722/6790 [59:44<2:59:06,  2.12s/it] 25%|██▌       | 1723/6790 [59:46<2:57:36,  2.10s/it]                                                     {'loss': 1.646, 'learning_rate': 0.000344670189837398, 'epoch': 0.25}
+ 25%|██▌       | 1723/6790 [59:46<2:57:36,  2.10s/it] 25%|██▌       | 1724/6790 [59:48<2:52:11,  2.04s/it]                                                     {'loss': 1.5029, 'learning_rate': 0.0003446053246012878, 'epoch': 0.25}
+ 25%|██▌       | 1724/6790 [59:48<2:52:11,  2.04s/it] 25%|██▌       | 1725/6790 [59:50<2:48:51,  2.00s/it]                                                     {'loss': 1.6225, 'learning_rate': 0.0003445404274768468, 'epoch': 0.25}
+ 25%|██▌       | 1725/6790 [59:50<2:48:51,  2.00s/it] 25%|██▌       | 1726/6790 [59:52<2:43:22,  1.94s/it]                                                     {'loss': 1.3906, 'learning_rate': 0.0003444754984783861, 'epoch': 0.25}
+ 25%|██▌       | 1726/6790 [59:52<2:43:22,  1.94s/it] 25%|██▌       | 1727/6790 [59:54<2:45:30,  1.96s/it]                                                     {'loss': 1.5828, 'learning_rate': 0.00034441053762022375, 'epoch': 0.25}
+ 25%|██▌       | 1727/6790 [59:54<2:45:30,  1.96s/it] 25%|██▌       | 1728/6790 [59:56<2:46:52,  1.98s/it]                                                     {'loss': 1.6213, 'learning_rate': 0.0003443455449166851, 'epoch': 0.25}
+ 25%|██▌       | 1728/6790 [59:56<2:46:52,  1.98s/it] 25%|██▌       | 1729/6790 [59:58<2:44:21,  1.95s/it]                                                     {'loss': 1.5415, 'learning_rate': 0.00034428052038210213, 'epoch': 0.25}
+ 25%|██▌       | 1729/6790 [59:58<2:44:21,  1.95s/it] 25%|██▌       | 1730/6790 [1:00:00<2:43:48,  1.94s/it]                                                       {'loss': 1.5807, 'learning_rate': 0.00034421546403081414, 'epoch': 0.25}
+ 25%|██▌       | 1730/6790 [1:00:00<2:43:48,  1.94s/it] 25%|██▌       | 1731/6790 [1:00:02<2:48:53,  2.00s/it]                                                       {'loss': 1.4129, 'learning_rate': 0.0003441503758771673, 'epoch': 0.25}
+ 25%|██▌       | 1731/6790 [1:00:02<2:48:53,  2.00s/it] 26%|██▌       | 1732/6790 [1:00:04<2:42:37,  1.93s/it]                                                       {'loss': 1.506, 'learning_rate': 0.00034408525593551486, 'epoch': 0.26}
+ 26%|██▌       | 1732/6790 [1:00:04<2:42:37,  1.93s/it] 26%|██▌       | 1733/6790 [1:00:06<2:51:47,  2.04s/it]                                                       {'loss': 1.5018, 'learning_rate': 0.000344020104220217, 'epoch': 0.26}
+ 26%|██▌       | 1733/6790 [1:00:06<2:51:47,  2.04s/it] 26%|██▌       | 1734/6790 [1:00:08<2:47:59,  1.99s/it]                                                       {'loss': 1.7144, 'learning_rate': 0.000343954920745641, 'epoch': 0.26}
+ 26%|██▌       | 1734/6790 [1:00:08<2:47:59,  1.99s/it] 26%|██▌       | 1735/6790 [1:00:10<2:57:43,  2.11s/it]                                                       {'loss': 1.8894, 'learning_rate': 0.0003438897055261612, 'epoch': 0.26}
+ 26%|██▌       | 1735/6790 [1:00:10<2:57:43,  2.11s/it] 26%|██▌       | 1736/6790 [1:00:12<2:56:09,  2.09s/it]                                                       {'loss': 1.4131, 'learning_rate': 0.00034382445857615866, 'epoch': 0.26}
+ 26%|██▌       | 1736/6790 [1:00:12<2:56:09,  2.09s/it] 26%|██▌       | 1737/6790 [1:00:14<2:53:10,  2.06s/it]                                                       {'loss': 1.431, 'learning_rate': 0.00034375917991002174, 'epoch': 0.26}
+ 26%|██▌       | 1737/6790 [1:00:14<2:53:10,  2.06s/it] 26%|██▌       | 1738/6790 [1:00:16<2:47:38,  1.99s/it]                                                       {'loss': 1.7208, 'learning_rate': 0.0003436938695421456, 'epoch': 0.26}
+ 26%|██▌       | 1738/6790 [1:00:16<2:47:38,  1.99s/it] 26%|██▌       | 1739/6790 [1:00:18<2:54:21,  2.07s/it]                                                       {'loss': 1.5374, 'learning_rate': 0.0003436285274869326, 'epoch': 0.26}
+ 26%|██▌       | 1739/6790 [1:00:18<2:54:21,  2.07s/it] 26%|██▌       | 1740/6790 [1:00:20<2:51:23,  2.04s/it]                                                       {'loss': 1.7084, 'learning_rate': 0.00034356315375879185, 'epoch': 0.26}
+ 26%|██▌       | 1740/6790 [1:00:20<2:51:23,  2.04s/it] 26%|██▌       | 1741/6790 [1:00:22<2:42:29,  1.93s/it]                                                       {'loss': 1.2436, 'learning_rate': 0.0003434977483721395, 'epoch': 0.26}
+ 26%|██▌       | 1741/6790 [1:00:22<2:42:29,  1.93s/it] 26%|██▌       | 1742/6790 [1:00:24<2:42:59,  1.94s/it]                                                       {'loss': 1.6205, 'learning_rate': 0.00034343231134139886, 'epoch': 0.26}
+ 26%|██▌       | 1742/6790 [1:00:24<2:42:59,  1.94s/it] 26%|██▌       | 1743/6790 [1:00:26<2:49:38,  2.02s/it]                                                       {'loss': 1.6436, 'learning_rate': 0.00034336684268099996, 'epoch': 0.26}
+ 26%|██▌       | 1743/6790 [1:00:26<2:49:38,  2.02s/it] 26%|██▌       | 1744/6790 [1:00:28<2:43:40,  1.95s/it]                                                       {'loss': 1.4344, 'learning_rate': 0.00034330134240538, 'epoch': 0.26}
+ 26%|██▌       | 1744/6790 [1:00:28<2:43:40,  1.95s/it] 26%|██▌       | 1745/6790 [1:00:30<2:52:49,  2.06s/it]                                                       {'loss': 1.665, 'learning_rate': 0.0003432358105289831, 'epoch': 0.26}
+ 26%|██▌       | 1745/6790 [1:00:30<2:52:49,  2.06s/it] 26%|██▌       | 1746/6790 [1:00:32<2:51:00,  2.03s/it]                                                       {'loss': 1.6432, 'learning_rate': 0.00034317024706626036, 'epoch': 0.26}
+ 26%|██▌       | 1746/6790 [1:00:32<2:51:00,  2.03s/it] 26%|██▌       | 1747/6790 [1:00:35<2:55:11,  2.08s/it]                                                       {'loss': 1.3568, 'learning_rate': 0.0003431046520316697, 'epoch': 0.26}
+ 26%|██▌       | 1747/6790 [1:00:35<2:55:11,  2.08s/it] 26%|██▌       | 1748/6790 [1:00:36<2:47:44,  2.00s/it]                                                       {'loss': 1.401, 'learning_rate': 0.00034303902543967625, 'epoch': 0.26}
+ 26%|██▌       | 1748/6790 [1:00:36<2:47:44,  2.00s/it] 26%|██▌       | 1749/6790 [1:00:39<2:54:58,  2.08s/it]                                                       {'loss': 1.7272, 'learning_rate': 0.0003429733673047519, 'epoch': 0.26}
+ 26%|██▌       | 1749/6790 [1:00:39<2:54:58,  2.08s/it] 26%|██▌       | 1750/6790 [1:00:40<2:47:26,  1.99s/it]                                                       {'loss': 1.674, 'learning_rate': 0.00034290767764137556, 'epoch': 0.26}
+ 26%|██▌       | 1750/6790 [1:00:40<2:47:26,  1.99s/it] 26%|██▌       | 1751/6790 [1:00:42<2:47:26,  1.99s/it]                                                       {'loss': 1.542, 'learning_rate': 0.0003428419564640331, 'epoch': 0.26}
+ 26%|██▌       | 1751/6790 [1:00:42<2:47:26,  1.99s/it] 26%|██▌       | 1752/6790 [1:00:44<2:47:01,  1.99s/it]                                                       {'loss': 1.3389, 'learning_rate': 0.0003427762037872174, 'epoch': 0.26}
+ 26%|██▌       | 1752/6790 [1:00:44<2:47:01,  1.99s/it] 26%|██▌       | 1753/6790 [1:00:46<2:42:54,  1.94s/it]                                                       {'loss': 1.5301, 'learning_rate': 0.00034271041962542813, 'epoch': 0.26}
+ 26%|██▌       | 1753/6790 [1:00:46<2:42:54,  1.94s/it] 26%|██▌       | 1754/6790 [1:00:49<2:58:15,  2.12s/it]                                                       {'loss': 1.4746, 'learning_rate': 0.0003426446039931721, 'epoch': 0.26}
+ 26%|██▌       | 1754/6790 [1:00:49<2:58:15,  2.12s/it] 26%|██▌       | 1755/6790 [1:00:51<2:58:24,  2.13s/it]                                                       {'loss': 1.4486, 'learning_rate': 0.0003425787569049629, 'epoch': 0.26}
+ 26%|██▌       | 1755/6790 [1:00:51<2:58:24,  2.13s/it] 26%|██▌       | 1756/6790 [1:00:53<2:55:51,  2.10s/it]                                                       {'loss': 1.52, 'learning_rate': 0.0003425128783753211, 'epoch': 0.26}
+ 26%|██▌       | 1756/6790 [1:00:53<2:55:51,  2.10s/it] 26%|██▌       | 1757/6790 [1:00:55<2:49:03,  2.02s/it]                                                       {'loss': 1.455, 'learning_rate': 0.00034244696841877426, 'epoch': 0.26}
+ 26%|██▌       | 1757/6790 [1:00:55<2:49:03,  2.02s/it] 26%|██▌       | 1758/6790 [1:00:57<2:47:28,  2.00s/it]                                                       {'loss': 1.5948, 'learning_rate': 0.0003423810270498567, 'epoch': 0.26}
+ 26%|██▌       | 1758/6790 [1:00:57<2:47:28,  2.00s/it] 26%|██▌       | 1759/6790 [1:00:59<2:43:39,  1.95s/it]                                                       {'loss': 1.468, 'learning_rate': 0.00034231505428311006, 'epoch': 0.26}
+ 26%|██▌       | 1759/6790 [1:00:59<2:43:39,  1.95s/it] 26%|██▌       | 1760/6790 [1:01:01<2:49:48,  2.03s/it]                                                       {'loss': 1.6282, 'learning_rate': 0.00034224905013308235, 'epoch': 0.26}
+ 26%|██▌       | 1760/6790 [1:01:01<2:49:48,  2.03s/it] 26%|██▌       | 1761/6790 [1:01:03<3:00:36,  2.15s/it]                                                       {'loss': 1.55, 'learning_rate': 0.000342183014614329, 'epoch': 0.26}
+ 26%|██▌       | 1761/6790 [1:01:03<3:00:36,  2.15s/it] 26%|██▌       | 1762/6790 [1:01:05<2:58:28,  2.13s/it]                                                       {'loss': 1.6792, 'learning_rate': 0.000342116947741412, 'epoch': 0.26}
+ 26%|██▌       | 1762/6790 [1:01:05<2:58:28,  2.13s/it] 26%|██▌       | 1763/6790 [1:01:09<3:26:21,  2.46s/it]                                                       {'loss': 1.4841, 'learning_rate': 0.00034205084952890045, 'epoch': 0.26}
+ 26%|██▌       | 1763/6790 [1:01:09<3:26:21,  2.46s/it] 26%|██▌       | 1764/6790 [1:01:10<3:13:51,  2.31s/it]                                                       {'loss': 1.5773, 'learning_rate': 0.0003419847199913703, 'epoch': 0.26}
+ 26%|██▌       | 1764/6790 [1:01:10<3:13:51,  2.31s/it] 26%|██▌       | 1765/6790 [1:01:12<3:03:30,  2.19s/it]                                                       {'loss': 1.601, 'learning_rate': 0.00034191855914340457, 'epoch': 0.26}
+ 26%|██▌       | 1765/6790 [1:01:12<3:03:30,  2.19s/it] 26%|██▌       | 1766/6790 [1:01:14<2:58:02,  2.13s/it]                                                       {'loss': 1.6164, 'learning_rate': 0.0003418523669995928, 'epoch': 0.26}
+ 26%|██▌       | 1766/6790 [1:01:14<2:58:02,  2.13s/it] 26%|██▌       | 1767/6790 [1:01:16<2:56:24,  2.11s/it]                                                       {'loss': 1.583, 'learning_rate': 0.0003417861435745318, 'epoch': 0.26}
+ 26%|██▌       | 1767/6790 [1:01:16<2:56:24,  2.11s/it] 26%|██▌       | 1768/6790 [1:01:19<2:58:18,  2.13s/it]                                                       {'loss': 1.6592, 'learning_rate': 0.00034171988888282513, 'epoch': 0.26}
+ 26%|██▌       | 1768/6790 [1:01:19<2:58:18,  2.13s/it] 26%|██▌       | 1769/6790 [1:01:20<2:51:57,  2.05s/it]                                                       {'loss': 1.5393, 'learning_rate': 0.0003416536029390832, 'epoch': 0.26}
+ 26%|██▌       | 1769/6790 [1:01:20<2:51:57,  2.05s/it] 26%|██▌       | 1770/6790 [1:01:22<2:46:46,  1.99s/it]                                                       {'loss': 1.4544, 'learning_rate': 0.0003415872857579235, 'epoch': 0.26}
+ 26%|██▌       | 1770/6790 [1:01:22<2:46:46,  1.99s/it] 26%|���█▌       | 1771/6790 [1:01:24<2:47:38,  2.00s/it]                                                       {'loss': 1.2569, 'learning_rate': 0.0003415209373539701, 'epoch': 0.26}
+ 26%|██▌       | 1771/6790 [1:01:24<2:47:38,  2.00s/it] 26%|██▌       | 1772/6790 [1:01:27<3:01:47,  2.17s/it]                                                       {'loss': 1.3097, 'learning_rate': 0.00034145455774185426, 'epoch': 0.26}
+ 26%|██▌       | 1772/6790 [1:01:27<3:01:47,  2.17s/it] 26%|██▌       | 1773/6790 [1:01:29<3:03:30,  2.19s/it]                                                       {'loss': 1.5111, 'learning_rate': 0.00034138814693621393, 'epoch': 0.26}
+ 26%|██▌       | 1773/6790 [1:01:29<3:03:30,  2.19s/it] 26%|██▌       | 1774/6790 [1:01:31<3:05:57,  2.22s/it]                                                       {'loss': 1.539, 'learning_rate': 0.0003413217049516941, 'epoch': 0.26}
+ 26%|██▌       | 1774/6790 [1:01:31<3:05:57,  2.22s/it] 26%|██▌       | 1775/6790 [1:01:33<2:59:14,  2.14s/it]                                                       {'loss': 1.5024, 'learning_rate': 0.00034125523180294646, 'epoch': 0.26}
+ 26%|██▌       | 1775/6790 [1:01:33<2:59:14,  2.14s/it] 26%|██▌       | 1776/6790 [1:01:35<2:52:28,  2.06s/it]                                                       {'loss': 1.5458, 'learning_rate': 0.00034118872750462965, 'epoch': 0.26}
+ 26%|██▌       | 1776/6790 [1:01:35<2:52:28,  2.06s/it] 26%|██▌       | 1777/6790 [1:01:37<2:54:11,  2.08s/it]                                                       {'loss': 1.4306, 'learning_rate': 0.0003411221920714092, 'epoch': 0.26}
+ 26%|██▌       | 1777/6790 [1:01:37<2:54:11,  2.08s/it] 26%|██▌       | 1778/6790 [1:01:39<2:51:14,  2.05s/it]                                                       {'loss': 1.5413, 'learning_rate': 0.0003410556255179575, 'epoch': 0.26}
+ 26%|██▌       | 1778/6790 [1:01:39<2:51:14,  2.05s/it] 26%|██▌       | 1779/6790 [1:01:42<2:54:05,  2.08s/it]                                                       {'loss': 1.534, 'learning_rate': 0.0003409890278589538, 'epoch': 0.26}
+ 26%|██▌       | 1779/6790 [1:01:42<2:54:05,  2.08s/it] 26%|██▌       | 1780/6790 [1:01:43<2:46:55,  2.00s/it]                                                       {'loss': 1.5671, 'learning_rate': 0.0003409223991090841, 'epoch': 0.26}
+ 26%|██▌       | 1780/6790 [1:01:43<2:46:55,  2.00s/it] 26%|██▌       | 1781/6790 [1:01:45<2:43:04,  1.95s/it]                                                       {'loss': 1.4948, 'learning_rate': 0.00034085573928304157, 'epoch': 0.26}
+ 26%|██▌       | 1781/6790 [1:01:45<2:43:04,  1.95s/it] 26%|██▌       | 1782/6790 [1:01:47<2:41:43,  1.94s/it]                                                       {'loss': 1.4676, 'learning_rate': 0.00034078904839552574, 'epoch': 0.26}
+ 26%|██▌       | 1782/6790 [1:01:47<2:41:43,  1.94s/it] 26%|██▋       | 1783/6790 [1:01:49<2:50:38,  2.04s/it]                                                       {'loss': 1.3504, 'learning_rate': 0.0003407223264612435, 'epoch': 0.26}
+ 26%|██▋       | 1783/6790 [1:01:49<2:50:38,  2.04s/it] 26%|██▋       | 1784/6790 [1:01:51<2:50:42,  2.05s/it]                                                       {'loss': 1.6263, 'learning_rate': 0.00034065557349490823, 'epoch': 0.26}
+ 26%|██▋       | 1784/6790 [1:01:51<2:50:42,  2.05s/it] 26%|██▋       | 1785/6790 [1:01:54<2:54:34,  2.09s/it]                                                       {'loss': 1.4077, 'learning_rate': 0.0003405887895112403, 'epoch': 0.26}
+ 26%|██▋       | 1785/6790 [1:01:54<2:54:34,  2.09s/it] 26%|██▋       | 1786/6790 [1:01:56<2:51:30,  2.06s/it]                                                       {'loss': 1.5883, 'learning_rate': 0.00034052197452496695, 'epoch': 0.26}
+ 26%|██▋       | 1786/6790 [1:01:56<2:51:30,  2.06s/it] 26%|██▋       | 1787/6790 [1:01:58<2:46:56,  2.00s/it]                                                       {'loss': 1.4701, 'learning_rate': 0.00034045512855082215, 'epoch': 0.26}
+ 26%|██▋       | 1787/6790 [1:01:58<2:46:56,  2.00s/it] 26%|██▋       | 1788/6790 [1:02:00<2:49:28,  2.03s/it]                                                       {'loss': 1.6245, 'learning_rate': 0.0003403882516035467, 'epoch': 0.26}
+ 26%|██▋       | 1788/6790 [1:02:00<2:49:28,  2.03s/it] 26%|██▋       | 1789/6790 [1:02:02<2:51:41,  2.06s/it]                                                       {'loss': 1.4398, 'learning_rate': 0.0003403213436978885, 'epoch': 0.26}
+ 26%|██▋       | 1789/6790 [1:02:02<2:51:41,  2.06s/it] 26%|██▋       | 1790/6790 [1:02:04<2:54:28,  2.09s/it]                                                       {'loss': 1.4369, 'learning_rate': 0.0003402544048486018, 'epoch': 0.26}
+ 26%|██▋       | 1790/6790 [1:02:04<2:54:28,  2.09s/it] 26%|██▋       | 1791/6790 [1:02:06<2:50:42,  2.05s/it]                                                       {'loss': 1.6134, 'learning_rate': 0.00034018743507044813, 'epoch': 0.26}
+ 26%|██▋       | 1791/6790 [1:02:06<2:50:42,  2.05s/it] 26%|██▋       | 1792/6790 [1:02:08<2:58:40,  2.14s/it]                                                       {'loss': 1.5836, 'learning_rate': 0.0003401204343781956, 'epoch': 0.26}
+ 26%|██▋       | 1792/6790 [1:02:08<2:58:40,  2.14s/it] 26%|██▋       | 1793/6790 [1:02:10<2:55:13,  2.10s/it]                                                       {'loss': 1.5446, 'learning_rate': 0.0003400534027866191, 'epoch': 0.26}
+ 26%|██▋       | 1793/6790 [1:02:10<2:55:13,  2.10s/it] 26%|██▋       | 1794/6790 [1:02:12<2:47:29,  2.01s/it]                                                       {'loss': 1.5113, 'learning_rate': 0.00033998634031050056, 'epoch': 0.26}
+ 26%|██▋       | 1794/6790 [1:02:12<2:47:29,  2.01s/it] 26%|██▋       | 1795/6790 [1:02:15<3:21:14,  2.42s/it]                                                       {'loss': 1.2509, 'learning_rate': 0.0003399192469646285, 'epoch': 0.26}
+ 26%|██▋       | 1795/6790 [1:02:15<3:21:14,  2.42s/it] 26%|██▋       | 1796/6790 [1:02:17<3:05:56,  2.23s/it]                                                       {'loss': 1.6881, 'learning_rate': 0.0003398521227637983, 'epoch': 0.26}
+ 26%|██▋       | 1796/6790 [1:02:17<3:05:56,  2.23s/it] 26%|██▋       | 1797/6790 [1:02:19<3:04:09,  2.21s/it]                                                       {'loss': 1.7496, 'learning_rate': 0.00033978496772281224, 'epoch': 0.26}
+ 26%|██▋       | 1797/6790 [1:02:19<3:04:09,  2.21s/it] 26%|██▋       | 1798/6790 [1:02:21<2:55:38,  2.11s/it]                                                       {'loss': 1.5066, 'learning_rate': 0.0003397177818564793, 'epoch': 0.26}
+ 26%|██▋       | 1798/6790 [1:02:21<2:55:38,  2.11s/it] 26%|██▋       | 1799/6790 [1:02:23<2:50:52,  2.05s/it]                                                       {'loss': 1.6852, 'learning_rate': 0.0003396505651796153, 'epoch': 0.26}
+ 26%|██▋       | 1799/6790 [1:02:23<2:50:52,  2.05s/it] 27%|██▋       | 1800/6790 [1:02:25<2:44:39,  1.98s/it]                                                       {'loss': 1.3723, 'learning_rate': 0.0003395833177070428, 'epoch': 0.27}
+ 27%|██▋       | 1800/6790 [1:02:25<2:44:39,  1.98s/it] 27%|██▋       | 1801/6790 [1:02:27<2:50:00,  2.04s/it]                                                       {'loss': 1.4536, 'learning_rate': 0.0003395160394535913, 'epoch': 0.27}
+ 27%|██▋       | 1801/6790 [1:02:27<2:50:00,  2.04s/it] 27%|██▋       | 1802/6790 [1:02:29<2:56:41,  2.13s/it]                                                       {'loss': 1.4792, 'learning_rate': 0.0003394487304340969, 'epoch': 0.27}
+ 27%|██▋       | 1802/6790 [1:02:29<2:56:41,  2.13s/it] 27%|██▋       | 1803/6790 [1:02:32<2:58:41,  2.15s/it]                                                       {'loss': 1.4575, 'learning_rate': 0.00033938139066340254, 'epoch': 0.27}
+ 27%|██▋       | 1803/6790 [1:02:32<2:58:41,  2.15s/it] 27%|██▋       | 1804/6790 [1:02:34<3:03:10,  2.20s/it]                                                       {'loss': 1.5704, 'learning_rate': 0.0003393140201563581, 'epoch': 0.27}
+ 27%|██▋       | 1804/6790 [1:02:34<3:03:10,  2.20s/it] 27%|██▋       | 1805/6790 [1:02:36<3:01:19,  2.18s/it]                                                       {'loss': 1.5181, 'learning_rate': 0.00033924661892782, 'epoch': 0.27}
+ 27%|██▋       | 1805/6790 [1:02:36<3:01:19,  2.18s/it] 27%|██▋       | 1806/6790 [1:02:38<2:52:43,  2.08s/it]                                                       {'loss': 1.6646, 'learning_rate': 0.00033917918699265156, 'epoch': 0.27}
+ 27%|██▋       | 1806/6790 [1:02:38<2:52:43,  2.08s/it] 27%|██▋       | 1807/6790 [1:02:40<2:49:34,  2.04s/it]                                                       {'loss': 1.7014, 'learning_rate': 0.00033911172436572285, 'epoch': 0.27}
+ 27%|██▋       | 1807/6790 [1:02:40<2:49:34,  2.04s/it] 27%|██▋       | 1808/6790 [1:02:42<2:45:00,  1.99s/it]                                                       {'loss': 1.5953, 'learning_rate': 0.0003390442310619107, 'epoch': 0.27}
+ 27%|██▋       | 1808/6790 [1:02:42<2:45:00,  1.99s/it] 27%|██▋       | 1809/6790 [1:02:44<2:47:02,  2.01s/it]                                                       {'loss': 1.3817, 'learning_rate': 0.00033897670709609874, 'epoch': 0.27}
+ 27%|██▋       | 1809/6790 [1:02:44<2:47:02,  2.01s/it] 27%|██▋       | 1810/6790 [1:02:46<2:42:23,  1.96s/it]                                                       {'loss': 1.5697, 'learning_rate': 0.00033890915248317743, 'epoch': 0.27}
+ 27%|██▋       | 1810/6790 [1:02:46<2:42:23,  1.96s/it] 27%|██▋       | 1811/6790 [1:02:48<2:45:29,  1.99s/it]                                                       {'loss': 1.4501, 'learning_rate': 0.0003388415672380437, 'epoch': 0.27}
+ 27%|██▋       | 1811/6790 [1:02:48<2:45:29,  1.99s/it] 27%|██▋       | 1812/6790 [1:02:50<2:42:39,  1.96s/it]                                                       {'loss': 1.3583, 'learning_rate': 0.0003387739513756016, 'epoch': 0.27}
+ 27%|██▋       | 1812/6790 [1:02:50<2:42:39,  1.96s/it] 27%|██▋       | 1813/6790 [1:02:52<2:43:23,  1.97s/it]                                                       {'loss': 1.3326, 'learning_rate': 0.0003387063049107617, 'epoch': 0.27}
+ 27%|██▋       | 1813/6790 [1:02:52<2:43:23,  1.97s/it] 27%|██▋       | 1814/6790 [1:02:54<2:48:06,  2.03s/it]                                                       {'loss': 1.5437, 'learning_rate': 0.0003386386278584414, 'epoch': 0.27}
+ 27%|██▋       | 1814/6790 [1:02:54<2:48:06,  2.03s/it] 27%|██▋       | 1815/6790 [1:02:56<2:47:51,  2.02s/it]                                                       {'loss': 1.6454, 'learning_rate': 0.00033857092023356476, 'epoch': 0.27}
+ 27%|██▋       | 1815/6790 [1:02:56<2:47:51,  2.02s/it] 27%|██▋       | 1816/6790 [1:02:58<2:50:59,  2.06s/it]                                                       {'loss': 1.3881, 'learning_rate': 0.00033850318205106274, 'epoch': 0.27}
+ 27%|██▋       | 1816/6790 [1:02:58<2:50:59,  2.06s/it] 27%|██▋       | 1817/6790 [1:03:00<2:45:15,  1.99s/it]                                                       {'loss': 1.4246, 'learning_rate': 0.00033843541332587287, 'epoch': 0.27}
+ 27%|██▋       | 1817/6790 [1:03:00<2:45:15,  1.99s/it] 27%|██▋       | 1818/6790 [1:03:02<2:48:52,  2.04s/it]                                                       {'loss': 1.6625, 'learning_rate': 0.0003383676140729396, 'epoch': 0.27}
+ 27%|██▋       | 1818/6790 [1:03:02<2:48:52,  2.04s/it] 27%|██▋       | 1819/6790 [1:03:04<2:51:14,  2.07s/it]                                                       {'loss': 1.6203, 'learning_rate': 0.0003382997843072139, 'epoch': 0.27}
+ 27%|██▋       | 1819/6790 [1:03:04<2:51:14,  2.07s/it] 27%|██▋       | 1820/6790 [1:03:06<2:57:07,  2.14s/it]                                                       {'loss': 1.6151, 'learning_rate': 0.00033823192404365353, 'epoch': 0.27}
+ 27%|██▋       | 1820/6790 [1:03:06<2:57:07,  2.14s/it] 27%|██▋       | 1821/6790 [1:03:08<2:54:50,  2.11s/it]                                                       {'loss': 1.3215, 'learning_rate': 0.0003381640332972232, 'epoch': 0.27}
+ 27%|██▋       | 1821/6790 [1:03:08<2:54:50,  2.11s/it] 27%|██▋       | 1822/6790 [1:03:10<2:45:56,  2.00s/it]                                                       {'loss': 1.6349, 'learning_rate': 0.000338096112082894, 'epoch': 0.27}
+ 27%|██▋       | 1822/6790 [1:03:10<2:45:56,  2.00s/it] 27%|██▋       | 1823/6790 [1:03:12<2:48:14,  2.03s/it]                                                       {'loss': 1.6535, 'learning_rate': 0.00033802816041564397, 'epoch': 0.27}
+ 27%|██▋       | 1823/6790 [1:03:12<2:48:14,  2.03s/it] 27%|██▋       | 1824/6790 [1:03:14<2:42:11,  1.96s/it]                                                       {'loss': 1.5193, 'learning_rate': 0.0003379601783104578, 'epoch': 0.27}
+ 27%|██▋       | 1824/6790 [1:03:14<2:42:11,  1.96s/it] 27%|██▋       | 1825/6790 [1:03:16<2:40:17,  1.94s/it]                                                       {'loss': 1.5747, 'learning_rate': 0.00033789216578232684, 'epoch': 0.27}
+ 27%|██▋       | 1825/6790 [1:03:16<2:40:17,  1.94s/it] 27%|██▋       | 1826/6790 [1:03:18<2:46:52,  2.02s/it]                                                       {'loss': 1.5247, 'learning_rate': 0.00033782412284624926, 'epoch': 0.27}
+ 27%|██▋       | 1826/6790 [1:03:18<2:46:52,  2.02s/it] 27%|██▋       | 1827/6790 [1:03:21<3:18:44,  2.40s/it]                                                       {'loss': 1.3304, 'learning_rate': 0.0003377560495172298, 'epoch': 0.27}
+ 27%|██▋       | 1827/6790 [1:03:21<3:18:44,  2.40s/it] 27%|██▋       | 1828/6790 [1:03:24<3:16:31,  2.38s/it]                                                       {'loss': 1.5982, 'learning_rate': 0.0003376879458102801, 'epoch': 0.27}
+ 27%|██▋       | 1828/6790 [1:03:24<3:16:31,  2.38s/it] 27%|██▋       | 1829/6790 [1:03:26<3:04:46,  2.23s/it]                                                       {'loss': 1.6003, 'learning_rate': 0.0003376198117404182, 'epoch': 0.27}
+ 27%|██▋       | 1829/6790 [1:03:26<3:04:46,  2.23s/it] 27%|██▋       | 1830/6790 [1:03:28<2:57:28,  2.15s/it]                                                       {'loss': 1.5091, 'learning_rate': 0.0003375516473226691, 'epoch': 0.27}
+ 27%|██▋       | 1830/6790 [1:03:28<2:57:28,  2.15s/it] 27%|██▋       | 1831/6790 [1:03:30<2:52:30,  2.09s/it]                                                       {'loss': 1.3962, 'learning_rate': 0.00033748345257206437, 'epoch': 0.27}
+ 27%|██▋       | 1831/6790 [1:03:30<2:52:30,  2.09s/it] 27%|██▋       | 1832/6790 [1:03:31<2:47:29,  2.03s/it]                                                       {'loss': 1.2721, 'learning_rate': 0.00033741522750364237, 'epoch': 0.27}
+ 27%|██▋       | 1832/6790 [1:03:31<2:47:29,  2.03s/it] 27%|██▋       | 1833/6790 [1:03:34<2:52:13,  2.08s/it]                                                       {'loss': 1.6126, 'learning_rate': 0.00033734697213244803, 'epoch': 0.27}
+ 27%|██▋       | 1833/6790 [1:03:34<2:52:13,  2.08s/it] 27%|██▋       | 1834/6790 [1:03:36<3:03:48,  2.23s/it]                                                       {'loss': 1.6561, 'learning_rate': 0.00033727868647353296, 'epoch': 0.27}
+ 27%|██▋       | 1834/6790 [1:03:36<3:03:48,  2.23s/it] 27%|██▋       | 1835/6790 [1:03:38<3:02:07,  2.21s/it]                                                       {'loss': 1.5148, 'learning_rate': 0.0003372103705419556, 'epoch': 0.27}
+ 27%|██▋       | 1835/6790 [1:03:38<3:02:07,  2.21s/it] 27%|██▋       | 1836/6790 [1:03:41<3:00:25,  2.19s/it]                                                       {'loss': 1.5349, 'learning_rate': 0.0003371420243527808, 'epoch': 0.27}
+ 27%|██▋       | 1836/6790 [1:03:41<3:00:25,  2.19s/it] 27%|██▋       | 1837/6790 [1:03:42<2:49:43,  2.06s/it]                                                       {'loss': 1.556, 'learning_rate': 0.0003370736479210805, 'epoch': 0.27}
+ 27%|██▋       | 1837/6790 [1:03:42<2:49:43,  2.06s/it] 27%|██▋       | 1838/6790 [1:03:44<2:45:21,  2.00s/it]                                                       {'loss': 1.5455, 'learning_rate': 0.0003370052412619328, 'epoch': 0.27}
+ 27%|██▋       | 1838/6790 [1:03:44<2:45:21,  2.00s/it] 27%|██▋       | 1839/6790 [1:03:46<2:45:13,  2.00s/it]                                                       {'loss': 1.5192, 'learning_rate': 0.00033693680439042284, 'epoch': 0.27}
+ 27%|██▋       | 1839/6790 [1:03:46<2:45:13,  2.00s/it] 27%|██▋       | 1840/6790 [1:03:48<2:45:13,  2.00s/it]                                                       {'loss': 1.5965, 'learning_rate': 0.00033686833732164234, 'epoch': 0.27}
+ 27%|██▋       | 1840/6790 [1:03:48<2:45:13,  2.00s/it] 27%|██▋       | 1841/6790 [1:03:50<2:45:26,  2.01s/it]                                                       {'loss': 1.6311, 'learning_rate': 0.0003367998400706895, 'epoch': 0.27}
+ 27%|██▋       | 1841/6790 [1:03:50<2:45:26,  2.01s/it] 27%|██▋       | 1842/6790 [1:03:52<2:46:50,  2.02s/it]                                                       {'loss': 1.7112, 'learning_rate': 0.00033673131265266943, 'epoch': 0.27}
+ 27%|██▋       | 1842/6790 [1:03:52<2:46:50,  2.02s/it] 27%|██▋       | 1843/6790 [1:03:54<2:51:29,  2.08s/it]                                                       {'loss': 1.6788, 'learning_rate': 0.00033666275508269385, 'epoch': 0.27}
+ 27%|██▋       | 1843/6790 [1:03:54<2:51:29,  2.08s/it] 27%|██▋       | 1844/6790 [1:03:57<2:51:30,  2.08s/it]                                                       {'loss': 1.4735, 'learning_rate': 0.00033659416737588085, 'epoch': 0.27}
+ 27%|██▋       | 1844/6790 [1:03:57<2:51:30,  2.08s/it] 27%|██▋       | 1845/6790 [1:03:58<2:41:13,  1.96s/it]                                                       {'loss': 1.503, 'learning_rate': 0.0003365255495473555, 'epoch': 0.27}
+ 27%|██▋       | 1845/6790 [1:03:58<2:41:13,  1.96s/it] 27%|██▋       | 1846/6790 [1:04:00<2:42:47,  1.98s/it]                                                       {'loss': 1.4881, 'learning_rate': 0.0003364569016122494, 'epoch': 0.27}
+ 27%|██▋       | 1846/6790 [1:04:00<2:42:47,  1.98s/it] 27%|██▋       | 1847/6790 [1:04:03<2:52:16,  2.09s/it]                                                       {'loss': 1.62, 'learning_rate': 0.0003363882235857007, 'epoch': 0.27}
+ 27%|██▋       | 1847/6790 [1:04:03<2:52:16,  2.09s/it] 27%|██▋       | 1848/6790 [1:04:05<2:50:49,  2.07s/it]                                                       {'loss': 1.3868, 'learning_rate': 0.0003363195154828544, 'epoch': 0.27}
+ 27%|██▋       | 1848/6790 [1:04:05<2:50:49,  2.07s/it] 27%|██▋       | 1849/6790 [1:04:07<2:48:43,  2.05s/it]                                                       {'loss': 1.5897, 'learning_rate': 0.00033625077731886185, 'epoch': 0.27}
+ 27%|██▋       | 1849/6790 [1:04:07<2:48:43,  2.05s/it] 27%|██▋       | 1850/6790 [1:04:09<2:54:26,  2.12s/it]                                                       {'loss': 1.652, 'learning_rate': 0.0003361820091088812, 'epoch': 0.27}
+ 27%|██▋       | 1850/6790 [1:04:09<2:54:26,  2.12s/it] 27%|██▋       | 1851/6790 [1:04:11<3:00:32,  2.19s/it]                                                       {'loss': 1.4455, 'learning_rate': 0.0003361132108680773, 'epoch': 0.27}
+ 27%|██▋       | 1851/6790 [1:04:11<3:00:32,  2.19s/it] 27%|██▋       | 1852/6790 [1:04:13<2:55:36,  2.13s/it]                                                       {'loss': 1.6701, 'learning_rate': 0.0003360443826116214, 'epoch': 0.27}
+ 27%|██▋       | 1852/6790 [1:04:13<2:55:36,  2.13s/it] 27%|██▋       | 1853/6790 [1:04:15<2:58:00,  2.16s/it]                                                       {'loss': 1.5456, 'learning_rate': 0.0003359755243546915, 'epoch': 0.27}
+ 27%|██▋       | 1853/6790 [1:04:15<2:58:00,  2.16s/it] 27%|██▋       | 1854/6790 [1:04:17<2:48:16,  2.05s/it]                                                       {'loss': 1.3695, 'learning_rate': 0.00033590663611247234, 'epoch': 0.27}
+ 27%|██▋       | 1854/6790 [1:04:17<2:48:16,  2.05s/it] 27%|██▋       | 1855/6790 [1:04:19<2:51:20,  2.08s/it]                                                       {'loss': 1.6413, 'learning_rate': 0.000335837717900155, 'epoch': 0.27}
+ 27%|██▋       | 1855/6790 [1:04:19<2:51:20,  2.08s/it] 27%|██▋       | 1856/6790 [1:04:22<2:54:58,  2.13s/it]                                                       {'loss': 1.6846, 'learning_rate': 0.00033576876973293734, 'epoch': 0.27}
+ 27%|██▋       | 1856/6790 [1:04:22<2:54:58,  2.13s/it] 27%|██▋       | 1857/6790 [1:04:24<2:55:39,  2.14s/it]                                                       {'loss': 1.4427, 'learning_rate': 0.0003356997916260238, 'epoch': 0.27}
+ 27%|██▋       | 1857/6790 [1:04:24<2:55:39,  2.14s/it] 27%|██▋       | 1858/6790 [1:04:26<2:49:58,  2.07s/it]                                                       {'loss': 1.5308, 'learning_rate': 0.0003356307835946254, 'epoch': 0.27}
+ 27%|██▋       | 1858/6790 [1:04:26<2:49:58,  2.07s/it] 27%|██▋       | 1859/6790 [1:04:28<2:57:31,  2.16s/it]                                                       {'loss': 1.6319, 'learning_rate': 0.0003355617456539598, 'epoch': 0.27}
+ 27%|██▋       | 1859/6790 [1:04:28<2:57:31,  2.16s/it] 27%|██▋       | 1860/6790 [1:04:31<3:03:20,  2.23s/it]                                                       {'loss': 1.4211, 'learning_rate': 0.0003354926778192512, 'epoch': 0.27}
+ 27%|██▋       | 1860/6790 [1:04:31<3:03:20,  2.23s/it] 27%|██▋       | 1861/6790 [1:04:32<2:51:19,  2.09s/it]                                                       {'loss': 1.4225, 'learning_rate': 0.0003354235801057305, 'epoch': 0.27}
+ 27%|██▋       | 1861/6790 [1:04:32<2:51:19,  2.09s/it] 27%|██▋       | 1862/6790 [1:04:34<2:46:22,  2.03s/it]                                                       {'loss': 1.6391, 'learning_rate': 0.00033535445252863506, 'epoch': 0.27}
+ 27%|██▋       | 1862/6790 [1:04:34<2:46:22,  2.03s/it] 27%|██▋       | 1863/6790 [1:04:36<2:42:48,  1.98s/it]                                                       {'loss': 1.4105, 'learning_rate': 0.00033528529510320885, 'epoch': 0.27}
+ 27%|██▋       | 1863/6790 [1:04:36<2:42:48,  1.98s/it] 27%|██▋       | 1864/6790 [1:04:38<2:45:39,  2.02s/it]                                                       {'loss': 1.5133, 'learning_rate': 0.00033521610784470246, 'epoch': 0.27}
+ 27%|██▋       | 1864/6790 [1:04:38<2:45:39,  2.02s/it] 27%|██▋       | 1865/6790 [1:04:40<2:48:13,  2.05s/it]                                                       {'loss': 1.6023, 'learning_rate': 0.00033514689076837305, 'epoch': 0.27}
+ 27%|██▋       | 1865/6790 [1:04:40<2:48:13,  2.05s/it] 27%|██▋       | 1866/6790 [1:04:43<2:54:06,  2.12s/it]                                                       {'loss': 1.4276, 'learning_rate': 0.0003350776438894844, 'epoch': 0.27}
+ 27%|██▋       | 1866/6790 [1:04:43<2:54:06,  2.12s/it] 27%|██▋       | 1867/6790 [1:04:45<2:56:54,  2.16s/it]                                                       {'loss': 1.6119, 'learning_rate': 0.00033500836722330675, 'epoch': 0.27}
+ 27%|██▋       | 1867/6790 [1:04:45<2:56:54,  2.16s/it] 28%|██▊       | 1868/6790 [1:04:47<2:50:30,  2.08s/it]                                                       {'loss': 1.3704, 'learning_rate': 0.000334939060785117, 'epoch': 0.28}
+ 28%|██▊       | 1868/6790 [1:04:47<2:50:30,  2.08s/it] 28%|██▊       | 1869/6790 [1:04:49<2:59:40,  2.19s/it]                                                       {'loss': 1.6189, 'learning_rate': 0.00033486972459019856, 'epoch': 0.28}
+ 28%|██▊       | 1869/6790 [1:04:49<2:59:40,  2.19s/it] 28%|██▊       | 1870/6790 [1:04:51<2:56:41,  2.15s/it]                                                       {'loss': 1.5933, 'learning_rate': 0.0003348003586538415, 'epoch': 0.28}
+ 28%|██▊       | 1870/6790 [1:04:51<2:56:41,  2.15s/it] 28%|██▊       | 1871/6790 [1:04:54<3:00:37,  2.20s/it]                                                       {'loss': 1.106, 'learning_rate': 0.0003347309629913423, 'epoch': 0.28}
+ 28%|██▊       | 1871/6790 [1:04:54<3:00:37,  2.20s/it] 28%|██▊       | 1872/6790 [1:04:55<2:54:43,  2.13s/it]                                                       {'loss': 1.5141, 'learning_rate': 0.0003346615376180041, 'epoch': 0.28}
+ 28%|██▊       | 1872/6790 [1:04:55<2:54:43,  2.13s/it] 28%|██▊       | 1873/6790 [1:04:57<2:47:45,  2.05s/it]                                                       {'loss': 1.6069, 'learning_rate': 0.00033459208254913667, 'epoch': 0.28}
+ 28%|██▊       | 1873/6790 [1:04:57<2:47:45,  2.05s/it] 28%|██▊       | 1874/6790 [1:04:59<2:44:32,  2.01s/it]                                                       {'loss': 1.5525, 'learning_rate': 0.000334522597800056, 'epoch': 0.28}
+ 28%|██▊       | 1874/6790 [1:04:59<2:44:32,  2.01s/it] 28%|██▊       | 1875/6790 [1:05:01<2:47:14,  2.04s/it]                                                       {'loss': 1.5774, 'learning_rate': 0.00033445308338608506, 'epoch': 0.28}
+ 28%|██▊       | 1875/6790 [1:05:01<2:47:14,  2.04s/it] 28%|██▊       | 1876/6790 [1:05:03<2:43:17,  1.99s/it]                                                       {'loss': 1.3831, 'learning_rate': 0.00033438353932255303, 'epoch': 0.28}
+ 28%|██▊       | 1876/6790 [1:05:03<2:43:17,  1.99s/it] 28%|██▊       | 1877/6790 [1:05:05<2:39:38,  1.95s/it]                                                       {'loss': 1.5823, 'learning_rate': 0.0003343139656247958, 'epoch': 0.28}
+ 28%|██▊       | 1877/6790 [1:05:05<2:39:38,  1.95s/it] 28%|██▊       | 1878/6790 [1:05:07<2:46:10,  2.03s/it]                                                       {'loss': 1.5112, 'learning_rate': 0.00033424436230815584, 'epoch': 0.28}
+ 28%|██▊       | 1878/6790 [1:05:07<2:46:10,  2.03s/it] 28%|██▊       | 1879/6790 [1:05:09<2:40:28,  1.96s/it]                                                       {'loss': 1.6225, 'learning_rate': 0.00033417472938798183, 'epoch': 0.28}
+ 28%|██▊       | 1879/6790 [1:05:09<2:40:28,  1.96s/it] 28%|██▊       | 1880/6790 [1:05:11<2:36:27,  1.91s/it]                                                       {'loss': 1.2689, 'learning_rate': 0.0003341050668796294, 'epoch': 0.28}
+ 28%|██▊       | 1880/6790 [1:05:11<2:36:27,  1.91s/it] 28%|██▊       | 1881/6790 [1:05:13<2:37:43,  1.93s/it]                                                       {'loss': 1.6141, 'learning_rate': 0.0003340353747984604, 'epoch': 0.28}
+ 28%|██▊       | 1881/6790 [1:05:13<2:37:43,  1.93s/it] 28%|██▊       | 1882/6790 [1:05:15<2:41:38,  1.98s/it]                                                       {'loss': 1.6571, 'learning_rate': 0.00033396565315984336, 'epoch': 0.28}
+ 28%|██▊       | 1882/6790 [1:05:15<2:41:38,  1.98s/it] 28%|██▊       | 1883/6790 [1:05:17<2:46:18,  2.03s/it]                                                       {'loss': 1.8531, 'learning_rate': 0.00033389590197915333, 'epoch': 0.28}
+ 28%|██▊       | 1883/6790 [1:05:17<2:46:18,  2.03s/it] 28%|██▊       | 1884/6790 [1:05:19<2:47:07,  2.04s/it]                                                       {'loss': 1.3452, 'learning_rate': 0.00033382612127177166, 'epoch': 0.28}
+ 28%|██▊       | 1884/6790 [1:05:19<2:47:07,  2.04s/it] 28%|██▊       | 1885/6790 [1:05:21<2:42:32,  1.99s/it]                                                       {'loss': 1.5616, 'learning_rate': 0.00033375631105308655, 'epoch': 0.28}
+ 28%|██▊       | 1885/6790 [1:05:21<2:42:32,  1.99s/it] 28%|██▊       | 1886/6790 [1:05:23<2:41:43,  1.98s/it]                                                       {'loss': 1.4738, 'learning_rate': 0.0003336864713384924, 'epoch': 0.28}
+ 28%|██▊       | 1886/6790 [1:05:23<2:41:43,  1.98s/it] 28%|██▊       | 1887/6790 [1:05:26<2:56:57,  2.17s/it]                                                       {'loss': 1.5185, 'learning_rate': 0.00033361660214339034, 'epoch': 0.28}
+ 28%|██▊       | 1887/6790 [1:05:26<2:56:57,  2.17s/it] 28%|██▊       | 1888/6790 [1:05:28<2:57:28,  2.17s/it]                                                       {'loss': 1.5006, 'learning_rate': 0.0003335467034831878, 'epoch': 0.28}
+ 28%|██▊       | 1888/6790 [1:05:28<2:57:28,  2.17s/it] 28%|██▊       | 1889/6790 [1:05:30<2:52:55,  2.12s/it]                                                       {'loss': 1.4968, 'learning_rate': 0.000333476775373299, 'epoch': 0.28}
+ 28%|██▊       | 1889/6790 [1:05:30<2:52:55,  2.12s/it] 28%|██▊       | 1890/6790 [1:05:33<3:14:25,  2.38s/it]                                                       {'loss': 1.5314, 'learning_rate': 0.0003334068178291443, 'epoch': 0.28}
+ 28%|██▊       | 1890/6790 [1:05:33<3:14:25,  2.38s/it] 28%|██▊       | 1891/6790 [1:05:35<3:05:11,  2.27s/it]                                                       {'loss': 1.5624, 'learning_rate': 0.00033333683086615083, 'epoch': 0.28}
+ 28%|██▊       | 1891/6790 [1:05:35<3:05:11,  2.27s/it] 28%|██▊       | 1892/6790 [1:05:37<2:57:55,  2.18s/it]                                                       {'loss': 1.4159, 'learning_rate': 0.00033326681449975196, 'epoch': 0.28}
+ 28%|██▊       | 1892/6790 [1:05:37<2:57:55,  2.18s/it] 28%|██▊       | 1893/6790 [1:05:39<2:59:54,  2.20s/it]                                                       {'loss': 1.5174, 'learning_rate': 0.00033319676874538784, 'epoch': 0.28}
+ 28%|██▊       | 1893/6790 [1:05:39<2:59:54,  2.20s/it] 28%|██▊       | 1894/6790 [1:05:41<2:56:25,  2.16s/it]                                                       {'loss': 1.4717, 'learning_rate': 0.0003331266936185048, 'epoch': 0.28}
+ 28%|██▊       | 1894/6790 [1:05:41<2:56:25,  2.16s/it] 28%|██▊       | 1895/6790 [1:05:43<2:44:20,  2.01s/it]                                                       {'loss': 1.4379, 'learning_rate': 0.00033305658913455595, 'epoch': 0.28}
+ 28%|██▊       | 1895/6790 [1:05:43<2:44:20,  2.01s/it] 28%|██▊       | 1896/6790 [1:05:45<2:49:11,  2.07s/it]                                                       {'loss': 1.465, 'learning_rate': 0.0003329864553090006, 'epoch': 0.28}
+ 28%|██▊       | 1896/6790 [1:05:45<2:49:11,  2.07s/it] 28%|██▊       | 1897/6790 [1:05:47<2:47:32,  2.05s/it]                                                       {'loss': 1.2932, 'learning_rate': 0.00033291629215730464, 'epoch': 0.28}
+ 28%|██▊       | 1897/6790 [1:05:47<2:47:32,  2.05s/it] 28%|██▊       | 1898/6790 [1:05:49<2:47:20,  2.05s/it]                                                       {'loss': 1.5493, 'learning_rate': 0.0003328460996949405, 'epoch': 0.28}
+ 28%|██▊       | 1898/6790 [1:05:49<2:47:20,  2.05s/it] 28%|██▊       | 1899/6790 [1:05:51<2:46:01,  2.04s/it]                                                       {'loss': 1.4994, 'learning_rate': 0.0003327758779373869, 'epoch': 0.28}
+ 28%|██▊       | 1899/6790 [1:05:51<2:46:01,  2.04s/it] 28%|██▊       | 1900/6790 [1:05:53<2:44:08,  2.01s/it]                                                       {'loss': 1.5171, 'learning_rate': 0.00033270562690012923, 'epoch': 0.28}
+ 28%|██▊       | 1900/6790 [1:05:53<2:44:08,  2.01s/it] 28%|██▊       | 1901/6790 [1:05:55<2:53:28,  2.13s/it]                                                       {'loss': 1.4099, 'learning_rate': 0.0003326353465986592, 'epoch': 0.28}
+ 28%|██▊       | 1901/6790 [1:05:55<2:53:28,  2.13s/it] 28%|██▊       | 1902/6790 [1:05:58<2:58:14,  2.19s/it]                                                       {'loss': 1.6249, 'learning_rate': 0.0003325650370484749, 'epoch': 0.28}
+ 28%|██▊       | 1902/6790 [1:05:58<2:58:14,  2.19s/it] 28%|██▊       | 1903/6790 [1:06:00<2:49:28,  2.08s/it]                                                       {'loss': 1.6828, 'learning_rate': 0.0003324946982650812, 'epoch': 0.28}
+ 28%|██▊       | 1903/6790 [1:06:00<2:49:28,  2.08s/it] 28%|██▊       | 1904/6790 [1:06:02<2:55:50,  2.16s/it]                                                       {'loss': 1.6698, 'learning_rate': 0.000332424330263989, 'epoch': 0.28}
+ 28%|██▊       | 1904/6790 [1:06:02<2:55:50,  2.16s/it] 28%|██▊       | 1905/6790 [1:06:04<2:50:18,  2.09s/it]                                                       {'loss': 1.5492, 'learning_rate': 0.0003323539330607159, 'epoch': 0.28}
+ 28%|██▊       | 1905/6790 [1:06:04<2:50:18,  2.09s/it] 28%|██▊       | 1906/6790 [1:06:06<2:58:27,  2.19s/it]                                                       {'loss': 1.451, 'learning_rate': 0.0003322835066707859, 'epoch': 0.28}
+ 28%|██▊       | 1906/6790 [1:06:06<2:58:27,  2.19s/it] 28%|██▊       | 1907/6790 [1:06:08<2:55:35,  2.16s/it]                                                       {'loss': 1.4611, 'learning_rate': 0.00033221305110972934, 'epoch': 0.28}
+ 28%|██▊       | 1907/6790 [1:06:08<2:55:35,  2.16s/it] 28%|██▊       | 1908/6790 [1:06:10<2:55:46,  2.16s/it]                                                       {'loss': 1.4244, 'learning_rate': 0.0003321425663930831, 'epoch': 0.28}
+ 28%|██▊       | 1908/6790 [1:06:10<2:55:46,  2.16s/it] 28%|██▊       | 1909/6790 [1:06:12<2:49:34,  2.08s/it]                                                       {'loss': 1.6112, 'learning_rate': 0.0003320720525363905, 'epoch': 0.28}
+ 28%|██▊       | 1909/6790 [1:06:12<2:49:34,  2.08s/it] 28%|██▊       | 1910/6790 [1:06:14<2:49:15,  2.08s/it]                                                       {'loss': 1.622, 'learning_rate': 0.00033200150955520116, 'epoch': 0.28}
+ 28%|██▊       | 1910/6790 [1:06:14<2:49:15,  2.08s/it] 28%|██▊       | 1911/6790 [1:06:16<2:44:10,  2.02s/it]                                                       {'loss': 1.5114, 'learning_rate': 0.0003319309374650712, 'epoch': 0.28}
+ 28%|██▊       | 1911/6790 [1:06:16<2:44:10,  2.02s/it] 28%|██▊       | 1912/6790 [1:06:18<2:42:36,  2.00s/it]                                                       {'loss': 1.5238, 'learning_rate': 0.0003318603362815632, 'epoch': 0.28}
+ 28%|██▊       | 1912/6790 [1:06:18<2:42:36,  2.00s/it] 28%|██▊       | 1913/6790 [1:06:20<2:37:04,  1.93s/it]                                                       {'loss': 1.6671, 'learning_rate': 0.0003317897060202462, 'epoch': 0.28}
+ 28%|██▊       | 1913/6790 [1:06:20<2:37:04,  1.93s/it] 28%|██▊       | 1914/6790 [1:06:22<2:36:53,  1.93s/it]                                                       {'loss': 1.518, 'learning_rate': 0.0003317190466966954, 'epoch': 0.28}
+ 28%|██▊       | 1914/6790 [1:06:22<2:36:53,  1.93s/it] 28%|██▊       | 1915/6790 [1:06:24<2:45:38,  2.04s/it]                                                       {'loss': 1.4391, 'learning_rate': 0.0003316483583264927, 'epoch': 0.28}
+ 28%|██▊       | 1915/6790 [1:06:24<2:45:38,  2.04s/it] 28%|██▊       | 1916/6790 [1:06:26<2:44:47,  2.03s/it]                                                       {'loss': 1.5168, 'learning_rate': 0.00033157764092522625, 'epoch': 0.28}
+ 28%|██▊       | 1916/6790 [1:06:26<2:44:47,  2.03s/it] 28%|██▊       | 1917/6790 [1:06:28<2:46:36,  2.05s/it]                                                       {'loss': 1.5339, 'learning_rate': 0.0003315068945084906, 'epoch': 0.28}
+ 28%|██▊       | 1917/6790 [1:06:28<2:46:36,  2.05s/it] 28%|██▊       | 1918/6790 [1:06:31<2:49:22,  2.09s/it]                                                       {'loss': 1.5525, 'learning_rate': 0.00033143611909188675, 'epoch': 0.28}
+ 28%|██▊       | 1918/6790 [1:06:31<2:49:22,  2.09s/it] 28%|██▊       | 1919/6790 [1:06:32<2:44:04,  2.02s/it]                                                       {'loss': 1.3056, 'learning_rate': 0.00033136531469102207, 'epoch': 0.28}
+ 28%|██▊       | 1919/6790 [1:06:32<2:44:04,  2.02s/it] 28%|██▊       | 1920/6790 [1:06:34<2:43:25,  2.01s/it]                                                       {'loss': 1.5997, 'learning_rate': 0.0003312944813215103, 'epoch': 0.28}
+ 28%|██▊       | 1920/6790 [1:06:34<2:43:25,  2.01s/it] 28%|██▊       | 1921/6790 [1:06:37<2:51:18,  2.11s/it]                                                       {'loss': 1.7574, 'learning_rate': 0.0003312236189989717, 'epoch': 0.28}
+ 28%|██▊       | 1921/6790 [1:06:37<2:51:18,  2.11s/it] 28%|██▊       | 1922/6790 [1:06:39<2:48:19,  2.07s/it]                                                       {'loss': 1.5668, 'learning_rate': 0.00033115272773903275, 'epoch': 0.28}
+ 28%|██▊       | 1922/6790 [1:06:39<2:48:19,  2.07s/it] 28%|██▊       | 1923/6790 [1:06:41<2:46:08,  2.05s/it]                                                       {'loss': 1.473, 'learning_rate': 0.00033108180755732635, 'epoch': 0.28}
+ 28%|██▊       | 1923/6790 [1:06:41<2:46:08,  2.05s/it] 28%|██▊       | 1924/6790 [1:06:43<2:53:47,  2.14s/it]                                                       {'loss': 1.6924, 'learning_rate': 0.0003310108584694919, 'epoch': 0.28}
+ 28%|██▊       | 1924/6790 [1:06:43<2:53:47,  2.14s/it] 28%|██▊       | 1925/6790 [1:06:45<2:49:24,  2.09s/it]                                                       {'loss': 1.5389, 'learning_rate': 0.00033093988049117485, 'epoch': 0.28}
+ 28%|██▊       | 1925/6790 [1:06:45<2:49:24,  2.09s/it] 28%|██▊       | 1926/6790 [1:06:47<2:43:19,  2.01s/it]                                                       {'loss': 1.4801, 'learning_rate': 0.00033086887363802754, 'epoch': 0.28}
+ 28%|██▊       | 1926/6790 [1:06:47<2:43:19,  2.01s/it] 28%|██▊       | 1927/6790 [1:06:49<2:45:05,  2.04s/it]                                                       {'loss': 1.7996, 'learning_rate': 0.0003307978379257081, 'epoch': 0.28}
+ 28%|██▊       | 1927/6790 [1:06:49<2:45:05,  2.04s/it] 28%|██▊       | 1928/6790 [1:06:51<2:48:48,  2.08s/it]                                                       {'loss': 1.5307, 'learning_rate': 0.0003307267733698816, 'epoch': 0.28}
+ 28%|██▊       | 1928/6790 [1:06:51<2:48:48,  2.08s/it] 28%|██▊       | 1929/6790 [1:06:54<2:59:03,  2.21s/it]                                                       {'loss': 1.326, 'learning_rate': 0.000330655679986219, 'epoch': 0.28}
+ 28%|██▊       | 1929/6790 [1:06:54<2:59:03,  2.21s/it] 28%|██▊       | 1930/6790 [1:06:56<2:49:57,  2.10s/it]                                                       {'loss': 1.1977, 'learning_rate': 0.0003305845577903977, 'epoch': 0.28}
+ 28%|██▊       | 1930/6790 [1:06:56<2:49:57,  2.10s/it] 28%|██▊       | 1931/6790 [1:06:58<3:01:16,  2.24s/it]                                                       {'loss': 1.6035, 'learning_rate': 0.00033051340679810177, 'epoch': 0.28}
+ 28%|██▊       | 1931/6790 [1:06:58<3:01:16,  2.24s/it] 28%|██▊       | 1932/6790 [1:07:00<2:55:06,  2.16s/it]                                                       {'loss': 1.4315, 'learning_rate': 0.0003304422270250213, 'epoch': 0.28}
+ 28%|██▊       | 1932/6790 [1:07:00<2:55:06,  2.16s/it] 28%|██▊       | 1933/6790 [1:07:02<2:51:52,  2.12s/it]                                                       {'loss': 1.539, 'learning_rate': 0.0003303710184868528, 'epoch': 0.28}
+ 28%|██▊       | 1933/6790 [1:07:02<2:51:52,  2.12s/it] 28%|██▊       | 1934/6790 [1:07:04<2:52:07,  2.13s/it]                                                       {'loss': 1.5311, 'learning_rate': 0.00033029978119929925, 'epoch': 0.28}
+ 28%|██▊       | 1934/6790 [1:07:04<2:52:07,  2.13s/it] 28%|██▊       | 1935/6790 [1:07:06<2:47:03,  2.06s/it]                                                       {'loss': 1.3792, 'learning_rate': 0.00033022851517806987, 'epoch': 0.28}
+ 28%|██▊       | 1935/6790 [1:07:06<2:47:03,  2.06s/it] 29%|██▊       | 1936/6790 [1:07:10<3:26:45,  2.56s/it]                                                       {'loss': 1.4335, 'learning_rate': 0.0003301572204388801, 'epoch': 0.29}
+ 29%|██▊       | 1936/6790 [1:07:10<3:26:45,  2.56s/it] 29%|██▊       | 1937/6790 [1:07:12<3:09:30,  2.34s/it]                                                       {'loss': 1.4464, 'learning_rate': 0.00033008589699745205, 'epoch': 0.29}
+ 29%|██▊       | 1937/6790 [1:07:12<3:09:30,  2.34s/it] 29%|██▊       | 1938/6790 [1:07:14<2:57:26,  2.19s/it]                                                       {'loss': 1.5223, 'learning_rate': 0.0003300145448695137, 'epoch': 0.29}
+ 29%|██▊       | 1938/6790 [1:07:14<2:57:26,  2.19s/it] 29%|██▊       | 1939/6790 [1:07:15<2:48:32,  2.08s/it]                                                       {'loss': 1.2805, 'learning_rate': 0.00032994316407079983, 'epoch': 0.29}
+ 29%|██▊       | 1939/6790 [1:07:15<2:48:32,  2.08s/it] 29%|██▊       | 1940/6790 [1:07:17<2:43:59,  2.03s/it]                                                       {'loss': 1.4169, 'learning_rate': 0.00032987175461705117, 'epoch': 0.29}
+ 29%|██▊       | 1940/6790 [1:07:17<2:43:59,  2.03s/it] 29%|██▊       | 1941/6790 [1:07:19<2:41:44,  2.00s/it]                                                       {'loss': 1.4812, 'learning_rate': 0.000329800316524015, 'epoch': 0.29}
+ 29%|██▊       | 1941/6790 [1:07:19<2:41:44,  2.00s/it] 29%|██▊       | 1942/6790 [1:07:21<2:39:22,  1.97s/it]                                                       {'loss': 1.3449, 'learning_rate': 0.00032972884980744474, 'epoch': 0.29}
+ 29%|██▊       | 1942/6790 [1:07:21<2:39:22,  1.97s/it] 29%|██▊       | 1943/6790 [1:07:23<2:38:00,  1.96s/it]                                                       {'loss': 1.7321, 'learning_rate': 0.0003296573544831002, 'epoch': 0.29}
+ 29%|██▊       | 1943/6790 [1:07:23<2:38:00,  1.96s/it] 29%|██▊       | 1944/6790 [1:07:25<2:37:07,  1.95s/it]                                                       {'loss': 1.6111, 'learning_rate': 0.0003295858305667477, 'epoch': 0.29}
+ 29%|██▊       | 1944/6790 [1:07:25<2:37:07,  1.95s/it] 29%|██▊       | 1945/6790 [1:07:27<2:38:18,  1.96s/it]                                                       {'loss': 1.4845, 'learning_rate': 0.00032951427807415955, 'epoch': 0.29}
+ 29%|██▊       | 1945/6790 [1:07:27<2:38:18,  1.96s/it] 29%|██▊       | 1946/6790 [1:07:30<2:56:42,  2.19s/it]                                                       {'loss': 1.6439, 'learning_rate': 0.00032944269702111443, 'epoch': 0.29}
+ 29%|██▊       | 1946/6790 [1:07:30<2:56:42,  2.19s/it] 29%|██▊       | 1947/6790 [1:07:32<2:52:28,  2.14s/it]                                                       {'loss': 1.4245, 'learning_rate': 0.00032937108742339753, 'epoch': 0.29}
+ 29%|██▊       | 1947/6790 [1:07:32<2:52:28,  2.14s/it] 29%|██▊       | 1948/6790 [1:07:34<2:48:02,  2.08s/it]                                                       {'loss': 1.5163, 'learning_rate': 0.00032929944929680003, 'epoch': 0.29}
+ 29%|██▊       | 1948/6790 [1:07:34<2:48:02,  2.08s/it] 29%|██▊       | 1949/6790 [1:07:36<2:49:18,  2.10s/it]                                                       {'loss': 1.5479, 'learning_rate': 0.0003292277826571196, 'epoch': 0.29}
+ 29%|██▊       | 1949/6790 [1:07:36<2:49:18,  2.10s/it] 29%|██▊       | 1950/6790 [1:07:38<2:50:20,  2.11s/it]                                                       {'loss': 1.7732, 'learning_rate': 0.00032915608752016016, 'epoch': 0.29}
+ 29%|██▊       | 1950/6790 [1:07:38<2:50:20,  2.11s/it] 29%|██▊       | 1951/6790 [1:07:40<2:47:25,  2.08s/it]                                                       {'loss': 1.573, 'learning_rate': 0.00032908436390173193, 'epoch': 0.29}
+ 29%|██▊       | 1951/6790 [1:07:40<2:47:25,  2.08s/it] 29%|██▊       | 1952/6790 [1:07:42<2:44:40,  2.04s/it]                                                       {'loss': 1.6828, 'learning_rate': 0.00032901261181765134, 'epoch': 0.29}
+ 29%|██▊       | 1952/6790 [1:07:42<2:44:40,  2.04s/it] 29%|██▉       | 1953/6790 [1:07:44<2:43:54,  2.03s/it]                                                       {'loss': 1.6977, 'learning_rate': 0.0003289408312837412, 'epoch': 0.29}
+ 29%|██▉       | 1953/6790 [1:07:44<2:43:54,  2.03s/it] 29%|██▉       | 1954/6790 [1:07:46<2:36:25,  1.94s/it]                                                       {'loss': 1.4149, 'learning_rate': 0.00032886902231583047, 'epoch': 0.29}
+ 29%|██▉       | 1954/6790 [1:07:46<2:36:25,  1.94s/it] 29%|██▉       | 1955/6790 [1:07:48<2:34:57,  1.92s/it]                                                       {'loss': 1.7386, 'learning_rate': 0.0003287971849297545, 'epoch': 0.29}
+ 29%|██▉       | 1955/6790 [1:07:48<2:34:57,  1.92s/it] 29%|██▉       | 1956/6790 [1:07:49<2:32:54,  1.90s/it]                                                       {'loss': 1.2628, 'learning_rate': 0.0003287253191413548, 'epoch': 0.29}
+ 29%|██▉       | 1956/6790 [1:07:49<2:32:54,  1.90s/it] 29%|██▉       | 1957/6790 [1:07:51<2:37:50,  1.96s/it]                                                       {'loss': 1.6759, 'learning_rate': 0.0003286534249664792, 'epoch': 0.29}
+ 29%|██▉       | 1957/6790 [1:07:51<2:37:50,  1.96s/it] 29%|██▉       | 1958/6790 [1:07:54<2:46:07,  2.06s/it]                                                       {'loss': 1.3769, 'learning_rate': 0.00032858150242098187, 'epoch': 0.29}
+ 29%|██▉       | 1958/6790 [1:07:54<2:46:07,  2.06s/it] 29%|██▉       | 1959/6790 [1:07:56<2:41:20,  2.00s/it]                                                       {'loss': 1.3409, 'learning_rate': 0.000328509551520723, 'epoch': 0.29}
+ 29%|██▉       | 1959/6790 [1:07:56<2:41:20,  2.00s/it] 29%|██▉       | 1960/6790 [1:07:58<2:45:22,  2.05s/it]                                                       {'loss': 1.6713, 'learning_rate': 0.00032843757228156936, 'epoch': 0.29}
+ 29%|██▉       | 1960/6790 [1:07:58<2:45:22,  2.05s/it] 29%|██▉       | 1961/6790 [1:08:00<2:41:12,  2.00s/it]                                                       {'loss': 1.5391, 'learning_rate': 0.0003283655647193937, 'epoch': 0.29}
+ 29%|██▉       | 1961/6790 [1:08:00<2:41:12,  2.00s/it] 29%|██▉       | 1962/6790 [1:08:02<2:44:28,  2.04s/it]                                                       {'loss': 1.3437, 'learning_rate': 0.00032829352885007507, 'epoch': 0.29}
+ 29%|██▉       | 1962/6790 [1:08:02<2:44:28,  2.04s/it] 29%|██▉       | 1963/6790 [1:08:04<2:44:48,  2.05s/it]                                                       {'loss': 1.6157, 'learning_rate': 0.0003282214646894989, 'epoch': 0.29}
+ 29%|██▉       | 1963/6790 [1:08:04<2:44:48,  2.05s/it] 29%|██▉       | 1964/6790 [1:08:06<2:43:22,  2.03s/it]                                                       {'loss': 1.6936, 'learning_rate': 0.0003281493722535567, 'epoch': 0.29}
+ 29%|██▉       | 1964/6790 [1:08:06<2:43:22,  2.03s/it] 29%|██▉       | 1965/6790 [1:08:08<2:41:41,  2.01s/it]                                                       {'loss': 1.7196, 'learning_rate': 0.0003280772515581463, 'epoch': 0.29}
+ 29%|██▉       | 1965/6790 [1:08:08<2:41:41,  2.01s/it] 29%|██▉       | 1966/6790 [1:08:10<2:38:34,  1.97s/it]                                                       {'loss': 1.6345, 'learning_rate': 0.00032800510261917176, 'epoch': 0.29}
+ 29%|██▉       | 1966/6790 [1:08:10<2:38:34,  1.97s/it] 29%|██▉       | 1967/6790 [1:08:11<2:33:41,  1.91s/it]                                                       {'loss': 1.6095, 'learning_rate': 0.0003279329254525433, 'epoch': 0.29}
+ 29%|██▉       | 1967/6790 [1:08:11<2:33:41,  1.91s/it] 29%|██▉       | 1968/6790 [1:08:13<2:35:52,  1.94s/it]                                                       {'loss': 1.4927, 'learning_rate': 0.00032786072007417734, 'epoch': 0.29}
+ 29%|██▉       | 1968/6790 [1:08:14<2:35:52,  1.94s/it] 29%|██▉       | 1969/6790 [1:08:15<2:34:19,  1.92s/it]                                                       {'loss': 1.4369, 'learning_rate': 0.0003277884864999968, 'epoch': 0.29}
+ 29%|██▉       | 1969/6790 [1:08:15<2:34:19,  1.92s/it] 29%|██▉       | 1970/6790 [1:08:17<2:37:46,  1.96s/it]                                                       {'loss': 1.4614, 'learning_rate': 0.0003277162247459304, 'epoch': 0.29}
+ 29%|██▉       | 1970/6790 [1:08:17<2:37:46,  1.96s/it] 29%|██▉       | 1971/6790 [1:08:19<2:38:28,  1.97s/it]                                                       {'loss': 1.5591, 'learning_rate': 0.0003276439348279134, 'epoch': 0.29}
+ 29%|██▉       | 1971/6790 [1:08:19<2:38:28,  1.97s/it] 29%|██▉       | 1972/6790 [1:08:22<2:45:29,  2.06s/it]                                                       {'loss': 1.5774, 'learning_rate': 0.0003275716167618871, 'epoch': 0.29}
+ 29%|██▉       | 1972/6790 [1:08:22<2:45:29,  2.06s/it] 29%|██▉       | 1973/6790 [1:08:24<2:46:28,  2.07s/it]                                                       {'loss': 1.5112, 'learning_rate': 0.0003274992705637992, 'epoch': 0.29}
+ 29%|██▉       | 1973/6790 [1:08:24<2:46:28,  2.07s/it] 29%|██▉       | 1974/6790 [1:08:26<2:50:42,  2.13s/it]                                                       {'loss': 1.6582, 'learning_rate': 0.00032742689624960325, 'epoch': 0.29}
+ 29%|██▉       | 1974/6790 [1:08:26<2:50:42,  2.13s/it] 29%|██▉       | 1975/6790 [1:08:28<2:54:04,  2.17s/it]                                                       {'loss': 1.5631, 'learning_rate': 0.00032735449383525933, 'epoch': 0.29}
+ 29%|██▉       | 1975/6790 [1:08:28<2:54:04,  2.17s/it] 29%|██▉       | 1976/6790 [1:08:30<2:51:37,  2.14s/it]                                                       {'loss': 1.6436, 'learning_rate': 0.00032728206333673356, 'epoch': 0.29}
+ 29%|██▉       | 1976/6790 [1:08:30<2:51:37,  2.14s/it] 29%|██▉       | 1977/6790 [1:08:32<2:45:57,  2.07s/it]                                                       {'loss': 1.5109, 'learning_rate': 0.0003272096047699984, 'epoch': 0.29}
+ 29%|██▉       | 1977/6790 [1:08:32<2:45:57,  2.07s/it] 29%|██▉       | 1978/6790 [1:08:34<2:45:39,  2.07s/it]                                                       {'loss': 1.5519, 'learning_rate': 0.0003271371181510323, 'epoch': 0.29}
+ 29%|██▉       | 1978/6790 [1:08:34<2:45:39,  2.07s/it] 29%|██▉       | 1979/6790 [1:08:36<2:39:56,  1.99s/it]                                                       {'loss': 1.4462, 'learning_rate': 0.00032706460349582, 'epoch': 0.29}
+ 29%|██▉       | 1979/6790 [1:08:36<2:39:56,  1.99s/it] 29%|██▉       | 1980/6790 [1:08:38<2:44:01,  2.05s/it]                                                       {'loss': 1.7354, 'learning_rate': 0.0003269920608203525, 'epoch': 0.29}
+ 29%|██▉       | 1980/6790 [1:08:38<2:44:01,  2.05s/it] 29%|██▉       | 1981/6790 [1:08:42<3:17:55,  2.47s/it]                                                       {'loss': 1.3683, 'learning_rate': 0.00032691949014062677, 'epoch': 0.29}
+ 29%|██▉       | 1981/6790 [1:08:42<3:17:55,  2.47s/it] 29%|██▉       | 1982/6790 [1:08:44<3:10:04,  2.37s/it]                                                       {'loss': 1.3323, 'learning_rate': 0.00032684689147264613, 'epoch': 0.29}
+ 29%|██▉       | 1982/6790 [1:08:44<3:10:04,  2.37s/it] 29%|██▉       | 1983/6790 [1:08:46<2:56:41,  2.21s/it]                                                       {'loss': 1.2685, 'learning_rate': 0.0003267742648324201, 'epoch': 0.29}
+ 29%|██▉       | 1983/6790 [1:08:46<2:56:41,  2.21s/it] 29%|██▉       | 1984/6790 [1:08:48<2:53:39,  2.17s/it]                                                       {'loss': 1.4312, 'learning_rate': 0.00032670161023596407, 'epoch': 0.29}
+ 29%|██▉       | 1984/6790 [1:08:48<2:53:39,  2.17s/it] 29%|██▉       | 1985/6790 [1:08:50<2:44:54,  2.06s/it]                                                       {'loss': 1.3586, 'learning_rate': 0.00032662892769930006, 'epoch': 0.29}
+ 29%|██▉       | 1985/6790 [1:08:50<2:44:54,  2.06s/it] 29%|██▉       | 1986/6790 [1:08:52<2:46:51,  2.08s/it]                                                       {'loss': 1.5895, 'learning_rate': 0.00032655621723845583, 'epoch': 0.29}
+ 29%|██▉       | 1986/6790 [1:08:52<2:46:51,  2.08s/it] 29%|██▉       | 1987/6790 [1:08:54<2:45:51,  2.07s/it]                                                       {'loss': 1.5359, 'learning_rate': 0.00032648347886946564, 'epoch': 0.29}
+ 29%|██▉       | 1987/6790 [1:08:54<2:45:51,  2.07s/it] 29%|██▉       | 1988/6790 [1:08:56<2:41:18,  2.02s/it]                                                       {'loss': 1.712, 'learning_rate': 0.00032641071260836957, 'epoch': 0.29}
+ 29%|██▉       | 1988/6790 [1:08:56<2:41:18,  2.02s/it] 29%|██▉       | 1989/6790 [1:08:58<2:43:07,  2.04s/it]                                                       {'loss': 1.4663, 'learning_rate': 0.0003263379184712141, 'epoch': 0.29}
+ 29%|██▉       | 1989/6790 [1:08:58<2:43:07,  2.04s/it] 29%|██▉       | 1990/6790 [1:09:00<2:41:48,  2.02s/it]                                                       {'loss': 1.4356, 'learning_rate': 0.0003262650964740518, 'epoch': 0.29}
+ 29%|██▉       | 1990/6790 [1:09:00<2:41:48,  2.02s/it] 29%|██▉       | 1991/6790 [1:09:02<2:40:35,  2.01s/it]                                                       {'loss': 1.5134, 'learning_rate': 0.0003261922466329413, 'epoch': 0.29}
+ 29%|██▉       | 1991/6790 [1:09:02<2:40:35,  2.01s/it] 29%|██▉       | 1992/6790 [1:09:04<2:47:58,  2.10s/it]                                                       {'loss': 1.5289, 'learning_rate': 0.00032611936896394743, 'epoch': 0.29}
+ 29%|██▉       | 1992/6790 [1:09:04<2:47:58,  2.10s/it] 29%|██▉       | 1993/6790 [1:09:06<2:48:33,  2.11s/it]                                                       {'loss': 1.6237, 'learning_rate': 0.0003260464634831412, 'epoch': 0.29}
+ 29%|██▉       | 1993/6790 [1:09:06<2:48:33,  2.11s/it] 29%|██▉       | 1994/6790 [1:09:08<2:46:57,  2.09s/it]                                                       {'loss': 1.4875, 'learning_rate': 0.00032597353020659967, 'epoch': 0.29}
+ 29%|██▉       | 1994/6790 [1:09:08<2:46:57,  2.09s/it] 29%|██▉       | 1995/6790 [1:09:10<2:46:21,  2.08s/it]                                                       {'loss': 1.7081, 'learning_rate': 0.0003259005691504061, 'epoch': 0.29}
+ 29%|██▉       | 1995/6790 [1:09:10<2:46:21,  2.08s/it] 29%|██▉       | 1996/6790 [1:09:12<2:43:58,  2.05s/it]                                                       {'loss': 1.3447, 'learning_rate': 0.00032582758033064985, 'epoch': 0.29}
+ 29%|██▉       | 1996/6790 [1:09:12<2:43:58,  2.05s/it] 29%|██▉       | 1997/6790 [1:09:14<2:43:41,  2.05s/it]                                                       {'loss': 1.4183, 'learning_rate': 0.0003257545637634264, 'epoch': 0.29}
+ 29%|██▉       | 1997/6790 [1:09:14<2:43:41,  2.05s/it] 29%|██▉       | 1998/6790 [1:09:16<2:38:20,  1.98s/it]                                                       {'loss': 1.5849, 'learning_rate': 0.0003256815194648373, 'epoch': 0.29}
+ 29%|██▉       | 1998/6790 [1:09:16<2:38:20,  1.98s/it] 29%|██▉       | 1999/6790 [1:09:18<2:41:21,  2.02s/it]                                                       {'loss': 1.6191, 'learning_rate': 0.00032560844745099023, 'epoch': 0.29}
+ 29%|██▉       | 1999/6790 [1:09:18<2:41:21,  2.02s/it] 29%|██▉       | 2000/6790 [1:09:20<2:38:11,  1.98s/it]                                                       {'loss': 1.4454, 'learning_rate': 0.0003255353477379991, 'epoch': 0.29}
+ 29%|██▉       | 2000/6790 [1:09:20<2:38:11,  1.98s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 29%|██▉       | 2001/6790 [1:09:24<3:11:47,  2.40s/it]                                                       {'loss': 1.603, 'learning_rate': 0.0003254622203419838, 'epoch': 0.29}
+ 29%|██▉       | 2001/6790 [1:09:24<3:11:47,  2.40s/it] 29%|██▉       | 2002/6790 [1:09:25<2:59:21,  2.25s/it]                                                       {'loss': 1.3977, 'learning_rate': 0.0003253890652790704, 'epoch': 0.29}
+ 29%|██▉       | 2002/6790 [1:09:25<2:59:21,  2.25s/it] 29%|██▉       | 2003/6790 [1:09:28<2:54:47,  2.19s/it]                                                       {'loss': 1.473, 'learning_rate': 0.000325315882565391, 'epoch': 0.29}
+ 29%|██▉       | 2003/6790 [1:09:28<2:54:47,  2.19s/it] 30%|██▉       | 2004/6790 [1:09:30<2:50:35,  2.14s/it]                                                       {'loss': 1.3753, 'learning_rate': 0.00032524267221708376, 'epoch': 0.3}
+ 30%|██▉       | 2004/6790 [1:09:30<2:50:35,  2.14s/it] 30%|██▉       | 2005/6790 [1:09:31<2:45:09,  2.07s/it]                                                       {'loss': 1.5265, 'learning_rate': 0.0003251694342502932, 'epoch': 0.3}
+ 30%|██▉       | 2005/6790 [1:09:31<2:45:09,  2.07s/it] 30%|██▉       | 2006/6790 [1:09:34<2:51:49,  2.15s/it]                                                       {'loss': 1.3411, 'learning_rate': 0.0003250961686811696, 'epoch': 0.3}
+ 30%|██▉       | 2006/6790 [1:09:34<2:51:49,  2.15s/it] 30%|██▉       | 2007/6790 [1:09:36<2:48:18,  2.11s/it]                                                       {'loss': 1.2354, 'learning_rate': 0.0003250228755258695, 'epoch': 0.3}
+ 30%|██▉       | 2007/6790 [1:09:36<2:48:18,  2.11s/it] 30%|██▉       | 2008/6790 [1:09:38<2:40:25,  2.01s/it]                                                       {'loss': 1.5504, 'learning_rate': 0.0003249495548005554, 'epoch': 0.3}
+ 30%|██▉       | 2008/6790 [1:09:38<2:40:25,  2.01s/it] 30%|██▉       | 2009/6790 [1:09:39<2:34:56,  1.94s/it]                                                       {'loss': 1.5988, 'learning_rate': 0.00032487620652139616, 'epoch': 0.3}
+ 30%|██▉       | 2009/6790 [1:09:39<2:34:56,  1.94s/it] 30%|██▉       | 2010/6790 [1:09:41<2:36:59,  1.97s/it]                                                       {'loss': 1.5573, 'learning_rate': 0.00032480283070456645, 'epoch': 0.3}
+ 30%|██▉       | 2010/6790 [1:09:41<2:36:59,  1.97s/it] 30%|██▉       | 2011/6790 [1:09:43<2:37:10,  1.97s/it]                                                       {'loss': 1.4763, 'learning_rate': 0.0003247294273662469, 'epoch': 0.3}
+ 30%|██▉       | 2011/6790 [1:09:43<2:37:10,  1.97s/it] 30%|██▉       | 2012/6790 [1:09:46<2:44:41,  2.07s/it]                                                       {'loss': 1.7562, 'learning_rate': 0.0003246559965226246, 'epoch': 0.3}
+ 30%|██▉       | 2012/6790 [1:09:46<2:44:41,  2.07s/it] 30%|██▉       | 2013/6790 [1:09:48<2:40:48,  2.02s/it]                                                       {'loss': 1.6251, 'learning_rate': 0.0003245825381898925, 'epoch': 0.3}
+ 30%|██▉       | 2013/6790 [1:09:48<2:40:48,  2.02s/it] 30%|██▉       | 2014/6790 [1:09:50<2:43:40,  2.06s/it]                                                       {'loss': 1.6166, 'learning_rate': 0.0003245090523842496, 'epoch': 0.3}
+ 30%|██▉       | 2014/6790 [1:09:50<2:43:40,  2.06s/it] 30%|██▉       | 2015/6790 [1:09:53<3:03:44,  2.31s/it]                                                       {'loss': 1.3551, 'learning_rate': 0.0003244355391219009, 'epoch': 0.3}
+ 30%|██▉       | 2015/6790 [1:09:53<3:03:44,  2.31s/it] 30%|██▉       | 2016/6790 [1:09:55<3:02:11,  2.29s/it]                                                       {'loss': 1.5131, 'learning_rate': 0.0003243619984190575, 'epoch': 0.3}
+ 30%|██▉       | 2016/6790 [1:09:55<3:02:11,  2.29s/it] 30%|██▉       | 2017/6790 [1:09:57<2:57:13,  2.23s/it]                                                       {'loss': 1.6308, 'learning_rate': 0.00032428843029193673, 'epoch': 0.3}
+ 30%|██▉       | 2017/6790 [1:09:57<2:57:13,  2.23s/it] 30%|██▉       | 2018/6790 [1:09:59<2:55:33,  2.21s/it]                                                       {'loss': 1.6082, 'learning_rate': 0.0003242148347567617, 'epoch': 0.3}
+ 30%|██▉       | 2018/6790 [1:09:59<2:55:33,  2.21s/it] 30%|██▉       | 2019/6790 [1:10:01<2:56:30,  2.22s/it]                                                       {'loss': 1.4506, 'learning_rate': 0.0003241412118297617, 'epoch': 0.3}
+ 30%|██▉       | 2019/6790 [1:10:01<2:56:30,  2.22s/it] 30%|██▉       | 2020/6790 [1:10:04<2:59:43,  2.26s/it]                                                       {'loss': 1.3692, 'learning_rate': 0.00032406756152717197, 'epoch': 0.3}
+ 30%|██▉       | 2020/6790 [1:10:04<2:59:43,  2.26s/it] 30%|██▉       | 2021/6790 [1:10:06<2:55:15,  2.20s/it]                                                       {'loss': 1.5878, 'learning_rate': 0.000323993883865234, 'epoch': 0.3}
+ 30%|██▉       | 2021/6790 [1:10:06<2:55:15,  2.20s/it] 30%|██▉       | 2022/6790 [1:10:08<2:55:42,  2.21s/it]                                                       {'loss': 1.6522, 'learning_rate': 0.00032392017886019516, 'epoch': 0.3}
+ 30%|██▉       | 2022/6790 [1:10:08<2:55:42,  2.21s/it] 30%|██▉       | 2023/6790 [1:10:10<2:48:51,  2.13s/it]                                                       {'loss': 1.708, 'learning_rate': 0.0003238464465283087, 'epoch': 0.3}
+ 30%|██▉       | 2023/6790 [1:10:10<2:48:51,  2.13s/it] 30%|██▉       | 2024/6790 [1:10:12<2:41:50,  2.04s/it]                                                       {'loss': 1.689, 'learning_rate': 0.00032377268688583424, 'epoch': 0.3}
+ 30%|██▉       | 2024/6790 [1:10:12<2:41:50,  2.04s/it] 30%|██▉       | 2025/6790 [1:10:14<2:38:08,  1.99s/it]                                                       {'loss': 1.6841, 'learning_rate': 0.0003236988999490371, 'epoch': 0.3}
+ 30%|██▉       | 2025/6790 [1:10:14<2:38:08,  1.99s/it] 30%|██▉       | 2026/6790 [1:10:16<2:44:20,  2.07s/it]                                                       {'loss': 1.4976, 'learning_rate': 0.0003236250857341888, 'epoch': 0.3}
+ 30%|██▉       | 2026/6790 [1:10:16<2:44:20,  2.07s/it] 30%|██▉       | 2027/6790 [1:10:18<2:41:55,  2.04s/it]                                                       {'loss': 1.5996, 'learning_rate': 0.00032355124425756696, 'epoch': 0.3}
+ 30%|██▉       | 2027/6790 [1:10:18<2:41:55,  2.04s/it] 30%|██▉       | 2028/6790 [1:10:20<2:39:02,  2.00s/it]                                                       {'loss': 1.4894, 'learning_rate': 0.00032347737553545486, 'epoch': 0.3}
+ 30%|██▉       | 2028/6790 [1:10:20<2:39:02,  2.00s/it] 30%|██▉       | 2029/6790 [1:10:22<2:51:19,  2.16s/it]                                                       {'loss': 1.4708, 'learning_rate': 0.00032340347958414214, 'epoch': 0.3}
+ 30%|██▉       | 2029/6790 [1:10:22<2:51:19,  2.16s/it] 30%|██▉       | 2030/6790 [1:10:24<2:51:39,  2.16s/it]                                                       {'loss': 1.6562, 'learning_rate': 0.0003233295564199243, 'epoch': 0.3}
+ 30%|██▉       | 2030/6790 [1:10:24<2:51:39,  2.16s/it] 30%|██▉       | 2031/6790 [1:10:27<2:48:06,  2.12s/it]                                                       {'loss': 1.6137, 'learning_rate': 0.0003232556060591029, 'epoch': 0.3}
+ 30%|██▉       | 2031/6790 [1:10:27<2:48:06,  2.12s/it] 30%|██▉       | 2032/6790 [1:10:28<2:41:31,  2.04s/it]                                                       {'loss': 1.3795, 'learning_rate': 0.00032318162851798535, 'epoch': 0.3}
+ 30%|██▉       | 2032/6790 [1:10:28<2:41:31,  2.04s/it] 30%|██▉       | 2033/6790 [1:10:30<2:36:01,  1.97s/it]                                                       {'loss': 1.4064, 'learning_rate': 0.00032310762381288524, 'epoch': 0.3}
+ 30%|██▉       | 2033/6790 [1:10:30<2:36:01,  1.97s/it] 30%|██▉       | 2034/6790 [1:10:32<2:37:43,  1.99s/it]                                                       {'loss': 1.5622, 'learning_rate': 0.0003230335919601221, 'epoch': 0.3}
+ 30%|██▉       | 2034/6790 [1:10:32<2:37:43,  1.99s/it] 30%|██▉       | 2035/6790 [1:10:34<2:41:10,  2.03s/it]                                                       {'loss': 1.5003, 'learning_rate': 0.0003229595329760214, 'epoch': 0.3}
+ 30%|██▉       | 2035/6790 [1:10:34<2:41:10,  2.03s/it] 30%|██▉       | 2036/6790 [1:10:37<2:53:35,  2.19s/it]                                                       {'loss': 1.4169, 'learning_rate': 0.00032288544687691446, 'epoch': 0.3}
+ 30%|██▉       | 2036/6790 [1:10:37<2:53:35,  2.19s/it] 30%|███       | 2037/6790 [1:10:39<2:49:24,  2.14s/it]                                                       {'loss': 1.4235, 'learning_rate': 0.0003228113336791389, 'epoch': 0.3}
+ 30%|███       | 2037/6790 [1:10:39<2:49:24,  2.14s/it] 30%|███       | 2038/6790 [1:10:41<2:47:22,  2.11s/it]                                                       {'loss': 1.6628, 'learning_rate': 0.0003227371933990381, 'epoch': 0.3}
+ 30%|███       | 2038/6790 [1:10:41<2:47:22,  2.11s/it] 30%|███       | 2039/6790 [1:10:43<2:49:43,  2.14s/it]                                                       {'loss': 1.6251, 'learning_rate': 0.00032266302605296143, 'epoch': 0.3}
+ 30%|███       | 2039/6790 [1:10:43<2:49:43,  2.14s/it] 30%|███       | 2040/6790 [1:10:45<2:41:47,  2.04s/it]                                                       {'loss': 1.3539, 'learning_rate': 0.00032258883165726433, 'epoch': 0.3}
+ 30%|███       | 2040/6790 [1:10:45<2:41:47,  2.04s/it] 30%|███       | 2041/6790 [1:10:47<2:36:22,  1.98s/it]                                                       {'loss': 1.3329, 'learning_rate': 0.000322514610228308, 'epoch': 0.3}
+ 30%|███       | 2041/6790 [1:10:47<2:36:22,  1.98s/it] 30%|███       | 2042/6790 [1:10:49<2:38:11,  2.00s/it]                                                       {'loss': 1.7033, 'learning_rate': 0.00032244036178245985, 'epoch': 0.3}
+ 30%|███       | 2042/6790 [1:10:49<2:38:11,  2.00s/it] 30%|███       | 2043/6790 [1:10:51<2:36:37,  1.98s/it]                                                       {'loss': 1.6954, 'learning_rate': 0.00032236608633609304, 'epoch': 0.3}
+ 30%|███       | 2043/6790 [1:10:51<2:36:37,  1.98s/it] 30%|███       | 2044/6790 [1:10:53<2:36:49,  1.98s/it]                                                       {'loss': 1.3218, 'learning_rate': 0.0003222917839055868, 'epoch': 0.3}
+ 30%|███       | 2044/6790 [1:10:53<2:36:49,  1.98s/it] 30%|███       | 2045/6790 [1:10:55<2:31:49,  1.92s/it]                                                       {'loss': 1.3517, 'learning_rate': 0.00032221745450732633, 'epoch': 0.3}
+ 30%|███       | 2045/6790 [1:10:55<2:31:49,  1.92s/it] 30%|███       | 2046/6790 [1:10:56<2:29:02,  1.89s/it]                                                       {'loss': 1.3907, 'learning_rate': 0.0003221430981577027, 'epoch': 0.3}
+ 30%|███       | 2046/6790 [1:10:56<2:29:02,  1.89s/it] 30%|███       | 2047/6790 [1:10:58<2:28:49,  1.88s/it]                                                       {'loss': 1.6568, 'learning_rate': 0.00032206871487311297, 'epoch': 0.3}
+ 30%|███       | 2047/6790 [1:10:58<2:28:49,  1.88s/it] 30%|███       | 2048/6790 [1:11:00<2:33:39,  1.94s/it]                                                       {'loss': 1.667, 'learning_rate': 0.00032199430466996014, 'epoch': 0.3}
+ 30%|███       | 2048/6790 [1:11:00<2:33:39,  1.94s/it] 30%|███       | 2049/6790 [1:11:02<2:34:55,  1.96s/it]                                                       {'loss': 1.5948, 'learning_rate': 0.00032191986756465303, 'epoch': 0.3}
+ 30%|███       | 2049/6790 [1:11:02<2:34:55,  1.96s/it] 30%|███       | 2050/6790 [1:11:04<2:35:33,  1.97s/it]                                                       {'loss': 1.5012, 'learning_rate': 0.0003218454035736066, 'epoch': 0.3}
+ 30%|███       | 2050/6790 [1:11:04<2:35:33,  1.97s/it] 30%|███       | 2051/6790 [1:11:06<2:33:03,  1.94s/it]                                                       {'loss': 1.4494, 'learning_rate': 0.00032177091271324155, 'epoch': 0.3}
+ 30%|███       | 2051/6790 [1:11:06<2:33:03,  1.94s/it] 30%|███       | 2052/6790 [1:11:08<2:33:07,  1.94s/it]                                                       {'loss': 1.6441, 'learning_rate': 0.00032169639499998466, 'epoch': 0.3}
+ 30%|███       | 2052/6790 [1:11:08<2:33:07,  1.94s/it] 30%|███       | 2053/6790 [1:11:10<2:37:07,  1.99s/it]                                                       {'loss': 1.6031, 'learning_rate': 0.0003216218504502685, 'epoch': 0.3}
+ 30%|███       | 2053/6790 [1:11:10<2:37:07,  1.99s/it] 30%|███       | 2054/6790 [1:11:12<2:36:03,  1.98s/it]                                                       {'loss': 1.3038, 'learning_rate': 0.0003215472790805317, 'epoch': 0.3}
+ 30%|███       | 2054/6790 [1:11:12<2:36:03,  1.98s/it] 30%|███       | 2055/6790 [1:11:14<2:36:23,  1.98s/it]                                                       {'loss': 1.6119, 'learning_rate': 0.00032147268090721863, 'epoch': 0.3}
+ 30%|███       | 2055/6790 [1:11:14<2:36:23,  1.98s/it] 30%|███       | 2056/6790 [1:11:16<2:36:51,  1.99s/it]                                                       {'loss': 1.5654, 'learning_rate': 0.00032139805594677963, 'epoch': 0.3}
+ 30%|███       | 2056/6790 [1:11:16<2:36:51,  1.99s/it] 30%|███       | 2057/6790 [1:11:18<2:38:14,  2.01s/it]                                                       {'loss': 1.5851, 'learning_rate': 0.0003213234042156711, 'epoch': 0.3}
+ 30%|███       | 2057/6790 [1:11:18<2:38:14,  2.01s/it] 30%|███       | 2058/6790 [1:11:20<2:34:45,  1.96s/it]                                                       {'loss': 1.751, 'learning_rate': 0.00032124872573035515, 'epoch': 0.3}
+ 30%|███       | 2058/6790 [1:11:20<2:34:45,  1.96s/it] 30%|███       | 2059/6790 [1:11:22<2:32:19,  1.93s/it]                                                       {'loss': 1.427, 'learning_rate': 0.0003211740205072999, 'epoch': 0.3}
+ 30%|███       | 2059/6790 [1:11:22<2:32:19,  1.93s/it] 30%|███       | 2060/6790 [1:11:24<2:28:05,  1.88s/it]                                                       {'loss': 1.4434, 'learning_rate': 0.00032109928856297927, 'epoch': 0.3}
+ 30%|███       | 2060/6790 [1:11:24<2:28:05,  1.88s/it] 30%|███       | 2061/6790 [1:11:25<2:23:55,  1.83s/it]                                                       {'loss': 1.3392, 'learning_rate': 0.00032102452991387314, 'epoch': 0.3}
+ 30%|███       | 2061/6790 [1:11:25<2:23:55,  1.83s/it] 30%|███       | 2062/6790 [1:11:27<2:24:48,  1.84s/it]                                                       {'loss': 1.4512, 'learning_rate': 0.00032094974457646733, 'epoch': 0.3}
+ 30%|███       | 2062/6790 [1:11:27<2:24:48,  1.84s/it] 30%|███       | 2063/6790 [1:11:29<2:30:04,  1.90s/it]                                                       {'loss': 1.4103, 'learning_rate': 0.0003208749325672534, 'epoch': 0.3}
+ 30%|███       | 2063/6790 [1:11:29<2:30:04,  1.90s/it] 30%|███       | 2064/6790 [1:11:32<2:39:02,  2.02s/it]                                                       {'loss': 1.5684, 'learning_rate': 0.00032080009390272895, 'epoch': 0.3}
+ 30%|███       | 2064/6790 [1:11:32<2:39:02,  2.02s/it] 30%|███       | 2065/6790 [1:11:33<2:34:31,  1.96s/it]                                                       {'loss': 1.3734, 'learning_rate': 0.00032072522859939734, 'epoch': 0.3}
+ 30%|███       | 2065/6790 [1:11:33<2:34:31,  1.96s/it] 30%|███       | 2066/6790 [1:11:36<2:49:09,  2.15s/it]                                                       {'loss': 1.6504, 'learning_rate': 0.0003206503366737679, 'epoch': 0.3}
+ 30%|███       | 2066/6790 [1:11:36<2:49:09,  2.15s/it] 30%|███       | 2067/6790 [1:11:38<2:48:26,  2.14s/it]                                                       {'loss': 1.3231, 'learning_rate': 0.0003205754181423557, 'epoch': 0.3}
+ 30%|███       | 2067/6790 [1:11:38<2:48:26,  2.14s/it] 30%|███       | 2068/6790 [1:11:40<2:50:20,  2.16s/it]                                                       {'loss': 1.5593, 'learning_rate': 0.0003205004730216818, 'epoch': 0.3}
+ 30%|███       | 2068/6790 [1:11:40<2:50:20,  2.16s/it] 30%|███       | 2069/6790 [1:11:42<2:46:24,  2.11s/it]                                                       {'loss': 1.5828, 'learning_rate': 0.0003204255013282731, 'epoch': 0.3}
+ 30%|███       | 2069/6790 [1:11:42<2:46:24,  2.11s/it] 30%|███       | 2070/6790 [1:11:45<2:49:47,  2.16s/it]                                                       {'loss': 1.5053, 'learning_rate': 0.0003203505030786623, 'epoch': 0.3}
+ 30%|███       | 2070/6790 [1:11:45<2:49:47,  2.16s/it] 31%|███       | 2071/6790 [1:11:47<2:59:27,  2.28s/it]                                                       {'loss': 1.6788, 'learning_rate': 0.00032027547828938804, 'epoch': 0.31}
+ 31%|███       | 2071/6790 [1:11:47<2:59:27,  2.28s/it] 31%|███       | 2072/6790 [1:11:49<2:49:43,  2.16s/it]                                                       {'loss': 1.6237, 'learning_rate': 0.0003202004269769947, 'epoch': 0.31}
+ 31%|███       | 2072/6790 [1:11:49<2:49:43,  2.16s/it] 31%|███       | 2073/6790 [1:11:51<2:49:04,  2.15s/it]                                                       {'loss': 1.3642, 'learning_rate': 0.0003201253491580326, 'epoch': 0.31}
+ 31%|███       | 2073/6790 [1:11:51<2:49:04,  2.15s/it] 31%|███       | 2074/6790 [1:11:53<2:42:25,  2.07s/it]                                                       {'loss': 1.2902, 'learning_rate': 0.00032005024484905797, 'epoch': 0.31}
+ 31%|███       | 2074/6790 [1:11:53<2:42:25,  2.07s/it] 31%|███       | 2075/6790 [1:11:55<2:40:34,  2.04s/it]                                                       {'loss': 1.4843, 'learning_rate': 0.00031997511406663267, 'epoch': 0.31}
+ 31%|███       | 2075/6790 [1:11:55<2:40:34,  2.04s/it] 31%|███       | 2076/6790 [1:11:57<2:36:06,  1.99s/it]                                                       {'loss': 1.5066, 'learning_rate': 0.00031989995682732463, 'epoch': 0.31}
+ 31%|███       | 2076/6790 [1:11:57<2:36:06,  1.99s/it] 31%|███       | 2077/6790 [1:11:59<2:40:26,  2.04s/it]                                                       {'loss': 1.5495, 'learning_rate': 0.0003198247731477074, 'epoch': 0.31}
+ 31%|███       | 2077/6790 [1:11:59<2:40:26,  2.04s/it] 31%|███       | 2078/6790 [1:12:01<2:37:55,  2.01s/it]                                                       {'loss': 1.4473, 'learning_rate': 0.00031974956304436057, 'epoch': 0.31}
+ 31%|███       | 2078/6790 [1:12:01<2:37:55,  2.01s/it] 31%|███       | 2079/6790 [1:12:03<2:33:25,  1.95s/it]                                                       {'loss': 1.6385, 'learning_rate': 0.0003196743265338693, 'epoch': 0.31}
+ 31%|███       | 2079/6790 [1:12:03<2:33:25,  1.95s/it] 31%|███       | 2080/6790 [1:12:05<2:31:13,  1.93s/it]                                                       {'loss': 1.5221, 'learning_rate': 0.0003195990636328249, 'epoch': 0.31}
+ 31%|███       | 2080/6790 [1:12:05<2:31:13,  1.93s/it] 31%|███       | 2081/6790 [1:12:07<2:29:25,  1.90s/it]                                                       {'loss': 1.3544, 'learning_rate': 0.0003195237743578242, 'epoch': 0.31}
+ 31%|███       | 2081/6790 [1:12:07<2:29:25,  1.90s/it] 31%|███       | 2082/6790 [1:12:09<2:35:49,  1.99s/it]                                                       {'loss': 1.5859, 'learning_rate': 0.0003194484587254701, 'epoch': 0.31}
+ 31%|███       | 2082/6790 [1:12:09<2:35:49,  1.99s/it] 31%|███       | 2083/6790 [1:12:11<2:32:38,  1.95s/it]                                                       {'loss': 1.4149, 'learning_rate': 0.00031937311675237114, 'epoch': 0.31}
+ 31%|███       | 2083/6790 [1:12:11<2:32:38,  1.95s/it] 31%|███       | 2084/6790 [1:12:13<2:32:16,  1.94s/it]                                                       {'loss': 1.3341, 'learning_rate': 0.0003192977484551416, 'epoch': 0.31}
+ 31%|███       | 2084/6790 [1:12:13<2:32:16,  1.94s/it] 31%|███       | 2085/6790 [1:12:15<2:39:24,  2.03s/it]                                                       {'loss': 1.5948, 'learning_rate': 0.00031922235385040175, 'epoch': 0.31}
+ 31%|███       | 2085/6790 [1:12:15<2:39:24,  2.03s/it] 31%|███       | 2086/6790 [1:12:17<2:38:58,  2.03s/it]                                                       {'loss': 1.3656, 'learning_rate': 0.0003191469329547777, 'epoch': 0.31}
+ 31%|███       | 2086/6790 [1:12:17<2:38:58,  2.03s/it] 31%|███       | 2087/6790 [1:12:19<2:35:46,  1.99s/it]                                                       {'loss': 1.5917, 'learning_rate': 0.0003190714857849011, 'epoch': 0.31}
+ 31%|███       | 2087/6790 [1:12:19<2:35:46,  1.99s/it] 31%|███       | 2088/6790 [1:12:21<2:37:20,  2.01s/it]                                                       {'loss': 1.4097, 'learning_rate': 0.00031899601235740963, 'epoch': 0.31}
+ 31%|███       | 2088/6790 [1:12:21<2:37:20,  2.01s/it] 31%|███       | 2089/6790 [1:12:23<2:42:01,  2.07s/it]                                                       {'loss': 1.4178, 'learning_rate': 0.00031892051268894657, 'epoch': 0.31}
+ 31%|███       | 2089/6790 [1:12:23<2:42:01,  2.07s/it] 31%|███       | 2090/6790 [1:12:25<2:36:14,  1.99s/it]                                                       {'loss': 1.5764, 'learning_rate': 0.00031884498679616115, 'epoch': 0.31}
+ 31%|███       | 2090/6790 [1:12:25<2:36:14,  1.99s/it] 31%|███       | 2091/6790 [1:12:27<2:39:01,  2.03s/it]                                                       {'loss': 1.5756, 'learning_rate': 0.00031876943469570835, 'epoch': 0.31}
+ 31%|███       | 2091/6790 [1:12:27<2:39:01,  2.03s/it] 31%|███       | 2092/6790 [1:12:29<2:34:17,  1.97s/it]                                                       {'loss': 1.5744, 'learning_rate': 0.0003186938564042489, 'epoch': 0.31}
+ 31%|███       | 2092/6790 [1:12:29<2:34:17,  1.97s/it] 31%|███       | 2093/6790 [1:12:31<2:37:51,  2.02s/it]                                                       {'loss': 1.5441, 'learning_rate': 0.0003186182519384493, 'epoch': 0.31}
+ 31%|███       | 2093/6790 [1:12:31<2:37:51,  2.02s/it] 31%|███       | 2094/6790 [1:12:33<2:35:18,  1.98s/it]                                                       {'loss': 1.4905, 'learning_rate': 0.0003185426213149818, 'epoch': 0.31}
+ 31%|███       | 2094/6790 [1:12:33<2:35:18,  1.98s/it] 31%|███       | 2095/6790 [1:12:35<2:35:22,  1.99s/it]                                                       {'loss': 1.6935, 'learning_rate': 0.00031846696455052435, 'epoch': 0.31}
+ 31%|███       | 2095/6790 [1:12:35<2:35:22,  1.99s/it] 31%|███       | 2096/6790 [1:12:37<2:51:11,  2.19s/it]                                                       {'loss': 1.4936, 'learning_rate': 0.000318391281661761, 'epoch': 0.31}
+ 31%|███       | 2096/6790 [1:12:37<2:51:11,  2.19s/it] 31%|███       | 2097/6790 [1:12:40<2:51:07,  2.19s/it]                                                       {'loss': 1.5043, 'learning_rate': 0.0003183155726653811, 'epoch': 0.31}
+ 31%|███       | 2097/6790 [1:12:40<2:51:07,  2.19s/it] 31%|███       | 2098/6790 [1:12:42<2:57:54,  2.27s/it]                                                       {'loss': 1.5413, 'learning_rate': 0.0003182398375780801, 'epoch': 0.31}
+ 31%|███       | 2098/6790 [1:12:42<2:57:54,  2.27s/it] 31%|███       | 2099/6790 [1:12:44<2:54:19,  2.23s/it]                                                       {'loss': 1.7472, 'learning_rate': 0.000318164076416559, 'epoch': 0.31}
+ 31%|███       | 2099/6790 [1:12:44<2:54:19,  2.23s/it] 31%|███       | 2100/6790 [1:12:48<3:26:29,  2.64s/it]                                                       {'loss': 1.5987, 'learning_rate': 0.00031808828919752477, 'epoch': 0.31}
+ 31%|███       | 2100/6790 [1:12:48<3:26:29,  2.64s/it] 31%|███       | 2101/6790 [1:12:50<3:08:32,  2.41s/it]                                                       {'loss': 1.53, 'learning_rate': 0.00031801247593768987, 'epoch': 0.31}
+ 31%|███       | 2101/6790 [1:12:50<3:08:32,  2.41s/it] 31%|███       | 2102/6790 [1:12:52<2:55:46,  2.25s/it]                                                       {'loss': 1.4011, 'learning_rate': 0.00031793663665377267, 'epoch': 0.31}
+ 31%|███       | 2102/6790 [1:12:52<2:55:46,  2.25s/it] 31%|███       | 2103/6790 [1:12:53<2:45:45,  2.12s/it]                                                       {'loss': 1.5092, 'learning_rate': 0.0003178607713624972, 'epoch': 0.31}
+ 31%|███       | 2103/6790 [1:12:53<2:45:45,  2.12s/it] 31%|███       | 2104/6790 [1:12:55<2:40:28,  2.05s/it]                                                       {'loss': 1.5554, 'learning_rate': 0.0003177848800805933, 'epoch': 0.31}
+ 31%|███       | 2104/6790 [1:12:55<2:40:28,  2.05s/it] 31%|███       | 2105/6790 [1:12:57<2:35:36,  1.99s/it]                                                       {'loss': 1.4052, 'learning_rate': 0.00031770896282479644, 'epoch': 0.31}
+ 31%|███       | 2105/6790 [1:12:57<2:35:36,  1.99s/it] 31%|███       | 2106/6790 [1:12:59<2:36:19,  2.00s/it]                                                       {'loss': 1.5562, 'learning_rate': 0.0003176330196118479, 'epoch': 0.31}
+ 31%|███       | 2106/6790 [1:12:59<2:36:19,  2.00s/it] 31%|███       | 2107/6790 [1:13:01<2:31:37,  1.94s/it]                                                       {'loss': 1.5067, 'learning_rate': 0.00031755705045849464, 'epoch': 0.31}
+ 31%|███       | 2107/6790 [1:13:01<2:31:37,  1.94s/it] 31%|███       | 2108/6790 [1:13:03<2:31:19,  1.94s/it]                                                       {'loss': 1.4707, 'learning_rate': 0.0003174810553814894, 'epoch': 0.31}
+ 31%|███       | 2108/6790 [1:13:03<2:31:19,  1.94s/it] 31%|███       | 2109/6790 [1:13:05<2:34:40,  1.98s/it]                                                       {'loss': 1.9285, 'learning_rate': 0.0003174050343975906, 'epoch': 0.31}
+ 31%|███       | 2109/6790 [1:13:05<2:34:40,  1.98s/it] 31%|███       | 2110/6790 [1:13:07<2:38:16,  2.03s/it]                                                       {'loss': 1.5314, 'learning_rate': 0.00031732898752356235, 'epoch': 0.31}
+ 31%|███       | 2110/6790 [1:13:07<2:38:16,  2.03s/it] 31%|███       | 2111/6790 [1:13:09<2:43:44,  2.10s/it]                                                       {'loss': 1.4053, 'learning_rate': 0.0003172529147761744, 'epoch': 0.31}
+ 31%|███       | 2111/6790 [1:13:09<2:43:44,  2.10s/it] 31%|███       | 2112/6790 [1:13:12<2:45:22,  2.12s/it]                                                       {'loss': 1.512, 'learning_rate': 0.0003171768161722025, 'epoch': 0.31}
+ 31%|███       | 2112/6790 [1:13:12<2:45:22,  2.12s/it] 31%|███       | 2113/6790 [1:13:14<2:42:53,  2.09s/it]                                                       {'loss': 1.403, 'learning_rate': 0.00031710069172842764, 'epoch': 0.31}
+ 31%|███       | 2113/6790 [1:13:14<2:42:53,  2.09s/it] 31%|███       | 2114/6790 [1:13:16<2:40:42,  2.06s/it]                                                       {'loss': 1.5535, 'learning_rate': 0.00031702454146163703, 'epoch': 0.31}
+ 31%|███       | 2114/6790 [1:13:16<2:40:42,  2.06s/it] 31%|███       | 2115/6790 [1:13:18<2:53:42,  2.23s/it]                                                       {'loss': 1.4084, 'learning_rate': 0.00031694836538862306, 'epoch': 0.31}
+ 31%|███       | 2115/6790 [1:13:18<2:53:42,  2.23s/it] 31%|███       | 2116/6790 [1:13:20<2:42:58,  2.09s/it]                                                       {'loss': 1.4329, 'learning_rate': 0.0003168721635261842, 'epoch': 0.31}
+ 31%|███       | 2116/6790 [1:13:20<2:42:58,  2.09s/it] 31%|███       | 2117/6790 [1:13:22<2:36:58,  2.02s/it]                                                       {'loss': 1.6899, 'learning_rate': 0.00031679593589112445, 'epoch': 0.31}
+ 31%|███       | 2117/6790 [1:13:22<2:36:58,  2.02s/it] 31%|███       | 2118/6790 [1:13:24<2:45:38,  2.13s/it]                                                       {'loss': 1.1082, 'learning_rate': 0.00031671968250025355, 'epoch': 0.31}
+ 31%|███       | 2118/6790 [1:13:24<2:45:38,  2.13s/it] 31%|███       | 2119/6790 [1:13:26<2:41:18,  2.07s/it]                                                       {'loss': 1.3326, 'learning_rate': 0.0003166434033703868, 'epoch': 0.31}
+ 31%|███       | 2119/6790 [1:13:26<2:41:18,  2.07s/it] 31%|███       | 2120/6790 [1:13:28<2:39:50,  2.05s/it]                                                       {'loss': 1.3954, 'learning_rate': 0.00031656709851834525, 'epoch': 0.31}
+ 31%|███       | 2120/6790 [1:13:28<2:39:50,  2.05s/it] 31%|███       | 2121/6790 [1:13:30<2:42:43,  2.09s/it]                                                       {'loss': 1.58, 'learning_rate': 0.0003164907679609557, 'epoch': 0.31}
+ 31%|███       | 2121/6790 [1:13:30<2:42:43,  2.09s/it] 31%|███▏      | 2122/6790 [1:13:32<2:43:20,  2.10s/it]                                                       {'loss': 1.4451, 'learning_rate': 0.0003164144117150505, 'epoch': 0.31}
+ 31%|███▏      | 2122/6790 [1:13:32<2:43:20,  2.10s/it] 31%|███▏      | 2123/6790 [1:13:35<2:47:26,  2.15s/it]                                                       {'loss': 1.5545, 'learning_rate': 0.00031633802979746765, 'epoch': 0.31}
+ 31%|███▏      | 2123/6790 [1:13:35<2:47:26,  2.15s/it] 31%|███▏      | 2124/6790 [1:13:37<2:46:30,  2.14s/it]                                                       {'loss': 1.7524, 'learning_rate': 0.000316261622225051, 'epoch': 0.31}
+ 31%|███▏      | 2124/6790 [1:13:37<2:46:30,  2.14s/it] 31%|███▏      | 2125/6790 [1:13:39<2:47:38,  2.16s/it]                                                       {'loss': 1.4001, 'learning_rate': 0.0003161851890146499, 'epoch': 0.31}
+ 31%|███▏      | 2125/6790 [1:13:39<2:47:38,  2.16s/it] 31%|███▏      | 2126/6790 [1:13:41<2:41:42,  2.08s/it]                                                       {'loss': 1.5964, 'learning_rate': 0.00031610873018311927, 'epoch': 0.31}
+ 31%|███▏      | 2126/6790 [1:13:41<2:41:42,  2.08s/it] 31%|███▏      | 2127/6790 [1:13:43<2:48:44,  2.17s/it]                                                       {'loss': 1.7643, 'learning_rate': 0.00031603224574731995, 'epoch': 0.31}
+ 31%|███▏      | 2127/6790 [1:13:43<2:48:44,  2.17s/it] 31%|███▏      | 2128/6790 [1:13:45<2:47:59,  2.16s/it]                                                       {'loss': 1.2444, 'learning_rate': 0.0003159557357241181, 'epoch': 0.31}
+ 31%|███▏      | 2128/6790 [1:13:45<2:47:59,  2.16s/it] 31%|███▏      | 2129/6790 [1:13:48<2:52:08,  2.22s/it]                                                       {'loss': 1.5525, 'learning_rate': 0.00031587920013038587, 'epoch': 0.31}
+ 31%|███▏      | 2129/6790 [1:13:48<2:52:08,  2.22s/it] 31%|███▏      | 2130/6790 [1:13:50<2:50:20,  2.19s/it]                                                       {'loss': 1.3515, 'learning_rate': 0.0003158026389830007, 'epoch': 0.31}
+ 31%|███▏      | 2130/6790 [1:13:50<2:50:20,  2.19s/it] 31%|███▏      | 2131/6790 [1:13:52<2:41:45,  2.08s/it]                                                       {'loss': 1.4727, 'learning_rate': 0.000315726052298846, 'epoch': 0.31}
+ 31%|███▏      | 2131/6790 [1:13:52<2:41:45,  2.08s/it] 31%|███▏      | 2132/6790 [1:13:54<2:38:49,  2.05s/it]                                                       {'loss': 1.5004, 'learning_rate': 0.00031564944009481057, 'epoch': 0.31}
+ 31%|███▏      | 2132/6790 [1:13:54<2:38:49,  2.05s/it] 31%|███▏      | 2133/6790 [1:13:56<2:41:24,  2.08s/it]                                                       {'loss': 1.4906, 'learning_rate': 0.00031557280238778883, 'epoch': 0.31}
+ 31%|███▏      | 2133/6790 [1:13:56<2:41:24,  2.08s/it] 31%|███▏      | 2134/6790 [1:13:58<2:36:26,  2.02s/it]                                                       {'loss': 1.4864, 'learning_rate': 0.000315496139194681, 'epoch': 0.31}
+ 31%|███▏      | 2134/6790 [1:13:58<2:36:26,  2.02s/it] 31%|███▏      | 2135/6790 [1:14:00<2:42:33,  2.10s/it]                                                       {'loss': 1.4382, 'learning_rate': 0.0003154194505323929, 'epoch': 0.31}
+ 31%|███▏      | 2135/6790 [1:14:00<2:42:33,  2.10s/it] 31%|███▏      | 2136/6790 [1:14:02<2:36:54,  2.02s/it]                                                       {'loss': 1.5968, 'learning_rate': 0.00031534273641783576, 'epoch': 0.31}
+ 31%|███▏      | 2136/6790 [1:14:02<2:36:54,  2.02s/it] 31%|███▏      | 2137/6790 [1:14:04<2:43:10,  2.10s/it]                                                       {'loss': 1.4937, 'learning_rate': 0.00031526599686792665, 'epoch': 0.31}
+ 31%|███▏      | 2137/6790 [1:14:04<2:43:10,  2.10s/it] 31%|███▏      | 2138/6790 [1:14:06<2:38:32,  2.04s/it]                                                       {'loss': 1.5079, 'learning_rate': 0.0003151892318995881, 'epoch': 0.31}
+ 31%|███▏      | 2138/6790 [1:14:06<2:38:32,  2.04s/it] 32%|███▏      | 2139/6790 [1:14:08<2:35:29,  2.01s/it]                                                       {'loss': 1.3373, 'learning_rate': 0.00031511244152974824, 'epoch': 0.32}
+ 32%|███▏      | 2139/6790 [1:14:08<2:35:29,  2.01s/it] 32%|███▏      | 2140/6790 [1:14:11<3:07:44,  2.42s/it]                                                       {'loss': 1.5716, 'learning_rate': 0.000315035625775341, 'epoch': 0.32}
+ 32%|███▏      | 2140/6790 [1:14:11<3:07:44,  2.42s/it] 32%|███▏      | 2141/6790 [1:14:13<2:53:37,  2.24s/it]                                                       {'loss': 1.4495, 'learning_rate': 0.00031495878465330577, 'epoch': 0.32}
+ 32%|███▏      | 2141/6790 [1:14:13<2:53:37,  2.24s/it] 32%|███▏      | 2142/6790 [1:14:15<2:47:00,  2.16s/it]                                                       {'loss': 1.6901, 'learning_rate': 0.0003148819181805874, 'epoch': 0.32}
+ 32%|███▏      | 2142/6790 [1:14:15<2:47:00,  2.16s/it] 32%|███▏      | 2143/6790 [1:14:17<2:38:42,  2.05s/it]                                                       {'loss': 1.4761, 'learning_rate': 0.00031480502637413663, 'epoch': 0.32}
+ 32%|███▏      | 2143/6790 [1:14:17<2:38:42,  2.05s/it] 32%|███▏      | 2144/6790 [1:14:19<2:41:26,  2.08s/it]                                                       {'loss': 1.7003, 'learning_rate': 0.00031472810925090944, 'epoch': 0.32}
+ 32%|███▏      | 2144/6790 [1:14:19<2:41:26,  2.08s/it] 32%|███▏      | 2145/6790 [1:14:21<2:39:05,  2.06s/it]                                                       {'loss': 1.5052, 'learning_rate': 0.0003146511668278677, 'epoch': 0.32}
+ 32%|███▏      | 2145/6790 [1:14:21<2:39:05,  2.06s/it] 32%|███▏      | 2146/6790 [1:14:23<2:35:38,  2.01s/it]                                                       {'loss': 1.4834, 'learning_rate': 0.00031457419912197875, 'epoch': 0.32}
+ 32%|███▏      | 2146/6790 [1:14:23<2:35:38,  2.01s/it] 32%|███▏      | 2147/6790 [1:14:25<2:36:30,  2.02s/it]                                                       {'loss': 1.5681, 'learning_rate': 0.0003144972061502154, 'epoch': 0.32}
+ 32%|███▏      | 2147/6790 [1:14:25<2:36:30,  2.02s/it] 32%|███▏      | 2148/6790 [1:14:27<2:34:20,  1.99s/it]                                                       {'loss': 1.4511, 'learning_rate': 0.0003144972061502154, 'epoch': 0.32}
+ 32%|███▏      | 2148/6790 [1:14:27<2:34:20,  1.99s/it] 32%|███▏      | 2149/6790 [1:14:29<2:33:16,  1.98s/it]                                                       {'loss': 1.5254, 'learning_rate': 0.0003144201879295562, 'epoch': 0.32}
+ 32%|███▏      | 2149/6790 [1:14:29<2:33:16,  1.98s/it] 32%|███▏      | 2150/6790 [1:14:31<2:32:34,  1.97s/it]                                                       {'loss': 1.4782, 'learning_rate': 0.00031434314447698514, 'epoch': 0.32}
+ 32%|███▏      | 2150/6790 [1:14:31<2:32:34,  1.97s/it] 32%|███▏      | 2151/6790 [1:14:33<2:30:35,  1.95s/it]                                                       {'loss': 1.7858, 'learning_rate': 0.0003142660758094919, 'epoch': 0.32}
+ 32%|███▏      | 2151/6790 [1:14:33<2:30:35,  1.95s/it] 32%|███▏      | 2152/6790 [1:14:35<2:32:58,  1.98s/it]                                                       {'loss': 1.5168, 'learning_rate': 0.0003141889819440715, 'epoch': 0.32}
+ 32%|███▏      | 2152/6790 [1:14:35<2:32:58,  1.98s/it] 32%|███▏      | 2153/6790 [1:14:37<2:33:26,  1.99s/it]                                                       {'loss': 1.2965, 'learning_rate': 0.0003141118628977248, 'epoch': 0.32}
+ 32%|███▏      | 2153/6790 [1:14:37<2:33:26,  1.99s/it] 32%|███▏      | 2154/6790 [1:14:39<2:34:46,  2.00s/it]                                                       {'loss': 1.6234, 'learning_rate': 0.000314034718687458, 'epoch': 0.32}
+ 32%|███▏      | 2154/6790 [1:14:39<2:34:46,  2.00s/it] 32%|███▏      | 2155/6790 [1:14:41<2:38:25,  2.05s/it]                                                       {'loss': 1.5827, 'learning_rate': 0.00031395754933028294, 'epoch': 0.32}
+ 32%|███▏      | 2155/6790 [1:14:41<2:38:25,  2.05s/it] 32%|███▏      | 2156/6790 [1:14:43<2:37:48,  2.04s/it]                                                       {'loss': 1.6718, 'learning_rate': 0.0003138803548432169, 'epoch': 0.32}
+ 32%|███▏      | 2156/6790 [1:14:43<2:37:48,  2.04s/it] 32%|███▏      | 2157/6790 [1:14:45<2:43:29,  2.12s/it]                                                       {'loss': 1.5637, 'learning_rate': 0.000313803135243283, 'epoch': 0.32}
+ 32%|███▏      | 2157/6790 [1:14:45<2:43:29,  2.12s/it] 32%|███▏      | 2158/6790 [1:14:47<2:35:58,  2.02s/it]                                                       {'loss': 1.4651, 'learning_rate': 0.00031372589054750954, 'epoch': 0.32}
+ 32%|███▏      | 2158/6790 [1:14:47<2:35:58,  2.02s/it] 32%|███▏      | 2159/6790 [1:14:49<2:29:21,  1.94s/it]                                                       {'loss': 1.3266, 'learning_rate': 0.00031364862077293054, 'epoch': 0.32}
+ 32%|███▏      | 2159/6790 [1:14:49<2:29:21,  1.94s/it] 32%|███▏      | 2160/6790 [1:14:51<2:33:35,  1.99s/it]                                                       {'loss': 1.6721, 'learning_rate': 0.00031357132593658546, 'epoch': 0.32}
+ 32%|███▏      | 2160/6790 [1:14:51<2:33:35,  1.99s/it] 32%|███▏      | 2161/6790 [1:14:53<2:32:12,  1.97s/it]                                                       {'loss': 1.4916, 'learning_rate': 0.0003134940060555194, 'epoch': 0.32}
+ 32%|███▏      | 2161/6790 [1:14:53<2:32:12,  1.97s/it] 32%|███▏      | 2162/6790 [1:14:55<2:29:33,  1.94s/it]                                                       {'loss': 1.454, 'learning_rate': 0.0003134166611467829, 'epoch': 0.32}
+ 32%|███▏      | 2162/6790 [1:14:55<2:29:33,  1.94s/it] 32%|███▏      | 2163/6790 [1:14:57<2:33:24,  1.99s/it]                                                       {'loss': 1.5788, 'learning_rate': 0.00031333929122743197, 'epoch': 0.32}
+ 32%|███▏      | 2163/6790 [1:14:57<2:33:24,  1.99s/it] 32%|███▏      | 2164/6790 [1:14:59<2:40:07,  2.08s/it]                                                       {'loss': 1.5562, 'learning_rate': 0.00031326189631452836, 'epoch': 0.32}
+ 32%|███▏      | 2164/6790 [1:14:59<2:40:07,  2.08s/it] 32%|███▏      | 2165/6790 [1:15:01<2:36:55,  2.04s/it]                                                       {'loss': 1.3938, 'learning_rate': 0.000313184476425139, 'epoch': 0.32}
+ 32%|███▏      | 2165/6790 [1:15:01<2:36:55,  2.04s/it] 32%|███▏      | 2166/6790 [1:15:03<2:33:27,  1.99s/it]                                                       {'loss': 1.4993, 'learning_rate': 0.0003131070315763367, 'epoch': 0.32}
+ 32%|███▏      | 2166/6790 [1:15:03<2:33:27,  1.99s/it] 32%|███▏      | 2167/6790 [1:15:05<2:30:37,  1.95s/it]                                                       {'loss': 1.4929, 'learning_rate': 0.00031302956178519946, 'epoch': 0.32}
+ 32%|███▏      | 2167/6790 [1:15:05<2:30:37,  1.95s/it] 32%|███▏      | 2168/6790 [1:15:07<2:27:24,  1.91s/it]                                                       {'loss': 1.4302, 'learning_rate': 0.0003129520670688109, 'epoch': 0.32}
+ 32%|███▏      | 2168/6790 [1:15:07<2:27:24,  1.91s/it] 32%|███▏      | 2169/6790 [1:15:09<2:31:39,  1.97s/it]                                                       {'loss': 1.6303, 'learning_rate': 0.0003128745474442601, 'epoch': 0.32}
+ 32%|███▏      | 2169/6790 [1:15:09<2:31:39,  1.97s/it] 32%|███▏      | 2170/6790 [1:15:11<2:32:53,  1.99s/it]                                                       {'loss': 1.4557, 'learning_rate': 0.0003127970029286418, 'epoch': 0.32}
+ 32%|███▏      | 2170/6790 [1:15:11<2:32:53,  1.99s/it] 32%|███▏      | 2171/6790 [1:15:12<2:25:38,  1.89s/it]                                                       {'loss': 1.3236, 'learning_rate': 0.00031271943353905593, 'epoch': 0.32}
+ 32%|███▏      | 2171/6790 [1:15:12<2:25:38,  1.89s/it] 32%|███▏      | 2172/6790 [1:15:15<2:31:09,  1.96s/it]                                                       {'loss': 1.5851, 'learning_rate': 0.00031264183929260824, 'epoch': 0.32}
+ 32%|███▏      | 2172/6790 [1:15:15<2:31:09,  1.96s/it] 32%|███▏      | 2173/6790 [1:15:16<2:26:34,  1.90s/it]                                                       {'loss': 1.4012, 'learning_rate': 0.0003125642202064096, 'epoch': 0.32}
+ 32%|███▏      | 2173/6790 [1:15:16<2:26:34,  1.90s/it] 32%|███▏      | 2174/6790 [1:15:19<2:38:10,  2.06s/it]                                                       {'loss': 1.5358, 'learning_rate': 0.0003124865762975768, 'epoch': 0.32}
+ 32%|███▏      | 2174/6790 [1:15:19<2:38:10,  2.06s/it] 32%|███▏      | 2175/6790 [1:15:20<2:29:19,  1.94s/it]                                                       {'loss': 1.3195, 'learning_rate': 0.0003124089075832317, 'epoch': 0.32}
+ 32%|███▏      | 2175/6790 [1:15:20<2:29:19,  1.94s/it] 32%|███▏      | 2176/6790 [1:15:23<2:32:07,  1.98s/it]                                                       {'loss': 1.3756, 'learning_rate': 0.00031233121408050175, 'epoch': 0.32}
+ 32%|███▏      | 2176/6790 [1:15:23<2:32:07,  1.98s/it] 32%|███▏      | 2177/6790 [1:15:25<2:36:45,  2.04s/it]                                                       {'loss': 1.6071, 'learning_rate': 0.00031225349580652, 'epoch': 0.32}
+ 32%|███▏      | 2177/6790 [1:15:25<2:36:45,  2.04s/it] 32%|███▏      | 2178/6790 [1:15:27<2:32:59,  1.99s/it]                                                       {'loss': 1.4902, 'learning_rate': 0.0003121757527784248, 'epoch': 0.32}
+ 32%|███▏      | 2178/6790 [1:15:27<2:32:59,  1.99s/it] 32%|███▏      | 2179/6790 [1:15:29<2:38:40,  2.06s/it]                                                       {'loss': 1.4932, 'learning_rate': 0.00031209798501336005, 'epoch': 0.32}
+ 32%|███▏      | 2179/6790 [1:15:29<2:38:40,  2.06s/it] 32%|███▏      | 2180/6790 [1:15:31<2:44:57,  2.15s/it]                                                       {'loss': 1.6622, 'learning_rate': 0.000312020192528475, 'epoch': 0.32}
+ 32%|███▏      | 2180/6790 [1:15:31<2:44:57,  2.15s/it] 32%|███▏      | 2181/6790 [1:15:33<2:39:40,  2.08s/it]                                                       {'loss': 1.6962, 'learning_rate': 0.00031194237534092463, 'epoch': 0.32}
+ 32%|███▏      | 2181/6790 [1:15:33<2:39:40,  2.08s/it] 32%|███▏      | 2182/6790 [1:15:35<2:35:32,  2.03s/it]                                                       {'loss': 1.5594, 'learning_rate': 0.000311864533467869, 'epoch': 0.32}
+ 32%|███▏      | 2182/6790 [1:15:35<2:35:32,  2.03s/it] 32%|███▏      | 2183/6790 [1:15:37<2:34:57,  2.02s/it]                                                       {'loss': 1.5355, 'learning_rate': 0.00031178666692647383, 'epoch': 0.32}
+ 32%|███▏      | 2183/6790 [1:15:37<2:34:57,  2.02s/it] 32%|███▏      | 2184/6790 [1:15:39<2:35:26,  2.02s/it]                                                       {'loss': 1.5591, 'learning_rate': 0.0003117087757339102, 'epoch': 0.32}
+ 32%|███▏      | 2184/6790 [1:15:39<2:35:26,  2.02s/it] 32%|███▏      | 2185/6790 [1:15:41<2:38:06,  2.06s/it]                                                       {'loss': 1.6026, 'learning_rate': 0.0003116308599073547, 'epoch': 0.32}
+ 32%|███▏      | 2185/6790 [1:15:41<2:38:06,  2.06s/it] 32%|███▏      | 2186/6790 [1:15:43<2:33:18,  2.00s/it]                                                       {'loss': 1.4231, 'learning_rate': 0.0003115529194639893, 'epoch': 0.32}
+ 32%|███▏      | 2186/6790 [1:15:43<2:33:18,  2.00s/it] 32%|███▏      | 2187/6790 [1:15:45<2:29:53,  1.95s/it]                                                       {'loss': 1.5947, 'learning_rate': 0.0003114749544210014, 'epoch': 0.32}
+ 32%|███▏      | 2187/6790 [1:15:45<2:29:53,  1.95s/it] 32%|███▏      | 2188/6790 [1:15:47<2:35:41,  2.03s/it]                                                       {'loss': 1.624, 'learning_rate': 0.00031139696479558384, 'epoch': 0.32}
+ 32%|███▏      | 2188/6790 [1:15:47<2:35:41,  2.03s/it] 32%|███▏      | 2189/6790 [1:15:49<2:32:46,  1.99s/it]                                                       {'loss': 1.4124, 'learning_rate': 0.0003113189506049348, 'epoch': 0.32}
+ 32%|███▏      | 2189/6790 [1:15:49<2:32:46,  1.99s/it] 32%|███▏      | 2190/6790 [1:15:51<2:37:51,  2.06s/it]                                                       {'loss': 1.1582, 'learning_rate': 0.0003112409118662581, 'epoch': 0.32}
+ 32%|███▏      | 2190/6790 [1:15:51<2:37:51,  2.06s/it] 32%|███▏      | 2191/6790 [1:15:53<2:38:31,  2.07s/it]                                                       {'loss': 1.5302, 'learning_rate': 0.00031116284859676266, 'epoch': 0.32}
+ 32%|███▏      | 2191/6790 [1:15:53<2:38:31,  2.07s/it] 32%|███▏      | 2192/6790 [1:15:55<2:30:54,  1.97s/it]                                                       {'loss': 1.4591, 'learning_rate': 0.0003110847608136631, 'epoch': 0.32}
+ 32%|███▏      | 2192/6790 [1:15:55<2:30:54,  1.97s/it] 32%|███▏      | 2193/6790 [1:15:57<2:27:18,  1.92s/it]                                                       {'loss': 1.5601, 'learning_rate': 0.0003110066485341792, 'epoch': 0.32}
+ 32%|███▏      | 2193/6790 [1:15:57<2:27:18,  1.92s/it] 32%|███▏      | 2194/6790 [1:15:59<2:28:17,  1.94s/it]                                                       {'loss': 1.4927, 'learning_rate': 0.0003109285117755364, 'epoch': 0.32}
+ 32%|███▏      | 2194/6790 [1:15:59<2:28:17,  1.94s/it] 32%|███▏      | 2195/6790 [1:16:01<2:33:57,  2.01s/it]                                                       {'loss': 1.6208, 'learning_rate': 0.00031085035055496537, 'epoch': 0.32}
+ 32%|███▏      | 2195/6790 [1:16:01<2:33:57,  2.01s/it] 32%|███▏      | 2196/6790 [1:16:03<2:41:20,  2.11s/it]                                                       {'loss': 1.4464, 'learning_rate': 0.00031077216488970206, 'epoch': 0.32}
+ 32%|███▏      | 2196/6790 [1:16:03<2:41:20,  2.11s/it] 32%|███▏      | 2197/6790 [1:16:05<2:33:16,  2.00s/it]                                                       {'loss': 1.4674, 'learning_rate': 0.00031069395479698807, 'epoch': 0.32}
+ 32%|███▏      | 2197/6790 [1:16:05<2:33:16,  2.00s/it] 32%|███▏      | 2198/6790 [1:16:07<2:40:23,  2.10s/it]                                                       {'loss': 1.4069, 'learning_rate': 0.0003106157202940703, 'epoch': 0.32}
+ 32%|███▏      | 2198/6790 [1:16:07<2:40:23,  2.10s/it] 32%|███▏      | 2199/6790 [1:16:09<2:39:29,  2.08s/it]                                                       {'loss': 1.7044, 'learning_rate': 0.00031053746139820095, 'epoch': 0.32}
+ 32%|███▏      | 2199/6790 [1:16:09<2:39:29,  2.08s/it] 32%|███▏      | 2200/6790 [1:16:11<2:34:09,  2.02s/it]                                                       {'loss': 1.3827, 'learning_rate': 0.00031045917812663764, 'epoch': 0.32}
+ 32%|███▏      | 2200/6790 [1:16:11<2:34:09,  2.02s/it] 32%|███▏      | 2201/6790 [1:16:14<2:41:26,  2.11s/it]                                                       {'loss': 1.6477, 'learning_rate': 0.0003103808704966434, 'epoch': 0.32}
+ 32%|███▏      | 2201/6790 [1:16:14<2:41:26,  2.11s/it] 32%|███▏      | 2202/6790 [1:16:16<2:46:54,  2.18s/it]                                                       {'loss': 1.5811, 'learning_rate': 0.0003103025385254866, 'epoch': 0.32}
+ 32%|███▏      | 2202/6790 [1:16:16<2:46:54,  2.18s/it] 32%|███▏      | 2203/6790 [1:16:18<2:42:25,  2.12s/it]                                                       {'loss': 1.3914, 'learning_rate': 0.0003102241822304411, 'epoch': 0.32}
+ 32%|███▏      | 2203/6790 [1:16:18<2:42:25,  2.12s/it] 32%|███▏      | 2204/6790 [1:16:20<2:39:23,  2.09s/it]                                                       {'loss': 1.6075, 'learning_rate': 0.0003101458016287858, 'epoch': 0.32}
+ 32%|███▏      | 2204/6790 [1:16:20<2:39:23,  2.09s/it] 32%|███▏      | 2205/6790 [1:16:22<2:36:10,  2.04s/it]                                                       {'loss': 1.5151, 'learning_rate': 0.0003100673967378053, 'epoch': 0.32}
+ 32%|███▏      | 2205/6790 [1:16:22<2:36:10,  2.04s/it] 32%|███▏      | 2206/6790 [1:16:24<2:41:29,  2.11s/it]                                                       {'loss': 1.5138, 'learning_rate': 0.0003099889675747894, 'epoch': 0.32}
+ 32%|███▏      | 2206/6790 [1:16:24<2:41:29,  2.11s/it] 33%|███▎      | 2207/6790 [1:16:26<2:35:43,  2.04s/it]                                                       {'loss': 1.4911, 'learning_rate': 0.0003099105141570333, 'epoch': 0.33}
+ 33%|███▎      | 2207/6790 [1:16:26<2:35:43,  2.04s/it] 33%|███▎      | 2208/6790 [1:16:28<2:38:24,  2.07s/it]                                                       {'loss': 1.4401, 'learning_rate': 0.0003098320365018375, 'epoch': 0.33}
+ 33%|███▎      | 2208/6790 [1:16:28<2:38:24,  2.07s/it] 33%|███▎      | 2209/6790 [1:16:30<2:31:59,  1.99s/it]                                                       {'loss': 1.4382, 'learning_rate': 0.0003097535346265079, 'epoch': 0.33}
+ 33%|███▎      | 2209/6790 [1:16:30<2:31:59,  1.99s/it] 33%|███▎      | 2210/6790 [1:16:32<2:27:53,  1.94s/it]                                                       {'loss': 1.1917, 'learning_rate': 0.00030967500854835574, 'epoch': 0.33}
+ 33%|███▎      | 2210/6790 [1:16:32<2:27:53,  1.94s/it] 33%|███▎      | 2211/6790 [1:16:34<2:26:00,  1.91s/it]                                                       {'loss': 1.5046, 'learning_rate': 0.0003095964582846975, 'epoch': 0.33}
+ 33%|███▎      | 2211/6790 [1:16:34<2:26:00,  1.91s/it] 33%|███▎      | 2212/6790 [1:16:36<2:25:50,  1.91s/it]                                                       {'loss': 1.6125, 'learning_rate': 0.00030951788385285504, 'epoch': 0.33}
+ 33%|███▎      | 2212/6790 [1:16:36<2:25:50,  1.91s/it] 33%|███▎      | 2213/6790 [1:16:38<2:30:10,  1.97s/it]                                                       {'loss': 1.6434, 'learning_rate': 0.0003094392852701557, 'epoch': 0.33}
+ 33%|███▎      | 2213/6790 [1:16:38<2:30:10,  1.97s/it] 33%|███▎      | 2214/6790 [1:16:40<2:27:46,  1.94s/it]                                                       {'loss': 1.4356, 'learning_rate': 0.00030936066255393197, 'epoch': 0.33}
+ 33%|███▎      | 2214/6790 [1:16:40<2:27:46,  1.94s/it] 33%|███▎      | 2215/6790 [1:16:42<2:42:30,  2.13s/it]                                                       {'loss': 1.3685, 'learning_rate': 0.0003092820157215216, 'epoch': 0.33}
+ 33%|███▎      | 2215/6790 [1:16:42<2:42:30,  2.13s/it] 33%|███▎      | 2216/6790 [1:16:44<2:38:41,  2.08s/it]                                                       {'loss': 1.4102, 'learning_rate': 0.0003092033447902679, 'epoch': 0.33}
+ 33%|███▎      | 2216/6790 [1:16:44<2:38:41,  2.08s/it] 33%|███▎      | 2217/6790 [1:16:47<2:54:59,  2.30s/it]                                                       {'loss': 1.447, 'learning_rate': 0.00030912464977751947, 'epoch': 0.33}
+ 33%|███▎      | 2217/6790 [1:16:47<2:54:59,  2.30s/it] 33%|███▎      | 2218/6790 [1:16:49<2:46:06,  2.18s/it]                                                       {'loss': 1.3449, 'learning_rate': 0.00030904593070062977, 'epoch': 0.33}
+ 33%|███▎      | 2218/6790 [1:16:49<2:46:06,  2.18s/it] 33%|███▎      | 2219/6790 [1:16:51<2:45:14,  2.17s/it]                                                       {'loss': 1.5513, 'learning_rate': 0.00030896718757695825, 'epoch': 0.33}
+ 33%|███▎      | 2219/6790 [1:16:51<2:45:14,  2.17s/it] 33%|███▎      | 2220/6790 [1:16:53<2:44:23,  2.16s/it]                                                       {'loss': 1.3549, 'learning_rate': 0.0003088884204238692, 'epoch': 0.33}
+ 33%|███▎      | 2220/6790 [1:16:53<2:44:23,  2.16s/it] 33%|███▎      | 2221/6790 [1:16:55<2:40:03,  2.10s/it]                                                       {'loss': 1.4394, 'learning_rate': 0.00030880962925873226, 'epoch': 0.33}
+ 33%|███▎      | 2221/6790 [1:16:55<2:40:03,  2.10s/it] 33%|███▎      | 2222/6790 [1:16:57<2:34:33,  2.03s/it]                                                       {'loss': 1.5096, 'learning_rate': 0.0003087308140989225, 'epoch': 0.33}
+ 33%|███▎      | 2222/6790 [1:16:57<2:34:33,  2.03s/it] 33%|███▎      | 2223/6790 [1:16:59<2:36:04,  2.05s/it]                                                       {'loss': 1.4672, 'learning_rate': 0.0003086519749618202, 'epoch': 0.33}
+ 33%|███▎      | 2223/6790 [1:16:59<2:36:04,  2.05s/it] 33%|███▎      | 2224/6790 [1:17:02<2:46:59,  2.19s/it]                                                       {'loss': 1.3754, 'learning_rate': 0.0003085731118648111, 'epoch': 0.33}
+ 33%|███▎      | 2224/6790 [1:17:02<2:46:59,  2.19s/it] 33%|███▎      | 2225/6790 [1:17:03<2:40:42,  2.11s/it]                                                       {'loss': 1.5723, 'learning_rate': 0.0003084942248252858, 'epoch': 0.33}
+ 33%|███▎      | 2225/6790 [1:17:03<2:40:42,  2.11s/it] 33%|███▎      | 2226/6790 [1:17:05<2:35:58,  2.05s/it]                                                       {'loss': 1.5, 'learning_rate': 0.0003084153138606407, 'epoch': 0.33}
+ 33%|███▎      | 2226/6790 [1:17:05<2:35:58,  2.05s/it] 33%|███▎      | 2227/6790 [1:17:07<2:33:45,  2.02s/it]                                                       {'loss': 1.502, 'learning_rate': 0.00030833637898827705, 'epoch': 0.33}
+ 33%|███▎      | 2227/6790 [1:17:07<2:33:45,  2.02s/it] 33%|███▎      | 2228/6790 [1:17:09<2:30:23,  1.98s/it]                                                       {'loss': 1.5716, 'learning_rate': 0.00030825742022560164, 'epoch': 0.33}
+ 33%|███▎      | 2228/6790 [1:17:09<2:30:23,  1.98s/it] 33%|███▎      | 2229/6790 [1:17:11<2:31:49,  2.00s/it]                                                       {'loss': 1.3123, 'learning_rate': 0.0003081784375900264, 'epoch': 0.33}
+ 33%|███▎      | 2229/6790 [1:17:11<2:31:49,  2.00s/it] 33%|███▎      | 2230/6790 [1:17:13<2:34:26,  2.03s/it]                                                       {'loss': 1.5783, 'learning_rate': 0.0003080994310989685, 'epoch': 0.33}
+ 33%|███▎      | 2230/6790 [1:17:13<2:34:26,  2.03s/it] 33%|███▎      | 2231/6790 [1:17:15<2:31:26,  1.99s/it]                                                       {'loss': 1.612, 'learning_rate': 0.0003080204007698506, 'epoch': 0.33}
+ 33%|███▎      | 2231/6790 [1:17:15<2:31:26,  1.99s/it] 33%|███▎      | 2232/6790 [1:17:17<2:30:33,  1.98s/it]                                                       {'loss': 1.7377, 'learning_rate': 0.0003079413466201004, 'epoch': 0.33}
+ 33%|███▎      | 2232/6790 [1:17:17<2:30:33,  1.98s/it] 33%|███▎      | 2233/6790 [1:17:19<2:33:41,  2.02s/it]                                                       {'loss': 1.7135, 'learning_rate': 0.00030786226866715076, 'epoch': 0.33}
+ 33%|███▎      | 2233/6790 [1:17:19<2:33:41,  2.02s/it] 33%|███▎      | 2234/6790 [1:17:22<2:38:27,  2.09s/it]                                                       {'loss': 1.4777, 'learning_rate': 0.0003077831669284401, 'epoch': 0.33}
+ 33%|███▎      | 2234/6790 [1:17:22<2:38:27,  2.09s/it] 33%|███▎      | 2235/6790 [1:17:24<2:35:19,  2.05s/it]                                                       {'loss': 1.4628, 'learning_rate': 0.00030770404142141177, 'epoch': 0.33}
+ 33%|███▎      | 2235/6790 [1:17:24<2:35:19,  2.05s/it] 33%|███▎      | 2236/6790 [1:17:26<2:34:14,  2.03s/it]                                                       {'loss': 1.5371, 'learning_rate': 0.0003076248921635146, 'epoch': 0.33}
+ 33%|███▎      | 2236/6790 [1:17:26<2:34:14,  2.03s/it] 33%|███▎      | 2237/6790 [1:17:27<2:31:13,  1.99s/it]                                                       {'loss': 1.4201, 'learning_rate': 0.0003075457191722026, 'epoch': 0.33}
+ 33%|███▎      | 2237/6790 [1:17:27<2:31:13,  1.99s/it] 33%|███▎      | 2238/6790 [1:17:30<2:39:01,  2.10s/it]                                                       {'loss': 1.6616, 'learning_rate': 0.0003074665224649349, 'epoch': 0.33}
+ 33%|███▎      | 2238/6790 [1:17:30<2:39:01,  2.10s/it] 33%|███▎      | 2239/6790 [1:17:32<2:33:40,  2.03s/it]                                                       {'loss': 1.3769, 'learning_rate': 0.00030738730205917596, 'epoch': 0.33}
+ 33%|███▎      | 2239/6790 [1:17:32<2:33:40,  2.03s/it] 33%|███▎      | 2240/6790 [1:17:34<2:33:21,  2.02s/it]                                                       {'loss': 1.5881, 'learning_rate': 0.00030730805797239544, 'epoch': 0.33}
+ 33%|███▎      | 2240/6790 [1:17:34<2:33:21,  2.02s/it] 33%|███▎      | 2241/6790 [1:17:36<2:36:50,  2.07s/it]                                                       {'loss': 1.6685, 'learning_rate': 0.0003072287902220683, 'epoch': 0.33}
+ 33%|███▎      | 2241/6790 [1:17:36<2:36:50,  2.07s/it] 33%|███▎      | 2242/6790 [1:17:38<2:46:23,  2.20s/it]                                                       {'loss': 1.5891, 'learning_rate': 0.0003071494988256745, 'epoch': 0.33}
+ 33%|███▎      | 2242/6790 [1:17:38<2:46:23,  2.20s/it] 33%|███▎      | 2243/6790 [1:17:40<2:46:28,  2.20s/it]                                                       {'loss': 1.736, 'learning_rate': 0.00030707018380069943, 'epoch': 0.33}
+ 33%|███▎      | 2243/6790 [1:17:40<2:46:28,  2.20s/it] 33%|███▎      | 2244/6790 [1:17:43<2:43:45,  2.16s/it]                                                       {'loss': 1.4268, 'learning_rate': 0.00030699084516463374, 'epoch': 0.33}
+ 33%|███▎      | 2244/6790 [1:17:43<2:43:45,  2.16s/it] 33%|███▎      | 2245/6790 [1:17:45<2:43:30,  2.16s/it]                                                       {'loss': 1.3627, 'learning_rate': 0.0003069114829349729, 'epoch': 0.33}
+ 33%|███▎      | 2245/6790 [1:17:45<2:43:30,  2.16s/it] 33%|███▎      | 2246/6790 [1:17:47<2:46:04,  2.19s/it]                                                       {'loss': 1.5069, 'learning_rate': 0.00030683209712921807, 'epoch': 0.33}
+ 33%|███▎      | 2246/6790 [1:17:47<2:46:04,  2.19s/it] 33%|███▎      | 2247/6790 [1:17:49<2:46:26,  2.20s/it]                                                       {'loss': 1.6798, 'learning_rate': 0.00030675268776487536, 'epoch': 0.33}
+ 33%|███▎      | 2247/6790 [1:17:49<2:46:26,  2.20s/it] 33%|███▎      | 2248/6790 [1:17:51<2:40:55,  2.13s/it]                                                       {'loss': 1.7199, 'learning_rate': 0.0003066732548594561, 'epoch': 0.33}
+ 33%|███▎      | 2248/6790 [1:17:51<2:40:55,  2.13s/it] 33%|███▎      | 2249/6790 [1:17:53<2:39:18,  2.10s/it]                                                       {'loss': 1.4227, 'learning_rate': 0.00030659379843047665, 'epoch': 0.33}
+ 33%|███▎      | 2249/6790 [1:17:53<2:39:18,  2.10s/it] 33%|███▎      | 2250/6790 [1:17:55<2:32:46,  2.02s/it]                                                       {'loss': 1.6368, 'learning_rate': 0.00030651431849545893, 'epoch': 0.33}
+ 33%|███▎      | 2250/6790 [1:17:55<2:32:46,  2.02s/it] 33%|███▎      | 2251/6790 [1:17:57<2:33:57,  2.04s/it]                                                       {'loss': 1.5206, 'learning_rate': 0.0003064348150719298, 'epoch': 0.33}
+ 33%|███▎      | 2251/6790 [1:17:57<2:33:57,  2.04s/it] 33%|███▎      | 2252/6790 [1:17:59<2:37:18,  2.08s/it]                                                       {'loss': 1.4751, 'learning_rate': 0.00030635528817742123, 'epoch': 0.33}
+ 33%|███▎      | 2252/6790 [1:17:59<2:37:18,  2.08s/it] 33%|███▎      | 2253/6790 [1:18:01<2:35:48,  2.06s/it]                                                       {'loss': 1.3312, 'learning_rate': 0.00030627573782947065, 'epoch': 0.33}
+ 33%|███▎      | 2253/6790 [1:18:01<2:35:48,  2.06s/it] 33%|███▎      | 2254/6790 [1:18:03<2:29:53,  1.98s/it]                                                       {'loss': 1.3179, 'learning_rate': 0.0003061961640456202, 'epoch': 0.33}
+ 33%|███▎      | 2254/6790 [1:18:03<2:29:53,  1.98s/it] 33%|███▎      | 2255/6790 [1:18:05<2:32:56,  2.02s/it]                                                       {'loss': 1.5926, 'learning_rate': 0.0003061165668434178, 'epoch': 0.33}
+ 33%|███▎      | 2255/6790 [1:18:05<2:32:56,  2.02s/it] 33%|███▎      | 2256/6790 [1:18:07<2:31:56,  2.01s/it]                                                       {'loss': 1.4785, 'learning_rate': 0.0003060369462404159, 'epoch': 0.33}
+ 33%|███▎      | 2256/6790 [1:18:07<2:31:56,  2.01s/it] 33%|███▎      | 2257/6790 [1:18:09<2:32:15,  2.02s/it]                                                       {'loss': 1.4776, 'learning_rate': 0.00030595730225417274, 'epoch': 0.33}
+ 33%|███▎      | 2257/6790 [1:18:09<2:32:15,  2.02s/it] 33%|███▎      | 2258/6790 [1:18:11<2:31:12,  2.00s/it]                                                       {'loss': 1.606, 'learning_rate': 0.0003058776349022511, 'epoch': 0.33}
+ 33%|███▎      | 2258/6790 [1:18:11<2:31:12,  2.00s/it] 33%|███▎      | 2259/6790 [1:18:13<2:33:04,  2.03s/it]                                                       {'loss': 1.4439, 'learning_rate': 0.0003057979442022193, 'epoch': 0.33}
+ 33%|███▎      | 2259/6790 [1:18:13<2:33:04,  2.03s/it] 33%|███▎      | 2260/6790 [1:18:16<2:56:44,  2.34s/it]                                                       {'loss': 1.5091, 'learning_rate': 0.0003057182301716508, 'epoch': 0.33}
+ 33%|███▎      | 2260/6790 [1:18:16<2:56:44,  2.34s/it] 33%|███▎      | 2261/6790 [1:18:19<2:59:14,  2.37s/it]                                                       {'loss': 1.4095, 'learning_rate': 0.000305638492828124, 'epoch': 0.33}
+ 33%|███▎      | 2261/6790 [1:18:19<2:59:14,  2.37s/it] 33%|███▎      | 2262/6790 [1:18:21<2:46:32,  2.21s/it]                                                       {'loss': 1.5059, 'learning_rate': 0.0003055587321892227, 'epoch': 0.33}
+ 33%|███▎      | 2262/6790 [1:18:21<2:46:32,  2.21s/it] 33%|███▎      | 2263/6790 [1:18:23<2:43:00,  2.16s/it]                                                       {'loss': 1.6574, 'learning_rate': 0.0003054789482725355, 'epoch': 0.33}
+ 33%|███▎      | 2263/6790 [1:18:23<2:43:00,  2.16s/it] 33%|███▎      | 2264/6790 [1:18:25<2:38:10,  2.10s/it]                                                       {'loss': 1.7457, 'learning_rate': 0.00030539914109565646, 'epoch': 0.33}
+ 33%|███▎      | 2264/6790 [1:18:25<2:38:10,  2.10s/it] 33%|███▎      | 2265/6790 [1:18:27<2:41:43,  2.14s/it]                                                       {'loss': 1.6806, 'learning_rate': 0.00030531931067618467, 'epoch': 0.33}
+ 33%|███▎      | 2265/6790 [1:18:27<2:41:43,  2.14s/it] 33%|███▎      | 2266/6790 [1:18:29<2:37:01,  2.08s/it]                                                       {'loss': 1.6636, 'learning_rate': 0.0003052394570317242, 'epoch': 0.33}
+ 33%|███▎      | 2266/6790 [1:18:29<2:37:01,  2.08s/it] 33%|███▎      | 2267/6790 [1:18:31<2:39:05,  2.11s/it]                                                       {'loss': 1.4719, 'learning_rate': 0.00030515958017988444, 'epoch': 0.33}
+ 33%|███▎      | 2267/6790 [1:18:31<2:39:05,  2.11s/it] 33%|███▎      | 2268/6790 [1:18:33<2:41:42,  2.15s/it]                                                       {'loss': 1.5299, 'learning_rate': 0.0003050796801382798, 'epoch': 0.33}
+ 33%|███▎      | 2268/6790 [1:18:33<2:41:42,  2.15s/it] 33%|███▎      | 2269/6790 [1:18:35<2:34:40,  2.05s/it]                                                       {'loss': 1.5115, 'learning_rate': 0.00030499975692452986, 'epoch': 0.33}
+ 33%|███▎      | 2269/6790 [1:18:35<2:34:40,  2.05s/it] 33%|███▎      | 2270/6790 [1:18:37<2:39:15,  2.11s/it]                                                       {'loss': 1.5331, 'learning_rate': 0.0003049198105562591, 'epoch': 0.33}
+ 33%|███▎      | 2270/6790 [1:18:37<2:39:15,  2.11s/it] 33%|███▎      | 2271/6790 [1:18:39<2:38:11,  2.10s/it]                                                       {'loss': 1.6145, 'learning_rate': 0.0003048398410510975, 'epoch': 0.33}
+ 33%|███▎      | 2271/6790 [1:18:39<2:38:11,  2.10s/it] 33%|███▎      | 2272/6790 [1:18:41<2:34:20,  2.05s/it]                                                       {'loss': 1.4509, 'learning_rate': 0.0003047598484266798, 'epoch': 0.33}
+ 33%|███▎      | 2272/6790 [1:18:41<2:34:20,  2.05s/it] 33%|███▎      | 2273/6790 [1:18:43<2:33:18,  2.04s/it]                                                       {'loss': 1.4959, 'learning_rate': 0.00030467983270064593, 'epoch': 0.33}
+ 33%|███▎      | 2273/6790 [1:18:43<2:33:18,  2.04s/it] 33%|███▎      | 2274/6790 [1:18:46<2:44:57,  2.19s/it]                                                       {'loss': 1.4253, 'learning_rate': 0.00030459979389064096, 'epoch': 0.33}
+ 33%|███▎      | 2274/6790 [1:18:46<2:44:57,  2.19s/it] 34%|███▎      | 2275/6790 [1:18:48<2:50:00,  2.26s/it]                                                       {'loss': 1.4822, 'learning_rate': 0.00030451973201431505, 'epoch': 0.34}
+ 34%|███▎      | 2275/6790 [1:18:48<2:50:00,  2.26s/it] 34%|███▎      | 2276/6790 [1:18:50<2:46:52,  2.22s/it]                                                       {'loss': 1.4122, 'learning_rate': 0.0003044396470893234, 'epoch': 0.34}
+ 34%|███▎      | 2276/6790 [1:18:50<2:46:52,  2.22s/it] 34%|███▎      | 2277/6790 [1:18:52<2:42:41,  2.16s/it]                                                       {'loss': 1.6513, 'learning_rate': 0.00030435953913332634, 'epoch': 0.34}
+ 34%|███▎      | 2277/6790 [1:18:52<2:42:41,  2.16s/it] 34%|███▎      | 2278/6790 [1:18:55<2:40:32,  2.13s/it]                                                       {'loss': 1.6873, 'learning_rate': 0.0003042794081639893, 'epoch': 0.34}
+ 34%|███▎      | 2278/6790 [1:18:55<2:40:32,  2.13s/it] 34%|███▎      | 2279/6790 [1:18:56<2:35:58,  2.07s/it]                                                       {'loss': 1.5009, 'learning_rate': 0.0003041992541989826, 'epoch': 0.34}
+ 34%|███▎      | 2279/6790 [1:18:56<2:35:58,  2.07s/it] 34%|███▎      | 2280/6790 [1:18:59<2:38:24,  2.11s/it]                                                       {'loss': 1.5664, 'learning_rate': 0.00030411907725598193, 'epoch': 0.34}
+ 34%|███▎      | 2280/6790 [1:18:59<2:38:24,  2.11s/it] 34%|███▎      | 2281/6790 [1:19:01<2:34:12,  2.05s/it]                                                       {'loss': 1.5517, 'learning_rate': 0.0003040388773526678, 'epoch': 0.34}
+ 34%|███▎      | 2281/6790 [1:19:01<2:34:12,  2.05s/it] 34%|███▎      | 2282/6790 [1:19:03<2:31:45,  2.02s/it]                                                       {'loss': 1.6624, 'learning_rate': 0.0003039586545067259, 'epoch': 0.34}
+ 34%|███▎      | 2282/6790 [1:19:03<2:31:45,  2.02s/it] 34%|███▎      | 2283/6790 [1:19:04<2:27:33,  1.96s/it]                                                       {'loss': 1.6086, 'learning_rate': 0.00030387840873584687, 'epoch': 0.34}
+ 34%|███▎      | 2283/6790 [1:19:04<2:27:33,  1.96s/it] 34%|███▎      | 2284/6790 [1:19:07<2:34:16,  2.05s/it]                                                       {'loss': 1.5562, 'learning_rate': 0.0003037981400577267, 'epoch': 0.34}
+ 34%|███▎      | 2284/6790 [1:19:07<2:34:16,  2.05s/it] 34%|███▎      | 2285/6790 [1:19:09<2:31:36,  2.02s/it]                                                       {'loss': 1.4437, 'learning_rate': 0.00030371784849006603, 'epoch': 0.34}
+ 34%|███▎      | 2285/6790 [1:19:09<2:31:36,  2.02s/it] 34%|███▎      | 2286/6790 [1:19:11<2:30:44,  2.01s/it]                                                       {'loss': 1.5218, 'learning_rate': 0.00030363753405057074, 'epoch': 0.34}
+ 34%|███▎      | 2286/6790 [1:19:11<2:30:44,  2.01s/it] 34%|███▎      | 2287/6790 [1:19:13<2:33:23,  2.04s/it]                                                       {'loss': 1.6605, 'learning_rate': 0.0003035571967569519, 'epoch': 0.34}
+ 34%|███▎      | 2287/6790 [1:19:13<2:33:23,  2.04s/it] 34%|███▎      | 2288/6790 [1:19:15<2:35:04,  2.07s/it]                                                       {'loss': 1.4013, 'learning_rate': 0.0003034768366269253, 'epoch': 0.34}
+ 34%|███▎      | 2288/6790 [1:19:15<2:35:04,  2.07s/it] 34%|███▎      | 2289/6790 [1:19:17<2:33:08,  2.04s/it]                                                       {'loss': 1.3849, 'learning_rate': 0.000303396453678212, 'epoch': 0.34}
+ 34%|███▎      | 2289/6790 [1:19:17<2:33:08,  2.04s/it] 34%|███▎      | 2290/6790 [1:19:19<2:37:20,  2.10s/it]                                                       {'loss': 1.4494, 'learning_rate': 0.00030331604792853807, 'epoch': 0.34}
+ 34%|███▎      | 2290/6790 [1:19:19<2:37:20,  2.10s/it] 34%|███▎      | 2291/6790 [1:19:21<2:35:06,  2.07s/it]                                                       {'loss': 1.6489, 'learning_rate': 0.00030323561939563456, 'epoch': 0.34}
+ 34%|███▎      | 2291/6790 [1:19:21<2:35:06,  2.07s/it] 34%|███▍      | 2292/6790 [1:19:23<2:35:13,  2.07s/it]                                                       {'loss': 1.4347, 'learning_rate': 0.0003031551680972375, 'epoch': 0.34}
+ 34%|███▍      | 2292/6790 [1:19:23<2:35:13,  2.07s/it] 34%|███▍      | 2293/6790 [1:19:25<2:32:16,  2.03s/it]                                                       {'loss': 1.4726, 'learning_rate': 0.000303074694051088, 'epoch': 0.34}
+ 34%|███▍      | 2293/6790 [1:19:25<2:32:16,  2.03s/it] 34%|███▍      | 2294/6790 [1:19:27<2:36:28,  2.09s/it]                                                       {'loss': 1.7304, 'learning_rate': 0.00030299419727493224, 'epoch': 0.34}
+ 34%|███▍      | 2294/6790 [1:19:27<2:36:28,  2.09s/it] 34%|███▍      | 2295/6790 [1:19:29<2:30:32,  2.01s/it]                                                       {'loss': 1.5444, 'learning_rate': 0.00030299419727493224, 'epoch': 0.34}
+ 34%|███▍      | 2295/6790 [1:19:29<2:30:32,  2.01s/it] 34%|███▍      | 2296/6790 [1:19:31<2:39:19,  2.13s/it]                                                       {'loss': 1.7775, 'learning_rate': 0.00030291367778652117, 'epoch': 0.34}
+ 34%|███▍      | 2296/6790 [1:19:31<2:39:19,  2.13s/it] 34%|███▍      | 2297/6790 [1:19:34<2:37:40,  2.11s/it]                                                       {'loss': 1.4137, 'learning_rate': 0.00030283313560361115, 'epoch': 0.34}
+ 34%|███▍      | 2297/6790 [1:19:34<2:37:40,  2.11s/it] 34%|███▍      | 2298/6790 [1:19:36<2:35:52,  2.08s/it]                                                       {'loss': 1.6202, 'learning_rate': 0.0003027525707439632, 'epoch': 0.34}
+ 34%|███▍      | 2298/6790 [1:19:36<2:35:52,  2.08s/it] 34%|███▍      | 2299/6790 [1:19:38<2:34:48,  2.07s/it]                                                       {'loss': 1.5534, 'learning_rate': 0.00030267198322534355, 'epoch': 0.34}
+ 34%|███▍      | 2299/6790 [1:19:38<2:34:48,  2.07s/it] 34%|███▍      | 2300/6790 [1:19:40<2:40:34,  2.15s/it]                                                       {'loss': 1.4859, 'learning_rate': 0.00030259137306552325, 'epoch': 0.34}
+ 34%|███▍      | 2300/6790 [1:19:40<2:40:34,  2.15s/it] 34%|███▍      | 2301/6790 [1:19:42<2:36:18,  2.09s/it]                                                       {'loss': 1.3892, 'learning_rate': 0.0003025107402822785, 'epoch': 0.34}
+ 34%|███▍      | 2301/6790 [1:19:42<2:36:18,  2.09s/it] 34%|███▍      | 2302/6790 [1:19:44<2:36:00,  2.09s/it]                                                       {'loss': 1.6247, 'learning_rate': 0.0003024300848933903, 'epoch': 0.34}
+ 34%|███▍      | 2302/6790 [1:19:44<2:36:00,  2.09s/it] 34%|███▍      | 2303/6790 [1:19:46<2:36:21,  2.09s/it]                                                       {'loss': 1.4017, 'learning_rate': 0.0003023494069166449, 'epoch': 0.34}
+ 34%|███▍      | 2303/6790 [1:19:46<2:36:21,  2.09s/it] 34%|███▍      | 2304/6790 [1:19:50<3:26:24,  2.76s/it]                                                       {'loss': 1.2723, 'learning_rate': 0.00030226870636983335, 'epoch': 0.34}
+ 34%|███▍      | 2304/6790 [1:19:50<3:26:24,  2.76s/it] 34%|███▍      | 2305/6790 [1:19:52<3:10:24,  2.55s/it]                                                       {'loss': 1.4788, 'learning_rate': 0.0003021879832707517, 'epoch': 0.34}
+ 34%|███▍      | 2305/6790 [1:19:52<3:10:24,  2.55s/it] 34%|███▍      | 2306/6790 [1:19:54<2:53:58,  2.33s/it]                                                       {'loss': 1.6187, 'learning_rate': 0.000302107237637201, 'epoch': 0.34}
+ 34%|███▍      | 2306/6790 [1:19:54<2:53:58,  2.33s/it] 34%|███▍      | 2307/6790 [1:19:56<2:51:30,  2.30s/it]                                                       {'loss': 1.5199, 'learning_rate': 0.0003020264694869872, 'epoch': 0.34}
+ 34%|███▍      | 2307/6790 [1:19:56<2:51:30,  2.30s/it] 34%|███▍      | 2308/6790 [1:19:58<2:41:38,  2.16s/it]                                                       {'loss': 1.447, 'learning_rate': 0.0003019456788379213, 'epoch': 0.34}
+ 34%|███▍      | 2308/6790 [1:19:58<2:41:38,  2.16s/it] 34%|███▍      | 2309/6790 [1:20:00<2:39:54,  2.14s/it]                                                       {'loss': 1.6042, 'learning_rate': 0.00030186486570781934, 'epoch': 0.34}
+ 34%|███▍      | 2309/6790 [1:20:00<2:39:54,  2.14s/it] 34%|█���█▍      | 2310/6790 [1:20:03<2:40:52,  2.15s/it]                                                       {'loss': 1.763, 'learning_rate': 0.000301784030114502, 'epoch': 0.34}
+ 34%|███▍      | 2310/6790 [1:20:03<2:40:52,  2.15s/it] 34%|███▍      | 2311/6790 [1:20:05<2:41:19,  2.16s/it]                                                       {'loss': 1.5367, 'learning_rate': 0.00030170317207579535, 'epoch': 0.34}
+ 34%|███▍      | 2311/6790 [1:20:05<2:41:19,  2.16s/it] 34%|███▍      | 2312/6790 [1:20:07<2:38:25,  2.12s/it]                                                       {'loss': 1.5148, 'learning_rate': 0.00030162229160953, 'epoch': 0.34}
+ 34%|███▍      | 2312/6790 [1:20:07<2:38:25,  2.12s/it] 34%|███▍      | 2313/6790 [1:20:09<2:37:41,  2.11s/it]                                                       {'loss': 1.6551, 'learning_rate': 0.0003015413887335419, 'epoch': 0.34}
+ 34%|███▍      | 2313/6790 [1:20:09<2:37:41,  2.11s/it] 34%|███▍      | 2314/6790 [1:20:11<2:42:43,  2.18s/it]                                                       {'loss': 1.479, 'learning_rate': 0.00030146046346567147, 'epoch': 0.34}
+ 34%|███▍      | 2314/6790 [1:20:11<2:42:43,  2.18s/it] 34%|███▍      | 2315/6790 [1:20:13<2:37:50,  2.12s/it]                                                       {'loss': 1.5289, 'learning_rate': 0.0003013795158237645, 'epoch': 0.34}
+ 34%|███▍      | 2315/6790 [1:20:13<2:37:50,  2.12s/it] 34%|███▍      | 2316/6790 [1:20:15<2:34:55,  2.08s/it]                                                       {'loss': 1.563, 'learning_rate': 0.0003012985458256715, 'epoch': 0.34}
+ 34%|███▍      | 2316/6790 [1:20:15<2:34:55,  2.08s/it] 34%|███▍      | 2317/6790 [1:20:17<2:39:35,  2.14s/it]                                                       {'loss': 1.5238, 'learning_rate': 0.000301217553489248, 'epoch': 0.34}
+ 34%|███▍      | 2317/6790 [1:20:17<2:39:35,  2.14s/it] 34%|███▍      | 2318/6790 [1:20:20<2:47:31,  2.25s/it]                                                       {'loss': 1.4766, 'learning_rate': 0.00030113653883235436, 'epoch': 0.34}
+ 34%|███▍      | 2318/6790 [1:20:20<2:47:31,  2.25s/it] 34%|███▍      | 2319/6790 [1:20:22<2:43:51,  2.20s/it]                                                       {'loss': 1.5415, 'learning_rate': 0.0003010555018728559, 'epoch': 0.34}
+ 34%|███▍      | 2319/6790 [1:20:22<2:43:51,  2.20s/it] 34%|███▍      | 2320/6790 [1:20:24<2:34:32,  2.07s/it]                                                       {'loss': 1.4943, 'learning_rate': 0.0003009744426286229, 'epoch': 0.34}
+ 34%|███▍      | 2320/6790 [1:20:24<2:34:32,  2.07s/it] 34%|███▍      | 2321/6790 [1:20:26<2:31:35,  2.04s/it]                                                       {'loss': 1.4161, 'learning_rate': 0.00030089336111753057, 'epoch': 0.34}
+ 34%|███▍      | 2321/6790 [1:20:26<2:31:35,  2.04s/it] 34%|███▍      | 2322/6790 [1:20:28<2:30:19,  2.02s/it]                                                       {'loss': 1.6246, 'learning_rate': 0.00030081225735745893, 'epoch': 0.34}
+ 34%|███▍      | 2322/6790 [1:20:28<2:30:19,  2.02s/it] 34%|███▍      | 2323/6790 [1:20:30<2:29:46,  2.01s/it]                                                       {'loss': 1.4892, 'learning_rate': 0.00030073113136629294, 'epoch': 0.34}
+ 34%|███▍      | 2323/6790 [1:20:30<2:29:46,  2.01s/it] 34%|███▍      | 2324/6790 [1:20:32<2:35:24,  2.09s/it]                                                       {'loss': 1.5485, 'learning_rate': 0.0003006499831619225, 'epoch': 0.34}
+ 34%|███▍      | 2324/6790 [1:20:32<2:35:24,  2.09s/it] 34%|███▍      | 2325/6790 [1:20:35<2:45:21,  2.22s/it]                                                       {'loss': 1.5049, 'learning_rate': 0.0003005688127622424, 'epoch': 0.34}
+ 34%|███▍      | 2325/6790 [1:20:35<2:45:21,  2.22s/it] 34%|███▍      | 2326/6790 [1:20:37<2:51:29,  2.30s/it]                                                       {'loss': 1.3711, 'learning_rate': 0.00030048762018515236, 'epoch': 0.34}
+ 34%|███▍      | 2326/6790 [1:20:37<2:51:29,  2.30s/it] 34%|███▍      | 2327/6790 [1:20:39<2:47:29,  2.25s/it]                                                       {'loss': 1.397, 'learning_rate': 0.00030040640544855686, 'epoch': 0.34}
+ 34%|███▍      | 2327/6790 [1:20:39<2:47:29,  2.25s/it] 34%|███▍      | 2328/6790 [1:20:41<2:37:17,  2.12s/it]                                                       {'loss': 1.5181, 'learning_rate': 0.00030032516857036545, 'epoch': 0.34}
+ 34%|███▍      | 2328/6790 [1:20:41<2:37:17,  2.12s/it] 34%|███▍      | 2329/6790 [1:20:45<3:13:36,  2.60s/it]                                                       {'loss': 1.7501, 'learning_rate': 0.0003002439095684924, 'epoch': 0.34}
+ 34%|███▍      | 2329/6790 [1:20:45<3:13:36,  2.60s/it] 34%|███▍      | 2330/6790 [1:20:47<3:09:29,  2.55s/it]                                                       {'loss': 1.5274, 'learning_rate': 0.00030016262846085695, 'epoch': 0.34}
+ 34%|███▍      | 2330/6790 [1:20:47<3:09:29,  2.55s/it] 34%|███▍      | 2331/6790 [1:20:49<2:56:27,  2.37s/it]                                                       {'loss': 1.6014, 'learning_rate': 0.0003000813252653832, 'epoch': 0.34}
+ 34%|███▍      | 2331/6790 [1:20:49<2:56:27,  2.37s/it] 34%|███▍      | 2332/6790 [1:20:52<3:12:36,  2.59s/it]                                                       {'loss': 1.5863, 'learning_rate': 0.00030000000000000003, 'epoch': 0.34}
+ 34%|███▍      | 2332/6790 [1:20:52<3:12:36,  2.59s/it] 34%|███▍      | 2333/6790 [1:20:54<3:03:08,  2.47s/it]                                                       {'loss': 1.4341, 'learning_rate': 0.00029991865268264137, 'epoch': 0.34}
+ 34%|███▍      | 2333/6790 [1:20:54<3:03:08,  2.47s/it] 34%|███▍      | 2334/6790 [1:20:56<2:54:46,  2.35s/it]                                                       {'loss': 1.486, 'learning_rate': 0.00029983728333124584, 'epoch': 0.34}
+ 34%|███▍      | 2334/6790 [1:20:56<2:54:46,  2.35s/it] 34%|███▍      | 2335/6790 [1:20:59<2:49:32,  2.28s/it]                                                       {'loss': 1.6085, 'learning_rate': 0.00029975589196375705, 'epoch': 0.34}
+ 34%|███▍      | 2335/6790 [1:20:59<2:49:32,  2.28s/it] 34%|███▍      | 2336/6790 [1:21:00<2:38:36,  2.14s/it]                                                       {'loss': 1.7431, 'learning_rate': 0.00029967447859812336, 'epoch': 0.34}
+ 34%|███▍      | 2336/6790 [1:21:00<2:38:36,  2.14s/it] 34%|███▍      | 2337/6790 [1:21:02<2:35:50,  2.10s/it]                                                       {'loss': 1.6025, 'learning_rate': 0.0002995930432522981, 'epoch': 0.34}
+ 34%|███▍      | 2337/6790 [1:21:02<2:35:50,  2.10s/it] 34%|███▍      | 2338/6790 [1:21:04<2:34:34,  2.08s/it]                                                       {'loss': 1.4088, 'learning_rate': 0.0002995115859442392, 'epoch': 0.34}
+ 34%|███▍      | 2338/6790 [1:21:04<2:34:34,  2.08s/it] 34%|███▍      | 2339/6790 [1:21:07<2:37:04,  2.12s/it]                                                       {'loss': 1.4305, 'learning_rate': 0.0002994301066919098, 'epoch': 0.34}
+ 34%|███▍      | 2339/6790 [1:21:07<2:37:04,  2.12s/it] 34%|███▍      | 2340/6790 [1:21:09<2:33:46,  2.07s/it]                                                       {'loss': 1.4672, 'learning_rate': 0.0002993486055132776, 'epoch': 0.34}
+ 34%|███▍      | 2340/6790 [1:21:09<2:33:46,  2.07s/it] 34%|███▍      | 2341/6790 [1:21:10<2:29:51,  2.02s/it]                                                       {'loss': 1.3983, 'learning_rate': 0.0002992670824263152, 'epoch': 0.34}
+ 34%|███▍      | 2341/6790 [1:21:11<2:29:51,  2.02s/it] 34%|███▍      | 2342/6790 [1:21:13<2:40:02,  2.16s/it]                                                       {'loss': 1.5942, 'learning_rate': 0.0002991855374490001, 'epoch': 0.34}
+ 34%|███▍      | 2342/6790 [1:21:13<2:40:02,  2.16s/it] 35%|███▍      | 2343/6790 [1:21:15<2:33:20,  2.07s/it]                                                       {'loss': 1.4921, 'learning_rate': 0.00029910397059931457, 'epoch': 0.35}
+ 35%|███▍      | 2343/6790 [1:21:15<2:33:20,  2.07s/it] 35%|███▍      | 2344/6790 [1:21:17<2:33:41,  2.07s/it]                                                       {'loss': 1.6773, 'learning_rate': 0.00029902238189524565, 'epoch': 0.35}
+ 35%|███▍      | 2344/6790 [1:21:17<2:33:41,  2.07s/it] 35%|███▍      | 2345/6790 [1:21:19<2:38:43,  2.14s/it]                                                       {'loss': 1.38, 'learning_rate': 0.0002989407713547853, 'epoch': 0.35}
+ 35%|███▍      | 2345/6790 [1:21:19<2:38:43,  2.14s/it] 35%|███▍      | 2346/6790 [1:21:21<2:41:27,  2.18s/it]                                                       {'loss': 1.5477, 'learning_rate': 0.0002988591389959303, 'epoch': 0.35}
+ 35%|███▍      | 2346/6790 [1:21:21<2:41:27,  2.18s/it] 35%|███▍      | 2347/6790 [1:21:24<2:37:54,  2.13s/it]                                                       {'loss': 1.4641, 'learning_rate': 0.00029877748483668216, 'epoch': 0.35}
+ 35%|███▍      | 2347/6790 [1:21:24<2:37:54,  2.13s/it] 35%|███▍      | 2348/6790 [1:21:26<2:41:17,  2.18s/it]                                                       {'loss': 1.6478, 'learning_rate': 0.00029869580889504727, 'epoch': 0.35}
+ 35%|███▍      | 2348/6790 [1:21:26<2:41:17,  2.18s/it] 35%|███▍      | 2349/6790 [1:21:28<2:37:33,  2.13s/it]                                                       {'loss': 1.473, 'learning_rate': 0.00029861411118903665, 'epoch': 0.35}
+ 35%|███▍      | 2349/6790 [1:21:28<2:37:33,  2.13s/it] 35%|███▍      | 2350/6790 [1:21:30<2:42:16,  2.19s/it]                                                       {'loss': 1.4006, 'learning_rate': 0.00029853239173666644, 'epoch': 0.35}
+ 35%|███▍      | 2350/6790 [1:21:30<2:42:16,  2.19s/it] 35%|███▍      | 2351/6790 [1:21:32<2:43:12,  2.21s/it]                                                       {'loss': 1.33, 'learning_rate': 0.00029845065055595727, 'epoch': 0.35}
+ 35%|███▍      | 2351/6790 [1:21:32<2:43:12,  2.21s/it] 35%|███▍      | 2352/6790 [1:21:35<2:49:34,  2.29s/it]                                                       {'loss': 1.5083, 'learning_rate': 0.00029836888766493475, 'epoch': 0.35}
+ 35%|███▍      | 2352/6790 [1:21:35<2:49:34,  2.29s/it] 35%|███▍      | 2353/6790 [1:21:37<2:40:58,  2.18s/it]                                                       {'loss': 1.4423, 'learning_rate': 0.00029828710308162917, 'epoch': 0.35}
+ 35%|███▍      | 2353/6790 [1:21:37<2:40:58,  2.18s/it] 35%|███▍      | 2354/6790 [1:21:39<2:38:21,  2.14s/it]                                                       {'loss': 1.47, 'learning_rate': 0.00029820529682407574, 'epoch': 0.35}
+ 35%|███▍      | 2354/6790 [1:21:39<2:38:21,  2.14s/it] 35%|███▍      | 2355/6790 [1:21:41<2:38:19,  2.14s/it]                                                       {'loss': 1.3443, 'learning_rate': 0.00029812346891031424, 'epoch': 0.35}
+ 35%|███▍      | 2355/6790 [1:21:41<2:38:19,  2.14s/it] 35%|███▍      | 2356/6790 [1:21:43<2:39:45,  2.16s/it]                                                       {'loss': 1.4673, 'learning_rate': 0.00029804161935838937, 'epoch': 0.35}
+ 35%|███▍      | 2356/6790 [1:21:43<2:39:45,  2.16s/it] 35%|███▍      | 2357/6790 [1:21:45<2:34:00,  2.08s/it]                                                       {'loss': 1.3311, 'learning_rate': 0.00029795974818635064, 'epoch': 0.35}
+ 35%|███▍      | 2357/6790 [1:21:45<2:34:00,  2.08s/it] 35%|███▍      | 2358/6790 [1:21:47<2:36:53,  2.12s/it]                                                       {'loss': 1.736, 'learning_rate': 0.00029787785541225215, 'epoch': 0.35}
+ 35%|███▍      | 2358/6790 [1:21:47<2:36:53,  2.12s/it] 35%|███▍      | 2359/6790 [1:21:49<2:32:31,  2.07s/it]                                                       {'loss': 1.5232, 'learning_rate': 0.000297795941054153, 'epoch': 0.35}
+ 35%|███▍      | 2359/6790 [1:21:49<2:32:31,  2.07s/it] 35%|███▍      | 2360/6790 [1:21:51<2:34:30,  2.09s/it]                                                       {'loss': 1.5319, 'learning_rate': 0.00029771400513011685, 'epoch': 0.35}
+ 35%|███▍      | 2360/6790 [1:21:51<2:34:30,  2.09s/it] 35%|███▍      | 2361/6790 [1:21:54<2:38:45,  2.15s/it]                                                       {'loss': 1.5825, 'learning_rate': 0.00029763204765821216, 'epoch': 0.35}
+ 35%|███▍      | 2361/6790 [1:21:54<2:38:45,  2.15s/it] 35%|███▍      | 2362/6790 [1:21:55<2:29:38,  2.03s/it]                                                       {'loss': 1.3937, 'learning_rate': 0.0002975500686565123, 'epoch': 0.35}
+ 35%|███▍      | 2362/6790 [1:21:55<2:29:38,  2.03s/it] 35%|███▍      | 2363/6790 [1:21:58<2:30:41,  2.04s/it]                                                       {'loss': 1.3847, 'learning_rate': 0.00029746806814309507, 'epoch': 0.35}
+ 35%|███▍      | 2363/6790 [1:21:58<2:30:41,  2.04s/it] 35%|███▍      | 2364/6790 [1:21:59<2:28:50,  2.02s/it]                                                       {'loss': 1.6024, 'learning_rate': 0.00029738604613604335, 'epoch': 0.35}
+ 35%|███▍      | 2364/6790 [1:21:59<2:28:50,  2.02s/it] 35%|███▍      | 2365/6790 [1:22:02<2:38:27,  2.15s/it]                                                       {'loss': 1.4688, 'learning_rate': 0.0002973040026534445, 'epoch': 0.35}
+ 35%|███▍      | 2365/6790 [1:22:02<2:38:27,  2.15s/it] 35%|███▍      | 2366/6790 [1:22:04<2:34:52,  2.10s/it]                                                       {'loss': 1.8117, 'learning_rate': 0.0002972219377133909, 'epoch': 0.35}
+ 35%|███▍      | 2366/6790 [1:22:04<2:34:52,  2.10s/it] 35%|███▍      | 2367/6790 [1:22:06<2:30:40,  2.04s/it]                                                       {'loss': 1.278, 'learning_rate': 0.0002971398513339793, 'epoch': 0.35}
+ 35%|███▍      | 2367/6790 [1:22:06<2:30:40,  2.04s/it] 35%|███▍      | 2368/6790 [1:22:08<2:26:31,  1.99s/it]                                                       {'loss': 1.3163, 'learning_rate': 0.00029705774353331157, 'epoch': 0.35}
+ 35%|███▍      | 2368/6790 [1:22:08<2:26:31,  1.99s/it] 35%|███▍      | 2369/6790 [1:22:10<2:27:47,  2.01s/it]                                                       {'loss': 1.3999, 'learning_rate': 0.00029697561432949385, 'epoch': 0.35}
+ 35%|███▍      | 2369/6790 [1:22:10<2:27:47,  2.01s/it] 35%|███▍      | 2370/6790 [1:22:12<2:33:43,  2.09s/it]                                                       {'loss': 1.5372, 'learning_rate': 0.0002968934637406375, 'epoch': 0.35}
+ 35%|███▍      | 2370/6790 [1:22:12<2:33:43,  2.09s/it] 35%|███▍      | 2371/6790 [1:22:14<2:37:07,  2.13s/it]                                                       {'loss': 1.4746, 'learning_rate': 0.0002968112917848581, 'epoch': 0.35}
+ 35%|███▍      | 2371/6790 [1:22:14<2:37:07,  2.13s/it] 35%|███▍      | 2372/6790 [1:22:16<2:32:14,  2.07s/it]                                                       {'loss': 1.7613, 'learning_rate': 0.0002967290984802765, 'epoch': 0.35}
+ 35%|███▍      | 2372/6790 [1:22:16<2:32:14,  2.07s/it] 35%|███▍      | 2373/6790 [1:22:18<2:28:36,  2.02s/it]                                                       {'loss': 1.5342, 'learning_rate': 0.0002966468838450177, 'epoch': 0.35}
+ 35%|███▍      | 2373/6790 [1:22:18<2:28:36,  2.02s/it] 35%|███▍      | 2374/6790 [1:22:20<2:30:36,  2.05s/it]                                                       {'loss': 1.5181, 'learning_rate': 0.00029656464789721166, 'epoch': 0.35}
+ 35%|███▍      | 2374/6790 [1:22:20<2:30:36,  2.05s/it] 35%|███▍      | 2375/6790 [1:22:22<2:28:27,  2.02s/it]                                                       {'loss': 1.4005, 'learning_rate': 0.00029648239065499315, 'epoch': 0.35}
+ 35%|███▍      | 2375/6790 [1:22:22<2:28:27,  2.02s/it] 35%|███▍      | 2376/6790 [1:22:24<2:32:06,  2.07s/it]                                                       {'loss': 1.4587, 'learning_rate': 0.00029640011213650147, 'epoch': 0.35}
+ 35%|███▍      | 2376/6790 [1:22:24<2:32:06,  2.07s/it] 35%|███▌      | 2377/6790 [1:22:26<2:29:12,  2.03s/it]                                                       {'loss': 1.6324, 'learning_rate': 0.0002963178123598807, 'epoch': 0.35}
+ 35%|███▌      | 2377/6790 [1:22:26<2:29:12,  2.03s/it] 35%|███▌      | 2378/6790 [1:22:28<2:23:44,  1.95s/it]                                                       {'loss': 1.3577, 'learning_rate': 0.00029623549134327943, 'epoch': 0.35}
+ 35%|███▌      | 2378/6790 [1:22:28<2:23:44,  1.95s/it] 35%|███▌      | 2379/6790 [1:22:30<2:25:08,  1.97s/it]                                                       {'loss': 1.5543, 'learning_rate': 0.0002961531491048512, 'epoch': 0.35}
+ 35%|███▌      | 2379/6790 [1:22:30<2:25:08,  1.97s/it] 35%|███▌      | 2380/6790 [1:22:32<2:25:33,  1.98s/it]                                                       {'loss': 1.5994, 'learning_rate': 0.00029607078566275404, 'epoch': 0.35}
+ 35%|███▌      | 2380/6790 [1:22:32<2:25:33,  1.98s/it] 35%|███▌      | 2381/6790 [1:22:34<2:23:32,  1.95s/it]                                                       {'loss': 1.4307, 'learning_rate': 0.00029598840103515074, 'epoch': 0.35}
+ 35%|███▌      | 2381/6790 [1:22:34<2:23:32,  1.95s/it] 35%|███▌      | 2382/6790 [1:22:36<2:28:17,  2.02s/it]                                                       {'loss': 1.5111, 'learning_rate': 0.0002959059952402088, 'epoch': 0.35}
+ 35%|███▌      | 2382/6790 [1:22:36<2:28:17,  2.02s/it] 35%|███▌      | 2383/6790 [1:22:38<2:31:22,  2.06s/it]                                                       {'loss': 1.5827, 'learning_rate': 0.00029582356829610014, 'epoch': 0.35}
+ 35%|███▌      | 2383/6790 [1:22:38<2:31:22,  2.06s/it] 35%|███▌      | 2384/6790 [1:22:40<2:30:57,  2.06s/it]                                                       {'loss': 1.7005, 'learning_rate': 0.00029574112022100175, 'epoch': 0.35}
+ 35%|███▌      | 2384/6790 [1:22:40<2:30:57,  2.06s/it] 35%|███▌      | 2385/6790 [1:22:42<2:30:20,  2.05s/it]                                                       {'loss': 1.4302, 'learning_rate': 0.0002956586510330949, 'epoch': 0.35}
+ 35%|███▌      | 2385/6790 [1:22:42<2:30:20,  2.05s/it] 35%|███▌      | 2386/6790 [1:22:44<2:30:37,  2.05s/it]                                                       {'loss': 1.6469, 'learning_rate': 0.0002955761607505657, 'epoch': 0.35}
+ 35%|███▌      | 2386/6790 [1:22:44<2:30:37,  2.05s/it] 35%|███▌      | 2387/6790 [1:22:47<2:36:16,  2.13s/it]                                                       {'loss': 1.4539, 'learning_rate': 0.00029549364939160497, 'epoch': 0.35}
+ 35%|███▌      | 2387/6790 [1:22:47<2:36:16,  2.13s/it] 35%|███▌      | 2388/6790 [1:22:49<2:34:07,  2.10s/it]                                                       {'loss': 1.3371, 'learning_rate': 0.00029541111697440806, 'epoch': 0.35}
+ 35%|███▌      | 2388/6790 [1:22:49<2:34:07,  2.10s/it] 35%|███▌      | 2389/6790 [1:22:51<2:31:55,  2.07s/it]                                                       {'loss': 1.4311, 'learning_rate': 0.00029532856351717496, 'epoch': 0.35}
+ 35%|███▌      | 2389/6790 [1:22:51<2:31:55,  2.07s/it] 35%|███▌      | 2390/6790 [1:22:53<2:31:58,  2.07s/it]                                                       {'loss': 1.6396, 'learning_rate': 0.00029524598903811033, 'epoch': 0.35}
+ 35%|███▌      | 2390/6790 [1:22:53<2:31:58,  2.07s/it] 35%|███▌      | 2391/6790 [1:22:55<2:30:15,  2.05s/it]                                                       {'loss': 1.4966, 'learning_rate': 0.0002951633935554236, 'epoch': 0.35}
+ 35%|███▌      | 2391/6790 [1:22:55<2:30:15,  2.05s/it] 35%|███▌      | 2392/6790 [1:22:57<2:24:09,  1.97s/it]                                                       {'loss': 1.6439, 'learning_rate': 0.0002950807770873285, 'epoch': 0.35}
+ 35%|███▌      | 2392/6790 [1:22:57<2:24:09,  1.97s/it] 35%|███▌      | 2393/6790 [1:22:59<2:26:08,  1.99s/it]                                                       {'loss': 1.8061, 'learning_rate': 0.0002949981396520438, 'epoch': 0.35}
+ 35%|███▌      | 2393/6790 [1:22:59<2:26:08,  1.99s/it] 35%|███▌      | 2394/6790 [1:23:01<2:27:05,  2.01s/it]                                                       {'loss': 1.7254, 'learning_rate': 0.0002949154812677925, 'epoch': 0.35}
+ 35%|███▌      | 2394/6790 [1:23:01<2:27:05,  2.01s/it] 35%|███▌      | 2395/6790 [1:23:03<2:26:53,  2.01s/it]                                                       {'loss': 1.4805, 'learning_rate': 0.0002948328019528026, 'epoch': 0.35}
+ 35%|███▌      | 2395/6790 [1:23:03<2:26:53,  2.01s/it] 35%|███▌      | 2396/6790 [1:23:05<2:25:31,  1.99s/it]                                                       {'loss': 1.42, 'learning_rate': 0.00029475010172530633, 'epoch': 0.35}
+ 35%|███▌      | 2396/6790 [1:23:05<2:25:31,  1.99s/it] 35%|███▌      | 2397/6790 [1:23:06<2:20:24,  1.92s/it]                                                       {'loss': 1.5008, 'learning_rate': 0.00029466738060354085, 'epoch': 0.35}
+ 35%|███▌      | 2397/6790 [1:23:06<2:20:24,  1.92s/it] 35%|███▌      | 2398/6790 [1:23:08<2:17:18,  1.88s/it]                                                       {'loss': 1.3824, 'learning_rate': 0.0002945846386057478, 'epoch': 0.35}
+ 35%|███▌      | 2398/6790 [1:23:08<2:17:18,  1.88s/it] 35%|███▌      | 2399/6790 [1:23:10<2:18:56,  1.90s/it]                                                       {'loss': 1.6322, 'learning_rate': 0.0002945018757501733, 'epoch': 0.35}
+ 35%|███▌      | 2399/6790 [1:23:10<2:18:56,  1.90s/it] 35%|███▌      | 2400/6790 [1:23:12<2:23:45,  1.96s/it]                                                       {'loss': 1.5017, 'learning_rate': 0.00029441909205506835, 'epoch': 0.35}
+ 35%|███▌      | 2400/6790 [1:23:12<2:23:45,  1.96s/it] 35%|███▌      | 2401/6790 [1:23:15<2:31:14,  2.07s/it]                                                       {'loss': 1.474, 'learning_rate': 0.00029433628753868836, 'epoch': 0.35}
+ 35%|███▌      | 2401/6790 [1:23:15<2:31:14,  2.07s/it] 35%|███▌      | 2402/6790 [1:23:16<2:26:42,  2.01s/it]                                                       {'loss': 1.3641, 'learning_rate': 0.0002942534622192933, 'epoch': 0.35}
+ 35%|███▌      | 2402/6790 [1:23:16<2:26:42,  2.01s/it] 35%|███▌      | 2403/6790 [1:23:18<2:24:07,  1.97s/it]                                                       {'loss': 1.5781, 'learning_rate': 0.00029417061611514773, 'epoch': 0.35}
+ 35%|███▌      | 2403/6790 [1:23:18<2:24:07,  1.97s/it] 35%|███▌      | 2404/6790 [1:23:20<2:24:17,  1.97s/it]                                                       {'loss': 1.3302, 'learning_rate': 0.00029408774924452103, 'epoch': 0.35}
+ 35%|███▌      | 2404/6790 [1:23:20<2:24:17,  1.97s/it] 35%|███▌      | 2405/6790 [1:23:22<2:23:11,  1.96s/it]                                                       {'loss': 1.59, 'learning_rate': 0.0002940048616256868, 'epoch': 0.35}
+ 35%|███▌      | 2405/6790 [1:23:22<2:23:11,  1.96s/it] 35%|███▌      | 2406/6790 [1:23:25<2:43:04,  2.23s/it]                                                       {'loss': 1.4428, 'learning_rate': 0.00029392195327692365, 'epoch': 0.35}
+ 35%|███▌      | 2406/6790 [1:23:25<2:43:04,  2.23s/it] 35%|███▌      | 2407/6790 [1:23:28<2:47:53,  2.30s/it]                                                       {'loss': 1.2823, 'learning_rate': 0.0002938390242165142, 'epoch': 0.35}
+ 35%|███▌      | 2407/6790 [1:23:28<2:47:53,  2.30s/it] 35%|███▌      | 2408/6790 [1:23:30<2:42:49,  2.23s/it]                                                       {'loss': 1.5121, 'learning_rate': 0.00029375607446274613, 'epoch': 0.35}
+ 35%|███▌      | 2408/6790 [1:23:30<2:42:49,  2.23s/it] 35%|███▌      | 2409/6790 [1:23:31<2:35:11,  2.13s/it]                                                       {'loss': 1.2688, 'learning_rate': 0.0002936731040339115, 'epoch': 0.35}
+ 35%|███▌      | 2409/6790 [1:23:31<2:35:11,  2.13s/it] 35%|███▌      | 2410/6790 [1:23:34<2:33:24,  2.10s/it]                                                       {'loss': 1.7354, 'learning_rate': 0.0002935901129483069, 'epoch': 0.35}
+ 35%|███▌      | 2410/6790 [1:23:34<2:33:24,  2.10s/it] 36%|███▌      | 2411/6790 [1:23:35<2:28:11,  2.03s/it]                                                       {'loss': 1.5494, 'learning_rate': 0.00029350710122423346, 'epoch': 0.36}
+ 36%|███▌      | 2411/6790 [1:23:35<2:28:11,  2.03s/it] 36%|███▌      | 2412/6790 [1:23:38<2:32:13,  2.09s/it]                                                       {'loss': 1.576, 'learning_rate': 0.0002934240688799969, 'epoch': 0.36}
+ 36%|███▌      | 2412/6790 [1:23:38<2:32:13,  2.09s/it] 36%|███▌      | 2413/6790 [1:23:39<2:23:11,  1.96s/it]                                                       {'loss': 1.1983, 'learning_rate': 0.0002933410159339076, 'epoch': 0.36}
+ 36%|███▌      | 2413/6790 [1:23:39<2:23:11,  1.96s/it] 36%|███▌      | 2414/6790 [1:23:41<2:24:53,  1.99s/it]                                                       {'loss': 1.3135, 'learning_rate': 0.0002932579424042803, 'epoch': 0.36}
+ 36%|███▌      | 2414/6790 [1:23:41<2:24:53,  1.99s/it] 36%|███▌      | 2415/6790 [1:23:43<2:28:58,  2.04s/it]                                                       {'loss': 1.4291, 'learning_rate': 0.0002931748483094343, 'epoch': 0.36}
+ 36%|███▌      | 2415/6790 [1:23:43<2:28:58,  2.04s/it] 36%|███▌      | 2416/6790 [1:23:46<2:30:27,  2.06s/it]                                                       {'loss': 1.5709, 'learning_rate': 0.00029309173366769364, 'epoch': 0.36}
+ 36%|███▌      | 2416/6790 [1:23:46<2:30:27,  2.06s/it] 36%|███▌      | 2417/6790 [1:23:48<2:36:04,  2.14s/it]                                                       {'loss': 1.7591, 'learning_rate': 0.0002930085984973866, 'epoch': 0.36}
+ 36%|███▌      | 2417/6790 [1:23:48<2:36:04,  2.14s/it] 36%|███▌      | 2418/6790 [1:23:50<2:32:57,  2.10s/it]                                                       {'loss': 1.5974, 'learning_rate': 0.00029292544281684627, 'epoch': 0.36}
+ 36%|███▌      | 2418/6790 [1:23:50<2:32:57,  2.10s/it] 36%|███▌      | 2419/6790 [1:23:52<2:30:47,  2.07s/it]                                                       {'loss': 1.4479, 'learning_rate': 0.0002928422666444099, 'epoch': 0.36}
+ 36%|███▌      | 2419/6790 [1:23:52<2:30:47,  2.07s/it] 36%|███▌      | 2420/6790 [1:23:54<2:31:06,  2.07s/it]                                                       {'loss': 1.5737, 'learning_rate': 0.0002927590699984196, 'epoch': 0.36}
+ 36%|███▌      | 2420/6790 [1:23:54<2:31:06,  2.07s/it] 36%|███▌      | 2421/6790 [1:23:56<2:34:44,  2.13s/it]                                                       {'loss': 1.3459, 'learning_rate': 0.0002926758528972219, 'epoch': 0.36}
+ 36%|███▌      | 2421/6790 [1:23:56<2:34:44,  2.13s/it] 36%|███▌      | 2422/6790 [1:23:59<2:44:19,  2.26s/it]                                                       {'loss': 1.508, 'learning_rate': 0.0002925926153591679, 'epoch': 0.36}
+ 36%|███▌      | 2422/6790 [1:23:59<2:44:19,  2.26s/it] 36%|███▌      | 2423/6790 [1:24:01<2:36:09,  2.15s/it]                                                       {'loss': 1.4463, 'learning_rate': 0.00029250935740261297, 'epoch': 0.36}
+ 36%|███▌      | 2423/6790 [1:24:01<2:36:09,  2.15s/it] 36%|███▌      | 2424/6790 [1:24:02<2:25:59,  2.01s/it]                                                       {'loss': 1.5676, 'learning_rate': 0.00029242607904591715, 'epoch': 0.36}
+ 36%|███▌      | 2424/6790 [1:24:02<2:25:59,  2.01s/it] 36%|███▌      | 2425/6790 [1:24:05<2:48:15,  2.31s/it]                                                       {'loss': 1.4873, 'learning_rate': 0.00029234278030744503, 'epoch': 0.36}
+ 36%|███▌      | 2425/6790 [1:24:05<2:48:15,  2.31s/it] 36%|███▌      | 2426/6790 [1:24:07<2:38:14,  2.18s/it]                                                       {'loss': 1.4342, 'learning_rate': 0.00029225946120556555, 'epoch': 0.36}
+ 36%|███▌      | 2426/6790 [1:24:07<2:38:14,  2.18s/it] 36%|███▌      | 2427/6790 [1:24:09<2:32:34,  2.10s/it]                                                       {'loss': 1.5243, 'learning_rate': 0.00029217612175865237, 'epoch': 0.36}
+ 36%|███▌      | 2427/6790 [1:24:09<2:32:34,  2.10s/it] 36%|███▌      | 2428/6790 [1:24:11<2:30:17,  2.07s/it]                                                       {'loss': 1.6278, 'learning_rate': 0.0002920927619850833, 'epoch': 0.36}
+ 36%|███▌      | 2428/6790 [1:24:11<2:30:17,  2.07s/it] 36%|███▌      | 2429/6790 [1:24:13<2:30:35,  2.07s/it]                                                       {'loss': 1.3729, 'learning_rate': 0.0002920093819032409, 'epoch': 0.36}
+ 36%|███▌      | 2429/6790 [1:24:13<2:30:35,  2.07s/it] 36%|███▌      | 2430/6790 [1:24:15<2:23:44,  1.98s/it]                                                       {'loss': 1.3402, 'learning_rate': 0.00029192598153151205, 'epoch': 0.36}
+ 36%|███▌      | 2430/6790 [1:24:15<2:23:44,  1.98s/it] 36%|███▌      | 2431/6790 [1:24:18<2:55:20,  2.41s/it]                                                       {'loss': 1.3156, 'learning_rate': 0.00029184256088828834, 'epoch': 0.36}
+ 36%|███▌      | 2431/6790 [1:24:18<2:55:20,  2.41s/it] 36%|███▌      | 2432/6790 [1:24:20<2:44:29,  2.26s/it]                                                       {'loss': 1.3156, 'learning_rate': 0.0002917591199919656, 'epoch': 0.36}
+ 36%|███▌      | 2432/6790 [1:24:20<2:44:29,  2.26s/it] 36%|███▌      | 2433/6790 [1:24:22<2:32:59,  2.11s/it]                                                       {'loss': 1.4898, 'learning_rate': 0.0002916756588609441, 'epoch': 0.36}
+ 36%|███▌      | 2433/6790 [1:24:22<2:32:59,  2.11s/it] 36%|███▌      | 2434/6790 [1:24:24<2:32:27,  2.10s/it]                                                       {'loss': 1.5613, 'learning_rate': 0.00029159217751362877, 'epoch': 0.36}
+ 36%|███▌      | 2434/6790 [1:24:24<2:32:27,  2.10s/it] 36%|███▌      | 2435/6790 [1:24:26<2:34:41,  2.13s/it]                                                       {'loss': 1.2421, 'learning_rate': 0.00029150867596842886, 'epoch': 0.36}
+ 36%|███▌      | 2435/6790 [1:24:26<2:34:41,  2.13s/it] 36%|███▌      | 2436/6790 [1:24:28<2:31:45,  2.09s/it]                                                       {'loss': 1.6308, 'learning_rate': 0.0002914251542437581, 'epoch': 0.36}
+ 36%|███▌      | 2436/6790 [1:24:28<2:31:45,  2.09s/it] 36%|███▌      | 2437/6790 [1:24:30<2:23:46,  1.98s/it]                                                       {'loss': 1.3829, 'learning_rate': 0.0002913416123580347, 'epoch': 0.36}
+ 36%|███▌      | 2437/6790 [1:24:30<2:23:46,  1.98s/it] 36%|███▌      | 2438/6790 [1:24:32<2:31:18,  2.09s/it]                                                       {'loss': 1.3955, 'learning_rate': 0.00029125805032968136, 'epoch': 0.36}
+ 36%|███▌      | 2438/6790 [1:24:32<2:31:18,  2.09s/it] 36%|███▌      | 2439/6790 [1:24:34<2:28:23,  2.05s/it]                                                       {'loss': 1.7338, 'learning_rate': 0.000291174468177125, 'epoch': 0.36}
+ 36%|███▌      | 2439/6790 [1:24:34<2:28:23,  2.05s/it] 36%|███▌      | 2440/6790 [1:24:37<2:35:27,  2.14s/it]                                                       {'loss': 1.5109, 'learning_rate': 0.00029109086591879726, 'epoch': 0.36}
+ 36%|███▌      | 2440/6790 [1:24:37<2:35:27,  2.14s/it] 36%|███▌      | 2441/6790 [1:24:39<2:34:57,  2.14s/it]                                                       {'loss': 1.3852, 'learning_rate': 0.0002910072435731341, 'epoch': 0.36}
+ 36%|███▌      | 2441/6790 [1:24:39<2:34:57,  2.14s/it] 36%|███▌      | 2442/6790 [1:24:41<2:40:25,  2.21s/it]                                                       {'loss': 1.7356, 'learning_rate': 0.00029092360115857583, 'epoch': 0.36}
+ 36%|███▌      | 2442/6790 [1:24:41<2:40:25,  2.21s/it] 36%|███▌      | 2443/6790 [1:24:44<2:43:44,  2.26s/it]                                                       {'loss': 1.5349, 'learning_rate': 0.0002908399386935673, 'epoch': 0.36}
+ 36%|███▌      | 2443/6790 [1:24:44<2:43:44,  2.26s/it] 36%|███▌      | 2444/6790 [1:24:46<2:43:59,  2.26s/it]                                                       {'loss': 1.5205, 'learning_rate': 0.0002907562561965577, 'epoch': 0.36}
+ 36%|███▌      | 2444/6790 [1:24:46<2:43:59,  2.26s/it] 36%|███▌      | 2445/6790 [1:24:48<2:34:05,  2.13s/it]                                                       {'loss': 1.5954, 'learning_rate': 0.0002906725536860007, 'epoch': 0.36}
+ 36%|███▌      | 2445/6790 [1:24:48<2:34:05,  2.13s/it] 36%|███▌      | 2446/6790 [1:24:50<2:36:15,  2.16s/it]                                                       {'loss': 1.3615, 'learning_rate': 0.00029058883118035435, 'epoch': 0.36}
+ 36%|███▌      | 2446/6790 [1:24:50<2:36:15,  2.16s/it] 36%|███▌      | 2447/6790 [1:24:52<2:42:27,  2.24s/it]                                                       {'loss': 1.5078, 'learning_rate': 0.0002905050886980811, 'epoch': 0.36}
+ 36%|███▌      | 2447/6790 [1:24:52<2:42:27,  2.24s/it] 36%|███▌      | 2448/6790 [1:24:54<2:36:24,  2.16s/it]                                                       {'loss': 1.6185, 'learning_rate': 0.00029042132625764787, 'epoch': 0.36}
+ 36%|���██▌      | 2448/6790 [1:24:54<2:36:24,  2.16s/it] 36%|███▌      | 2449/6790 [1:24:58<3:05:54,  2.57s/it]                                                       {'loss': 1.7026, 'learning_rate': 0.00029033754387752586, 'epoch': 0.36}
+ 36%|███▌      | 2449/6790 [1:24:58<3:05:54,  2.57s/it] 36%|███▌      | 2450/6790 [1:25:00<3:00:40,  2.50s/it]                                                       {'loss': 1.7131, 'learning_rate': 0.00029025374157619084, 'epoch': 0.36}
+ 36%|███▌      | 2450/6790 [1:25:00<3:00:40,  2.50s/it] 36%|███▌      | 2451/6790 [1:25:02<2:48:09,  2.33s/it]                                                       {'loss': 1.4399, 'learning_rate': 0.00029016991937212276, 'epoch': 0.36}
+ 36%|███▌      | 2451/6790 [1:25:02<2:48:09,  2.33s/it] 36%|███▌      | 2452/6790 [1:25:04<2:46:20,  2.30s/it]                                                       {'loss': 1.54, 'learning_rate': 0.00029008607728380615, 'epoch': 0.36}
+ 36%|███▌      | 2452/6790 [1:25:04<2:46:20,  2.30s/it] 36%|███▌      | 2453/6790 [1:25:07<2:45:47,  2.29s/it]                                                       {'loss': 1.5439, 'learning_rate': 0.0002900022153297298, 'epoch': 0.36}
+ 36%|███▌      | 2453/6790 [1:25:07<2:45:47,  2.29s/it] 36%|███▌      | 2454/6790 [1:25:08<2:35:13,  2.15s/it]                                                       {'loss': 1.4294, 'learning_rate': 0.00028991833352838694, 'epoch': 0.36}
+ 36%|███▌      | 2454/6790 [1:25:09<2:35:13,  2.15s/it] 36%|███▌      | 2455/6790 [1:25:10<2:29:19,  2.07s/it]                                                       {'loss': 1.441, 'learning_rate': 0.0002898344318982752, 'epoch': 0.36}
+ 36%|███▌      | 2455/6790 [1:25:10<2:29:19,  2.07s/it] 36%|███▌      | 2456/6790 [1:25:13<2:31:47,  2.10s/it]                                                       {'loss': 1.4576, 'learning_rate': 0.0002897505104578965, 'epoch': 0.36}
+ 36%|███▌      | 2456/6790 [1:25:13<2:31:47,  2.10s/it] 36%|███▌      | 2457/6790 [1:25:15<2:37:31,  2.18s/it]                                                       {'loss': 1.5748, 'learning_rate': 0.00028966656922575724, 'epoch': 0.36}
+ 36%|███▌      | 2457/6790 [1:25:15<2:37:31,  2.18s/it] 36%|███▌      | 2458/6790 [1:25:17<2:28:49,  2.06s/it]                                                       {'loss': 1.5387, 'learning_rate': 0.00028958260822036804, 'epoch': 0.36}
+ 36%|███▌      | 2458/6790 [1:25:17<2:28:49,  2.06s/it] 36%|███▌      | 2459/6790 [1:25:19<2:28:21,  2.06s/it]                                                       {'loss': 1.1022, 'learning_rate': 0.00028949862746024404, 'epoch': 0.36}
+ 36%|███▌      | 2459/6790 [1:25:19<2:28:21,  2.06s/it] 36%|███▌      | 2460/6790 [1:25:21<2:24:08,  2.00s/it]                                                       {'loss': 1.3808, 'learning_rate': 0.00028941462696390456, 'epoch': 0.36}
+ 36%|███▌      | 2460/6790 [1:25:21<2:24:08,  2.00s/it] 36%|███▌      | 2461/6790 [1:25:23<2:33:37,  2.13s/it]                                                       {'loss': 1.5776, 'learning_rate': 0.00028933060674987346, 'epoch': 0.36}
+ 36%|███▌      | 2461/6790 [1:25:23<2:33:37,  2.13s/it] 36%|███▋      | 2462/6790 [1:25:25<2:30:57,  2.09s/it]                                                       {'loss': 1.5113, 'learning_rate': 0.0002892465668366788, 'epoch': 0.36}
+ 36%|███▋      | 2462/6790 [1:25:25<2:30:57,  2.09s/it] 36%|███▋      | 2463/6790 [1:25:27<2:24:59,  2.01s/it]                                                       {'loss': 1.1891, 'learning_rate': 0.000289162507242853, 'epoch': 0.36}
+ 36%|███▋      | 2463/6790 [1:25:27<2:24:59,  2.01s/it] 36%|███▋      | 2464/6790 [1:25:29<2:30:01,  2.08s/it]                                                       {'loss': 1.6181, 'learning_rate': 0.00028907842798693307, 'epoch': 0.36}
+ 36%|███▋      | 2464/6790 [1:25:29<2:30:01,  2.08s/it] 36%|███▋      | 2465/6790 [1:25:31<2:29:38,  2.08s/it]                                                       {'loss': 1.4799, 'learning_rate': 0.0002889943290874599, 'epoch': 0.36}
+ 36%|███▋      | 2465/6790 [1:25:31<2:29:38,  2.08s/it] 36%|███▋      | 2466/6790 [1:25:33<2:26:24,  2.03s/it]                                                       {'loss': 1.4167, 'learning_rate': 0.0002889102105629791, 'epoch': 0.36}
+ 36%|███▋      | 2466/6790 [1:25:33<2:26:24,  2.03s/it] 36%|███▋      | 2467/6790 [1:25:35<2:28:33,  2.06s/it]                                                       {'loss': 1.3898, 'learning_rate': 0.00028882607243204035, 'epoch': 0.36}
+ 36%|███▋      | 2467/6790 [1:25:35<2:28:33,  2.06s/it] 36%|███▋      | 2468/6790 [1:25:37<2:29:28,  2.08s/it]                                                       {'loss': 1.6703, 'learning_rate': 0.0002887419147131979, 'epoch': 0.36}
+ 36%|███▋      | 2468/6790 [1:25:37<2:29:28,  2.08s/it] 36%|███▋      | 2469/6790 [1:25:39<2:28:37,  2.06s/it]                                                       {'loss': 1.6146, 'learning_rate': 0.0002886577374250101, 'epoch': 0.36}
+ 36%|███▋      | 2469/6790 [1:25:39<2:28:37,  2.06s/it] 36%|███▋      | 2470/6790 [1:25:42<2:30:10,  2.09s/it]                                                       {'loss': 1.7205, 'learning_rate': 0.0002885735405860398, 'epoch': 0.36}
+ 36%|███▋      | 2470/6790 [1:25:42<2:30:10,  2.09s/it] 36%|███▋      | 2471/6790 [1:25:44<2:28:52,  2.07s/it]                                                       {'loss': 1.5312, 'learning_rate': 0.000288489324214854, 'epoch': 0.36}
+ 36%|███▋      | 2471/6790 [1:25:44<2:28:52,  2.07s/it] 36%|███▋      | 2472/6790 [1:25:45<2:24:15,  2.00s/it]                                                       {'loss': 1.6053, 'learning_rate': 0.00028840508833002395, 'epoch': 0.36}
+ 36%|███▋      | 2472/6790 [1:25:45<2:24:15,  2.00s/it] 36%|███▋      | 2473/6790 [1:25:47<2:21:54,  1.97s/it]                                                       {'loss': 1.5126, 'learning_rate': 0.0002883208329501256, 'epoch': 0.36}
+ 36%|███▋      | 2473/6790 [1:25:47<2:21:54,  1.97s/it] 36%|███▋      | 2474/6790 [1:25:49<2:21:15,  1.96s/it]                                                       {'loss': 1.6649, 'learning_rate': 0.00028823655809373874, 'epoch': 0.36}
+ 36%|███▋      | 2474/6790 [1:25:49<2:21:15,  1.96s/it] 36%|███▋      | 2475/6790 [1:25:51<2:16:55,  1.90s/it]                                                       {'loss': 1.6248, 'learning_rate': 0.0002881522637794477, 'epoch': 0.36}
+ 36%|███▋      | 2475/6790 [1:25:51<2:16:55,  1.90s/it] 36%|███▋      | 2476/6790 [1:25:53<2:18:40,  1.93s/it]                                                       {'loss': 1.4772, 'learning_rate': 0.00028806795002584096, 'epoch': 0.36}
+ 36%|███▋      | 2476/6790 [1:25:53<2:18:40,  1.93s/it] 36%|███▋      | 2477/6790 [1:25:55<2:22:09,  1.98s/it]                                                       {'loss': 1.6692, 'learning_rate': 0.0002879836168515115, 'epoch': 0.36}
+ 36%|███▋      | 2477/6790 [1:25:55<2:22:09,  1.98s/it] 36%|███▋      | 2478/6790 [1:25:57<2:22:25,  1.98s/it]                                                       {'loss': 1.5597, 'learning_rate': 0.0002878992642750563, 'epoch': 0.36}
+ 36%|███▋      | 2478/6790 [1:25:57<2:22:25,  1.98s/it] 37%|███▋      | 2479/6790 [1:25:59<2:28:20,  2.06s/it]                                                       {'loss': 1.5621, 'learning_rate': 0.0002878148923150769, 'epoch': 0.37}
+ 37%|███▋      | 2479/6790 [1:25:59<2:28:20,  2.06s/it] 37%|███▋      | 2480/6790 [1:26:01<2:25:47,  2.03s/it]                                                       {'loss': 1.6634, 'learning_rate': 0.000287730500990179, 'epoch': 0.37}
+ 37%|███▋      | 2480/6790 [1:26:01<2:25:47,  2.03s/it] 37%|███▋      | 2481/6790 [1:26:03<2:21:44,  1.97s/it]                                                       {'loss': 1.3623, 'learning_rate': 0.00028764609031897237, 'epoch': 0.37}
+ 37%|███▋      | 2481/6790 [1:26:03<2:21:44,  1.97s/it] 37%|███▋      | 2482/6790 [1:26:05<2:18:32,  1.93s/it]                                                       {'loss': 1.4824, 'learning_rate': 0.00028756166032007144, 'epoch': 0.37}
+ 37%|███▋      | 2482/6790 [1:26:05<2:18:32,  1.93s/it] 37%|███▋      | 2483/6790 [1:26:07<2:17:19,  1.91s/it]                                                       {'loss': 1.472, 'learning_rate': 0.0002874772110120946, 'epoch': 0.37}
+ 37%|███▋      | 2483/6790 [1:26:07<2:17:19,  1.91s/it] 37%|███▋      | 2484/6790 [1:26:09<2:15:38,  1.89s/it]                                                       {'loss': 1.6516, 'learning_rate': 0.00028739274241366454, 'epoch': 0.37}
+ 37%|███▋      | 2484/6790 [1:26:09<2:15:38,  1.89s/it] 37%|███▋      | 2485/6790 [1:26:11<2:33:28,  2.14s/it]                                                       {'loss': 1.2968, 'learning_rate': 0.00028730825454340833, 'epoch': 0.37}
+ 37%|███▋      | 2485/6790 [1:26:11<2:33:28,  2.14s/it] 37%|███▋      | 2486/6790 [1:26:14<2:39:41,  2.23s/it]                                                       {'loss': 1.388, 'learning_rate': 0.0002872237474199572, 'epoch': 0.37}
+ 37%|███▋      | 2486/6790 [1:26:14<2:39:41,  2.23s/it] 37%|███▋      | 2487/6790 [1:26:16<2:35:43,  2.17s/it]                                                       {'loss': 1.4824, 'learning_rate': 0.00028713922106194664, 'epoch': 0.37}
+ 37%|███▋      | 2487/6790 [1:26:16<2:35:43,  2.17s/it] 37%|███▋      | 2488/6790 [1:26:18<2:32:40,  2.13s/it]                                                       {'loss': 1.5735, 'learning_rate': 0.0002870546754880164, 'epoch': 0.37}
+ 37%|███▋      | 2488/6790 [1:26:18<2:32:40,  2.13s/it] 37%|███▋      | 2489/6790 [1:26:20<2:27:35,  2.06s/it]                                                       {'loss': 1.488, 'learning_rate': 0.00028697011071681034, 'epoch': 0.37}
+ 37%|███▋      | 2489/6790 [1:26:20<2:27:35,  2.06s/it] 37%|███▋      | 2490/6790 [1:26:22<2:24:20,  2.01s/it]                                                       {'loss': 1.5172, 'learning_rate': 0.00028688552676697684, 'epoch': 0.37}
+ 37%|███▋      | 2490/6790 [1:26:22<2:24:20,  2.01s/it] 37%|███▋      | 2491/6790 [1:26:24<2:29:25,  2.09s/it]                                                       {'loss': 1.4412, 'learning_rate': 0.0002868009236571682, 'epoch': 0.37}
+ 37%|███▋      | 2491/6790 [1:26:24<2:29:25,  2.09s/it] 37%|███▋      | 2492/6790 [1:26:26<2:30:19,  2.10s/it]                                                       {'loss': 1.6386, 'learning_rate': 0.0002867163014060411, 'epoch': 0.37}
+ 37%|███▋      | 2492/6790 [1:26:26<2:30:19,  2.10s/it] 37%|███▋      | 2493/6790 [1:26:28<2:22:06,  1.98s/it]                                                       {'loss': 1.484, 'learning_rate': 0.00028663166003225647, 'epoch': 0.37}
+ 37%|███▋      | 2493/6790 [1:26:28<2:22:06,  1.98s/it] 37%|███▋      | 2494/6790 [1:26:30<2:26:01,  2.04s/it]                                                       {'loss': 1.4138, 'learning_rate': 0.0002865469995544793, 'epoch': 0.37}
+ 37%|███▋      | 2494/6790 [1:26:30<2:26:01,  2.04s/it] 37%|███▋      | 2495/6790 [1:26:32<2:24:04,  2.01s/it]                                                       {'loss': 1.6241, 'learning_rate': 0.00028646231999137907, 'epoch': 0.37}
+ 37%|███▋      | 2495/6790 [1:26:32<2:24:04,  2.01s/it] 37%|███▋      | 2496/6790 [1:26:34<2:23:53,  2.01s/it]                                                       {'loss': 1.7344, 'learning_rate': 0.00028637762136162913, 'epoch': 0.37}
+ 37%|███▋      | 2496/6790 [1:26:34<2:23:53,  2.01s/it] 37%|███▋      | 2497/6790 [1:26:36<2:27:39,  2.06s/it]                                                       {'loss': 1.6023, 'learning_rate': 0.0002862929036839073, 'epoch': 0.37}
+ 37%|███▋      | 2497/6790 [1:26:36<2:27:39,  2.06s/it] 37%|███▋      | 2498/6790 [1:26:38<2:22:10,  1.99s/it]                                                       {'loss': 1.505, 'learning_rate': 0.0002862081669768954, 'epoch': 0.37}
+ 37%|███▋      | 2498/6790 [1:26:38<2:22:10,  1.99s/it] 37%|███▋      | 2499/6790 [1:26:40<2:31:40,  2.12s/it]                                                       {'loss': 1.564, 'learning_rate': 0.00028612341125927967, 'epoch': 0.37}
+ 37%|███▋      | 2499/6790 [1:26:40<2:31:40,  2.12s/it] 37%|███▋      | 2500/6790 [1:26:42<2:25:54,  2.04s/it]                                                       {'loss': 1.6483, 'learning_rate': 0.00028603863654975037, 'epoch': 0.37}
+ 37%|███▋      | 2500/6790 [1:26:42<2:25:54,  2.04s/it] 37%|███▋      | 2501/6790 [1:26:44<2:29:42,  2.09s/it]                                                       {'loss': 1.4305, 'learning_rate': 0.0002859538428670019, 'epoch': 0.37}
+ 37%|███▋      | 2501/6790 [1:26:44<2:29:42,  2.09s/it] 37%|███▋      | 2502/6790 [1:26:46<2:24:05,  2.02s/it]                                                       {'loss': 1.3188, 'learning_rate': 0.00028586903022973317, 'epoch': 0.37}
+ 37%|███▋      | 2502/6790 [1:26:46<2:24:05,  2.02s/it] 37%|███▋      | 2503/6790 [1:26:49<2:36:52,  2.20s/it]                                                       {'loss': 1.6356, 'learning_rate': 0.0002857841986566468, 'epoch': 0.37}
+ 37%|███▋      | 2503/6790 [1:26:49<2:36:52,  2.20s/it] 37%|███▋      | 2504/6790 [1:26:51<2:34:26,  2.16s/it]                                                       {'loss': 1.5847, 'learning_rate': 0.00028569934816645003, 'epoch': 0.37}
+ 37%|███▋      | 2504/6790 [1:26:51<2:34:26,  2.16s/it] 37%|███▋      | 2505/6790 [1:26:53<2:34:58,  2.17s/it]                                                       {'loss': 1.7294, 'learning_rate': 0.0002856144787778539, 'epoch': 0.37}
+ 37%|███▋      | 2505/6790 [1:26:53<2:34:58,  2.17s/it] 37%|███▋      | 2506/6790 [1:26:55<2:31:36,  2.12s/it]                                                       {'loss': 1.3651, 'learning_rate': 0.0002855295905095738, 'epoch': 0.37}
+ 37%|███▋      | 2506/6790 [1:26:55<2:31:36,  2.12s/it] 37%|███▋      | 2507/6790 [1:26:57<2:30:45,  2.11s/it]                                                       {'loss': 1.5273, 'learning_rate': 0.00028544468338032947, 'epoch': 0.37}
+ 37%|███▋      | 2507/6790 [1:26:57<2:30:45,  2.11s/it] 37%|███▋      | 2508/6790 [1:26:59<2:27:08,  2.06s/it]                                                       {'loss': 1.4477, 'learning_rate': 0.0002853597574088444, 'epoch': 0.37}
+ 37%|███▋      | 2508/6790 [1:26:59<2:27:08,  2.06s/it] 37%|███▋      | 2509/6790 [1:27:02<2:38:22,  2.22s/it]                                                       {'loss': 1.6621, 'learning_rate': 0.00028527481261384657, 'epoch': 0.37}
+ 37%|███▋      | 2509/6790 [1:27:02<2:38:22,  2.22s/it] 37%|███▋      | 2510/6790 [1:27:04<2:40:47,  2.25s/it]                                                       {'loss': 1.5498, 'learning_rate': 0.00028518984901406785, 'epoch': 0.37}
+ 37%|███▋      | 2510/6790 [1:27:04<2:40:47,  2.25s/it] 37%|███▋      | 2511/6790 [1:27:06<2:33:46,  2.16s/it]                                                       {'loss': 1.5196, 'learning_rate': 0.0002851048666282446, 'epoch': 0.37}
+ 37%|███▋      | 2511/6790 [1:27:06<2:33:46,  2.16s/it] 37%|███▋      | 2512/6790 [1:27:08<2:33:55,  2.16s/it]                                                       {'loss': 1.6687, 'learning_rate': 0.0002850198654751169, 'epoch': 0.37}
+ 37%|███▋      | 2512/6790 [1:27:08<2:33:55,  2.16s/it] 37%|███▋      | 2513/6790 [1:27:10<2:35:07,  2.18s/it]                                                       {'loss': 1.3898, 'learning_rate': 0.00028493484557342923, 'epoch': 0.37}
+ 37%|███▋      | 2513/6790 [1:27:10<2:35:07,  2.18s/it] 37%|███▋      | 2514/6790 [1:27:13<2:35:23,  2.18s/it]                                                       {'loss': 1.5456, 'learning_rate': 0.00028484980694193026, 'epoch': 0.37}
+ 37%|███▋      | 2514/6790 [1:27:13<2:35:23,  2.18s/it] 37%|███▋      | 2515/6790 [1:27:15<2:33:55,  2.16s/it]                                                       {'loss': 1.5464, 'learning_rate': 0.00028476474959937255, 'epoch': 0.37}
+ 37%|███▋      | 2515/6790 [1:27:15<2:33:55,  2.16s/it] 37%|███▋      | 2516/6790 [1:27:17<2:31:18,  2.12s/it]                                                       {'loss': 1.3977, 'learning_rate': 0.0002846796735645131, 'epoch': 0.37}
+ 37%|███▋      | 2516/6790 [1:27:17<2:31:18,  2.12s/it] 37%|███▋      | 2517/6790 [1:27:19<2:35:29,  2.18s/it]                                                       {'loss': 1.3938, 'learning_rate': 0.0002845945788561127, 'epoch': 0.37}
+ 37%|███▋      | 2517/6790 [1:27:19<2:35:29,  2.18s/it] 37%|███▋      | 2518/6790 [1:27:21<2:31:11,  2.12s/it]                                                       {'loss': 1.5621, 'learning_rate': 0.0002845094654929365, 'epoch': 0.37}
+ 37%|███▋      | 2518/6790 [1:27:21<2:31:11,  2.12s/it] 37%|███▋      | 2519/6790 [1:27:23<2:23:07,  2.01s/it]                                                       {'loss': 1.4181, 'learning_rate': 0.00028442433349375364, 'epoch': 0.37}
+ 37%|███▋      | 2519/6790 [1:27:23<2:23:07,  2.01s/it] 37%|███▋      | 2520/6790 [1:27:25<2:27:14,  2.07s/it]                                                       {'loss': 1.4432, 'learning_rate': 0.0002843391828773374, 'epoch': 0.37}
+ 37%|███▋      | 2520/6790 [1:27:25<2:27:14,  2.07s/it] 37%|███▋      | 2521/6790 [1:27:27<2:20:11,  1.97s/it]                                                       {'loss': 1.4452, 'learning_rate': 0.0002842540136624652, 'epoch': 0.37}
+ 37%|███▋      | 2521/6790 [1:27:27<2:20:11,  1.97s/it] 37%|███▋      | 2522/6790 [1:27:29<2:23:31,  2.02s/it]                                                       {'loss': 1.2613, 'learning_rate': 0.0002841688258679185, 'epoch': 0.37}
+ 37%|███▋      | 2522/6790 [1:27:29<2:23:31,  2.02s/it] 37%|███▋      | 2523/6790 [1:27:31<2:27:42,  2.08s/it]                                                       {'loss': 1.4646, 'learning_rate': 0.00028408361951248295, 'epoch': 0.37}
+ 37%|███▋      | 2523/6790 [1:27:31<2:27:42,  2.08s/it] 37%|███▋      | 2524/6790 [1:27:33<2:25:49,  2.05s/it]                                                       {'loss': 1.477, 'learning_rate': 0.0002839983946149482, 'epoch': 0.37}
+ 37%|███▋      | 2524/6790 [1:27:33<2:25:49,  2.05s/it] 37%|███▋      | 2525/6790 [1:27:35<2:23:24,  2.02s/it]                                                       {'loss': 1.3961, 'learning_rate': 0.000283913151194108, 'epoch': 0.37}
+ 37%|███▋      | 2525/6790 [1:27:35<2:23:24,  2.02s/it] 37%|███▋      | 2526/6790 [1:27:37<2:24:03,  2.03s/it]                                                       {'loss': 1.4218, 'learning_rate': 0.00028382788926876025, 'epoch': 0.37}
+ 37%|███▋      | 2526/6790 [1:27:37<2:24:03,  2.03s/it] 37%|███▋      | 2527/6790 [1:27:39<2:20:17,  1.97s/it]                                                       {'loss': 1.5261, 'learning_rate': 0.0002837426088577069, 'epoch': 0.37}
+ 37%|███▋      | 2527/6790 [1:27:39<2:20:17,  1.97s/it] 37%|███��      | 2528/6790 [1:27:42<2:47:10,  2.35s/it]                                                       {'loss': 1.4221, 'learning_rate': 0.0002836573099797539, 'epoch': 0.37}
+ 37%|███▋      | 2528/6790 [1:27:42<2:47:10,  2.35s/it] 37%|███▋      | 2529/6790 [1:27:44<2:38:57,  2.24s/it]                                                       {'loss': 1.3951, 'learning_rate': 0.0002835719926537114, 'epoch': 0.37}
+ 37%|███▋      | 2529/6790 [1:27:44<2:38:57,  2.24s/it] 37%|███▋      | 2530/6790 [1:27:46<2:32:29,  2.15s/it]                                                       {'loss': 1.5949, 'learning_rate': 0.00028348665689839354, 'epoch': 0.37}
+ 37%|███▋      | 2530/6790 [1:27:46<2:32:29,  2.15s/it] 37%|███▋      | 2531/6790 [1:27:48<2:28:24,  2.09s/it]                                                       {'loss': 1.4919, 'learning_rate': 0.00028340130273261845, 'epoch': 0.37}
+ 37%|███▋      | 2531/6790 [1:27:48<2:28:24,  2.09s/it] 37%|███▋      | 2532/6790 [1:27:50<2:29:01,  2.10s/it]                                                       {'loss': 1.6357, 'learning_rate': 0.0002833159301752086, 'epoch': 0.37}
+ 37%|███▋      | 2532/6790 [1:27:50<2:29:01,  2.10s/it] 37%|███▋      | 2533/6790 [1:27:52<2:24:33,  2.04s/it]                                                       {'loss': 1.5588, 'learning_rate': 0.00028323053924499017, 'epoch': 0.37}
+ 37%|███▋      | 2533/6790 [1:27:52<2:24:33,  2.04s/it] 37%|███▋      | 2534/6790 [1:27:54<2:23:52,  2.03s/it]                                                       {'loss': 1.4364, 'learning_rate': 0.00028314512996079365, 'epoch': 0.37}
+ 37%|███▋      | 2534/6790 [1:27:54<2:23:52,  2.03s/it] 37%|███▋      | 2535/6790 [1:27:57<2:37:34,  2.22s/it]                                                       {'loss': 1.4334, 'learning_rate': 0.00028305970234145334, 'epoch': 0.37}
+ 37%|███▋      | 2535/6790 [1:27:57<2:37:34,  2.22s/it] 37%|███▋      | 2536/6790 [1:27:59<2:42:10,  2.29s/it]                                                       {'loss': 1.6371, 'learning_rate': 0.0002829742564058078, 'epoch': 0.37}
+ 37%|███▋      | 2536/6790 [1:27:59<2:42:10,  2.29s/it] 37%|███▋      | 2537/6790 [1:28:01<2:37:18,  2.22s/it]                                                       {'loss': 1.4131, 'learning_rate': 0.00028288879217269953, 'epoch': 0.37}
+ 37%|███▋      | 2537/6790 [1:28:01<2:37:18,  2.22s/it] 37%|███▋      | 2538/6790 [1:28:03<2:31:23,  2.14s/it]                                                       {'loss': 1.5459, 'learning_rate': 0.0002828033096609751, 'epoch': 0.37}
+ 37%|███▋      | 2538/6790 [1:28:03<2:31:23,  2.14s/it] 37%|███▋      | 2539/6790 [1:28:05<2:28:37,  2.10s/it]                                                       {'loss': 1.4366, 'learning_rate': 0.00028271780888948505, 'epoch': 0.37}
+ 37%|███▋      | 2539/6790 [1:28:05<2:28:37,  2.10s/it] 37%|███▋      | 2540/6790 [1:28:07<2:24:16,  2.04s/it]                                                       {'loss': 1.4225, 'learning_rate': 0.00028263228987708414, 'epoch': 0.37}
+ 37%|███▋      | 2540/6790 [1:28:07<2:24:16,  2.04s/it] 37%|███▋      | 2541/6790 [1:28:10<2:33:59,  2.17s/it]                                                       {'loss': 1.739, 'learning_rate': 0.00028254675264263084, 'epoch': 0.37}
+ 37%|███▋      | 2541/6790 [1:28:10<2:33:59,  2.17s/it] 37%|███▋      | 2542/6790 [1:28:12<2:38:41,  2.24s/it]                                                       {'loss': 1.6734, 'learning_rate': 0.0002824611972049878, 'epoch': 0.37}
+ 37%|███▋      | 2542/6790 [1:28:12<2:38:41,  2.24s/it] 37%|███▋      | 2543/6790 [1:28:14<2:40:52,  2.27s/it]                                                       {'loss': 1.5067, 'learning_rate': 0.00028237562358302183, 'epoch': 0.37}
+ 37%|███▋      | 2543/6790 [1:28:14<2:40:52,  2.27s/it] 37%|███▋      | 2544/6790 [1:28:16<2:35:29,  2.20s/it]                                                       {'loss': 1.6574, 'learning_rate': 0.0002822900317956034, 'epoch': 0.37}
+ 37%|███▋      | 2544/6790 [1:28:16<2:35:29,  2.20s/it] 37%|███▋      | 2545/6790 [1:28:18<2:31:52,  2.15s/it]                                                       {'loss': 1.3748, 'learning_rate': 0.0002822044218616073, 'epoch': 0.37}
+ 37%|███▋      | 2545/6790 [1:28:18<2:31:52,  2.15s/it] 37%|███▋      | 2546/6790 [1:28:20<2:22:41,  2.02s/it]                                                       {'loss': 1.3674, 'learning_rate': 0.0002821187937999123, 'epoch': 0.37}
+ 37%|███▋      | 2546/6790 [1:28:20<2:22:41,  2.02s/it] 38%|███▊      | 2547/6790 [1:28:22<2:22:47,  2.02s/it]                                                       {'loss': 1.3027, 'learning_rate': 0.0002820331476294009, 'epoch': 0.38}
+ 38%|███▊      | 2547/6790 [1:28:22<2:22:47,  2.02s/it] 38%|███▊      | 2548/6790 [1:28:25<2:40:39,  2.27s/it]                                                       {'loss': 1.2885, 'learning_rate': 0.0002819474833689599, 'epoch': 0.38}
+ 38%|███▊      | 2548/6790 [1:28:25<2:40:39,  2.27s/it] 38%|███▊      | 2549/6790 [1:28:27<2:33:43,  2.17s/it]                                                       {'loss': 1.4986, 'learning_rate': 0.00028186180103747995, 'epoch': 0.38}
+ 38%|███▊      | 2549/6790 [1:28:27<2:33:43,  2.17s/it] 38%|███▊      | 2550/6790 [1:28:29<2:34:16,  2.18s/it]                                                       {'loss': 1.5887, 'learning_rate': 0.0002817761006538556, 'epoch': 0.38}
+ 38%|███▊      | 2550/6790 [1:28:29<2:34:16,  2.18s/it] 38%|███▊      | 2551/6790 [1:28:31<2:29:49,  2.12s/it]                                                       {'loss': 1.4527, 'learning_rate': 0.0002816903822369856, 'epoch': 0.38}
+ 38%|███▊      | 2551/6790 [1:28:31<2:29:49,  2.12s/it] 38%|███▊      | 2552/6790 [1:28:33<2:30:43,  2.13s/it]                                                       {'loss': 1.3555, 'learning_rate': 0.00028160464580577243, 'epoch': 0.38}
+ 38%|███▊      | 2552/6790 [1:28:33<2:30:43,  2.13s/it] 38%|███▊      | 2553/6790 [1:28:35<2:26:07,  2.07s/it]                                                       {'loss': 1.7434, 'learning_rate': 0.00028151889137912283, 'epoch': 0.38}
+ 38%|███▊      | 2553/6790 [1:28:35<2:26:07,  2.07s/it] 38%|███▊      | 2554/6790 [1:28:37<2:22:01,  2.01s/it]                                                       {'loss': 1.39, 'learning_rate': 0.00028143311897594714, 'epoch': 0.38}
+ 38%|███▊      | 2554/6790 [1:28:37<2:22:01,  2.01s/it] 38%|███▊      | 2555/6790 [1:28:39<2:19:22,  1.97s/it]                                                       {'loss': 1.3773, 'learning_rate': 0.0002813473286151601, 'epoch': 0.38}
+ 38%|███▊      | 2555/6790 [1:28:39<2:19:22,  1.97s/it] 38%|███▊      | 2556/6790 [1:28:41<2:14:00,  1.90s/it]                                                       {'loss': 1.4904, 'learning_rate': 0.0002812615203156799, 'epoch': 0.38}
+ 38%|███▊      | 2556/6790 [1:28:41<2:14:00,  1.90s/it] 38%|███▊      | 2557/6790 [1:28:43<2:17:52,  1.95s/it]                                                       {'loss': 1.5703, 'learning_rate': 0.0002811756940964293, 'epoch': 0.38}
+ 38%|███▊      | 2557/6790 [1:28:43<2:17:52,  1.95s/it] 38%|███▊      | 2558/6790 [1:28:45<2:29:51,  2.12s/it]                                                       {'loss': 1.5086, 'learning_rate': 0.0002810898499763344, 'epoch': 0.38}
+ 38%|███▊      | 2558/6790 [1:28:45<2:29:51,  2.12s/it] 38%|███▊      | 2559/6790 [1:28:47<2:27:49,  2.10s/it]                                                       {'loss': 1.2636, 'learning_rate': 0.00028100398797432566, 'epoch': 0.38}
+ 38%|███▊      | 2559/6790 [1:28:47<2:27:49,  2.10s/it] 38%|███▊      | 2560/6790 [1:28:49<2:26:55,  2.08s/it]                                                       {'loss': 1.3517, 'learning_rate': 0.0002809181081093373, 'epoch': 0.38}
+ 38%|███▊      | 2560/6790 [1:28:49<2:26:55,  2.08s/it] 38%|███▊      | 2561/6790 [1:28:52<2:30:12,  2.13s/it]                                                       {'loss': 1.5268, 'learning_rate': 0.00028083221040030754, 'epoch': 0.38}
+ 38%|███▊      | 2561/6790 [1:28:52<2:30:12,  2.13s/it] 38%|███▊      | 2562/6790 [1:28:54<2:30:38,  2.14s/it]                                                       {'loss': 1.6142, 'learning_rate': 0.0002807462948661786, 'epoch': 0.38}
+ 38%|███▊      | 2562/6790 [1:28:54<2:30:38,  2.14s/it] 38%|███▊      | 2563/6790 [1:28:56<2:28:04,  2.10s/it]                                                       {'loss': 1.5349, 'learning_rate': 0.00028066036152589636, 'epoch': 0.38}
+ 38%|███▊      | 2563/6790 [1:28:56<2:28:04,  2.10s/it] 38%|███▊      | 2564/6790 [1:28:58<2:25:40,  2.07s/it]                                                       {'loss': 1.3886, 'learning_rate': 0.000280574410398411, 'epoch': 0.38}
+ 38%|███▊      | 2564/6790 [1:28:58<2:25:40,  2.07s/it] 38%|███▊      | 2565/6790 [1:29:00<2:20:16,  1.99s/it]                                                       {'loss': 1.5938, 'learning_rate': 0.0002804884415026764, 'epoch': 0.38}
+ 38%|███▊      | 2565/6790 [1:29:00<2:20:16,  1.99s/it] 38%|███▊      | 2566/6790 [1:29:02<2:28:36,  2.11s/it]                                                       {'loss': 1.5032, 'learning_rate': 0.00028040245485765037, 'epoch': 0.38}
+ 38%|███▊      | 2566/6790 [1:29:02<2:28:36,  2.11s/it] 38%|███▊      | 2567/6790 [1:29:04<2:24:03,  2.05s/it]                                                       {'loss': 1.5284, 'learning_rate': 0.0002803164504822946, 'epoch': 0.38}
+ 38%|███▊      | 2567/6790 [1:29:04<2:24:03,  2.05s/it] 38%|███▊      | 2568/6790 [1:29:06<2:22:16,  2.02s/it]                                                       {'loss': 1.5676, 'learning_rate': 0.00028023042839557484, 'epoch': 0.38}
+ 38%|███▊      | 2568/6790 [1:29:06<2:22:16,  2.02s/it] 38%|███▊      | 2569/6790 [1:29:10<2:58:05,  2.53s/it]                                                       {'loss': 1.5518, 'learning_rate': 0.0002801443886164607, 'epoch': 0.38}
+ 38%|███▊      | 2569/6790 [1:29:10<2:58:05,  2.53s/it] 38%|███▊      | 2570/6790 [1:29:12<2:55:10,  2.49s/it]                                                       {'loss': 1.2138, 'learning_rate': 0.00028005833116392557, 'epoch': 0.38}
+ 38%|███▊      | 2570/6790 [1:29:12<2:55:10,  2.49s/it] 38%|███▊      | 2571/6790 [1:29:14<2:44:01,  2.33s/it]                                                       {'loss': 1.4545, 'learning_rate': 0.0002799722560569468, 'epoch': 0.38}
+ 38%|███▊      | 2571/6790 [1:29:14<2:44:01,  2.33s/it] 38%|███▊      | 2572/6790 [1:29:16<2:36:01,  2.22s/it]                                                       {'loss': 1.6086, 'learning_rate': 0.00027988616331450577, 'epoch': 0.38}
+ 38%|███▊      | 2572/6790 [1:29:16<2:36:01,  2.22s/it] 38%|███▊      | 2573/6790 [1:29:18<2:30:09,  2.14s/it]                                                       {'loss': 1.224, 'learning_rate': 0.0002798000529555875, 'epoch': 0.38}
+ 38%|███▊      | 2573/6790 [1:29:18<2:30:09,  2.14s/it] 38%|███▊      | 2574/6790 [1:29:20<2:34:18,  2.20s/it]                                                       {'loss': 1.2877, 'learning_rate': 0.00027971392499918105, 'epoch': 0.38}
+ 38%|███▊      | 2574/6790 [1:29:20<2:34:18,  2.20s/it] 38%|███▊      | 2575/6790 [1:29:22<2:31:35,  2.16s/it]                                                       {'loss': 1.6333, 'learning_rate': 0.00027962777946427943, 'epoch': 0.38}
+ 38%|███▊      | 2575/6790 [1:29:22<2:31:35,  2.16s/it] 38%|███▊      | 2576/6790 [1:29:24<2:30:40,  2.15s/it]                                                       {'loss': 1.4689, 'learning_rate': 0.00027954161636987936, 'epoch': 0.38}
+ 38%|███▊      | 2576/6790 [1:29:24<2:30:40,  2.15s/it] 38%|███▊      | 2577/6790 [1:29:26<2:28:17,  2.11s/it]                                                       {'loss': 1.504, 'learning_rate': 0.0002794554357349815, 'epoch': 0.38}
+ 38%|███▊      | 2577/6790 [1:29:26<2:28:17,  2.11s/it] 38%|███▊      | 2578/6790 [1:29:28<2:21:21,  2.01s/it]                                                       {'loss': 1.595, 'learning_rate': 0.0002793692375785904, 'epoch': 0.38}
+ 38%|███▊      | 2578/6790 [1:29:28<2:21:21,  2.01s/it] 38%|███▊      | 2579/6790 [1:29:30<2:23:34,  2.05s/it]                                                       {'loss': 1.5339, 'learning_rate': 0.0002792830219197144, 'epoch': 0.38}
+ 38%|███▊      | 2579/6790 [1:29:30<2:23:34,  2.05s/it] 38%|███▊      | 2580/6790 [1:29:32<2:25:58,  2.08s/it]                                                       {'loss': 1.3977, 'learning_rate': 0.0002791967887773659, 'epoch': 0.38}
+ 38%|███▊      | 2580/6790 [1:29:32<2:25:58,  2.08s/it] 38%|███▊      | 2581/6790 [1:29:35<2:32:41,  2.18s/it]                                                       {'loss': 1.516, 'learning_rate': 0.00027911053817056085, 'epoch': 0.38}
+ 38%|███▊      | 2581/6790 [1:29:35<2:32:41,  2.18s/it] 38%|███▊      | 2582/6790 [1:29:37<2:32:23,  2.17s/it]                                                       {'loss': 1.7391, 'learning_rate': 0.00027902427011831937, 'epoch': 0.38}
+ 38%|███▊      | 2582/6790 [1:29:37<2:32:23,  2.17s/it] 38%|███▊      | 2583/6790 [1:29:39<2:31:17,  2.16s/it]                                                       {'loss': 1.3659, 'learning_rate': 0.0002789379846396651, 'epoch': 0.38}
+ 38%|███▊      | 2583/6790 [1:29:39<2:31:17,  2.16s/it] 38%|███▊      | 2584/6790 [1:29:41<2:31:57,  2.17s/it]                                                       {'loss': 1.4699, 'learning_rate': 0.00027885168175362577, 'epoch': 0.38}
+ 38%|███▊      | 2584/6790 [1:29:41<2:31:57,  2.17s/it] 38%|███▊      | 2585/6790 [1:29:43<2:24:30,  2.06s/it]                                                       {'loss': 1.6575, 'learning_rate': 0.0002787653614792329, 'epoch': 0.38}
+ 38%|███▊      | 2585/6790 [1:29:43<2:24:30,  2.06s/it] 38%|███▊      | 2586/6790 [1:29:45<2:25:13,  2.07s/it]                                                       {'loss': 1.5931, 'learning_rate': 0.00027867902383552177, 'epoch': 0.38}
+ 38%|███▊      | 2586/6790 [1:29:45<2:25:13,  2.07s/it] 38%|███▊      | 2587/6790 [1:29:48<2:31:41,  2.17s/it]                                                       {'loss': 1.2967, 'learning_rate': 0.0002785926688415316, 'epoch': 0.38}
+ 38%|███▊      | 2587/6790 [1:29:48<2:31:41,  2.17s/it] 38%|███▊      | 2588/6790 [1:29:49<2:25:44,  2.08s/it]                                                       {'loss': 1.5862, 'learning_rate': 0.00027850629651630525, 'epoch': 0.38}
+ 38%|███▊      | 2588/6790 [1:29:49<2:25:44,  2.08s/it] 38%|███▊      | 2589/6790 [1:29:51<2:21:44,  2.02s/it]                                                       {'loss': 1.4884, 'learning_rate': 0.00027841990687888977, 'epoch': 0.38}
+ 38%|███▊      | 2589/6790 [1:29:51<2:21:44,  2.02s/it] 38%|███▊      | 2590/6790 [1:29:54<2:27:36,  2.11s/it]                                                       {'loss': 1.4419, 'learning_rate': 0.0002783334999483354, 'epoch': 0.38}
+ 38%|███▊      | 2590/6790 [1:29:54<2:27:36,  2.11s/it] 38%|███▊      | 2591/6790 [1:29:56<2:21:52,  2.03s/it]                                                       {'loss': 1.2859, 'learning_rate': 0.0002782470757436969, 'epoch': 0.38}
+ 38%|███▊      | 2591/6790 [1:29:56<2:21:52,  2.03s/it] 38%|███▊      | 2592/6790 [1:29:58<2:22:16,  2.03s/it]                                                       {'loss': 1.6416, 'learning_rate': 0.0002781606342840324, 'epoch': 0.38}
+ 38%|███▊      | 2592/6790 [1:29:58<2:22:16,  2.03s/it] 38%|███▊      | 2593/6790 [1:29:59<2:18:46,  1.98s/it]                                                       {'loss': 1.6231, 'learning_rate': 0.00027807417558840396, 'epoch': 0.38}
+ 38%|███▊      | 2593/6790 [1:29:59<2:18:46,  1.98s/it] 38%|███▊      | 2594/6790 [1:30:01<2:15:15,  1.93s/it]                                                       {'loss': 1.3836, 'learning_rate': 0.0002779876996758774, 'epoch': 0.38}
+ 38%|███▊      | 2594/6790 [1:30:01<2:15:15,  1.93s/it] 38%|███▊      | 2595/6790 [1:30:03<2:18:15,  1.98s/it]                                                       {'loss': 1.5957, 'learning_rate': 0.00027790120656552244, 'epoch': 0.38}
+ 38%|███▊      | 2595/6790 [1:30:03<2:18:15,  1.98s/it] 38%|███▊      | 2596/6790 [1:30:05<2:16:19,  1.95s/it]                                                       {'loss': 1.6744, 'learning_rate': 0.0002778146962764125, 'epoch': 0.38}
+ 38%|███▊      | 2596/6790 [1:30:05<2:16:19,  1.95s/it] 38%|███▊      | 2597/6790 [1:30:07<2:21:43,  2.03s/it]                                                       {'loss': 1.4105, 'learning_rate': 0.00027772816882762466, 'epoch': 0.38}
+ 38%|███▊      | 2597/6790 [1:30:07<2:21:43,  2.03s/it] 38%|███▊      | 2598/6790 [1:30:10<2:22:57,  2.05s/it]                                                       {'loss': 1.4718, 'learning_rate': 0.0002776416242382401, 'epoch': 0.38}
+ 38%|███▊      | 2598/6790 [1:30:10<2:22:57,  2.05s/it] 38%|███▊      | 2599/6790 [1:30:11<2:20:52,  2.02s/it]                                                       {'loss': 1.4505, 'learning_rate': 0.00027755506252734357, 'epoch': 0.38}
+ 38%|███▊      | 2599/6790 [1:30:11<2:20:52,  2.02s/it] 38%|███▊      | 2600/6790 [1:30:14<2:24:22,  2.07s/it]                                                       {'loss': 1.5522, 'learning_rate': 0.0002774684837140237, 'epoch': 0.38}
+ 38%|███▊      | 2600/6790 [1:30:14<2:24:22,  2.07s/it] 38%|███▊      | 2601/6790 [1:30:16<2:20:42,  2.02s/it]                                                       {'loss': 1.7029, 'learning_rate': 0.00027738188781737267, 'epoch': 0.38}
+ 38%|███▊      | 2601/6790 [1:30:16<2:20:42,  2.02s/it] 38%|███▊      | 2602/6790 [1:30:17<2:18:24,  1.98s/it]                                                       {'loss': 1.4088, 'learning_rate': 0.0002772952748564867, 'epoch': 0.38}
+ 38%|███▊      | 2602/6790 [1:30:17<2:18:24,  1.98s/it] 38%|███▊      | 2603/6790 [1:30:20<2:21:35,  2.03s/it]                                                       {'loss': 1.6674, 'learning_rate': 0.00027720864485046565, 'epoch': 0.38}
+ 38%|███▊      | 2603/6790 [1:30:20<2:21:35,  2.03s/it] 38%|███▊      | 2604/6790 [1:30:22<2:23:13,  2.05s/it]                                                       {'loss': 1.8194, 'learning_rate': 0.00027712199781841304, 'epoch': 0.38}
+ 38%|███▊      | 2604/6790 [1:30:22<2:23:13,  2.05s/it] 38%|███▊      | 2605/6790 [1:30:24<2:33:50,  2.21s/it]                                                       {'loss': 1.5644, 'learning_rate': 0.00027703533377943646, 'epoch': 0.38}
+ 38%|███▊      | 2605/6790 [1:30:24<2:33:50,  2.21s/it] 38%|███▊      | 2606/6790 [1:30:26<2:28:00,  2.12s/it]                                                       {'loss': 1.6764, 'learning_rate': 0.0002769486527526469, 'epoch': 0.38}
+ 38%|███▊      | 2606/6790 [1:30:26<2:28:00,  2.12s/it] 38%|███▊      | 2607/6790 [1:30:28<2:24:30,  2.07s/it]                                                       {'loss': 1.582, 'learning_rate': 0.0002768619547571592, 'epoch': 0.38}
+ 38%|███▊      | 2607/6790 [1:30:28<2:24:30,  2.07s/it] 38%|███▊      | 2608/6790 [1:30:30<2:19:05,  2.00s/it]                                                       {'loss': 1.4928, 'learning_rate': 0.0002767752398120921, 'epoch': 0.38}
+ 38%|███▊      | 2608/6790 [1:30:30<2:19:05,  2.00s/it] 38%|███▊      | 2609/6790 [1:30:32<2:19:16,  2.00s/it]                                                       {'loss': 1.478, 'learning_rate': 0.00027668850793656795, 'epoch': 0.38}
+ 38%|███▊      | 2609/6790 [1:30:32<2:19:16,  2.00s/it] 38%|███▊      | 2610/6790 [1:30:34<2:22:00,  2.04s/it]                                                       {'loss': 1.6834, 'learning_rate': 0.00027660175914971273, 'epoch': 0.38}
+ 38%|███▊      | 2610/6790 [1:30:34<2:22:00,  2.04s/it] 38%|███▊      | 2611/6790 [1:30:36<2:16:24,  1.96s/it]                                                       {'loss': 1.4879, 'learning_rate': 0.00027651499347065633, 'epoch': 0.38}
+ 38%|███▊      | 2611/6790 [1:30:36<2:16:24,  1.96s/it] 38%|███▊      | 2612/6790 [1:30:38<2:15:38,  1.95s/it]                                                       {'loss': 1.6324, 'learning_rate': 0.00027642821091853226, 'epoch': 0.38}
+ 38%|███▊      | 2612/6790 [1:30:38<2:15:38,  1.95s/it] 38%|███▊      | 2613/6790 [1:30:40<2:28:53,  2.14s/it]                                                       {'loss': 1.6345, 'learning_rate': 0.0002763414115124779, 'epoch': 0.38}
+ 38%|███▊      | 2613/6790 [1:30:40<2:28:53,  2.14s/it] 38%|███▊      | 2614/6790 [1:30:42<2:25:40,  2.09s/it]                                                       {'loss': 1.5319, 'learning_rate': 0.00027625459527163415, 'epoch': 0.38}
+ 38%|███▊      | 2614/6790 [1:30:42<2:25:40,  2.09s/it] 39%|███▊      | 2615/6790 [1:30:45<2:31:20,  2.17s/it]                                                       {'loss': 1.3872, 'learning_rate': 0.00027616776221514567, 'epoch': 0.39}
+ 39%|███▊      | 2615/6790 [1:30:45<2:31:20,  2.17s/it] 39%|███▊      | 2616/6790 [1:30:47<2:32:28,  2.19s/it]                                                       {'loss': 1.5442, 'learning_rate': 0.0002760809123621609, 'epoch': 0.39}
+ 39%|███▊      | 2616/6790 [1:30:47<2:32:28,  2.19s/it] 39%|███▊      | 2617/6790 [1:30:49<2:30:02,  2.16s/it]                                                       {'loss': 1.3617, 'learning_rate': 0.00027599404573183195, 'epoch': 0.39}
+ 39%|███▊      | 2617/6790 [1:30:49<2:30:02,  2.16s/it] 39%|███▊      | 2618/6790 [1:30:51<2:28:26,  2.13s/it]                                                       {'loss': 1.3455, 'learning_rate': 0.00027590716234331467, 'epoch': 0.39}
+ 39%|███▊      | 2618/6790 [1:30:51<2:28:26,  2.13s/it] 39%|███▊      | 2619/6790 [1:30:54<2:47:50,  2.41s/it]                                                       {'loss': 1.6445, 'learning_rate': 0.00027582026221576855, 'epoch': 0.39}
+ 39%|███▊      | 2619/6790 [1:30:54<2:47:50,  2.41s/it] 39%|███▊      | 2620/6790 [1:30:56<2:37:56,  2.27s/it]                                                       {'loss': 1.4017, 'learning_rate': 0.0002757333453683567, 'epoch': 0.39}
+ 39%|███▊      | 2620/6790 [1:30:56<2:37:56,  2.27s/it] 39%|███▊      | 2621/6790 [1:30:58<2:32:47,  2.20s/it]                                                       {'loss': 1.5529, 'learning_rate': 0.0002756464118202461, 'epoch': 0.39}
+ 39%|███▊      | 2621/6790 [1:30:58<2:32:47,  2.20s/it] 39%|███▊      | 2622/6790 [1:31:00<2:23:31,  2.07s/it]                                                       {'loss': 1.3389, 'learning_rate': 0.00027555946159060724, 'epoch': 0.39}
+ 39%|███▊      | 2622/6790 [1:31:00<2:23:31,  2.07s/it] 39%|███▊      | 2623/6790 [1:31:02<2:16:51,  1.97s/it]                                                       {'loss': 1.4108, 'learning_rate': 0.00027547249469861445, 'epoch': 0.39}
+ 39%|███▊      | 2623/6790 [1:31:02<2:16:51,  1.97s/it] 39%|███▊      | 2624/6790 [1:31:04<2:17:05,  1.97s/it]                                                       {'loss': 1.3468, 'learning_rate': 0.0002753855111634455, 'epoch': 0.39}
+ 39%|███▊      | 2624/6790 [1:31:04<2:17:05,  1.97s/it] 39%|███▊      | 2625/6790 [1:31:06<2:15:29,  1.95s/it]                                                       {'loss': 1.2975, 'learning_rate': 0.0002752985110042822, 'epoch': 0.39}
+ 39%|███▊      | 2625/6790 [1:31:06<2:15:29,  1.95s/it] 39%|███▊      | 2626/6790 [1:31:08<2:29:28,  2.15s/it]                                                       {'loss': 1.7112, 'learning_rate': 0.00027521149424030957, 'epoch': 0.39}
+ 39%|███▊      | 2626/6790 [1:31:08<2:29:28,  2.15s/it] 39%|███▊      | 2627/6790 [1:31:10<2:21:16,  2.04s/it]                                                       {'loss': 1.4632, 'learning_rate': 0.00027512446089071667, 'epoch': 0.39}
+ 39%|███▊      | 2627/6790 [1:31:10<2:21:16,  2.04s/it] 39%|███▊      | 2628/6790 [1:31:12<2:16:19,  1.97s/it]                                                       {'loss': 1.5034, 'learning_rate': 0.00027503741097469606, 'epoch': 0.39}
+ 39%|███▊      | 2628/6790 [1:31:12<2:16:19,  1.97s/it] 39%|███▊      | 2629/6790 [1:31:14<2:14:16,  1.94s/it]                                                       {'loss': 1.6292, 'learning_rate': 0.00027495034451144394, 'epoch': 0.39}
+ 39%|███▊      | 2629/6790 [1:31:14<2:14:16,  1.94s/it] 39%|███▊      | 2630/6790 [1:31:16<2:17:28,  1.98s/it]                                                       {'loss': 1.5139, 'learning_rate': 0.00027486326152016026, 'epoch': 0.39}
+ 39%|███▊      | 2630/6790 [1:31:16<2:17:28,  1.98s/it] 39%|███▊      | 2631/6790 [1:31:18<2:26:27,  2.11s/it]                                                       {'loss': 1.585, 'learning_rate': 0.0002747761620200484, 'epoch': 0.39}
+ 39%|███▊      | 2631/6790 [1:31:18<2:26:27,  2.11s/it] 39%|███▉      | 2632/6790 [1:31:20<2:24:09,  2.08s/it]                                                       {'loss': 1.5687, 'learning_rate': 0.0002746890460303155, 'epoch': 0.39}
+ 39%|███▉      | 2632/6790 [1:31:20<2:24:09,  2.08s/it] 39%|███▉      | 2633/6790 [1:31:22<2:18:55,  2.01s/it]                                                       {'loss': 1.5212, 'learning_rate': 0.0002746019135701726, 'epoch': 0.39}
+ 39%|███▉      | 2633/6790 [1:31:22<2:18:55,  2.01s/it] 39%|███▉      | 2634/6790 [1:31:24<2:18:27,  2.00s/it]                                                       {'loss': 1.312, 'learning_rate': 0.00027451476465883387, 'epoch': 0.39}
+ 39%|███▉      | 2634/6790 [1:31:24<2:18:27,  2.00s/it] 39%|███▉      | 2635/6790 [1:31:26<2:18:54,  2.01s/it]                                                       {'loss': 1.6583, 'learning_rate': 0.0002744275993155175, 'epoch': 0.39}
+ 39%|███▉      | 2635/6790 [1:31:26<2:18:54,  2.01s/it] 39%|███▉      | 2636/6790 [1:31:28<2:22:48,  2.06s/it]                                                       {'loss': 1.2598, 'learning_rate': 0.00027434041755944517, 'epoch': 0.39}
+ 39%|███▉      | 2636/6790 [1:31:28<2:22:48,  2.06s/it] 39%|███▉      | 2637/6790 [1:31:31<2:34:50,  2.24s/it]                                                       {'loss': 1.4949, 'learning_rate': 0.00027425321940984215, 'epoch': 0.39}
+ 39%|███▉      | 2637/6790 [1:31:31<2:34:50,  2.24s/it] 39%|███▉      | 2638/6790 [1:31:33<2:29:52,  2.17s/it]                                                       {'loss': 1.4817, 'learning_rate': 0.00027416600488593736, 'epoch': 0.39}
+ 39%|███▉      | 2638/6790 [1:31:33<2:29:52,  2.17s/it] 39%|███▉      | 2639/6790 [1:31:35<2:22:01,  2.05s/it]                                                       {'loss': 1.4369, 'learning_rate': 0.0002740787740069633, 'epoch': 0.39}
+ 39%|███▉      | 2639/6790 [1:31:35<2:22:01,  2.05s/it] 39%|███▉      | 2640/6790 [1:31:37<2:20:58,  2.04s/it]                                                       {'loss': 1.6167, 'learning_rate': 0.00027399152679215613, 'epoch': 0.39}
+ 39%|███▉      | 2640/6790 [1:31:37<2:20:58,  2.04s/it] 39%|███▉      | 2641/6790 [1:31:39<2:21:05,  2.04s/it]                                                       {'loss': 1.4814, 'learning_rate': 0.00027390426326075553, 'epoch': 0.39}
+ 39%|███▉      | 2641/6790 [1:31:39<2:21:05,  2.04s/it] 39%|███▉      | 2642/6790 [1:31:41<2:22:22,  2.06s/it]                                                       {'loss': 1.5809, 'learning_rate': 0.0002738169834320049, 'epoch': 0.39}
+ 39%|███▉      | 2642/6790 [1:31:41<2:22:22,  2.06s/it] 39%|███▉      | 2643/6790 [1:31:43<2:24:27,  2.09s/it]                                                       {'loss': 1.5743, 'learning_rate': 0.0002737296873251512, 'epoch': 0.39}
+ 39%|███▉      | 2643/6790 [1:31:43<2:24:27,  2.09s/it] 39%|███▉      | 2644/6790 [1:31:45<2:22:41,  2.06s/it]                                                       {'loss': 1.5634, 'learning_rate': 0.0002736423749594449, 'epoch': 0.39}
+ 39%|███▉      | 2644/6790 [1:31:45<2:22:41,  2.06s/it] 39%|███▉      | 2645/6790 [1:31:47<2:22:58,  2.07s/it]                                                       {'loss': 1.5987, 'learning_rate': 0.00027355504635414007, 'epoch': 0.39}
+ 39%|███▉      | 2645/6790 [1:31:47<2:22:58,  2.07s/it] 39%|███▉      | 2646/6790 [1:31:49<2:20:06,  2.03s/it]                                                       {'loss': 1.4211, 'learning_rate': 0.0002734677015284944, 'epoch': 0.39}
+ 39%|███▉      | 2646/6790 [1:31:49<2:20:06,  2.03s/it] 39%|███▉      | 2647/6790 [1:31:51<2:18:32,  2.01s/it]                                                       {'loss': 1.4136, 'learning_rate': 0.00027338034050176913, 'epoch': 0.39}
+ 39%|███▉      | 2647/6790 [1:31:51<2:18:32,  2.01s/it] 39%|███▉      | 2648/6790 [1:31:53<2:15:14,  1.96s/it]                                                       {'loss': 1.4527, 'learning_rate': 0.00027329296329322927, 'epoch': 0.39}
+ 39%|███▉      | 2648/6790 [1:31:53<2:15:14,  1.96s/it] 39%|███▉      | 2649/6790 [1:31:55<2:12:39,  1.92s/it]                                                       {'loss': 1.6497, 'learning_rate': 0.0002732055699221429, 'epoch': 0.39}
+ 39%|███▉      | 2649/6790 [1:31:55<2:12:39,  1.92s/it] 39%|███▉      | 2650/6790 [1:31:56<2:11:00,  1.90s/it]                                                       {'loss': 1.5957, 'learning_rate': 0.0002731181604077823, 'epoch': 0.39}
+ 39%|███▉      | 2650/6790 [1:31:56<2:11:00,  1.90s/it] 39%|███▉      | 2651/6790 [1:31:59<2:15:37,  1.97s/it]                                                       {'loss': 1.5047, 'learning_rate': 0.00027303073476942283, 'epoch': 0.39}
+ 39%|███▉      | 2651/6790 [1:31:59<2:15:37,  1.97s/it] 39%|███▉      | 2652/6790 [1:32:01<2:19:45,  2.03s/it]                                                       {'loss': 1.4405, 'learning_rate': 0.0002729432930263435, 'epoch': 0.39}
+ 39%|███▉      | 2652/6790 [1:32:01<2:19:45,  2.03s/it] 39%|███▉      | 2653/6790 [1:32:03<2:18:46,  2.01s/it]                                                       {'loss': 1.6964, 'learning_rate': 0.0002728558351978272, 'epoch': 0.39}
+ 39%|███▉      | 2653/6790 [1:32:03<2:18:46,  2.01s/it] 39%|███▉      | 2654/6790 [1:32:05<2:15:42,  1.97s/it]                                                       {'loss': 1.4124, 'learning_rate': 0.00027276836130315986, 'epoch': 0.39}
+ 39%|███▉      | 2654/6790 [1:32:05<2:15:42,  1.97s/it] 39%|███▉      | 2655/6790 [1:32:07<2:19:28,  2.02s/it]                                                       {'loss': 1.638, 'learning_rate': 0.00027268087136163137, 'epoch': 0.39}
+ 39%|███▉      | 2655/6790 [1:32:07<2:19:28,  2.02s/it] 39%|███▉      | 2656/6790 [1:32:09<2:20:35,  2.04s/it]                                                       {'loss': 1.533, 'learning_rate': 0.0002725933653925348, 'epoch': 0.39}
+ 39%|███▉      | 2656/6790 [1:32:09<2:20:35,  2.04s/it] 39%|███▉      | 2657/6790 [1:32:11<2:16:20,  1.98s/it]                                                       {'loss': 1.5882, 'learning_rate': 0.0002725058434151671, 'epoch': 0.39}
+ 39%|███▉      | 2657/6790 [1:32:11<2:16:20,  1.98s/it] 39%|███▉      | 2658/6790 [1:32:13<2:19:36,  2.03s/it]                                                       {'loss': 1.6052, 'learning_rate': 0.0002724183054488285, 'epoch': 0.39}
+ 39%|███▉      | 2658/6790 [1:32:13<2:19:36,  2.03s/it] 39%|███▉      | 2659/6790 [1:32:15<2:17:51,  2.00s/it]                                                       {'loss': 1.2839, 'learning_rate': 0.000272330751512823, 'epoch': 0.39}
+ 39%|███▉      | 2659/6790 [1:32:15<2:17:51,  2.00s/it] 39%|███▉      | 2660/6790 [1:32:17<2:18:08,  2.01s/it]                                                       {'loss': 1.4584, 'learning_rate': 0.0002722431816264579, 'epoch': 0.39}
+ 39%|███▉      | 2660/6790 [1:32:17<2:18:08,  2.01s/it] 39%|███▉      | 2661/6790 [1:32:19<2:18:59,  2.02s/it]                                                       {'loss': 1.5835, 'learning_rate': 0.000272155595809044, 'epoch': 0.39}
+ 39%|███▉      | 2661/6790 [1:32:19<2:18:59,  2.02s/it] 39%|███▉      | 2662/6790 [1:32:21<2:16:49,  1.99s/it]                                                       {'loss': 1.2874, 'learning_rate': 0.00027206799407989573, 'epoch': 0.39}
+ 39%|███▉      | 2662/6790 [1:32:21<2:16:49,  1.99s/it] 39%|███▉      | 2663/6790 [1:32:23<2:16:29,  1.98s/it]                                                       {'loss': 1.5926, 'learning_rate': 0.0002719803764583311, 'epoch': 0.39}
+ 39%|███▉      | 2663/6790 [1:32:23<2:16:29,  1.98s/it] 39%|███▉      | 2664/6790 [1:32:25<2:17:46,  2.00s/it]                                                       {'loss': 1.4291, 'learning_rate': 0.00027189274296367147, 'epoch': 0.39}
+ 39%|███▉      | 2664/6790 [1:32:25<2:17:46,  2.00s/it] 39%|███▉      | 2665/6790 [1:32:27<2:14:27,  1.96s/it]                                                       {'loss': 1.3938, 'learning_rate': 0.0002718050936152417, 'epoch': 0.39}
+ 39%|███▉      | 2665/6790 [1:32:27<2:14:27,  1.96s/it] 39%|███▉      | 2666/6790 [1:32:29<2:17:53,  2.01s/it]                                                       {'loss': 1.5382, 'learning_rate': 0.0002717174284323703, 'epoch': 0.39}
+ 39%|���██▉      | 2666/6790 [1:32:29<2:17:53,  2.01s/it] 39%|███▉      | 2667/6790 [1:32:31<2:19:46,  2.03s/it]                                                       {'loss': 1.2609, 'learning_rate': 0.00027162974743438913, 'epoch': 0.39}
+ 39%|███▉      | 2667/6790 [1:32:31<2:19:46,  2.03s/it] 39%|███▉      | 2668/6790 [1:32:33<2:18:20,  2.01s/it]                                                       {'loss': 1.4156, 'learning_rate': 0.0002715420506406336, 'epoch': 0.39}
+ 39%|███▉      | 2668/6790 [1:32:33<2:18:20,  2.01s/it] 39%|███▉      | 2669/6790 [1:32:35<2:15:57,  1.98s/it]                                                       {'loss': 1.6345, 'learning_rate': 0.0002714543380704426, 'epoch': 0.39}
+ 39%|███▉      | 2669/6790 [1:32:35<2:15:57,  1.98s/it] 39%|███▉      | 2670/6790 [1:32:37<2:25:15,  2.12s/it]                                                       {'loss': 1.5009, 'learning_rate': 0.00027136660974315835, 'epoch': 0.39}
+ 39%|███▉      | 2670/6790 [1:32:37<2:25:15,  2.12s/it] 39%|███▉      | 2671/6790 [1:32:39<2:23:44,  2.09s/it]                                                       {'loss': 1.587, 'learning_rate': 0.0002712788656781269, 'epoch': 0.39}
+ 39%|███▉      | 2671/6790 [1:32:39<2:23:44,  2.09s/it] 39%|███▉      | 2672/6790 [1:32:41<2:19:26,  2.03s/it]                                                       {'loss': 1.4627, 'learning_rate': 0.00027119110589469736, 'epoch': 0.39}
+ 39%|███▉      | 2672/6790 [1:32:41<2:19:26,  2.03s/it] 39%|███▉      | 2673/6790 [1:32:43<2:21:46,  2.07s/it]                                                       {'loss': 1.8777, 'learning_rate': 0.00027110333041222256, 'epoch': 0.39}
+ 39%|███▉      | 2673/6790 [1:32:43<2:21:46,  2.07s/it] 39%|███▉      | 2674/6790 [1:32:45<2:21:21,  2.06s/it]                                                       {'loss': 1.53, 'learning_rate': 0.0002710155392500588, 'epoch': 0.39}
+ 39%|███▉      | 2674/6790 [1:32:45<2:21:21,  2.06s/it] 39%|███▉      | 2675/6790 [1:32:47<2:20:47,  2.05s/it]                                                       {'loss': 1.4698, 'learning_rate': 0.00027092773242756566, 'epoch': 0.39}
+ 39%|███▉      | 2675/6790 [1:32:47<2:20:47,  2.05s/it] 39%|███▉      | 2676/6790 [1:32:50<2:39:14,  2.32s/it]                                                       {'loss': 1.5398, 'learning_rate': 0.0002708399099641063, 'epoch': 0.39}
+ 39%|███▉      | 2676/6790 [1:32:50<2:39:14,  2.32s/it] 39%|███▉      | 2677/6790 [1:32:52<2:32:22,  2.22s/it]                                                       {'loss': 1.6513, 'learning_rate': 0.00027075207187904734, 'epoch': 0.39}
+ 39%|███▉      | 2677/6790 [1:32:52<2:32:22,  2.22s/it] 39%|███▉      | 2678/6790 [1:32:55<2:51:21,  2.50s/it]                                                       {'loss': 1.5569, 'learning_rate': 0.0002706642181917588, 'epoch': 0.39}
+ 39%|███▉      | 2678/6790 [1:32:55<2:51:21,  2.50s/it] 39%|███▉      | 2679/6790 [1:32:57<2:38:28,  2.31s/it]                                                       {'loss': 1.4985, 'learning_rate': 0.00027057634892161417, 'epoch': 0.39}
+ 39%|███▉      | 2679/6790 [1:32:57<2:38:28,  2.31s/it] 39%|███▉      | 2680/6790 [1:32:59<2:31:32,  2.21s/it]                                                       {'loss': 1.584, 'learning_rate': 0.00027048846408799036, 'epoch': 0.39}
+ 39%|███▉      | 2680/6790 [1:32:59<2:31:32,  2.21s/it] 39%|███▉      | 2681/6790 [1:33:01<2:31:08,  2.21s/it]                                                       {'loss': 1.5651, 'learning_rate': 0.0002704005637102677, 'epoch': 0.39}
+ 39%|███▉      | 2681/6790 [1:33:01<2:31:08,  2.21s/it] 39%|███▉      | 2682/6790 [1:33:04<2:30:36,  2.20s/it]                                                       {'loss': 1.573, 'learning_rate': 0.00027031264780783, 'epoch': 0.39}
+ 39%|███▉      | 2682/6790 [1:33:04<2:30:36,  2.20s/it] 40%|███▉      | 2683/6790 [1:33:06<2:26:54,  2.15s/it]                                                       {'loss': 1.7318, 'learning_rate': 0.00027022471640006433, 'epoch': 0.4}
+ 40%|███▉      | 2683/6790 [1:33:06<2:26:54,  2.15s/it] 40%|███▉      | 2684/6790 [1:33:07<2:18:13,  2.02s/it]                                                       {'loss': 1.2763, 'learning_rate': 0.00027013676950636144, 'epoch': 0.4}
+ 40%|███▉      | 2684/6790 [1:33:07<2:18:13,  2.02s/it] 40%|███▉      | 2685/6790 [1:33:10<2:23:19,  2.09s/it]                                                       {'loss': 1.6066, 'learning_rate': 0.00027004880714611524, 'epoch': 0.4}
+ 40%|███▉      | 2685/6790 [1:33:10<2:23:19,  2.09s/it] 40%|███▉      | 2686/6790 [1:33:12<2:30:34,  2.20s/it]                                                       {'loss': 1.5111, 'learning_rate': 0.00026996082933872326, 'epoch': 0.4}
+ 40%|███▉      | 2686/6790 [1:33:12<2:30:34,  2.20s/it] 40%|███▉      | 2687/6790 [1:33:14<2:29:45,  2.19s/it]                                                       {'loss': 1.7013, 'learning_rate': 0.00026987283610358637, 'epoch': 0.4}
+ 40%|███▉      | 2687/6790 [1:33:14<2:29:45,  2.19s/it] 40%|███▉      | 2688/6790 [1:33:17<2:33:34,  2.25s/it]                                                       {'loss': 1.4031, 'learning_rate': 0.0002697848274601087, 'epoch': 0.4}
+ 40%|███▉      | 2688/6790 [1:33:17<2:33:34,  2.25s/it] 40%|███▉      | 2689/6790 [1:33:19<2:34:14,  2.26s/it]                                                       {'loss': 1.547, 'learning_rate': 0.00026969680342769795, 'epoch': 0.4}
+ 40%|███▉      | 2689/6790 [1:33:19<2:34:14,  2.26s/it] 40%|███▉      | 2690/6790 [1:33:21<2:31:31,  2.22s/it]                                                       {'loss': 1.5198, 'learning_rate': 0.0002696087640257652, 'epoch': 0.4}
+ 40%|███▉      | 2690/6790 [1:33:21<2:31:31,  2.22s/it] 40%|███▉      | 2691/6790 [1:33:23<2:26:10,  2.14s/it]                                                       {'loss': 1.4506, 'learning_rate': 0.0002695207092737248, 'epoch': 0.4}
+ 40%|███▉      | 2691/6790 [1:33:23<2:26:10,  2.14s/it] 40%|███▉      | 2692/6790 [1:33:25<2:25:53,  2.14s/it]                                                       {'loss': 1.5763, 'learning_rate': 0.0002694326391909946, 'epoch': 0.4}
+ 40%|███▉      | 2692/6790 [1:33:25<2:25:53,  2.14s/it] 40%|███▉      | 2693/6790 [1:33:27<2:21:48,  2.08s/it]                                                       {'loss': 1.4048, 'learning_rate': 0.0002693445537969958, 'epoch': 0.4}
+ 40%|███▉      | 2693/6790 [1:33:27<2:21:48,  2.08s/it] 40%|███▉      | 2694/6790 [1:33:29<2:24:24,  2.12s/it]                                                       {'loss': 1.4724, 'learning_rate': 0.00026925645311115303, 'epoch': 0.4}
+ 40%|███▉      | 2694/6790 [1:33:29<2:24:24,  2.12s/it] 40%|███▉      | 2695/6790 [1:33:32<2:37:04,  2.30s/it]                                                       {'loss': 1.4396, 'learning_rate': 0.0002691683371528941, 'epoch': 0.4}
+ 40%|███▉      | 2695/6790 [1:33:32<2:37:04,  2.30s/it] 40%|███▉      | 2696/6790 [1:33:34<2:29:26,  2.19s/it]                                                       {'loss': 1.4945, 'learning_rate': 0.00026908020594165044, 'epoch': 0.4}
+ 40%|███▉      | 2696/6790 [1:33:34<2:29:26,  2.19s/it] 40%|███▉      | 2697/6790 [1:33:36<2:26:57,  2.15s/it]                                                       {'loss': 1.4541, 'learning_rate': 0.0002689920594968566, 'epoch': 0.4}
+ 40%|███▉      | 2697/6790 [1:33:36<2:26:57,  2.15s/it] 40%|███▉      | 2698/6790 [1:33:38<2:28:43,  2.18s/it]                                                       {'loss': 1.5915, 'learning_rate': 0.0002689038978379508, 'epoch': 0.4}
+ 40%|███▉      | 2698/6790 [1:33:38<2:28:43,  2.18s/it] 40%|███▉      | 2699/6790 [1:33:40<2:27:11,  2.16s/it]                                                       {'loss': 1.6012, 'learning_rate': 0.0002688157209843742, 'epoch': 0.4}
+ 40%|███▉      | 2699/6790 [1:33:40<2:27:11,  2.16s/it] 40%|███▉      | 2700/6790 [1:33:42<2:24:12,  2.12s/it]                                                       {'loss': 1.4065, 'learning_rate': 0.0002687275289555717, 'epoch': 0.4}
+ 40%|███▉      | 2700/6790 [1:33:42<2:24:12,  2.12s/it] 40%|███▉      | 2701/6790 [1:33:45<2:33:43,  2.26s/it]                                                       {'loss': 1.4273, 'learning_rate': 0.0002686393217709913, 'epoch': 0.4}
+ 40%|███▉      | 2701/6790 [1:33:45<2:33:43,  2.26s/it] 40%|███▉      | 2702/6790 [1:33:47<2:32:42,  2.24s/it]                                                       {'loss': 1.4029, 'learning_rate': 0.0002685510994500845, 'epoch': 0.4}
+ 40%|███▉      | 2702/6790 [1:33:47<2:32:42,  2.24s/it] 40%|███▉      | 2703/6790 [1:33:49<2:26:40,  2.15s/it]                                                       {'loss': 1.4447, 'learning_rate': 0.000268462862012306, 'epoch': 0.4}
+ 40%|███▉      | 2703/6790 [1:33:49<2:26:40,  2.15s/it] 40%|███▉      | 2704/6790 [1:33:51<2:23:58,  2.11s/it]                                                       {'loss': 1.6631, 'learning_rate': 0.00026837460947711395, 'epoch': 0.4}
+ 40%|███▉      | 2704/6790 [1:33:51<2:23:58,  2.11s/it] 40%|███▉      | 2705/6790 [1:33:53<2:25:18,  2.13s/it]                                                       {'loss': 1.4509, 'learning_rate': 0.00026828634186396976, 'epoch': 0.4}
+ 40%|███▉      | 2705/6790 [1:33:53<2:25:18,  2.13s/it] 40%|███▉      | 2706/6790 [1:33:55<2:20:50,  2.07s/it]                                                       {'loss': 1.4557, 'learning_rate': 0.0002681980591923381, 'epoch': 0.4}
+ 40%|███▉      | 2706/6790 [1:33:55<2:20:50,  2.07s/it] 40%|███▉      | 2707/6790 [1:33:57<2:25:29,  2.14s/it]                                                       {'loss': 1.5418, 'learning_rate': 0.00026810976148168716, 'epoch': 0.4}
+ 40%|███▉      | 2707/6790 [1:33:57<2:25:29,  2.14s/it] 40%|███▉      | 2708/6790 [1:33:59<2:22:19,  2.09s/it]                                                       {'loss': 1.4999, 'learning_rate': 0.0002680214487514883, 'epoch': 0.4}
+ 40%|███▉      | 2708/6790 [1:33:59<2:22:19,  2.09s/it] 40%|███▉      | 2709/6790 [1:34:02<2:22:29,  2.09s/it]                                                       {'loss': 1.6502, 'learning_rate': 0.0002679331210212161, 'epoch': 0.4}
+ 40%|███▉      | 2709/6790 [1:34:02<2:22:29,  2.09s/it] 40%|███▉      | 2710/6790 [1:34:03<2:15:51,  2.00s/it]                                                       {'loss': 1.5322, 'learning_rate': 0.00026784477831034883, 'epoch': 0.4}
+ 40%|███▉      | 2710/6790 [1:34:03<2:15:51,  2.00s/it] 40%|███▉      | 2711/6790 [1:34:05<2:13:17,  1.96s/it]                                                       {'loss': 1.4772, 'learning_rate': 0.0002677564206383675, 'epoch': 0.4}
+ 40%|███▉      | 2711/6790 [1:34:05<2:13:17,  1.96s/it] 40%|███▉      | 2712/6790 [1:34:07<2:13:36,  1.97s/it]                                                       {'loss': 1.4124, 'learning_rate': 0.000267668048024757, 'epoch': 0.4}
+ 40%|███▉      | 2712/6790 [1:34:07<2:13:36,  1.97s/it] 40%|███▉      | 2713/6790 [1:34:09<2:12:25,  1.95s/it]                                                       {'loss': 1.7345, 'learning_rate': 0.00026757966048900506, 'epoch': 0.4}
+ 40%|███▉      | 2713/6790 [1:34:09<2:12:25,  1.95s/it] 40%|███▉      | 2714/6790 [1:34:11<2:22:22,  2.10s/it]                                                       {'loss': 1.642, 'learning_rate': 0.00026749125805060293, 'epoch': 0.4}
+ 40%|███▉      | 2714/6790 [1:34:11<2:22:22,  2.10s/it] 40%|███▉      | 2715/6790 [1:34:13<2:18:28,  2.04s/it]                                                       {'loss': 1.5261, 'learning_rate': 0.0002674028407290451, 'epoch': 0.4}
+ 40%|███▉      | 2715/6790 [1:34:13<2:18:28,  2.04s/it] 40%|████      | 2716/6790 [1:34:15<2:17:31,  2.03s/it]                                                       {'loss': 1.283, 'learning_rate': 0.0002673144085438293, 'epoch': 0.4}
+ 40%|████      | 2716/6790 [1:34:15<2:17:31,  2.03s/it] 40%|████      | 2717/6790 [1:34:17<2:17:28,  2.03s/it]                                                       {'loss': 1.5188, 'learning_rate': 0.00026722596151445665, 'epoch': 0.4}
+ 40%|████      | 2717/6790 [1:34:17<2:17:28,  2.03s/it] 40%|████      | 2718/6790 [1:34:20<2:19:26,  2.05s/it]                                                       {'loss': 1.3755, 'learning_rate': 0.00026713749966043133, 'epoch': 0.4}
+ 40%|████      | 2718/6790 [1:34:20<2:19:26,  2.05s/it] 40%|████      | 2719/6790 [1:34:21<2:12:20,  1.95s/it]                                                       {'loss': 1.3268, 'learning_rate': 0.00026704902300126116, 'epoch': 0.4}
+ 40%|████      | 2719/6790 [1:34:21<2:12:20,  1.95s/it] 40%|████      | 2720/6790 [1:34:23<2:10:18,  1.92s/it]                                                       {'loss': 1.3515, 'learning_rate': 0.0002669605315564567, 'epoch': 0.4}
+ 40%|████      | 2720/6790 [1:34:23<2:10:18,  1.92s/it] 40%|████      | 2721/6790 [1:34:25<2:17:58,  2.03s/it]                                                       {'loss': 1.3937, 'learning_rate': 0.0002668720253455323, 'epoch': 0.4}
+ 40%|████      | 2721/6790 [1:34:25<2:17:58,  2.03s/it] 40%|████      | 2722/6790 [1:34:27<2:14:08,  1.98s/it]                                                       {'loss': 1.507, 'learning_rate': 0.00026678350438800514, 'epoch': 0.4}
+ 40%|████      | 2722/6790 [1:34:27<2:14:08,  1.98s/it] 40%|████      | 2723/6790 [1:34:30<2:23:12,  2.11s/it]                                                       {'loss': 1.4121, 'learning_rate': 0.00026669496870339597, 'epoch': 0.4}
+ 40%|████      | 2723/6790 [1:34:30<2:23:12,  2.11s/it] 40%|████      | 2724/6790 [1:34:31<2:15:52,  2.01s/it]                                                       {'loss': 1.6155, 'learning_rate': 0.00026660641831122866, 'epoch': 0.4}
+ 40%|████      | 2724/6790 [1:34:31<2:15:52,  2.01s/it] 40%|████      | 2725/6790 [1:34:34<2:20:54,  2.08s/it]                                                       {'loss': 1.4592, 'learning_rate': 0.0002665178532310303, 'epoch': 0.4}
+ 40%|████      | 2725/6790 [1:34:34<2:20:54,  2.08s/it] 40%|████      | 2726/6790 [1:34:36<2:19:09,  2.05s/it]                                                       {'loss': 1.614, 'learning_rate': 0.0002664292734823311, 'epoch': 0.4}
+ 40%|████      | 2726/6790 [1:34:36<2:19:09,  2.05s/it] 40%|████      | 2727/6790 [1:34:38<2:14:40,  1.99s/it]                                                       {'loss': 1.5052, 'learning_rate': 0.0002663406790846649, 'epoch': 0.4}
+ 40%|████      | 2727/6790 [1:34:38<2:14:40,  1.99s/it] 40%|████      | 2728/6790 [1:34:40<2:18:19,  2.04s/it]                                                       {'loss': 1.5089, 'learning_rate': 0.00026625207005756833, 'epoch': 0.4}
+ 40%|████      | 2728/6790 [1:34:40<2:18:19,  2.04s/it] 40%|████      | 2729/6790 [1:34:42<2:18:05,  2.04s/it]                                                       {'loss': 1.5977, 'learning_rate': 0.0002661634464205815, 'epoch': 0.4}
+ 40%|████      | 2729/6790 [1:34:42<2:18:05,  2.04s/it] 40%|████      | 2730/6790 [1:34:44<2:31:44,  2.24s/it]                                                       {'loss': 1.5722, 'learning_rate': 0.00026607480819324766, 'epoch': 0.4}
+ 40%|████      | 2730/6790 [1:34:44<2:31:44,  2.24s/it] 40%|████      | 2731/6790 [1:34:46<2:25:28,  2.15s/it]                                                       {'loss': 1.4461, 'learning_rate': 0.0002659861553951133, 'epoch': 0.4}
+ 40%|████      | 2731/6790 [1:34:46<2:25:28,  2.15s/it] 40%|████      | 2732/6790 [1:34:49<2:27:40,  2.18s/it]                                                       {'loss': 1.4422, 'learning_rate': 0.00026589748804572804, 'epoch': 0.4}
+ 40%|████      | 2732/6790 [1:34:49<2:27:40,  2.18s/it] 40%|████      | 2733/6790 [1:34:51<2:28:43,  2.20s/it]                                                       {'loss': 1.4643, 'learning_rate': 0.00026580880616464494, 'epoch': 0.4}
+ 40%|████      | 2733/6790 [1:34:51<2:28:43,  2.20s/it] 40%|████      | 2734/6790 [1:34:53<2:30:46,  2.23s/it]                                                       {'loss': 1.5432, 'learning_rate': 0.00026572010977141987, 'epoch': 0.4}
+ 40%|████      | 2734/6790 [1:34:53<2:30:46,  2.23s/it] 40%|████      | 2735/6790 [1:34:55<2:25:46,  2.16s/it]                                                       {'loss': 1.4908, 'learning_rate': 0.0002656313988856124, 'epoch': 0.4}
+ 40%|████      | 2735/6790 [1:34:55<2:25:46,  2.16s/it] 40%|████      | 2736/6790 [1:34:57<2:22:49,  2.11s/it]                                                       {'loss': 1.5116, 'learning_rate': 0.0002655426735267848, 'epoch': 0.4}
+ 40%|████      | 2736/6790 [1:34:57<2:22:49,  2.11s/it] 40%|████      | 2737/6790 [1:34:59<2:20:46,  2.08s/it]                                                       {'loss': 1.5444, 'learning_rate': 0.000265453933714503, 'epoch': 0.4}
+ 40%|████      | 2737/6790 [1:34:59<2:20:46,  2.08s/it] 40%|████      | 2738/6790 [1:35:01<2:18:28,  2.05s/it]                                                       {'loss': 1.4084, 'learning_rate': 0.00026536517946833564, 'epoch': 0.4}
+ 40%|████      | 2738/6790 [1:35:01<2:18:28,  2.05s/it] 40%|████      | 2739/6790 [1:35:03<2:16:22,  2.02s/it]                                                       {'loss': 1.5277, 'learning_rate': 0.00026527641080785496, 'epoch': 0.4}
+ 40%|████      | 2739/6790 [1:35:03<2:16:22,  2.02s/it] 40%|████      | 2740/6790 [1:35:05<2:19:29,  2.07s/it]                                                       {'loss': 1.5153, 'learning_rate': 0.0002651876277526362, 'epoch': 0.4}
+ 40%|████      | 2740/6790 [1:35:05<2:19:29,  2.07s/it] 40%|████      | 2741/6790 [1:35:07<2:21:31,  2.10s/it]                                                       {'loss': 1.5749, 'learning_rate': 0.0002650988303222576, 'epoch': 0.4}
+ 40%|████      | 2741/6790 [1:35:07<2:21:31,  2.10s/it] 40%|████      | 2742/6790 [1:35:09<2:18:52,  2.06s/it]                                                       {'loss': 1.6306, 'learning_rate': 0.0002650100185363009, 'epoch': 0.4}
+ 40%|████      | 2742/6790 [1:35:09<2:18:52,  2.06s/it] 40%|████      | 2743/6790 [1:35:12<2:22:48,  2.12s/it]                                                       {'loss': 1.5822, 'learning_rate': 0.0002649211924143508, 'epoch': 0.4}
+ 40%|████      | 2743/6790 [1:35:12<2:22:48,  2.12s/it] 40%|████      | 2744/6790 [1:35:14<2:21:51,  2.10s/it]                                                       {'loss': 1.5454, 'learning_rate': 0.0002648323519759953, 'epoch': 0.4}
+ 40%|████      | 2744/6790 [1:35:14<2:21:51,  2.10s/it] 40%|████      | 2745/6790 [1:35:16<2:21:53,  2.10s/it]                                                       {'loss': 1.5726, 'learning_rate': 0.00026474349724082535, 'epoch': 0.4}
+ 40%|████      | 2745/6790 [1:35:16<2:21:53,  2.10s/it] 40%|████      | 2746/6790 [1:35:18<2:15:02,  2.00s/it]                                                       {'loss': 1.4556, 'learning_rate': 0.00026465462822843533, 'epoch': 0.4}
+ 40%|████      | 2746/6790 [1:35:18<2:15:02,  2.00s/it] 40%|████      | 2747/6790 [1:35:20<2:13:17,  1.98s/it]                                                       {'loss': 1.5019, 'learning_rate': 0.0002645657449584224, 'epoch': 0.4}
+ 40%|████      | 2747/6790 [1:35:20<2:13:17,  1.98s/it] 40%|████      | 2748/6790 [1:35:22<2:23:46,  2.13s/it]                                                       {'loss': 1.5357, 'learning_rate': 0.00026447684745038724, 'epoch': 0.4}
+ 40%|████      | 2748/6790 [1:35:22<2:23:46,  2.13s/it] 40%|████      | 2749/6790 [1:35:24<2:20:49,  2.09s/it]                                                       {'loss': 1.5838, 'learning_rate': 0.0002643879357239335, 'epoch': 0.4}
+ 40%|████      | 2749/6790 [1:35:24<2:20:49,  2.09s/it] 41%|████      | 2750/6790 [1:35:26<2:19:41,  2.07s/it]                                                       {'loss': 1.2753, 'learning_rate': 0.00026429900979866786, 'epoch': 0.41}
+ 41%|████      | 2750/6790 [1:35:26<2:19:41,  2.07s/it] 41%|████      | 2751/6790 [1:35:28<2:21:21,  2.10s/it]                                                       {'loss': 1.5787, 'learning_rate': 0.00026421006969420035, 'epoch': 0.41}
+ 41%|████      | 2751/6790 [1:35:28<2:21:21,  2.10s/it] 41%|████      | 2752/6790 [1:35:30<2:18:57,  2.06s/it]                                                       {'loss': 1.4022, 'learning_rate': 0.00026412111543014393, 'epoch': 0.41}
+ 41%|████      | 2752/6790 [1:35:30<2:18:57,  2.06s/it] 41%|████      | 2753/6790 [1:35:32<2:15:44,  2.02s/it]                                                       {'loss': 1.5296, 'learning_rate': 0.00026403214702611495, 'epoch': 0.41}
+ 41%|████      | 2753/6790 [1:35:32<2:15:44,  2.02s/it] 41%|████      | 2754/6790 [1:35:34<2:15:52,  2.02s/it]                                                       {'loss': 1.4026, 'learning_rate': 0.0002639431645017325, 'epoch': 0.41}
+ 41%|████      | 2754/6790 [1:35:34<2:15:52,  2.02s/it] 41%|████      | 2755/6790 [1:35:36<2:21:39,  2.11s/it]                                                       {'loss': 1.5486, 'learning_rate': 0.000263854167876619, 'epoch': 0.41}
+ 41%|████      | 2755/6790 [1:35:36<2:21:39,  2.11s/it] 41%|████      | 2756/6790 [1:35:39<2:37:57,  2.35s/it]                                                       {'loss': 1.4526, 'learning_rate': 0.00026376515717040013, 'epoch': 0.41}
+ 41%|████      | 2756/6790 [1:35:39<2:37:57,  2.35s/it] 41%|████      | 2757/6790 [1:35:41<2:29:22,  2.22s/it]                                                       {'loss': 1.3676, 'learning_rate': 0.0002636761324027043, 'epoch': 0.41}
+ 41%|████      | 2757/6790 [1:35:41<2:29:22,  2.22s/it] 41%|████      | 2758/6790 [1:35:43<2:22:06,  2.11s/it]                                                       {'loss': 1.4442, 'learning_rate': 0.00026358709359316346, 'epoch': 0.41}
+ 41%|████      | 2758/6790 [1:35:43<2:22:06,  2.11s/it] 41%|████      | 2759/6790 [1:35:45<2:19:33,  2.08s/it]                                                       {'loss': 1.4338, 'learning_rate': 0.00026349804076141223, 'epoch': 0.41}
+ 41%|████      | 2759/6790 [1:35:45<2:19:33,  2.08s/it] 41%|████      | 2760/6790 [1:35:47<2:17:15,  2.04s/it]                                                       {'loss': 1.6938, 'learning_rate': 0.0002634089739270886, 'epoch': 0.41}
+ 41%|████      | 2760/6790 [1:35:47<2:17:15,  2.04s/it] 41%|████      | 2761/6790 [1:35:49<2:13:40,  1.99s/it]                                                       {'loss': 1.3292, 'learning_rate': 0.0002633198931098335, 'epoch': 0.41}
+ 41%|████      | 2761/6790 [1:35:49<2:13:40,  1.99s/it] 41%|████      | 2762/6790 [1:35:51<2:15:01,  2.01s/it]                                                       {'loss': 1.6125, 'learning_rate': 0.00026323079832929117, 'epoch': 0.41}
+ 41%|████      | 2762/6790 [1:35:51<2:15:01,  2.01s/it] 41%|████      | 2763/6790 [1:35:53<2:11:11,  1.95s/it]                                                       {'loss': 1.545, 'learning_rate': 0.0002631416896051086, 'epoch': 0.41}
+ 41%|████      | 2763/6790 [1:35:53<2:11:11,  1.95s/it] 41%|████      | 2764/6790 [1:35:55<2:08:04,  1.91s/it]                                                       {'loss': 1.2856, 'learning_rate': 0.0002630525669569361, 'epoch': 0.41}
+ 41%|████      | 2764/6790 [1:35:55<2:08:04,  1.91s/it] 41%|████      | 2765/6790 [1:35:57<2:09:43,  1.93s/it]                                                       {'loss': 1.64, 'learning_rate': 0.00026296343040442695, 'epoch': 0.41}
+ 41%|████      | 2765/6790 [1:35:57<2:09:43,  1.93s/it] 41%|████      | 2766/6790 [1:35:59<2:13:59,  2.00s/it]                                                       {'loss': 1.6693, 'learning_rate': 0.00026287427996723756, 'epoch': 0.41}
+ 41%|████      | 2766/6790 [1:35:59<2:13:59,  2.00s/it] 41%|████      | 2767/6790 [1:36:01<2:13:39,  1.99s/it]                                                       {'loss': 1.461, 'learning_rate': 0.00026278511566502733, 'epoch': 0.41}
+ 41%|████      | 2767/6790 [1:36:01<2:13:39,  1.99s/it] 41%|████      | 2768/6790 [1:36:03<2:19:03,  2.07s/it]                                                       {'loss': 1.4652, 'learning_rate': 0.00026269593751745876, 'epoch': 0.41}
+ 41%|████      | 2768/6790 [1:36:03<2:19:03,  2.07s/it] 41%|████      | 2769/6790 [1:36:05<2:22:52,  2.13s/it]                                                       {'loss': 1.3957, 'learning_rate': 0.0002626067455441974, 'epoch': 0.41}
+ 41%|████      | 2769/6790 [1:36:05<2:22:52,  2.13s/it] 41%|████      | 2770/6790 [1:36:08<2:31:00,  2.25s/it]                                                       {'loss': 1.5668, 'learning_rate': 0.00026251753976491184, 'epoch': 0.41}
+ 41%|████      | 2770/6790 [1:36:08<2:31:00,  2.25s/it] 41%|████      | 2771/6790 [1:36:10<2:22:31,  2.13s/it]                                                       {'loss': 1.4126, 'learning_rate': 0.00026242832019927366, 'epoch': 0.41}
+ 41%|████      | 2771/6790 [1:36:10<2:22:31,  2.13s/it] 41%|████      | 2772/6790 [1:36:12<2:24:07,  2.15s/it]                                                       {'loss': 1.5905, 'learning_rate': 0.00026233908686695763, 'epoch': 0.41}
+ 41%|████      | 2772/6790 [1:36:12<2:24:07,  2.15s/it] 41%|████      | 2773/6790 [1:36:14<2:16:51,  2.04s/it]                                                       {'loss': 1.5971, 'learning_rate': 0.0002622498397876414, 'epoch': 0.41}
+ 41%|████      | 2773/6790 [1:36:14<2:16:51,  2.04s/it] 41%|████      | 2774/6790 [1:36:16<2:25:18,  2.17s/it]                                                       {'loss': 1.4878, 'learning_rate': 0.0002621605789810058, 'epoch': 0.41}
+ 41%|████      | 2774/6790 [1:36:16<2:25:18,  2.17s/it] 41%|████      | 2775/6790 [1:36:18<2:25:04,  2.17s/it]                                                       {'loss': 1.5474, 'learning_rate': 0.00026207130446673444, 'epoch': 0.41}
+ 41%|████      | 2775/6790 [1:36:18<2:25:04,  2.17s/it] 41%|████      | 2776/6790 [1:36:20<2:20:39,  2.10s/it]                                                       {'loss': 1.4707, 'learning_rate': 0.00026198201626451427, 'epoch': 0.41}
+ 41%|████      | 2776/6790 [1:36:20<2:20:39,  2.10s/it] 41%|████      | 2777/6790 [1:36:22<2:21:26,  2.11s/it]                                                       {'loss': 1.5486, 'learning_rate': 0.000261892714394035, 'epoch': 0.41}
+ 41%|████      | 2777/6790 [1:36:22<2:21:26,  2.11s/it] 41%|████      | 2778/6790 [1:36:24<2:19:11,  2.08s/it]                                                       {'loss': 1.4813, 'learning_rate': 0.00026180339887498953, 'epoch': 0.41}
+ 41%|████      | 2778/6790 [1:36:24<2:19:11,  2.08s/it] 41%|████      | 2779/6790 [1:36:26<2:16:43,  2.05s/it]                                                       {'loss': 1.5958, 'learning_rate': 0.0002617140697270736, 'epoch': 0.41}
+ 41%|████      | 2779/6790 [1:36:26<2:16:43,  2.05s/it] 41%|████      | 2780/6790 [1:36:28<2:17:13,  2.05s/it]                                                       {'loss': 1.6127, 'learning_rate': 0.00026162472696998623, 'epoch': 0.41}
+ 41%|████      | 2780/6790 [1:36:28<2:17:13,  2.05s/it] 41%|████      | 2781/6790 [1:36:30<2:16:07,  2.04s/it]                                                       {'loss': 1.5037, 'learning_rate': 0.00026153537062342905, 'epoch': 0.41}
+ 41%|████      | 2781/6790 [1:36:30<2:16:07,  2.04s/it] 41%|████      | 2782/6790 [1:36:32<2:16:36,  2.04s/it]                                                       {'loss': 1.761, 'learning_rate': 0.000261446000707107, 'epoch': 0.41}
+ 41%|████      | 2782/6790 [1:36:32<2:16:36,  2.04s/it] 41%|████      | 2783/6790 [1:36:34<2:14:06,  2.01s/it]                                                       {'loss': 1.5525, 'learning_rate': 0.00026135661724072795, 'epoch': 0.41}
+ 41%|████      | 2783/6790 [1:36:34<2:14:06,  2.01s/it] 41%|████      | 2784/6790 [1:36:36<2:12:37,  1.99s/it]                                                       {'loss': 1.3675, 'learning_rate': 0.00026126722024400265, 'epoch': 0.41}
+ 41%|████      | 2784/6790 [1:36:36<2:12:37,  1.99s/it] 41%|████      | 2785/6790 [1:36:38<2:12:08,  1.98s/it]                                                       {'loss': 1.6479, 'learning_rate': 0.00026117780973664506, 'epoch': 0.41}
+ 41%|████      | 2785/6790 [1:36:38<2:12:08,  1.98s/it] 41%|████      | 2786/6790 [1:36:40<2:09:43,  1.94s/it]                                                       {'loss': 1.4746, 'learning_rate': 0.00026108838573837167, 'epoch': 0.41}
+ 41%|████      | 2786/6790 [1:36:40<2:09:43,  1.94s/it] 41%|████      | 2787/6790 [1:36:42<2:16:31,  2.05s/it]                                                       {'loss': 1.5219, 'learning_rate': 0.0002609989482689025, 'epoch': 0.41}
+ 41%|████      | 2787/6790 [1:36:42<2:16:31,  2.05s/it] 41%|████      | 2788/6790 [1:36:45<2:20:48,  2.11s/it]                                                       {'loss': 1.476, 'learning_rate': 0.00026090949734796016, 'epoch': 0.41}
+ 41%|████      | 2788/6790 [1:36:45<2:20:48,  2.11s/it] 41%|████      | 2789/6790 [1:36:47<2:26:23,  2.20s/it]                                                       {'loss': 1.4395, 'learning_rate': 0.0002608200329952703, 'epoch': 0.41}
+ 41%|████      | 2789/6790 [1:36:47<2:26:23,  2.20s/it] 41%|████      | 2790/6790 [1:36:49<2:24:49,  2.17s/it]                                                       {'loss': 1.3812, 'learning_rate': 0.00026073055523056176, 'epoch': 0.41}
+ 41%|████      | 2790/6790 [1:36:49<2:24:49,  2.17s/it] 41%|████      | 2791/6790 [1:36:51<2:24:39,  2.17s/it]                                                       {'loss': 1.3467, 'learning_rate': 0.000260641064073566, 'epoch': 0.41}
+ 41%|████      | 2791/6790 [1:36:51<2:24:39,  2.17s/it] 41%|████      | 2792/6790 [1:36:53<2:22:39,  2.14s/it]                                                       {'loss': 1.423, 'learning_rate': 0.00026055155954401765, 'epoch': 0.41}
+ 41%|████      | 2792/6790 [1:36:53<2:22:39,  2.14s/it] 41%|████      | 2793/6790 [1:36:55<2:18:37,  2.08s/it]                                                       {'loss': 1.3959, 'learning_rate': 0.00026046204166165415, 'epoch': 0.41}
+ 41%|████      | 2793/6790 [1:36:55<2:18:37,  2.08s/it] 41%|████      | 2794/6790 [1:36:58<2:19:33,  2.10s/it]                                                       {'loss': 1.47, 'learning_rate': 0.00026037251044621604, 'epoch': 0.41}
+ 41%|████      | 2794/6790 [1:36:58<2:19:33,  2.10s/it] 41%|████      | 2795/6790 [1:37:00<2:18:57,  2.09s/it]                                                       {'loss': 1.4705, 'learning_rate': 0.0002602829659174467, 'epoch': 0.41}
+ 41%|████      | 2795/6790 [1:37:00<2:18:57,  2.09s/it] 41%|████      | 2796/6790 [1:37:02<2:20:06,  2.10s/it]                                                       {'loss': 1.5466, 'learning_rate': 0.0002601934080950925, 'epoch': 0.41}
+ 41%|████      | 2796/6790 [1:37:02<2:20:06,  2.10s/it] 41%|████      | 2797/6790 [1:37:04<2:15:35,  2.04s/it]                                                       {'loss': 1.408, 'learning_rate': 0.0002601038369989026, 'epoch': 0.41}
+ 41%|████      | 2797/6790 [1:37:04<2:15:35,  2.04s/it] 41%|████      | 2798/6790 [1:37:06<2:14:02,  2.01s/it]                                                       {'loss': 1.6283, 'learning_rate': 0.0002600142526486293, 'epoch': 0.41}
+ 41%|████      | 2798/6790 [1:37:06<2:14:02,  2.01s/it] 41%|████      | 2799/6790 [1:37:08<2:17:23,  2.07s/it]                                                       {'loss': 1.4465, 'learning_rate': 0.0002599246550640278, 'epoch': 0.41}
+ 41%|████      | 2799/6790 [1:37:08<2:17:23,  2.07s/it] 41%|████      | 2800/6790 [1:37:10<2:18:33,  2.08s/it]                                                       {'loss': 1.5502, 'learning_rate': 0.0002598350442648559, 'epoch': 0.41}
+ 41%|████      | 2800/6790 [1:37:10<2:18:33,  2.08s/it] 41%|████▏     | 2801/6790 [1:37:12<2:19:25,  2.10s/it]                                                       {'loss': 1.4744, 'learning_rate': 0.00025974542027087477, 'epoch': 0.41}
+ 41%|████▏     | 2801/6790 [1:37:12<2:19:25,  2.10s/it] 41%|████▏     | 2802/6790 [1:37:14<2:15:15,  2.03s/it]                                                       {'loss': 1.3366, 'learning_rate': 0.00025965578310184814, 'epoch': 0.41}
+ 41%|████▏     | 2802/6790 [1:37:14<2:15:15,  2.03s/it] 41%|████▏     | 2803/6790 [1:37:16<2:19:46,  2.10s/it]                                                       {'loss': 1.4317, 'learning_rate': 0.00025956613277754284, 'epoch': 0.41}
+ 41%|████▏     | 2803/6790 [1:37:16<2:19:46,  2.10s/it] 41%|████▏     | 2804/6790 [1:37:18<2:15:27,  2.04s/it]                                                       {'loss': 1.2146, 'learning_rate': 0.00025947646931772847, 'epoch': 0.41}
+ 41%|████▏     | 2804/6790 [1:37:18<2:15:27,  2.04s/it] 41%|████▏     | 2805/6790 [1:37:20<2:15:35,  2.04s/it]                                                       {'loss': 1.5558, 'learning_rate': 0.00025938679274217763, 'epoch': 0.41}
+ 41%|████▏     | 2805/6790 [1:37:20<2:15:35,  2.04s/it] 41%|████▏     | 2806/6790 [1:37:22<2:17:39,  2.07s/it]                                                       {'loss': 1.3899, 'learning_rate': 0.00025929710307066585, 'epoch': 0.41}
+ 41%|████▏     | 2806/6790 [1:37:22<2:17:39,  2.07s/it] 41%|████▏     | 2807/6790 [1:37:25<2:21:06,  2.13s/it]                                                       {'loss': 1.6333, 'learning_rate': 0.00025920740032297135, 'epoch': 0.41}
+ 41%|████▏     | 2807/6790 [1:37:25<2:21:06,  2.13s/it] 41%|████▏     | 2808/6790 [1:37:27<2:22:02,  2.14s/it]                                                       {'loss': 1.3715, 'learning_rate': 0.00025911768451887556, 'epoch': 0.41}
+ 41%|████▏     | 2808/6790 [1:37:27<2:22:02,  2.14s/it] 41%|████▏     | 2809/6790 [1:37:29<2:16:09,  2.05s/it]                                                       {'loss': 1.4512, 'learning_rate': 0.0002590279556781623, 'epoch': 0.41}
+ 41%|████▏     | 2809/6790 [1:37:29<2:16:09,  2.05s/it] 41%|████▏     | 2810/6790 [1:37:31<2:15:00,  2.04s/it]                                                       {'loss': 1.6156, 'learning_rate': 0.00025893821382061877, 'epoch': 0.41}
+ 41%|████▏     | 2810/6790 [1:37:31<2:15:00,  2.04s/it] 41%|████▏     | 2811/6790 [1:37:33<2:16:44,  2.06s/it]                                                       {'loss': 1.6794, 'learning_rate': 0.00025884845896603466, 'epoch': 0.41}
+ 41%|████▏     | 2811/6790 [1:37:33<2:16:44,  2.06s/it] 41%|████▏     | 2812/6790 [1:37:36<2:38:51,  2.40s/it]                                                       {'loss': 1.3133, 'learning_rate': 0.00025875869113420287, 'epoch': 0.41}
+ 41%|████▏     | 2812/6790 [1:37:36<2:38:51,  2.40s/it] 41%|████▏     | 2813/6790 [1:37:38<2:28:01,  2.23s/it]                                                       {'loss': 1.4726, 'learning_rate': 0.00025866891034491884, 'epoch': 0.41}
+ 41%|████▏     | 2813/6790 [1:37:38<2:28:01,  2.23s/it] 41%|████▏     | 2814/6790 [1:37:40<2:24:02,  2.17s/it]                                                       {'loss': 1.5433, 'learning_rate': 0.0002585791166179811, 'epoch': 0.41}
+ 41%|████▏     | 2814/6790 [1:37:40<2:24:02,  2.17s/it] 41%|████▏     | 2815/6790 [1:37:42<2:17:22,  2.07s/it]                                                       {'loss': 1.4702, 'learning_rate': 0.00025848930997319087, 'epoch': 0.41}
+ 41%|████▏     | 2815/6790 [1:37:42<2:17:22,  2.07s/it] 41%|████▏     | 2816/6790 [1:37:43<2:14:05,  2.02s/it]                                                       {'loss': 1.3795, 'learning_rate': 0.0002583994904303523, 'epoch': 0.41}
+ 41%|████▏     | 2816/6790 [1:37:43<2:14:05,  2.02s/it] 41%|████▏     | 2817/6790 [1:37:46<2:15:56,  2.05s/it]                                                       {'loss': 1.4205, 'learning_rate': 0.00025830965800927247, 'epoch': 0.41}
+ 41%|████▏     | 2817/6790 [1:37:46<2:15:56,  2.05s/it] 42%|████▏     | 2818/6790 [1:37:48<2:15:50,  2.05s/it]                                                       {'loss': 1.6177, 'learning_rate': 0.00025821981272976106, 'epoch': 0.42}
+ 42%|████▏     | 2818/6790 [1:37:48<2:15:50,  2.05s/it] 42%|████▏     | 2819/6790 [1:37:50<2:23:03,  2.16s/it]                                                       {'loss': 1.5877, 'learning_rate': 0.00025812995461163085, 'epoch': 0.42}
+ 42%|████▏     | 2819/6790 [1:37:50<2:23:03,  2.16s/it] 42%|████▏     | 2820/6790 [1:37:52<2:17:30,  2.08s/it]                                                       {'loss': 1.5863, 'learning_rate': 0.0002580400836746971, 'epoch': 0.42}
+ 42%|████▏     | 2820/6790 [1:37:52<2:17:30,  2.08s/it] 42%|████▏     | 2821/6790 [1:37:54<2:15:05,  2.04s/it]                                                       {'loss': 1.3888, 'learning_rate': 0.0002579501999387785, 'epoch': 0.42}
+ 42%|████▏     | 2821/6790 [1:37:54<2:15:05,  2.04s/it] 42%|████▏     | 2822/6790 [1:37:56<2:18:35,  2.10s/it]                                                       {'loss': 1.7352, 'learning_rate': 0.00025786030342369595, 'epoch': 0.42}
+ 42%|████▏     | 2822/6790 [1:37:56<2:18:35,  2.10s/it] 42%|████▏     | 2823/6790 [1:37:58<2:16:39,  2.07s/it]                                                       {'loss': 1.4447, 'learning_rate': 0.0002577703941492734, 'epoch': 0.42}
+ 42%|████▏     | 2823/6790 [1:37:58<2:16:39,  2.07s/it] 42%|████▏     | 2824/6790 [1:38:00<2:15:55,  2.06s/it]                                                       {'loss': 1.4701, 'learning_rate': 0.0002576804721353377, 'epoch': 0.42}
+ 42%|████▏     | 2824/6790 [1:38:00<2:15:55,  2.06s/it] 42%|████▏     | 2825/6790 [1:38:02<2:12:08,  2.00s/it]                                                       {'loss': 1.5681, 'learning_rate': 0.0002575905374017184, 'epoch': 0.42}
+ 42%|████▏     | 2825/6790 [1:38:02<2:12:08,  2.00s/it] 42%|████▏     | 2826/6790 [1:38:04<2:19:26,  2.11s/it]                                                       {'loss': 1.3401, 'learning_rate': 0.0002575005899682479, 'epoch': 0.42}
+ 42%|████▏     | 2826/6790 [1:38:04<2:19:26,  2.11s/it] 42%|████▏     | 2827/6790 [1:38:06<2:15:46,  2.06s/it]                                                       {'loss': 1.6369, 'learning_rate': 0.0002574106298547613, 'epoch': 0.42}
+ 42%|████▏     | 2827/6790 [1:38:06<2:15:46,  2.06s/it] 42%|████▏     | 2828/6790 [1:38:08<2:13:35,  2.02s/it]                                                       {'loss': 1.4719, 'learning_rate': 0.00025732065708109663, 'epoch': 0.42}
+ 42%|████▏     | 2828/6790 [1:38:08<2:13:35,  2.02s/it] 42%|████▏     | 2829/6790 [1:38:10<2:12:51,  2.01s/it]                                                       {'loss': 1.4069, 'learning_rate': 0.0002572306716670948, 'epoch': 0.42}
+ 42%|████▏     | 2829/6790 [1:38:10<2:12:51,  2.01s/it] 42%|████▏     | 2830/6790 [1:38:12<2:16:22,  2.07s/it]                                                       {'loss': 1.7314, 'learning_rate': 0.0002571406736325992, 'epoch': 0.42}
+ 42%|████▏     | 2830/6790 [1:38:12<2:16:22,  2.07s/it] 42%|████▏     | 2831/6790 [1:38:15<2:16:41,  2.07s/it]                                                       {'loss': 1.5916, 'learning_rate': 0.00025705066299745624, 'epoch': 0.42}
+ 42%|████▏     | 2831/6790 [1:38:15<2:16:41,  2.07s/it] 42%|████▏     | 2832/6790 [1:38:17<2:20:10,  2.12s/it]                                                       {'loss': 1.5672, 'learning_rate': 0.00025696063978151507, 'epoch': 0.42}
+ 42%|████▏     | 2832/6790 [1:38:17<2:20:10,  2.12s/it] 42%|████▏     | 2833/6790 [1:38:19<2:24:14,  2.19s/it]                                                       {'loss': 1.6966, 'learning_rate': 0.00025687060400462754, 'epoch': 0.42}
+ 42%|████▏     | 2833/6790 [1:38:19<2:24:14,  2.19s/it] 42%|████▏     | 2834/6790 [1:38:21<2:17:07,  2.08s/it]                                                       {'loss': 1.3916, 'learning_rate': 0.0002567805556866483, 'epoch': 0.42}
+ 42%|████▏     | 2834/6790 [1:38:21<2:17:07,  2.08s/it] 42%|████▏     | 2835/6790 [1:38:23<2:14:03,  2.03s/it]                                                       {'loss': 1.3723, 'learning_rate': 0.00025669049484743485, 'epoch': 0.42}
+ 42%|████▏     | 2835/6790 [1:38:23<2:14:03,  2.03s/it] 42%|████▏     | 2836/6790 [1:38:25<2:14:01,  2.03s/it]                                                       {'loss': 1.425, 'learning_rate': 0.00025660042150684733, 'epoch': 0.42}
+ 42%|████▏     | 2836/6790 [1:38:25<2:14:01,  2.03s/it] 42%|████▏     | 2837/6790 [1:38:27<2:16:11,  2.07s/it]                                                       {'loss': 1.4998, 'learning_rate': 0.0002565103356847487, 'epoch': 0.42}
+ 42%|████▏     | 2837/6790 [1:38:27<2:16:11,  2.07s/it] 42%|████▏     | 2838/6790 [1:38:29<2:12:10,  2.01s/it]                                                       {'loss': 1.4664, 'learning_rate': 0.0002564202374010047, 'epoch': 0.42}
+ 42%|████▏     | 2838/6790 [1:38:29<2:12:10,  2.01s/it] 42%|████▏     | 2839/6790 [1:38:32<2:24:29,  2.19s/it]                                                       {'loss': 1.5878, 'learning_rate': 0.0002563301266754837, 'epoch': 0.42}
+ 42%|████▏     | 2839/6790 [1:38:32<2:24:29,  2.19s/it] 42%|████▏     | 2840/6790 [1:38:33<2:16:52,  2.08s/it]                                                       {'loss': 1.4324, 'learning_rate': 0.00025624000352805705, 'epoch': 0.42}
+ 42%|████▏     | 2840/6790 [1:38:33<2:16:52,  2.08s/it] 42%|████▏     | 2841/6790 [1:38:35<2:12:04,  2.01s/it]                                                       {'loss': 1.4682, 'learning_rate': 0.0002561498679785985, 'epoch': 0.42}
+ 42%|████▏     | 2841/6790 [1:38:35<2:12:04,  2.01s/it] 42%|████▏     | 2842/6790 [1:38:38<2:34:43,  2.35s/it]                                                       {'loss': 1.4051, 'learning_rate': 0.0002560597200469848, 'epoch': 0.42}
+ 42%|████▏     | 2842/6790 [1:38:38<2:34:43,  2.35s/it] 42%|████▏     | 2843/6790 [1:38:40<2:26:03,  2.22s/it]                                                       {'loss': 1.5633, 'learning_rate': 0.0002559695597530954, 'epoch': 0.42}
+ 42%|████▏     | 2843/6790 [1:38:40<2:26:03,  2.22s/it] 42%|████▏     | 2844/6790 [1:38:42<2:19:41,  2.12s/it]                                                       {'loss': 1.5929, 'learning_rate': 0.0002558793871168124, 'epoch': 0.42}
+ 42%|████▏     | 2844/6790 [1:38:42<2:19:41,  2.12s/it] 42%|████▏     | 2845/6790 [1:38:44<2:13:09,  2.03s/it]                                                       {'loss': 1.3421, 'learning_rate': 0.00025578920215802055, 'epoch': 0.42}
+ 42%|████▏     | 2845/6790 [1:38:44<2:13:09,  2.03s/it] 42%|████▏     | 2846/6790 [1:38:46<2:14:03,  2.04s/it]                                                       {'loss': 1.3859, 'learning_rate': 0.00025569900489660755, 'epoch': 0.42}
+ 42%|████▏     | 2846/6790 [1:38:46<2:14:03,  2.04s/it] 42%|████▏     | 2847/6790 [1:38:48<2:21:49,  2.16s/it]                                                       {'loss': 1.4332, 'learning_rate': 0.00025560879535246363, 'epoch': 0.42}
+ 42%|████▏     | 2847/6790 [1:38:48<2:21:49,  2.16s/it] 42%|████▏     | 2848/6790 [1:38:51<2:23:56,  2.19s/it]                                                       {'loss': 1.3254, 'learning_rate': 0.0002555185735454817, 'epoch': 0.42}
+ 42%|████▏     | 2848/6790 [1:38:51<2:23:56,  2.19s/it] 42%|████▏     | 2849/6790 [1:38:53<2:18:21,  2.11s/it]                                                       {'loss': 1.3431, 'learning_rate': 0.00025542833949555757, 'epoch': 0.42}
+ 42%|████▏     | 2849/6790 [1:38:53<2:18:21,  2.11s/it] 42%|████▏     | 2850/6790 [1:38:55<2:16:56,  2.09s/it]                                                       {'loss': 1.6145, 'learning_rate': 0.00025533809322258956, 'epoch': 0.42}
+ 42%|████▏     | 2850/6790 [1:38:55<2:16:56,  2.09s/it] 42%|████▏     | 2851/6790 [1:38:57<2:17:27,  2.09s/it]                                                       {'loss': 1.59, 'learning_rate': 0.0002552478347464788, 'epoch': 0.42}
+ 42%|████▏     | 2851/6790 [1:38:57<2:17:27,  2.09s/it] 42%|████▏     | 2852/6790 [1:38:59<2:17:31,  2.10s/it]                                                       {'loss': 1.4986, 'learning_rate': 0.000255157564087129, 'epoch': 0.42}
+ 42%|████▏     | 2852/6790 [1:38:59<2:17:31,  2.10s/it] 42%|████▏     | 2853/6790 [1:39:01<2:13:50,  2.04s/it]                                                       {'loss': 1.6337, 'learning_rate': 0.0002550672812644467, 'epoch': 0.42}
+ 42%|████▏     | 2853/6790 [1:39:01<2:13:50,  2.04s/it] 42%|████▏     | 2854/6790 [1:39:04<2:27:41,  2.25s/it]                                                       {'loss': 1.6263, 'learning_rate': 0.00025497698629834103, 'epoch': 0.42}
+ 42%|████▏     | 2854/6790 [1:39:04<2:27:41,  2.25s/it] 42%|████▏     | 2855/6790 [1:39:05<2:20:15,  2.14s/it]                                                       {'loss': 1.582, 'learning_rate': 0.00025488667920872373, 'epoch': 0.42}
+ 42%|████▏     | 2855/6790 [1:39:05<2:20:15,  2.14s/it] 42%|████▏     | 2856/6790 [1:39:08<2:23:48,  2.19s/it]                                                       {'loss': 1.5368, 'learning_rate': 0.0002547963600155094, 'epoch': 0.42}
+ 42%|████▏     | 2856/6790 [1:39:08<2:23:48,  2.19s/it] 42%|████▏     | 2857/6790 [1:39:10<2:17:17,  2.09s/it]                                                       {'loss': 1.5488, 'learning_rate': 0.00025470602873861516, 'epoch': 0.42}
+ 42%|████▏     | 2857/6790 [1:39:10<2:17:17,  2.09s/it] 42%|████▏     | 2858/6790 [1:39:12<2:22:50,  2.18s/it]                                                       {'loss': 1.612, 'learning_rate': 0.00025461568539796085, 'epoch': 0.42}
+ 42%|████▏     | 2858/6790 [1:39:12<2:22:50,  2.18s/it] 42%|████▏     | 2859/6790 [1:39:14<2:22:18,  2.17s/it]                                                       {'loss': 1.3632, 'learning_rate': 0.000254525330013469, 'epoch': 0.42}
+ 42%|████▏     | 2859/6790 [1:39:14<2:22:18,  2.17s/it] 42%|████▏     | 2860/6790 [1:39:16<2:25:05,  2.22s/it]                                                       {'loss': 1.6533, 'learning_rate': 0.00025443496260506467, 'epoch': 0.42}
+ 42%|████▏     | 2860/6790 [1:39:16<2:25:05,  2.22s/it] 42%|████▏     | 2861/6790 [1:39:18<2:20:44,  2.15s/it]                                                       {'loss': 1.4145, 'learning_rate': 0.00025434458319267573, 'epoch': 0.42}
+ 42%|████▏     | 2861/6790 [1:39:18<2:20:44,  2.15s/it] 42%|████▏     | 2862/6790 [1:39:20<2:15:13,  2.07s/it]                                                       {'loss': 1.4905, 'learning_rate': 0.0002542541917962326, 'epoch': 0.42}
+ 42%|████▏     | 2862/6790 [1:39:20<2:15:13,  2.07s/it] 42%|████▏     | 2863/6790 [1:39:22<2:11:19,  2.01s/it]                                                       {'loss': 1.493, 'learning_rate': 0.00025416378843566833, 'epoch': 0.42}
+ 42%|████▏     | 2863/6790 [1:39:22<2:11:19,  2.01s/it] 42%|████▏     | 2864/6790 [1:39:24<2:11:06,  2.00s/it]                                                       {'loss': 1.49, 'learning_rate': 0.0002540733731309187, 'epoch': 0.42}
+ 42%|████▏     | 2864/6790 [1:39:24<2:11:06,  2.00s/it] 42%|████▏     | 2865/6790 [1:39:26<2:15:17,  2.07s/it]                                                       {'loss': 1.5801, 'learning_rate': 0.0002539829459019221, 'epoch': 0.42}
+ 42%|████▏     | 2865/6790 [1:39:26<2:15:17,  2.07s/it] 42%|████▏     | 2866/6790 [1:39:28<2:13:54,  2.05s/it]                                                       {'loss': 1.4859, 'learning_rate': 0.00025389250676861945, 'epoch': 0.42}
+ 42%|████▏     | 2866/6790 [1:39:28<2:13:54,  2.05s/it] 42%|████▏     | 2867/6790 [1:39:31<2:17:17,  2.10s/it]                                                       {'loss': 1.4817, 'learning_rate': 0.00025380205575095444, 'epoch': 0.42}
+ 42%|████▏     | 2867/6790 [1:39:31<2:17:17,  2.10s/it] 42%|████▏     | 2868/6790 [1:39:33<2:17:20,  2.10s/it]                                                       {'loss': 1.4706, 'learning_rate': 0.00025371159286887324, 'epoch': 0.42}
+ 42%|████▏     | 2868/6790 [1:39:33<2:17:20,  2.10s/it] 42%|████▏     | 2869/6790 [1:39:35<2:13:37,  2.04s/it]                                                       {'loss': 1.2345, 'learning_rate': 0.0002536211181423247, 'epoch': 0.42}
+ 42%|████▏     | 2869/6790 [1:39:35<2:13:37,  2.04s/it] 42%|████▏     | 2870/6790 [1:39:37<2:11:58,  2.02s/it]                                                       {'loss': 1.3118, 'learning_rate': 0.0002535306315912603, 'epoch': 0.42}
+ 42%|████▏     | 2870/6790 [1:39:37<2:11:58,  2.02s/it] 42%|████▏     | 2871/6790 [1:39:39<2:12:02,  2.02s/it]                                                       {'loss': 1.3877, 'learning_rate': 0.0002534401332356342, 'epoch': 0.42}
+ 42%|████▏     | 2871/6790 [1:39:39<2:12:02,  2.02s/it] 42%|████▏     | 2872/6790 [1:39:41<2:12:58,  2.04s/it]                                                       {'loss': 1.3485, 'learning_rate': 0.00025334962309540295, 'epoch': 0.42}
+ 42%|████▏     | 2872/6790 [1:39:41<2:12:58,  2.04s/it] 42%|████▏     | 2873/6790 [1:39:43<2:11:05,  2.01s/it]                                                       {'loss': 1.5984, 'learning_rate': 0.00025325910119052583, 'epoch': 0.42}
+ 42%|████▏     | 2873/6790 [1:39:43<2:11:05,  2.01s/it] 42%|████▏     | 2874/6790 [1:39:45<2:09:05,  1.98s/it]                                                       {'loss': 1.4415, 'learning_rate': 0.00025316856754096476, 'epoch': 0.42}
+ 42%|████▏     | 2874/6790 [1:39:45<2:09:05,  1.98s/it] 42%|████▏     | 2875/6790 [1:39:46<2:06:34,  1.94s/it]                                                       {'loss': 1.3927, 'learning_rate': 0.00025307802216668424, 'epoch': 0.42}
+ 42%|████▏     | 2875/6790 [1:39:46<2:06:34,  1.94s/it] 42%|████▏     | 2876/6790 [1:39:48<2:07:13,  1.95s/it]                                                       {'loss': 1.48, 'learning_rate': 0.0002529874650876512, 'epoch': 0.42}
+ 42%|████▏     | 2876/6790 [1:39:48<2:07:13,  1.95s/it] 42%|████▏     | 2877/6790 [1:39:50<2:06:21,  1.94s/it]                                                       {'loss': 1.672, 'learning_rate': 0.0002528968963238354, 'epoch': 0.42}
+ 42%|████▏     | 2877/6790 [1:39:50<2:06:21,  1.94s/it] 42%|████▏     | 2878/6790 [1:39:53<2:12:03,  2.03s/it]                                                       {'loss': 1.5176, 'learning_rate': 0.00025280631589520887, 'epoch': 0.42}
+ 42%|████▏     | 2878/6790 [1:39:53<2:12:03,  2.03s/it] 42%|████▏     | 2879/6790 [1:39:54<2:10:26,  2.00s/it]                                                       {'loss': 1.3632, 'learning_rate': 0.00025271572382174655, 'epoch': 0.42}
+ 42%|████▏     | 2879/6790 [1:39:54<2:10:26,  2.00s/it] 42%|████▏     | 2880/6790 [1:39:56<2:09:23,  1.99s/it]                                                       {'loss': 1.3717, 'learning_rate': 0.0002526251201234256, 'epoch': 0.42}
+ 42%|████▏     | 2880/6790 [1:39:56<2:09:23,  1.99s/it] 42%|████▏     | 2881/6790 [1:39:59<2:20:56,  2.16s/it]                                                       {'loss': 1.4668, 'learning_rate': 0.0002525345048202262, 'epoch': 0.42}
+ 42%|████▏     | 2881/6790 [1:39:59<2:20:56,  2.16s/it] 42%|████▏     | 2882/6790 [1:40:01<2:14:32,  2.07s/it]                                                       {'loss': 1.5058, 'learning_rate': 0.00025244387793213057, 'epoch': 0.42}
+ 42%|████▏     | 2882/6790 [1:40:01<2:14:32,  2.07s/it] 42%|████▏     | 2883/6790 [1:40:03<2:11:32,  2.02s/it]                                                       {'loss': 1.4759, 'learning_rate': 0.00025235323947912384, 'epoch': 0.42}
+ 42%|████▏     | 2883/6790 [1:40:03<2:11:32,  2.02s/it] 42%|████▏     | 2884/6790 [1:40:05<2:16:27,  2.10s/it]                                                       {'loss': 1.6033, 'learning_rate': 0.00025226258948119357, 'epoch': 0.42}
+ 42%|████▏     | 2884/6790 [1:40:05<2:16:27,  2.10s/it] 42%|████▏     | 2885/6790 [1:40:07<2:12:49,  2.04s/it]                                                       {'loss': 1.7502, 'learning_rate': 0.0002521719279583298, 'epoch': 0.42}
+ 42%|████▏     | 2885/6790 [1:40:07<2:12:49,  2.04s/it] 43%|████▎     | 2886/6790 [1:40:09<2:12:55,  2.04s/it]                                                       {'loss': 1.5793, 'learning_rate': 0.0002520812549305253, 'epoch': 0.43}
+ 43%|████▎     | 2886/6790 [1:40:09<2:12:55,  2.04s/it] 43%|████▎     | 2887/6790 [1:40:11<2:15:31,  2.08s/it]                                                       {'loss': 1.5823, 'learning_rate': 0.00025199057041777514, 'epoch': 0.43}
+ 43%|████▎     | 2887/6790 [1:40:11<2:15:31,  2.08s/it] 43%|████▎     | 2888/6790 [1:40:14<2:22:52,  2.20s/it]                                                       {'loss': 1.425, 'learning_rate': 0.0002518998744400772, 'epoch': 0.43}
+ 43%|████▎     | 2888/6790 [1:40:14<2:22:52,  2.20s/it] 43%|████▎     | 2889/6790 [1:40:15<2:13:32,  2.05s/it]                                                       {'loss': 1.3789, 'learning_rate': 0.00025180916701743154, 'epoch': 0.43}
+ 43%|████▎     | 2889/6790 [1:40:15<2:13:32,  2.05s/it] 43%|████▎     | 2890/6790 [1:40:17<2:15:19,  2.08s/it]                                                       {'loss': 1.5889, 'learning_rate': 0.00025171844816984114, 'epoch': 0.43}
+ 43%|████▎     | 2890/6790 [1:40:17<2:15:19,  2.08s/it] 43%|████▎     | 2891/6790 [1:40:19<2:13:39,  2.06s/it]                                                       {'loss': 1.4614, 'learning_rate': 0.0002516277179173112, 'epoch': 0.43}
+ 43%|████▎     | 2891/6790 [1:40:19<2:13:39,  2.06s/it] 43%|████▎     | 2892/6790 [1:40:22<2:15:48,  2.09s/it]                                                       {'loss': 1.506, 'learning_rate': 0.0002515369762798495, 'epoch': 0.43}
+ 43%|████▎     | 2892/6790 [1:40:22<2:15:48,  2.09s/it] 43%|████▎     | 2893/6790 [1:40:24<2:17:30,  2.12s/it]                                                       {'loss': 1.4821, 'learning_rate': 0.0002514462232774664, 'epoch': 0.43}
+ 43%|████▎     | 2893/6790 [1:40:24<2:17:30,  2.12s/it] 43%|████▎     | 2894/6790 [1:40:28<3:02:24,  2.81s/it]                                                       {'loss': 1.4404, 'learning_rate': 0.0002513554589301747, 'epoch': 0.43}
+ 43%|████▎     | 2894/6790 [1:40:28<3:02:24,  2.81s/it] 43%|████▎     | 2895/6790 [1:40:30<2:51:14,  2.64s/it]                                                       {'loss': 1.4503, 'learning_rate': 0.00025126468325798986, 'epoch': 0.43}
+ 43%|████▎     | 2895/6790 [1:40:30<2:51:14,  2.64s/it] 43%|████▎     | 2896/6790 [1:40:33<2:43:11,  2.51s/it]                                                       {'loss': 1.6367, 'learning_rate': 0.0002511738962809295, 'epoch': 0.43}
+ 43%|████▎     | 2896/6790 [1:40:33<2:43:11,  2.51s/it] 43%|████▎     | 2897/6790 [1:40:35<2:37:22,  2.43s/it]                                                       {'loss': 1.7446, 'learning_rate': 0.00025108309801901416, 'epoch': 0.43}
+ 43%|████▎     | 2897/6790 [1:40:35<2:37:22,  2.43s/it] 43%|████▎     | 2898/6790 [1:40:37<2:31:21,  2.33s/it]                                                       {'loss': 1.2629, 'learning_rate': 0.00025099228849226644, 'epoch': 0.43}
+ 43%|████▎     | 2898/6790 [1:40:37<2:31:21,  2.33s/it] 43%|████▎     | 2899/6790 [1:40:40<2:35:35,  2.40s/it]                                                       {'loss': 1.5745, 'learning_rate': 0.00025090146772071187, 'epoch': 0.43}
+ 43%|████▎     | 2899/6790 [1:40:40<2:35:35,  2.40s/it] 43%|████▎     | 2900/6790 [1:40:41<2:24:46,  2.23s/it]                                                       {'loss': 1.527, 'learning_rate': 0.000250810635724378, 'epoch': 0.43}
+ 43%|████▎     | 2900/6790 [1:40:41<2:24:46,  2.23s/it] 43%|████▎     | 2901/6790 [1:40:44<2:22:20,  2.20s/it]                                                       {'loss': 1.4988, 'learning_rate': 0.00025071979252329525, 'epoch': 0.43}
+ 43%|████▎     | 2901/6790 [1:40:44<2:22:20,  2.20s/it] 43%|████▎     | 2902/6790 [1:40:45<2:16:46,  2.11s/it]                                                       {'loss': 1.485, 'learning_rate': 0.00025062893813749615, 'epoch': 0.43}
+ 43%|████▎     | 2902/6790 [1:40:45<2:16:46,  2.11s/it] 43%|████▎     | 2903/6790 [1:40:48<2:16:06,  2.10s/it]                                                       {'loss': 1.4792, 'learning_rate': 0.00025053807258701606, 'epoch': 0.43}
+ 43%|████▎     | 2903/6790 [1:40:48<2:16:06,  2.10s/it] 43%|████▎     | 2904/6790 [1:40:50<2:17:07,  2.12s/it]                                                       {'loss': 1.5652, 'learning_rate': 0.0002504471958918926, 'epoch': 0.43}
+ 43%|████▎     | 2904/6790 [1:40:50<2:17:07,  2.12s/it] 43%|████▎     | 2905/6790 [1:40:52<2:18:12,  2.13s/it]                                                       {'loss': 1.5682, 'learning_rate': 0.00025035630807216584, 'epoch': 0.43}
+ 43%|████▎     | 2905/6790 [1:40:52<2:18:12,  2.13s/it] 43%|████▎     | 2906/6790 [1:40:54<2:27:01,  2.27s/it]                                                       {'loss': 1.6872, 'learning_rate': 0.00025026540914787834, 'epoch': 0.43}
+ 43%|████▎     | 2906/6790 [1:40:54<2:27:01,  2.27s/it] 43%|████▎     | 2907/6790 [1:40:56<2:17:53,  2.13s/it]                                                       {'loss': 1.3514, 'learning_rate': 0.0002501744991390751, 'epoch': 0.43}
+ 43%|████▎     | 2907/6790 [1:40:56<2:17:53,  2.13s/it] 43%|████▎     | 2908/6790 [1:40:58<2:11:58,  2.04s/it]                                                       {'loss': 1.6145, 'learning_rate': 0.0002500835780658036, 'epoch': 0.43}
+ 43%|████▎     | 2908/6790 [1:40:58<2:11:58,  2.04s/it] 43%|████▎     | 2909/6790 [1:41:00<2:13:26,  2.06s/it]                                                       {'loss': 1.6298, 'learning_rate': 0.0002499926459481137, 'epoch': 0.43}
+ 43%|████▎     | 2909/6790 [1:41:00<2:13:26,  2.06s/it] 43%|████▎     | 2910/6790 [1:41:02<2:09:24,  2.00s/it]                                                       {'loss': 1.6117, 'learning_rate': 0.0002499017028060578, 'epoch': 0.43}
+ 43%|████▎     | 2910/6790 [1:41:02<2:09:24,  2.00s/it] 43%|████▎     | 2911/6790 [1:41:04<2:13:08,  2.06s/it]                                                       {'loss': 1.5717, 'learning_rate': 0.00024981074865969055, 'epoch': 0.43}
+ 43%|████▎     | 2911/6790 [1:41:04<2:13:08,  2.06s/it] 43%|████▎     | 2912/6790 [1:41:06<2:11:39,  2.04s/it]                                                       {'loss': 1.3773, 'learning_rate': 0.00024971978352906923, 'epoch': 0.43}
+ 43%|████▎     | 2912/6790 [1:41:06<2:11:39,  2.04s/it] 43%|████▎     | 2913/6790 [1:41:08<2:08:23,  1.99s/it]                                                       {'loss': 1.6276, 'learning_rate': 0.0002496288074342534, 'epoch': 0.43}
+ 43%|████▎     | 2913/6790 [1:41:08<2:08:23,  1.99s/it] 43%|████▎     | 2914/6790 [1:41:10<2:10:09,  2.01s/it]                                                       {'loss': 1.337, 'learning_rate': 0.00024953782039530505, 'epoch': 0.43}
+ 43%|████▎     | 2914/6790 [1:41:10<2:10:09,  2.01s/it] 43%|████▎     | 2915/6790 [1:41:12<2:05:34,  1.94s/it]                                                       {'loss': 1.5051, 'learning_rate': 0.00024944682243228873, 'epoch': 0.43}
+ 43%|████▎     | 2915/6790 [1:41:12<2:05:34,  1.94s/it] 43%|████▎     | 2916/6790 [1:41:14<2:07:40,  1.98s/it]                                                       {'loss': 1.6789, 'learning_rate': 0.0002493558135652712, 'epoch': 0.43}
+ 43%|████▎     | 2916/6790 [1:41:14<2:07:40,  1.98s/it] 43%|████▎     | 2917/6790 [1:41:16<2:15:04,  2.09s/it]                                                       {'loss': 1.3524, 'learning_rate': 0.0002492647938143218, 'epoch': 0.43}
+ 43%|████▎     | 2917/6790 [1:41:16<2:15:04,  2.09s/it] 43%|████▎     | 2918/6790 [1:41:18<2:13:31,  2.07s/it]                                                       {'loss': 1.4874, 'learning_rate': 0.0002491737631995121, 'epoch': 0.43}
+ 43%|████▎     | 2918/6790 [1:41:18<2:13:31,  2.07s/it] 43%|████▎     | 2919/6790 [1:41:20<2:12:22,  2.05s/it]                                                       {'loss': 1.5069, 'learning_rate': 0.0002490827217409161, 'epoch': 0.43}
+ 43%|████▎     | 2919/6790 [1:41:20<2:12:22,  2.05s/it] 43%|████▎     | 2920/6790 [1:41:22<2:07:54,  1.98s/it]                                                       {'loss': 1.3613, 'learning_rate': 0.0002489916694586104, 'epoch': 0.43}
+ 43%|████▎     | 2920/6790 [1:41:22<2:07:54,  1.98s/it] 43%|████▎     | 2921/6790 [1:41:24<2:06:55,  1.97s/it]                                                       {'loss': 1.5336, 'learning_rate': 0.0002489006063726737, 'epoch': 0.43}
+ 43%|████▎     | 2921/6790 [1:41:24<2:06:55,  1.97s/it] 43%|████▎     | 2922/6790 [1:41:26<2:05:22,  1.94s/it]                                                       {'loss': 1.5403, 'learning_rate': 0.0002488095325031873, 'epoch': 0.43}
+ 43%|███��▎     | 2922/6790 [1:41:26<2:05:22,  1.94s/it] 43%|████▎     | 2923/6790 [1:41:28<2:10:40,  2.03s/it]                                                       {'loss': 1.6249, 'learning_rate': 0.00024871844787023465, 'epoch': 0.43}
+ 43%|████▎     | 2923/6790 [1:41:28<2:10:40,  2.03s/it] 43%|████▎     | 2924/6790 [1:41:31<2:14:27,  2.09s/it]                                                       {'loss': 1.3463, 'learning_rate': 0.0002486273524939018, 'epoch': 0.43}
+ 43%|████▎     | 2924/6790 [1:41:31<2:14:27,  2.09s/it] 43%|████▎     | 2925/6790 [1:41:33<2:19:20,  2.16s/it]                                                       {'loss': 1.5874, 'learning_rate': 0.00024853624639427715, 'epoch': 0.43}
+ 43%|████▎     | 2925/6790 [1:41:33<2:19:20,  2.16s/it] 43%|████▎     | 2926/6790 [1:41:35<2:25:53,  2.27s/it]                                                       {'loss': 1.4906, 'learning_rate': 0.00024844512959145126, 'epoch': 0.43}
+ 43%|████▎     | 2926/6790 [1:41:35<2:25:53,  2.27s/it] 43%|████▎     | 2927/6790 [1:41:38<2:29:38,  2.32s/it]                                                       {'loss': 1.6929, 'learning_rate': 0.0002483540021055173, 'epoch': 0.43}
+ 43%|████▎     | 2927/6790 [1:41:38<2:29:38,  2.32s/it] 43%|████▎     | 2928/6790 [1:41:40<2:27:11,  2.29s/it]                                                       {'loss': 1.4503, 'learning_rate': 0.0002482628639565706, 'epoch': 0.43}
+ 43%|████▎     | 2928/6790 [1:41:40<2:27:11,  2.29s/it] 43%|████▎     | 2929/6790 [1:41:42<2:23:27,  2.23s/it]                                                       {'loss': 1.5122, 'learning_rate': 0.00024817171516470897, 'epoch': 0.43}
+ 43%|████▎     | 2929/6790 [1:41:42<2:23:27,  2.23s/it] 43%|████▎     | 2930/6790 [1:41:44<2:15:30,  2.11s/it]                                                       {'loss': 1.4681, 'learning_rate': 0.00024808055575003244, 'epoch': 0.43}
+ 43%|████▎     | 2930/6790 [1:41:44<2:15:30,  2.11s/it] 43%|████▎     | 2931/6790 [1:41:46<2:14:16,  2.09s/it]                                                       {'loss': 1.4064, 'learning_rate': 0.0002479893857326436, 'epoch': 0.43}
+ 43%|████▎     | 2931/6790 [1:41:46<2:14:16,  2.09s/it] 43%|████▎     | 2932/6790 [1:41:48<2:14:01,  2.08s/it]                                                       {'loss': 1.6629, 'learning_rate': 0.0002478982051326471, 'epoch': 0.43}
+ 43%|████▎     | 2932/6790 [1:41:48<2:14:01,  2.08s/it] 43%|████▎     | 2933/6790 [1:41:50<2:15:50,  2.11s/it]                                                       {'loss': 1.5373, 'learning_rate': 0.0002478070139701502, 'epoch': 0.43}
+ 43%|████▎     | 2933/6790 [1:41:50<2:15:50,  2.11s/it] 43%|████▎     | 2934/6790 [1:41:52<2:14:05,  2.09s/it]                                                       {'loss': 1.4987, 'learning_rate': 0.00024771581226526224, 'epoch': 0.43}
+ 43%|████▎     | 2934/6790 [1:41:52<2:14:05,  2.09s/it] 43%|████▎     | 2935/6790 [1:41:54<2:14:25,  2.09s/it]                                                       {'loss': 1.3602, 'learning_rate': 0.000247624600038095, 'epoch': 0.43}
+ 43%|████▎     | 2935/6790 [1:41:54<2:14:25,  2.09s/it] 43%|████▎     | 2936/6790 [1:41:56<2:13:54,  2.08s/it]                                                       {'loss': 1.5095, 'learning_rate': 0.00024753337730876266, 'epoch': 0.43}
+ 43%|████▎     | 2936/6790 [1:41:56<2:13:54,  2.08s/it] 43%|████▎     | 2937/6790 [1:41:58<2:08:26,  2.00s/it]                                                       {'loss': 1.3807, 'learning_rate': 0.00024744214409738155, 'epoch': 0.43}
+ 43%|████▎     | 2937/6790 [1:41:58<2:08:26,  2.00s/it] 43%|████▎     | 2938/6790 [1:42:00<2:07:51,  1.99s/it]                                                       {'loss': 1.4269, 'learning_rate': 0.00024735090042407045, 'epoch': 0.43}
+ 43%|████▎     | 2938/6790 [1:42:00<2:07:51,  1.99s/it] 43%|████▎     | 2939/6790 [1:42:02<2:02:27,  1.91s/it]                                                       {'loss': 1.264, 'learning_rate': 0.0002472596463089504, 'epoch': 0.43}
+ 43%|████▎     | 2939/6790 [1:42:02<2:02:27,  1.91s/it] 43%|████▎     | 2940/6790 [1:42:04<2:02:54,  1.92s/it]                                                       {'loss': 1.3385, 'learning_rate': 0.00024716838177214474, 'epoch': 0.43}
+ 43%|████▎     | 2940/6790 [1:42:04<2:02:54,  1.92s/it] 43%|████▎     | 2941/6790 [1:42:06<2:03:37,  1.93s/it]                                                       {'loss': 1.5646, 'learning_rate': 0.00024707710683377897, 'epoch': 0.43}
+ 43%|████▎     | 2941/6790 [1:42:06<2:03:37,  1.93s/it] 43%|████▎     | 2942/6790 [1:42:08<2:05:13,  1.95s/it]                                                       {'loss': 1.4356, 'learning_rate': 0.00024698582151398116, 'epoch': 0.43}
+ 43%|████▎     | 2942/6790 [1:42:08<2:05:13,  1.95s/it] 43%|████▎     | 2943/6790 [1:42:09<1:59:42,  1.87s/it]                                                       {'loss': 1.4707, 'learning_rate': 0.0002468945258328815, 'epoch': 0.43}
+ 43%|████▎     | 2943/6790 [1:42:09<1:59:42,  1.87s/it] 43%|████▎     | 2944/6790 [1:42:12<2:09:17,  2.02s/it]                                                       {'loss': 1.7866, 'learning_rate': 0.0002468032198106125, 'epoch': 0.43}
+ 43%|████▎     | 2944/6790 [1:42:12<2:09:17,  2.02s/it] 43%|████▎     | 2945/6790 [1:42:14<2:07:36,  1.99s/it]                                                       {'loss': 1.5282, 'learning_rate': 0.00024671190346730893, 'epoch': 0.43}
+ 43%|████▎     | 2945/6790 [1:42:14<2:07:36,  1.99s/it] 43%|████▎     | 2946/6790 [1:42:16<2:06:28,  1.97s/it]                                                       {'loss': 1.4584, 'learning_rate': 0.0002466205768231078, 'epoch': 0.43}
+ 43%|████▎     | 2946/6790 [1:42:16<2:06:28,  1.97s/it] 43%|████▎     | 2947/6790 [1:42:18<2:09:52,  2.03s/it]                                                       {'loss': 1.6537, 'learning_rate': 0.0002465292398981485, 'epoch': 0.43}
+ 43%|████▎     | 2947/6790 [1:42:18<2:09:52,  2.03s/it] 43%|████▎     | 2948/6790 [1:42:20<2:09:08,  2.02s/it]                                                       {'loss': 1.4909, 'learning_rate': 0.0002464378927125725, 'epoch': 0.43}
+ 43%|████▎     | 2948/6790 [1:42:20<2:09:08,  2.02s/it] 43%|████▎     | 2949/6790 [1:42:22<2:05:19,  1.96s/it]                                                       {'loss': 1.28, 'learning_rate': 0.0002463465352865239, 'epoch': 0.43}
+ 43%|████▎     | 2949/6790 [1:42:22<2:05:19,  1.96s/it] 43%|████▎     | 2950/6790 [1:42:23<2:02:09,  1.91s/it]                                                       {'loss': 1.34, 'learning_rate': 0.00024625516764014864, 'epoch': 0.43}
+ 43%|████▎     | 2950/6790 [1:42:23<2:02:09,  1.91s/it] 43%|████▎     | 2951/6790 [1:42:25<2:01:00,  1.89s/it]                                                       {'loss': 1.3959, 'learning_rate': 0.00024616378979359514, 'epoch': 0.43}
+ 43%|████▎     | 2951/6790 [1:42:25<2:01:00,  1.89s/it] 43%|████▎     | 2952/6790 [1:42:27<2:00:24,  1.88s/it]                                                       {'loss': 1.423, 'learning_rate': 0.000246072401767014, 'epoch': 0.43}
+ 43%|████▎     | 2952/6790 [1:42:27<2:00:24,  1.88s/it] 43%|████▎     | 2953/6790 [1:42:29<2:04:16,  1.94s/it]                                                       {'loss': 1.443, 'learning_rate': 0.00024598100358055804, 'epoch': 0.43}
+ 43%|████▎     | 2953/6790 [1:42:29<2:04:16,  1.94s/it] 44%|████▎     | 2954/6790 [1:42:31<2:03:05,  1.93s/it]                                                       {'loss': 1.529, 'learning_rate': 0.0002458895952543825, 'epoch': 0.44}
+ 44%|████▎     | 2954/6790 [1:42:31<2:03:05,  1.93s/it] 44%|████▎     | 2955/6790 [1:42:33<2:07:48,  2.00s/it]                                                       {'loss': 1.7918, 'learning_rate': 0.00024579817680864464, 'epoch': 0.44}
+ 44%|████▎     | 2955/6790 [1:42:33<2:07:48,  2.00s/it] 44%|████▎     | 2956/6790 [1:42:35<2:08:10,  2.01s/it]                                                       {'loss': 1.5292, 'learning_rate': 0.00024570674826350405, 'epoch': 0.44}
+ 44%|████▎     | 2956/6790 [1:42:35<2:08:10,  2.01s/it] 44%|████▎     | 2957/6790 [1:42:38<2:10:59,  2.05s/it]                                                       {'loss': 1.536, 'learning_rate': 0.0002456153096391225, 'epoch': 0.44}
+ 44%|████▎     | 2957/6790 [1:42:38<2:10:59,  2.05s/it] 44%|████▎     | 2958/6790 [1:42:40<2:12:33,  2.08s/it]                                                       {'loss': 1.6146, 'learning_rate': 0.00024552386095566395, 'epoch': 0.44}
+ 44%|████▎     | 2958/6790 [1:42:40<2:12:33,  2.08s/it] 44%|████▎     | 2959/6790 [1:42:42<2:10:22,  2.04s/it]                                                       {'loss': 1.4089, 'learning_rate': 0.0002454324022332948, 'epoch': 0.44}
+ 44%|████▎     | 2959/6790 [1:42:42<2:10:22,  2.04s/it] 44%|████▎     | 2960/6790 [1:42:44<2:12:31,  2.08s/it]                                                       {'loss': 1.333, 'learning_rate': 0.00024534093349218343, 'epoch': 0.44}
+ 44%|████▎     | 2960/6790 [1:42:44<2:12:31,  2.08s/it] 44%|████▎     | 2961/6790 [1:42:46<2:12:54,  2.08s/it]                                                       {'loss': 1.4556, 'learning_rate': 0.00024524945475250053, 'epoch': 0.44}
+ 44%|████▎     | 2961/6790 [1:42:46<2:12:54,  2.08s/it] 44%|████▎     | 2962/6790 [1:42:48<2:10:21,  2.04s/it]                                                       {'loss': 1.4299, 'learning_rate': 0.0002451579660344188, 'epoch': 0.44}
+ 44%|████▎     | 2962/6790 [1:42:48<2:10:21,  2.04s/it] 44%|████▎     | 2963/6790 [1:42:50<2:09:56,  2.04s/it]                                                       {'loss': 1.5721, 'learning_rate': 0.00024506646735811364, 'epoch': 0.44}
+ 44%|████▎     | 2963/6790 [1:42:50<2:09:56,  2.04s/it] 44%|████▎     | 2964/6790 [1:42:52<2:10:15,  2.04s/it]                                                       {'loss': 1.5875, 'learning_rate': 0.00024497495874376197, 'epoch': 0.44}
+ 44%|████▎     | 2964/6790 [1:42:52<2:10:15,  2.04s/it] 44%|████▎     | 2965/6790 [1:42:54<2:12:11,  2.07s/it]                                                       {'loss': 1.5921, 'learning_rate': 0.0002448834402115435, 'epoch': 0.44}
+ 44%|████▎     | 2965/6790 [1:42:54<2:12:11,  2.07s/it] 44%|████▎     | 2966/6790 [1:42:58<2:45:18,  2.59s/it]                                                       {'loss': 1.3663, 'learning_rate': 0.0002447919117816397, 'epoch': 0.44}
+ 44%|████▎     | 2966/6790 [1:42:58<2:45:18,  2.59s/it] 44%|████▎     | 2967/6790 [1:43:00<2:37:39,  2.47s/it]                                                       {'loss': 1.7381, 'learning_rate': 0.0002447003734742346, 'epoch': 0.44}
+ 44%|████▎     | 2967/6790 [1:43:00<2:37:39,  2.47s/it] 44%|████▎     | 2968/6790 [1:43:02<2:30:54,  2.37s/it]                                                       {'loss': 1.7021, 'learning_rate': 0.000244608825309514, 'epoch': 0.44}
+ 44%|████▎     | 2968/6790 [1:43:02<2:30:54,  2.37s/it] 44%|████▎     | 2969/6790 [1:43:04<2:23:18,  2.25s/it]                                                       {'loss': 1.6846, 'learning_rate': 0.0002445172673076661, 'epoch': 0.44}
+ 44%|████▎     | 2969/6790 [1:43:04<2:23:18,  2.25s/it] 44%|████▎     | 2970/6790 [1:43:06<2:15:09,  2.12s/it]                                                       {'loss': 1.4155, 'learning_rate': 0.0002444256994888814, 'epoch': 0.44}
+ 44%|████▎     | 2970/6790 [1:43:06<2:15:09,  2.12s/it] 44%|████▍     | 2971/6790 [1:43:08<2:09:51,  2.04s/it]                                                       {'loss': 1.4561, 'learning_rate': 0.00024433412187335225, 'epoch': 0.44}
+ 44%|████▍     | 2971/6790 [1:43:08<2:09:51,  2.04s/it] 44%|████▍     | 2972/6790 [1:43:10<2:08:59,  2.03s/it]                                                       {'loss': 1.636, 'learning_rate': 0.0002442425344812735, 'epoch': 0.44}
+ 44%|████▍     | 2972/6790 [1:43:10<2:08:59,  2.03s/it] 44%|████▍     | 2973/6790 [1:43:12<2:05:39,  1.98s/it]                                                       {'loss': 1.6237, 'learning_rate': 0.0002441509373328418, 'epoch': 0.44}
+ 44%|████▍     | 2973/6790 [1:43:12<2:05:39,  1.98s/it] 44%|████▍     | 2974/6790 [1:43:14<2:07:01,  2.00s/it]                                                       {'loss': 1.5575, 'learning_rate': 0.00024405933044825622, 'epoch': 0.44}
+ 44%|████▍     | 2974/6790 [1:43:14<2:07:01,  2.00s/it] 44%|████▍     | 2975/6790 [1:43:16<2:03:53,  1.95s/it]                                                       {'loss': 1.4129, 'learning_rate': 0.00024396771384771783, 'epoch': 0.44}
+ 44%|████▍     | 2975/6790 [1:43:16<2:03:53,  1.95s/it] 44%|████▍     | 2976/6790 [1:43:18<2:09:04,  2.03s/it]                                                       {'loss': 1.0656, 'learning_rate': 0.00024387608755142997, 'epoch': 0.44}
+ 44%|████▍     | 2976/6790 [1:43:18<2:09:04,  2.03s/it] 44%|████▍     | 2977/6790 [1:43:20<2:04:07,  1.95s/it]                                                       {'loss': 1.3194, 'learning_rate': 0.00024378445157959805, 'epoch': 0.44}
+ 44%|████▍     | 2977/6790 [1:43:20<2:04:07,  1.95s/it] 44%|████▍     | 2978/6790 [1:43:21<2:04:24,  1.96s/it]                                                       {'loss': 1.1741, 'learning_rate': 0.00024369280595242955, 'epoch': 0.44}
+ 44%|████▍     | 2978/6790 [1:43:22<2:04:24,  1.96s/it] 44%|████▍     | 2979/6790 [1:43:23<1:59:04,  1.87s/it]                                                       {'loss': 1.5629, 'learning_rate': 0.0002436011506901342, 'epoch': 0.44}
+ 44%|████▍     | 2979/6790 [1:43:23<1:59:04,  1.87s/it] 44%|████▍     | 2980/6790 [1:43:25<1:56:46,  1.84s/it]                                                       {'loss': 1.4346, 'learning_rate': 0.00024350948581292373, 'epoch': 0.44}
+ 44%|████▍     | 2980/6790 [1:43:25<1:56:46,  1.84s/it] 44%|████▍     | 2981/6790 [1:43:27<2:01:35,  1.92s/it]                                                       {'loss': 1.6236, 'learning_rate': 0.00024341781134101207, 'epoch': 0.44}
+ 44%|████▍     | 2981/6790 [1:43:27<2:01:35,  1.92s/it] 44%|████▍     | 2982/6790 [1:43:29<2:04:44,  1.97s/it]                                                       {'loss': 1.6913, 'learning_rate': 0.0002433261272946153, 'epoch': 0.44}
+ 44%|████▍     | 2982/6790 [1:43:29<2:04:44,  1.97s/it] 44%|████▍     | 2983/6790 [1:43:31<2:03:47,  1.95s/it]                                                       {'loss': 1.4402, 'learning_rate': 0.0002432344336939516, 'epoch': 0.44}
+ 44%|████▍     | 2983/6790 [1:43:31<2:03:47,  1.95s/it] 44%|████▍     | 2984/6790 [1:43:33<2:03:33,  1.95s/it]                                                       {'loss': 1.5704, 'learning_rate': 0.00024314273055924112, 'epoch': 0.44}
+ 44%|████▍     | 2984/6790 [1:43:33<2:03:33,  1.95s/it] 44%|████▍     | 2985/6790 [1:43:35<2:00:30,  1.90s/it]                                                       {'loss': 1.4268, 'learning_rate': 0.00024305101791070624, 'epoch': 0.44}
+ 44%|████▍     | 2985/6790 [1:43:35<2:00:30,  1.90s/it] 44%|████▍     | 2986/6790 [1:43:37<2:03:24,  1.95s/it]                                                       {'loss': 1.4291, 'learning_rate': 0.00024295929576857148, 'epoch': 0.44}
+ 44%|████▍     | 2986/6790 [1:43:37<2:03:24,  1.95s/it] 44%|████▍     | 2987/6790 [1:43:39<2:03:01,  1.94s/it]                                                       {'loss': 1.229, 'learning_rate': 0.00024286756415306329, 'epoch': 0.44}
+ 44%|████▍     | 2987/6790 [1:43:39<2:03:01,  1.94s/it] 44%|████▍     | 2988/6790 [1:43:41<2:03:56,  1.96s/it]                                                       {'loss': 1.4693, 'learning_rate': 0.00024277582308441034, 'epoch': 0.44}
+ 44%|████▍     | 2988/6790 [1:43:41<2:03:56,  1.96s/it] 44%|████▍     | 2989/6790 [1:43:44<2:22:43,  2.25s/it]                                                       {'loss': 1.4342, 'learning_rate': 0.00024268407258284334, 'epoch': 0.44}
+ 44%|████▍     | 2989/6790 [1:43:44<2:22:43,  2.25s/it] 44%|████▍     | 2990/6790 [1:43:46<2:21:15,  2.23s/it]                                                       {'loss': 1.4482, 'learning_rate': 0.00024259231266859517, 'epoch': 0.44}
+ 44%|████▍     | 2990/6790 [1:43:46<2:21:15,  2.23s/it] 44%|████▍     | 2991/6790 [1:43:48<2:14:20,  2.12s/it]                                                       {'loss': 1.516, 'learning_rate': 0.00024250054336190054, 'epoch': 0.44}
+ 44%|████▍     | 2991/6790 [1:43:48<2:14:20,  2.12s/it] 44%|████▍     | 2992/6790 [1:43:50<2:11:47,  2.08s/it]                                                       {'loss': 1.493, 'learning_rate': 0.00024240876468299653, 'epoch': 0.44}
+ 44%|████▍     | 2992/6790 [1:43:50<2:11:47,  2.08s/it] 44%|████▍     | 2993/6790 [1:43:52<2:19:42,  2.21s/it]                                                       {'loss': 1.5149, 'learning_rate': 0.00024231697665212215, 'epoch': 0.44}
+ 44%|████▍     | 2993/6790 [1:43:52<2:19:42,  2.21s/it] 44%|████▍     | 2994/6790 [1:43:54<2:16:39,  2.16s/it]                                                       {'loss': 1.5165, 'learning_rate': 0.00024222517928951836, 'epoch': 0.44}
+ 44%|████▍     | 2994/6790 [1:43:54<2:16:39,  2.16s/it] 44%|████▍     | 2995/6790 [1:43:56<2:12:42,  2.10s/it]                                                       {'loss': 1.3016, 'learning_rate': 0.0002421333726154284, 'epoch': 0.44}
+ 44%|████▍     | 2995/6790 [1:43:56<2:12:42,  2.10s/it] 44%|████▍     | 2996/6790 [1:43:58<2:13:54,  2.12s/it]                                                       {'loss': 1.3659, 'learning_rate': 0.00024204155665009746, 'epoch': 0.44}
+ 44%|████▍     | 2996/6790 [1:43:58<2:13:54,  2.12s/it] 44%|████▍     | 2997/6790 [1:44:00<2:12:24,  2.09s/it]                                                       {'loss': 1.4883, 'learning_rate': 0.00024194973141377268, 'epoch': 0.44}
+ 44%|████▍     | 2997/6790 [1:44:00<2:12:24,  2.09s/it] 44%|████▍     | 2998/6790 [1:44:02<2:11:27,  2.08s/it]                                                       {'loss': 1.335, 'learning_rate': 0.00024185789692670334, 'epoch': 0.44}
+ 44%|████▍     | 2998/6790 [1:44:02<2:11:27,  2.08s/it] 44%|████▍     | 2999/6790 [1:44:04<2:04:47,  1.97s/it]                                                       {'loss': 1.497, 'learning_rate': 0.00024176605320914095, 'epoch': 0.44}
+ 44%|████▍     | 2999/6790 [1:44:04<2:04:47,  1.97s/it] 44%|████▍     | 3000/6790 [1:44:06<2:02:09,  1.93s/it]                                                       {'loss': 1.4529, 'learning_rate': 0.00024167420028133862, 'epoch': 0.44}
+ 44%|████▍     | 3000/6790 [1:44:06<2:02:09,  1.93s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 44%|████▍     | 3001/6790 [1:44:09<2:19:45,  2.21s/it]                                                       {'loss': 1.4569, 'learning_rate': 0.00024158233816355185, 'epoch': 0.44}
+ 44%|████▍     | 3001/6790 [1:44:09<2:19:45,  2.21s/it] 44%|████▍     | 3002/6790 [1:44:11<2:17:16,  2.17s/it]                                                       {'loss': 1.5477, 'learning_rate': 0.00024149046687603812, 'epoch': 0.44}
+ 44%|████▍     | 3002/6790 [1:44:11<2:17:16,  2.17s/it] 44%|████▍     | 3003/6790 [1:44:13<2:19:45,  2.21s/it]                                                       {'loss': 1.5344, 'learning_rate': 0.0002413985864390567, 'epoch': 0.44}
+ 44%|████▍     | 3003/6790 [1:44:13<2:19:45,  2.21s/it] 44%|████▍     | 3004/6790 [1:44:16<2:19:57,  2.22s/it]                                                       {'loss': 1.3418, 'learning_rate': 0.00024130669687286922, 'epoch': 0.44}
+ 44%|████▍     | 3004/6790 [1:44:16<2:19:57,  2.22s/it] 44%|████▍     | 3005/6790 [1:44:17<2:12:10,  2.10s/it]                                                       {'loss': 1.3364, 'learning_rate': 0.00024121479819773898, 'epoch': 0.44}
+ 44%|████▍     | 3005/6790 [1:44:17<2:12:10,  2.10s/it] 44%|████▍     | 3006/6790 [1:44:19<2:10:36,  2.07s/it]                                                       {'loss': 1.4736, 'learning_rate': 0.00024112289043393158, 'epoch': 0.44}
+ 44%|████▍     | 3006/6790 [1:44:19<2:10:36,  2.07s/it] 44%|████▍     | 3007/6790 [1:44:21<2:04:57,  1.98s/it]                                                       {'loss': 1.3519, 'learning_rate': 0.0002410309736017144, 'epoch': 0.44}
+ 44%|████▍     | 3007/6790 [1:44:21<2:04:57,  1.98s/it] 44%|████▍     | 3008/6790 [1:44:23<2:08:31,  2.04s/it]                                                       {'loss': 1.4704, 'learning_rate': 0.00024093904772135697, 'epoch': 0.44}
+ 44%|████▍     | 3008/6790 [1:44:23<2:08:31,  2.04s/it] 44%|████▍     | 3009/6790 [1:44:25<2:08:28,  2.04s/it]                                                       {'loss': 1.4928, 'learning_rate': 0.0002408471128131308, 'epoch': 0.44}
+ 44%|████▍     | 3009/6790 [1:44:25<2:08:28,  2.04s/it] 44%|████▍     | 3010/6790 [1:44:27<2:03:24,  1.96s/it]                                                       {'loss': 1.5044, 'learning_rate': 0.00024075516889730927, 'epoch': 0.44}
+ 44%|████▍     | 3010/6790 [1:44:27<2:03:24,  1.96s/it] 44%|████▍     | 3011/6790 [1:44:29<2:09:47,  2.06s/it]                                                       {'loss': 1.6997, 'learning_rate': 0.00024066321599416787, 'epoch': 0.44}
+ 44%|████▍     | 3011/6790 [1:44:29<2:09:47,  2.06s/it] 44%|████▍     | 3012/6790 [1:44:31<2:08:28,  2.04s/it]                                                       {'loss': 1.7503, 'learning_rate': 0.000240571254123984, 'epoch': 0.44}
+ 44%|████▍     | 3012/6790 [1:44:31<2:08:28,  2.04s/it] 44%|████▍     | 3013/6790 [1:44:33<2:08:38,  2.04s/it]                                                       {'loss': 1.2193, 'learning_rate': 0.00024047928330703716, 'epoch': 0.44}
+ 44%|████▍     | 3013/6790 [1:44:33<2:08:38,  2.04s/it] 44%|████▍     | 3014/6790 [1:44:36<2:09:18,  2.05s/it]                                                       {'loss': 1.5995, 'learning_rate': 0.0002403873035636086, 'epoch': 0.44}
+ 44%|████▍     | 3014/6790 [1:44:36<2:09:18,  2.05s/it] 44%|████▍     | 3015/6790 [1:44:38<2:10:46,  2.08s/it]                                                       {'loss': 1.4333, 'learning_rate': 0.00024029531491398182, 'epoch': 0.44}
+ 44%|████▍     | 3015/6790 [1:44:38<2:10:46,  2.08s/it] 44%|████▍     | 3016/6790 [1:44:40<2:07:27,  2.03s/it]                                                       {'loss': 1.6454, 'learning_rate': 0.00024020331737844197, 'epoch': 0.44}
+ 44%|████▍     | 3016/6790 [1:44:40<2:07:27,  2.03s/it] 44%|████▍     | 3017/6790 [1:44:41<2:03:36,  1.97s/it]                                                       {'loss': 1.4701, 'learning_rate': 0.00024011131097727645, 'epoch': 0.44}
+ 44%|████▍     | 3017/6790 [1:44:41<2:03:36,  1.97s/it] 44%|████▍     | 3018/6790 [1:44:43<2:04:32,  1.98s/it]                                                       {'loss': 1.5253, 'learning_rate': 0.00024001929573077448, 'epoch': 0.44}
+ 44%|████▍     | 3018/6790 [1:44:43<2:04:32,  1.98s/it] 44%|████▍     | 3019/6790 [1:44:45<1:59:38,  1.90s/it]                                                       {'loss': 1.458, 'learning_rate': 0.00023992727165922717, 'epoch': 0.44}
+ 44%|████▍     | 3019/6790 [1:44:45<1:59:38,  1.90s/it] 44%|████▍     | 3020/6790 [1:44:47<1:59:31,  1.90s/it]                                                       {'loss': 1.4487, 'learning_rate': 0.00023983523878292774, 'epoch': 0.44}
+ 44%|████▍     | 3020/6790 [1:44:47<1:59:31,  1.90s/it] 44%|████▍     | 3021/6790 [1:44:49<2:05:04,  1.99s/it]                                                       {'loss': 1.2825, 'learning_rate': 0.00023974319712217112, 'epoch': 0.44}
+ 44%|████▍     | 3021/6790 [1:44:49<2:05:04,  1.99s/it] 45%|████▍     | 3022/6790 [1:44:51<2:02:33,  1.95s/it]                                                       {'loss': 1.6549, 'learning_rate': 0.00023965114669725445, 'epoch': 0.45}
+ 45%|████▍     | 3022/6790 [1:44:51<2:02:33,  1.95s/it] 45%|████▍     | 3023/6790 [1:44:53<2:02:06,  1.95s/it]                                                       {'loss': 1.4405, 'learning_rate': 0.0002395590875284766, 'epoch': 0.45}
+ 45%|████▍     | 3023/6790 [1:44:53<2:02:06,  1.95s/it] 45%|████▍     | 3024/6790 [1:44:55<2:06:57,  2.02s/it]                                                       {'loss': 1.5857, 'learning_rate': 0.00023946701963613843, 'epoch': 0.45}
+ 45%|████▍     | 3024/6790 [1:44:55<2:06:57,  2.02s/it] 45%|████▍     | 3025/6790 [1:44:57<2:08:43,  2.05s/it]                                                       {'loss': 1.7165, 'learning_rate': 0.0002393749430405428, 'epoch': 0.45}
+ 45%|████▍     | 3025/6790 [1:44:57<2:08:43,  2.05s/it] 45%|████▍     | 3026/6790 [1:44:59<2:07:43,  2.04s/it]                                                       {'loss': 1.5218, 'learning_rate': 0.00023928285776199433, 'epoch': 0.45}
+ 45%|████▍     | 3026/6790 [1:44:59<2:07:43,  2.04s/it] 45%|████▍     | 3027/6790 [1:45:01<2:06:29,  2.02s/it]                                                       {'loss': 1.5721, 'learning_rate': 0.0002391907638207997, 'epoch': 0.45}
+ 45%|████▍     | 3027/6790 [1:45:01<2:06:29,  2.02s/it] 45%|████▍     | 3028/6790 [1:45:04<2:13:34,  2.13s/it]                                                       {'loss': 1.7981, 'learning_rate': 0.0002390986612372674, 'epoch': 0.45}
+ 45%|████▍     | 3028/6790 [1:45:04<2:13:34,  2.13s/it] 45%|████▍     | 3029/6790 [1:45:06<2:15:02,  2.15s/it]                                                       {'loss': 1.4553, 'learning_rate': 0.0002390065500317079, 'epoch': 0.45}
+ 45%|████▍     | 3029/6790 [1:45:06<2:15:02,  2.15s/it] 45%|████▍     | 3030/6790 [1:45:08<2:09:04,  2.06s/it]                                                       {'loss': 1.3479, 'learning_rate': 0.00023891443022443354, 'epoch': 0.45}
+ 45%|████▍     | 3030/6790 [1:45:08<2:09:04,  2.06s/it] 45%|████▍     | 3031/6790 [1:45:10<2:10:24,  2.08s/it]                                                       {'loss': 1.3771, 'learning_rate': 0.00023882230183575848, 'epoch': 0.45}
+ 45%|████▍     | 3031/6790 [1:45:10<2:10:24,  2.08s/it] 45%|████▍     | 3032/6790 [1:45:12<2:05:36,  2.01s/it]                                                       {'loss': 1.4485, 'learning_rate': 0.00023873016488599896, 'epoch': 0.45}
+ 45%|████▍     | 3032/6790 [1:45:12<2:05:36,  2.01s/it] 45%|████▍     | 3033/6790 [1:45:14<2:10:23,  2.08s/it]                                                       {'loss': 1.5249, 'learning_rate': 0.00023863801939547302, 'epoch': 0.45}
+ 45%|████▍     | 3033/6790 [1:45:14<2:10:23,  2.08s/it] 45%|████▍     | 3034/6790 [1:45:16<2:09:20,  2.07s/it]                                                       {'loss': 1.4589, 'learning_rate': 0.00023854586538450044, 'epoch': 0.45}
+ 45%|████▍     | 3034/6790 [1:45:16<2:09:20,  2.07s/it] 45%|████▍     | 3035/6790 [1:45:18<2:08:06,  2.05s/it]                                                       {'loss': 1.4931, 'learning_rate': 0.00023845370287340302, 'epoch': 0.45}
+ 45%|████▍     | 3035/6790 [1:45:18<2:08:06,  2.05s/it] 45%|████▍     | 3036/6790 [1:45:20<2:09:48,  2.07s/it]                                                       {'loss': 1.4388, 'learning_rate': 0.00023836153188250454, 'epoch': 0.45}
+ 45%|████▍     | 3036/6790 [1:45:20<2:09:48,  2.07s/it] 45%|████▍     | 3037/6790 [1:45:22<2:11:55,  2.11s/it]                                                       {'loss': 1.5325, 'learning_rate': 0.0002382693524321304, 'epoch': 0.45}
+ 45%|████▍     | 3037/6790 [1:45:22<2:11:55,  2.11s/it] 45%|████▍     | 3038/6790 [1:45:25<2:15:19,  2.16s/it]                                                       {'loss': 1.4863, 'learning_rate': 0.00023817716454260803, 'epoch': 0.45}
+ 45%|████▍     | 3038/6790 [1:45:25<2:15:19,  2.16s/it] 45%|████▍     | 3039/6790 [1:45:27<2:11:44,  2.11s/it]                                                       {'loss': 1.4181, 'learning_rate': 0.0002380849682342667, 'epoch': 0.45}
+ 45%|████▍     | 3039/6790 [1:45:27<2:11:44,  2.11s/it] 45%|████▍     | 3040/6790 [1:45:29<2:11:15,  2.10s/it]                                                       {'loss': 1.4422, 'learning_rate': 0.00023799276352743745, 'epoch': 0.45}
+ 45%|████▍     | 3040/6790 [1:45:29<2:11:15,  2.10s/it] 45%|████▍     | 3041/6790 [1:45:30<2:05:53,  2.01s/it]                                                       {'loss': 1.1962, 'learning_rate': 0.00023790055044245332, 'epoch': 0.45}
+ 45%|████▍     | 3041/6790 [1:45:31<2:05:53,  2.01s/it] 45%|████▍     | 3042/6790 [1:45:33<2:09:04,  2.07s/it]                                                       {'loss': 1.555, 'learning_rate': 0.00023780832899964903, 'epoch': 0.45}
+ 45%|████▍     | 3042/6790 [1:45:33<2:09:04,  2.07s/it] 45%|████▍     | 3043/6790 [1:45:35<2:13:13,  2.13s/it]                                                       {'loss': 1.3105, 'learning_rate': 0.00023771609921936136, 'epoch': 0.45}
+ 45%|████▍     | 3043/6790 [1:45:35<2:13:13,  2.13s/it] 45%|████▍     | 3044/6790 [1:45:37<2:15:03,  2.16s/it]                                                       {'loss': 1.5665, 'learning_rate': 0.00023762386112192866, 'epoch': 0.45}
+ 45%|████▍     | 3044/6790 [1:45:37<2:15:03,  2.16s/it] 45%|████▍     | 3045/6790 [1:45:39<2:11:21,  2.10s/it]                                                       {'loss': 1.6334, 'learning_rate': 0.00023753161472769136, 'epoch': 0.45}
+ 45%|████▍     | 3045/6790 [1:45:39<2:11:21,  2.10s/it] 45%|████▍     | 3046/6790 [1:45:41<2:07:18,  2.04s/it]                                                       {'loss': 1.4255, 'learning_rate': 0.00023743936005699153, 'epoch': 0.45}
+ 45%|████▍     | 3046/6790 [1:45:41<2:07:18,  2.04s/it] 45%|████▍     | 3047/6790 [1:45:43<2:03:34,  1.98s/it]                                                       {'loss': 1.7019, 'learning_rate': 0.00023734709713017313, 'epoch': 0.45}
+ 45%|████▍     | 3047/6790 [1:45:43<2:03:34,  1.98s/it] 45%|████▍     | 3048/6790 [1:45:45<2:05:48,  2.02s/it]                                                       {'loss': 1.5316, 'learning_rate': 0.00023725482596758207, 'epoch': 0.45}
+ 45%|████▍     | 3048/6790 [1:45:45<2:05:48,  2.02s/it] 45%|████▍     | 3049/6790 [1:45:47<2:03:08,  1.97s/it]                                                       {'loss': 1.4862, 'learning_rate': 0.0002371625465895659, 'epoch': 0.45}
+ 45%|████▍     | 3049/6790 [1:45:47<2:03:08,  1.97s/it] 45%|████▍     | 3050/6790 [1:45:49<2:05:11,  2.01s/it]                                                       {'loss': 1.583, 'learning_rate': 0.00023707025901647405, 'epoch': 0.45}
+ 45%|████▍     | 3050/6790 [1:45:49<2:05:11,  2.01s/it] 45%|████▍     | 3051/6790 [1:45:51<2:03:38,  1.98s/it]                                                       {'loss': 1.4929, 'learning_rate': 0.00023697796326865774, 'epoch': 0.45}
+ 45%|████▍     | 3051/6790 [1:45:51<2:03:38,  1.98s/it] 45%|████▍     | 3052/6790 [1:45:53<2:01:57,  1.96s/it]                                                       {'loss': 1.4452, 'learning_rate': 0.00023688565936647003, 'epoch': 0.45}
+ 45%|████▍     | 3052/6790 [1:45:53<2:01:57,  1.96s/it] 45%|████▍     | 3053/6790 [1:45:55<2:03:40,  1.99s/it]                                                       {'loss': 1.3471, 'learning_rate': 0.00023679334733026574, 'epoch': 0.45}
+ 45%|████▍     | 3053/6790 [1:45:55<2:03:40,  1.99s/it] 45%|████▍     | 3054/6790 [1:45:57<2:02:37,  1.97s/it]                                                       {'loss': 1.5554, 'learning_rate': 0.00023670102718040153, 'epoch': 0.45}
+ 45%|████▍     | 3054/6790 [1:45:57<2:02:37,  1.97s/it] 45%|████▍     | 3055/6790 [1:46:00<2:21:58,  2.28s/it]                                                       {'loss': 1.3459, 'learning_rate': 0.00023660869893723577, 'epoch': 0.45}
+ 45%|████▍     | 3055/6790 [1:46:00<2:21:58,  2.28s/it] 45%|████▌     | 3056/6790 [1:46:02<2:15:26,  2.18s/it]                                                       {'loss': 1.3198, 'learning_rate': 0.0002365163626211287, 'epoch': 0.45}
+ 45%|████▌     | 3056/6790 [1:46:02<2:15:26,  2.18s/it] 45%|████▌     | 3057/6790 [1:46:04<2:10:25,  2.10s/it]                                                       {'loss': 1.4149, 'learning_rate': 0.0002364240182524422, 'epoch': 0.45}
+ 45%|████▌     | 3057/6790 [1:46:04<2:10:25,  2.10s/it] 45%|████▌     | 3058/6790 [1:46:05<2:04:37,  2.00s/it]                                                       {'loss': 1.6073, 'learning_rate': 0.00023633166585154016, 'epoch': 0.45}
+ 45%|████▌     | 3058/6790 [1:46:05<2:04:37,  2.00s/it] 45%|████▌     | 3059/6790 [1:46:07<2:04:41,  2.01s/it]                                                       {'loss': 1.6924, 'learning_rate': 0.00023623930543878804, 'epoch': 0.45}
+ 45%|████▌     | 3059/6790 [1:46:07<2:04:41,  2.01s/it] 45%|████▌     | 3060/6790 [1:46:10<2:06:45,  2.04s/it]                                                       {'loss': 1.4186, 'learning_rate': 0.00023614693703455318, 'epoch': 0.45}
+ 45%|████▌     | 3060/6790 [1:46:10<2:06:45,  2.04s/it] 45%|████▌     | 3061/6790 [1:46:12<2:07:40,  2.05s/it]                                                       {'loss': 1.6329, 'learning_rate': 0.0002360545606592046, 'epoch': 0.45}
+ 45%|████▌     | 3061/6790 [1:46:12<2:07:40,  2.05s/it] 45%|████▌     | 3062/6790 [1:46:14<2:18:44,  2.23s/it]                                                       {'loss': 1.4042, 'learning_rate': 0.00023596217633311314, 'epoch': 0.45}
+ 45%|████▌     | 3062/6790 [1:46:14<2:18:44,  2.23s/it] 45%|████▌     | 3063/6790 [1:46:16<2:10:30,  2.10s/it]                                                       {'loss': 1.3261, 'learning_rate': 0.00023586978407665136, 'epoch': 0.45}
+ 45%|████▌     | 3063/6790 [1:46:16<2:10:30,  2.10s/it] 45%|████▌     | 3064/6790 [1:46:18<2:04:47,  2.01s/it]                                                       {'loss': 1.5133, 'learning_rate': 0.00023577738391019354, 'epoch': 0.45}
+ 45%|████▌     | 3064/6790 [1:46:18<2:04:47,  2.01s/it] 45%|████▌     | 3065/6790 [1:46:20<2:08:39,  2.07s/it]                                                       {'loss': 1.9005, 'learning_rate': 0.00023568497585411575, 'epoch': 0.45}
+ 45%|████▌     | 3065/6790 [1:46:20<2:08:39,  2.07s/it] 45%|████▌     | 3066/6790 [1:46:22<2:05:34,  2.02s/it]                                                       {'loss': 1.6354, 'learning_rate': 0.00023559255992879586, 'epoch': 0.45}
+ 45%|████▌     | 3066/6790 [1:46:22<2:05:34,  2.02s/it] 45%|████▌     | 3067/6790 [1:46:24<2:09:48,  2.09s/it]                                                       {'loss': 1.4112, 'learning_rate': 0.00023550013615461333, 'epoch': 0.45}
+ 45%|████▌     | 3067/6790 [1:46:24<2:09:48,  2.09s/it] 45%|████▌     | 3068/6790 [1:46:26<2:02:48,  1.98s/it]                                                       {'loss': 1.6054, 'learning_rate': 0.00023540770455194953, 'epoch': 0.45}
+ 45%|████▌     | 3068/6790 [1:46:26<2:02:48,  1.98s/it] 45%|████▌     | 3069/6790 [1:46:28<2:01:37,  1.96s/it]                                                       {'loss': 1.2967, 'learning_rate': 0.00023531526514118735, 'epoch': 0.45}
+ 45%|████▌     | 3069/6790 [1:46:28<2:01:37,  1.96s/it] 45%|████▌     | 3070/6790 [1:46:30<2:07:06,  2.05s/it]                                                       {'loss': 1.5934, 'learning_rate': 0.00023522281794271157, 'epoch': 0.45}
+ 45%|████▌     | 3070/6790 [1:46:30<2:07:06,  2.05s/it] 45%|████▌     | 3071/6790 [1:46:32<2:11:48,  2.13s/it]                                                       {'loss': 1.5701, 'learning_rate': 0.00023513036297690855, 'epoch': 0.45}
+ 45%|████▌     | 3071/6790 [1:46:32<2:11:48,  2.13s/it] 45%|████▌     | 3072/6790 [1:46:35<2:10:37,  2.11s/it]                                                       {'loss': 1.5509, 'learning_rate': 0.0002350379002641665, 'epoch': 0.45}
+ 45%|████▌     | 3072/6790 [1:46:35<2:10:37,  2.11s/it] 45%|████▌     | 3073/6790 [1:46:36<2:07:33,  2.06s/it]                                                       {'loss': 1.5649, 'learning_rate': 0.00023494542982487526, 'epoch': 0.45}
+ 45%|████▌     | 3073/6790 [1:46:36<2:07:33,  2.06s/it] 45%|████▌     | 3074/6790 [1:46:39<2:16:22,  2.20s/it]                                                       {'loss': 1.5281, 'learning_rate': 0.00023485295167942637, 'epoch': 0.45}
+ 45%|████▌     | 3074/6790 [1:46:39<2:16:22,  2.20s/it] 45%|████▌     | 3075/6790 [1:46:41<2:12:56,  2.15s/it]                                                       {'loss': 1.4804, 'learning_rate': 0.00023476046584821315, 'epoch': 0.45}
+ 45%|████▌     | 3075/6790 [1:46:41<2:12:56,  2.15s/it] 45%|████▌     | 3076/6790 [1:46:43<2:12:48,  2.15s/it]                                                       {'loss': 1.4409, 'learning_rate': 0.00023466797235163048, 'epoch': 0.45}
+ 45%|████▌     | 3076/6790 [1:46:43<2:12:48,  2.15s/it] 45%|████▌     | 3077/6790 [1:46:45<2:06:39,  2.05s/it]                                                       {'loss': 1.4703, 'learning_rate': 0.00023457547121007502, 'epoch': 0.45}
+ 45%|████▌     | 3077/6790 [1:46:45<2:06:39,  2.05s/it] 45%|████▌     | 3078/6790 [1:46:47<2:09:44,  2.10s/it]                                                       {'loss': 1.7276, 'learning_rate': 0.00023448296244394512, 'epoch': 0.45}
+ 45%|████▌     | 3078/6790 [1:46:47<2:09:44,  2.10s/it] 45%|████▌     | 3079/6790 [1:46:49<2:12:17,  2.14s/it]                                                       {'loss': 1.4046, 'learning_rate': 0.0002343904460736408, 'epoch': 0.45}
+ 45%|████▌     | 3079/6790 [1:46:49<2:12:17,  2.14s/it] 45%|████▌     | 3080/6790 [1:46:52<2:13:16,  2.16s/it]                                                       {'loss': 1.5086, 'learning_rate': 0.00023429792211956371, 'epoch': 0.45}
+ 45%|████▌     | 3080/6790 [1:46:52<2:13:16,  2.16s/it] 45%|████▌     | 3081/6790 [1:46:53<2:08:12,  2.07s/it]                                                       {'loss': 1.5308, 'learning_rate': 0.0002342053906021172, 'epoch': 0.45}
+ 45%|████▌     | 3081/6790 [1:46:54<2:08:12,  2.07s/it] 45%|████▌     | 3082/6790 [1:46:56<2:14:14,  2.17s/it]                                                       {'loss': 1.7097, 'learning_rate': 0.0002341128515417063, 'epoch': 0.45}
+ 45%|████▌     | 3082/6790 [1:46:56<2:14:14,  2.17s/it] 45%|████▌     | 3083/6790 [1:46:58<2:10:22,  2.11s/it]                                                       {'loss': 1.3213, 'learning_rate': 0.00023402030495873777, 'epoch': 0.45}
+ 45%|████▌     | 3083/6790 [1:46:58<2:10:22,  2.11s/it] 45%|████▌     | 3084/6790 [1:47:00<2:07:45,  2.07s/it]                                                       {'loss': 1.1396, 'learning_rate': 0.00023392775087361997, 'epoch': 0.45}
+ 45%|████▌     | 3084/6790 [1:47:00<2:07:45,  2.07s/it] 45%|████▌     | 3085/6790 [1:47:02<2:06:30,  2.05s/it]                                                       {'loss': 1.4084, 'learning_rate': 0.00023383518930676278, 'epoch': 0.45}
+ 45%|████▌     | 3085/6790 [1:47:02<2:06:30,  2.05s/it] 45%|████▌     | 3086/6790 [1:47:04<2:08:51,  2.09s/it]                                                       {'loss': 1.631, 'learning_rate': 0.00023374262027857796, 'epoch': 0.45}
+ 45%|████▌     | 3086/6790 [1:47:04<2:08:51,  2.09s/it] 45%|████▌     | 3087/6790 [1:47:07<2:18:23,  2.24s/it]                                                       {'loss': 1.4478, 'learning_rate': 0.00023365004380947876, 'epoch': 0.45}
+ 45%|████▌     | 3087/6790 [1:47:07<2:18:23,  2.24s/it] 45%|████▌     | 3088/6790 [1:47:09<2:11:55,  2.14s/it]                                                       {'loss': 1.444, 'learning_rate': 0.00023355745991988016, 'epoch': 0.45}
+ 45%|████▌     | 3088/6790 [1:47:09<2:11:55,  2.14s/it] 45%|████▌     | 3089/6790 [1:47:10<2:08:10,  2.08s/it]                                                       {'loss': 1.6286, 'learning_rate': 0.00023346486863019865, 'epoch': 0.45}
+ 45%|████▌     | 3089/6790 [1:47:10<2:08:10,  2.08s/it] 46%|████▌     | 3090/6790 [1:47:12<2:04:05,  2.01s/it]                                                       {'loss': 1.5801, 'learning_rate': 0.00023337226996085253, 'epoch': 0.46}
+ 46%|████▌     | 3090/6790 [1:47:12<2:04:05,  2.01s/it] 46%|████▌     | 3091/6790 [1:47:15<2:07:57,  2.08s/it]                                                       {'loss': 1.6437, 'learning_rate': 0.00023327966393226163, 'epoch': 0.46}
+ 46%|████▌     | 3091/6790 [1:47:15<2:07:57,  2.08s/it] 46%|████▌     | 3092/6790 [1:47:16<2:05:10,  2.03s/it]                                                       {'loss': 1.5551, 'learning_rate': 0.00023318705056484733, 'epoch': 0.46}
+ 46%|████▌     | 3092/6790 [1:47:16<2:05:10,  2.03s/it] 46%|████▌     | 3093/6790 [1:47:18<2:04:44,  2.02s/it]                                                       {'loss': 1.4584, 'learning_rate': 0.00023309442987903283, 'epoch': 0.46}
+ 46%|████▌     | 3093/6790 [1:47:18<2:04:44,  2.02s/it] 46%|████▌     | 3094/6790 [1:47:20<2:03:25,  2.00s/it]                                                       {'loss': 1.4203, 'learning_rate': 0.0002330018018952427, 'epoch': 0.46}
+ 46%|████▌     | 3094/6790 [1:47:20<2:03:25,  2.00s/it] 46%|████▌     | 3095/6790 [1:47:22<1:59:21,  1.94s/it]                                                       {'loss': 1.4113, 'learning_rate': 0.0002329091666339033, 'epoch': 0.46}
+ 46%|████▌     | 3095/6790 [1:47:22<1:59:21,  1.94s/it] 46%|████▌     | 3096/6790 [1:47:24<1:57:57,  1.92s/it]                                                       {'loss': 1.5075, 'learning_rate': 0.00023281652411544254, 'epoch': 0.46}
+ 46%|████▌     | 3096/6790 [1:47:24<1:57:57,  1.92s/it] 46%|████▌     | 3097/6790 [1:47:26<2:00:33,  1.96s/it]                                                       {'loss': 1.3837, 'learning_rate': 0.00023272387436028987, 'epoch': 0.46}
+ 46%|████▌     | 3097/6790 [1:47:26<2:00:33,  1.96s/it] 46%|████▌     | 3098/6790 [1:47:28<2:05:12,  2.03s/it]                                                       {'loss': 1.6381, 'learning_rate': 0.0002326312173888765, 'epoch': 0.46}
+ 46%|████▌     | 3098/6790 [1:47:28<2:05:12,  2.03s/it] 46%|████▌     | 3099/6790 [1:47:30<2:03:34,  2.01s/it]                                                       {'loss': 1.5944, 'learning_rate': 0.00023253855322163497, 'epoch': 0.46}
+ 46%|████▌     | 3099/6790 [1:47:30<2:03:34,  2.01s/it] 46%|████▌     | 3100/6790 [1:47:32<2:03:49,  2.01s/it]                                                       {'loss': 1.4256, 'learning_rate': 0.00023244588187899972, 'epoch': 0.46}
+ 46%|████▌     | 3100/6790 [1:47:32<2:03:49,  2.01s/it] 46%|████▌     | 3101/6790 [1:47:35<2:15:33,  2.20s/it]                                                       {'loss': 1.4845, 'learning_rate': 0.00023235320338140653, 'epoch': 0.46}
+ 46%|████▌     | 3101/6790 [1:47:35<2:15:33,  2.20s/it] 46%|████▌     | 3102/6790 [1:47:37<2:12:25,  2.15s/it]                                                       {'loss': 1.6219, 'learning_rate': 0.00023226051774929282, 'epoch': 0.46}
+ 46%|████▌     | 3102/6790 [1:47:37<2:12:25,  2.15s/it] 46%|████▌     | 3103/6790 [1:47:39<2:15:00,  2.20s/it]                                                       {'loss': 1.4123, 'learning_rate': 0.00023216782500309763, 'epoch': 0.46}
+ 46%|████▌     | 3103/6790 [1:47:39<2:15:00,  2.20s/it] 46%|████▌     | 3104/6790 [1:47:41<2:09:41,  2.11s/it]                                                       {'loss': 1.5358, 'learning_rate': 0.00023207512516326158, 'epoch': 0.46}
+ 46%|████▌     | 3104/6790 [1:47:41<2:09:41,  2.11s/it] 46%|████▌     | 3105/6790 [1:47:43<2:04:54,  2.03s/it]                                                       {'loss': 1.5049, 'learning_rate': 0.00023198241825022673, 'epoch': 0.46}
+ 46%|████▌     | 3105/6790 [1:47:43<2:04:54,  2.03s/it] 46%|████▌     | 3106/6790 [1:47:45<2:09:26,  2.11s/it]                                                       {'loss': 1.517, 'learning_rate': 0.00023188970428443688, 'epoch': 0.46}
+ 46%|████▌     | 3106/6790 [1:47:45<2:09:26,  2.11s/it] 46%|████▌     | 3107/6790 [1:47:48<2:14:48,  2.20s/it]                                                       {'loss': 1.3604, 'learning_rate': 0.00023179698328633724, 'epoch': 0.46}
+ 46%|████▌     | 3107/6790 [1:47:48<2:14:48,  2.20s/it] 46%|████▌     | 3108/6790 [1:47:50<2:10:00,  2.12s/it]                                                       {'loss': 1.5009, 'learning_rate': 0.00023170425527637459, 'epoch': 0.46}
+ 46%|████▌     | 3108/6790 [1:47:50<2:10:00,  2.12s/it] 46%|████▌     | 3109/6790 [1:47:52<2:08:16,  2.09s/it]                                                       {'loss': 1.5948, 'learning_rate': 0.00023161152027499738, 'epoch': 0.46}
+ 46%|████▌     | 3109/6790 [1:47:52<2:08:16,  2.09s/it] 46%|████▌     | 3110/6790 [1:47:54<2:06:53,  2.07s/it]                                                       {'loss': 1.5878, 'learning_rate': 0.00023151877830265537, 'epoch': 0.46}
+ 46%|████▌     | 3110/6790 [1:47:54<2:06:53,  2.07s/it] 46%|████▌     | 3111/6790 [1:47:56<2:08:12,  2.09s/it]                                                       {'loss': 1.6131, 'learning_rate': 0.0002314260293798002, 'epoch': 0.46}
+ 46%|████▌     | 3111/6790 [1:47:56<2:08:12,  2.09s/it] 46%|████▌     | 3112/6790 [1:47:58<2:11:01,  2.14s/it]                                                       {'loss': 1.4467, 'learning_rate': 0.00023133327352688464, 'epoch': 0.46}
+ 46%|████▌     | 3112/6790 [1:47:58<2:11:01,  2.14s/it] 46%|████▌     | 3113/6790 [1:48:00<2:06:18,  2.06s/it]                                                       {'loss': 1.526, 'learning_rate': 0.00023124051076436325, 'epoch': 0.46}
+ 46%|████▌     | 3113/6790 [1:48:00<2:06:18,  2.06s/it] 46%|████▌     | 3114/6790 [1:48:02<2:01:51,  1.99s/it]                                                       {'loss': 1.5473, 'learning_rate': 0.00023114774111269212, 'epoch': 0.46}
+ 46%|████▌     | 3114/6790 [1:48:02<2:01:51,  1.99s/it] 46%|████▌     | 3115/6790 [1:48:04<2:06:33,  2.07s/it]                                                       {'loss': 1.5548, 'learning_rate': 0.00023105496459232874, 'epoch': 0.46}
+ 46%|████▌     | 3115/6790 [1:48:04<2:06:33,  2.07s/it] 46%|████▌     | 3116/6790 [1:48:06<2:09:40,  2.12s/it]                                                       {'loss': 1.7391, 'learning_rate': 0.0002309621812237321, 'epoch': 0.46}
+ 46%|████▌     | 3116/6790 [1:48:06<2:09:40,  2.12s/it] 46%|████▌     | 3117/6790 [1:48:08<2:06:35,  2.07s/it]                                                       {'loss': 1.6306, 'learning_rate': 0.0002308693910273629, 'epoch': 0.46}
+ 46%|████▌     | 3117/6790 [1:48:08<2:06:35,  2.07s/it] 46%|████▌     | 3118/6790 [1:48:10<2:08:14,  2.10s/it]                                                       {'loss': 1.5498, 'learning_rate': 0.00023077659402368314, 'epoch': 0.46}
+ 46%|████▌     | 3118/6790 [1:48:10<2:08:14,  2.10s/it] 46%|████▌     | 3119/6790 [1:48:12<2:07:51,  2.09s/it]                                                       {'loss': 1.5011, 'learning_rate': 0.00023068379023315636, 'epoch': 0.46}
+ 46%|████▌     | 3119/6790 [1:48:12<2:07:51,  2.09s/it] 46%|████▌     | 3120/6790 [1:48:15<2:07:20,  2.08s/it]                                                       {'loss': 1.6496, 'learning_rate': 0.00023059097967624773, 'epoch': 0.46}
+ 46%|████▌     | 3120/6790 [1:48:15<2:07:20,  2.08s/it] 46%|████▌     | 3121/6790 [1:48:17<2:06:36,  2.07s/it]                                                       {'loss': 1.6473, 'learning_rate': 0.0002304981623734237, 'epoch': 0.46}
+ 46%|████▌     | 3121/6790 [1:48:17<2:06:36,  2.07s/it] 46%|████▌     | 3122/6790 [1:48:18<2:01:34,  1.99s/it]                                                       {'loss': 1.2563, 'learning_rate': 0.00023040533834515237, 'epoch': 0.46}
+ 46%|████▌     | 3122/6790 [1:48:18<2:01:34,  1.99s/it] 46%|████▌     | 3123/6790 [1:48:20<2:01:13,  1.98s/it]                                                       {'loss': 1.5476, 'learning_rate': 0.00023031250761190332, 'epoch': 0.46}
+ 46%|████▌     | 3123/6790 [1:48:20<2:01:13,  1.98s/it] 46%|████▌     | 3124/6790 [1:48:22<1:56:31,  1.91s/it]                                                       {'loss': 1.3671, 'learning_rate': 0.00023021967019414742, 'epoch': 0.46}
+ 46%|████▌     | 3124/6790 [1:48:22<1:56:31,  1.91s/it] 46%|████▌     | 3125/6790 [1:48:24<2:00:18,  1.97s/it]                                                       {'loss': 1.6138, 'learning_rate': 0.00023012682611235735, 'epoch': 0.46}
+ 46%|████▌     | 3125/6790 [1:48:24<2:00:18,  1.97s/it] 46%|████▌     | 3126/6790 [1:48:26<2:04:31,  2.04s/it]                                                       {'loss': 1.6092, 'learning_rate': 0.00023003397538700688, 'epoch': 0.46}
+ 46%|████▌     | 3126/6790 [1:48:26<2:04:31,  2.04s/it] 46%|████▌     | 3127/6790 [1:48:29<2:05:50,  2.06s/it]                                                       {'loss': 1.5879, 'learning_rate': 0.00022994111803857154, 'epoch': 0.46}
+ 46%|████▌     | 3127/6790 [1:48:29<2:05:50,  2.06s/it] 46%|████▌     | 3128/6790 [1:48:31<2:08:25,  2.10s/it]                                                       {'loss': 1.6298, 'learning_rate': 0.00022984825408752814, 'epoch': 0.46}
+ 46%|████▌     | 3128/6790 [1:48:31<2:08:25,  2.10s/it] 46%|████▌     | 3129/6790 [1:48:34<2:21:57,  2.33s/it]                                                       {'loss': 1.3748, 'learning_rate': 0.00022975538355435505, 'epoch': 0.46}
+ 46%|████▌     | 3129/6790 [1:48:34<2:21:57,  2.33s/it] 46%|████▌     | 3130/6790 [1:48:36<2:20:30,  2.30s/it]                                                       {'loss': 1.4367, 'learning_rate': 0.00022966250645953213, 'epoch': 0.46}
+ 46%|████▌     | 3130/6790 [1:48:36<2:20:30,  2.30s/it] 46%|████▌     | 3131/6790 [1:48:38<2:16:45,  2.24s/it]                                                       {'loss': 1.3233, 'learning_rate': 0.0002295696228235405, 'epoch': 0.46}
+ 46%|████▌     | 3131/6790 [1:48:38<2:16:45,  2.24s/it] 46%|████▌     | 3132/6790 [1:48:40<2:21:55,  2.33s/it]                                                       {'loss': 1.4211, 'learning_rate': 0.00022947673266686289, 'epoch': 0.46}
+ 46%|████▌     | 3132/6790 [1:48:40<2:21:55,  2.33s/it] 46%|████▌     | 3133/6790 [1:48:42<2:16:13,  2.23s/it]                                                       {'loss': 1.5755, 'learning_rate': 0.00022938383600998332, 'epoch': 0.46}
+ 46%|████▌     | 3133/6790 [1:48:42<2:16:13,  2.23s/it] 46%|████▌     | 3134/6790 [1:48:45<2:12:46,  2.18s/it]                                                       {'loss': 1.3472, 'learning_rate': 0.00022929093287338756, 'epoch': 0.46}
+ 46%|████▌     | 3134/6790 [1:48:45<2:12:46,  2.18s/it] 46%|████▌     | 3135/6790 [1:48:46<2:07:06,  2.09s/it]                                                       {'loss': 1.4034, 'learning_rate': 0.00022919802327756234, 'epoch': 0.46}
+ 46%|████▌     | 3135/6790 [1:48:46<2:07:06,  2.09s/it] 46%|████▌     | 3136/6790 [1:48:48<2:03:58,  2.04s/it]                                                       {'loss': 1.4775, 'learning_rate': 0.00022910510724299629, 'epoch': 0.46}
+ 46%|████▌     | 3136/6790 [1:48:48<2:03:58,  2.04s/it] 46%|████▌     | 3137/6790 [1:48:50<2:04:45,  2.05s/it]                                                       {'loss': 1.6916, 'learning_rate': 0.00022901218479017902, 'epoch': 0.46}
+ 46%|████▌     | 3137/6790 [1:48:50<2:04:45,  2.05s/it] 46%|████▌     | 3138/6790 [1:48:52<2:02:31,  2.01s/it]                                                       {'loss': 1.1347, 'learning_rate': 0.00022891925593960193, 'epoch': 0.46}
+ 46%|████▌     | 3138/6790 [1:48:52<2:02:31,  2.01s/it] 46%|████▌     | 3139/6790 [1:48:55<2:08:11,  2.11s/it]                                                       {'loss': 1.3257, 'learning_rate': 0.00022882632071175753, 'epoch': 0.46}
+ 46%|████▌     | 3139/6790 [1:48:55<2:08:11,  2.11s/it] 46%|████▌     | 3140/6790 [1:48:57<2:10:16,  2.14s/it]                                                       {'loss': 1.4052, 'learning_rate': 0.00022873337912713995, 'epoch': 0.46}
+ 46%|████▌     | 3140/6790 [1:48:57<2:10:16,  2.14s/it] 46%|████▋     | 3141/6790 [1:48:59<2:11:26,  2.16s/it]                                                       {'loss': 1.685, 'learning_rate': 0.00022864043120624463, 'epoch': 0.46}
+ 46%|████▋     | 3141/6790 [1:48:59<2:11:26,  2.16s/it] 46%|████▋     | 3142/6790 [1:49:01<2:10:59,  2.15s/it]                                                       {'loss': 1.66, 'learning_rate': 0.00022854747696956845, 'epoch': 0.46}
+ 46%|████▋     | 3142/6790 [1:49:01<2:10:59,  2.15s/it] 46%|████▋     | 3143/6790 [1:49:03<2:09:59,  2.14s/it]                                                       {'loss': 1.3637, 'learning_rate': 0.00022845451643760964, 'epoch': 0.46}
+ 46%|████▋     | 3143/6790 [1:49:03<2:09:59,  2.14s/it] 46%|████▋     | 3144/6790 [1:49:05<2:08:36,  2.12s/it]                                                       {'loss': 1.3709, 'learning_rate': 0.00022836154963086784, 'epoch': 0.46}
+ 46%|████▋     | 3144/6790 [1:49:05<2:08:36,  2.12s/it] 46%|████▋     | 3145/6790 [1:49:07<2:03:14,  2.03s/it]                                                       {'loss': 1.2202, 'learning_rate': 0.00022826857656984406, 'epoch': 0.46}
+ 46%|████▋     | 3145/6790 [1:49:07<2:03:14,  2.03s/it] 46%|████▋     | 3146/6790 [1:49:09<2:00:54,  1.99s/it]                                                       {'loss': 1.4279, 'learning_rate': 0.00022817559727504065, 'epoch': 0.46}
+ 46%|████▋     | 3146/6790 [1:49:09<2:00:54,  1.99s/it] 46%|████▋     | 3147/6790 [1:49:11<2:00:30,  1.98s/it]                                                       {'loss': 1.5805, 'learning_rate': 0.00022808261176696145, 'epoch': 0.46}
+ 46%|████▋     | 3147/6790 [1:49:11<2:00:30,  1.98s/it] 46%|████▋     | 3148/6790 [1:49:13<1:59:04,  1.96s/it]                                                       {'loss': 1.5588, 'learning_rate': 0.00022798962006611158, 'epoch': 0.46}
+ 46%|████▋     | 3148/6790 [1:49:13<1:59:04,  1.96s/it] 46%|████▋     | 3149/6790 [1:49:15<2:02:34,  2.02s/it]                                                       {'loss': 1.5153, 'learning_rate': 0.0002278966221929975, 'epoch': 0.46}
+ 46%|████▋     | 3149/6790 [1:49:15<2:02:34,  2.02s/it] 46%|████▋     | 3150/6790 [1:49:17<2:02:20,  2.02s/it]                                                       {'loss': 1.6208, 'learning_rate': 0.00022780361816812717, 'epoch': 0.46}
+ 46%|████▋     | 3150/6790 [1:49:17<2:02:20,  2.02s/it] 46%|████▋     | 3151/6790 [1:49:19<2:03:11,  2.03s/it]                                                       {'loss': 1.3498, 'learning_rate': 0.00022771060801200972, 'epoch': 0.46}
+ 46%|████▋     | 3151/6790 [1:49:19<2:03:11,  2.03s/it] 46%|████▋     | 3152/6790 [1:49:21<2:00:09,  1.98s/it]                                                       {'loss': 1.4927, 'learning_rate': 0.00022761759174515583, 'epoch': 0.46}
+ 46%|████▋     | 3152/6790 [1:49:21<2:00:09,  1.98s/it] 46%|████▋     | 3153/6790 [1:49:23<2:01:35,  2.01s/it]                                                       {'loss': 1.3718, 'learning_rate': 0.0002275245693880773, 'epoch': 0.46}
+ 46%|████▋     | 3153/6790 [1:49:23<2:01:35,  2.01s/it] 46%|████▋     | 3154/6790 [1:49:25<2:07:03,  2.10s/it]                                                       {'loss': 1.4322, 'learning_rate': 0.00022743154096128754, 'epoch': 0.46}
+ 46%|████▋     | 3154/6790 [1:49:25<2:07:03,  2.10s/it] 46%|████▋     | 3155/6790 [1:49:27<2:05:09,  2.07s/it]                                                       {'loss': 1.3819, 'learning_rate': 0.00022733850648530104, 'epoch': 0.46}
+ 46%|████▋     | 3155/6790 [1:49:27<2:05:09,  2.07s/it] 46%|████▋     | 3156/6790 [1:49:29<2:01:49,  2.01s/it]                                                       {'loss': 1.4085, 'learning_rate': 0.00022724546598063374, 'epoch': 0.46}
+ 46%|████▋     | 3156/6790 [1:49:29<2:01:49,  2.01s/it] 46%|████▋     | 3157/6790 [1:49:31<2:02:28,  2.02s/it]                                                       {'loss': 1.4947, 'learning_rate': 0.00022715241946780302, 'epoch': 0.46}
+ 46%|████▋     | 3157/6790 [1:49:31<2:02:28,  2.02s/it] 47%|████▋     | 3158/6790 [1:49:33<1:57:26,  1.94s/it]                                                       {'loss': 1.498, 'learning_rate': 0.00022705936696732737, 'epoch': 0.47}
+ 47%|████▋     | 3158/6790 [1:49:33<1:57:26,  1.94s/it] 47%|████▋     | 3159/6790 [1:49:36<2:09:18,  2.14s/it]                                                       {'loss': 1.3292, 'learning_rate': 0.00022696630849972676, 'epoch': 0.47}
+ 47%|████▋     | 3159/6790 [1:49:36<2:09:18,  2.14s/it] 47%|████▋     | 3160/6790 [1:49:38<2:12:46,  2.19s/it]                                                       {'loss': 1.5059, 'learning_rate': 0.00022687324408552235, 'epoch': 0.47}
+ 47%|████▋     | 3160/6790 [1:49:38<2:12:46,  2.19s/it] 47%|████▋     | 3161/6790 [1:49:40<2:08:01,  2.12s/it]                                                       {'loss': 1.2829, 'learning_rate': 0.0002267801737452368, 'epoch': 0.47}
+ 47%|████▋     | 3161/6790 [1:49:40<2:08:01,  2.12s/it] 47%|████▋     | 3162/6790 [1:49:42<2:11:26,  2.17s/it]                                                       {'loss': 1.438, 'learning_rate': 0.0002266870974993938, 'epoch': 0.47}
+ 47%|████▋     | 3162/6790 [1:49:42<2:11:26,  2.17s/it] 47%|████▋     | 3163/6790 [1:49:44<2:08:43,  2.13s/it]                                                       {'loss': 1.3945, 'learning_rate': 0.00022659401536851865, 'epoch': 0.47}
+ 47%|████▋     | 3163/6790 [1:49:44<2:08:43,  2.13s/it] 47%|████▋     | 3164/6790 [1:49:46<2:02:39,  2.03s/it]                                                       {'loss': 1.3503, 'learning_rate': 0.00022650092737313773, 'epoch': 0.47}
+ 47%|████▋     | 3164/6790 [1:49:46<2:02:39,  2.03s/it] 47%|████▋     | 3165/6790 [1:49:49<2:09:11,  2.14s/it]                                                       {'loss': 1.4985, 'learning_rate': 0.00022640783353377879, 'epoch': 0.47}
+ 47%|████▋     | 3165/6790 [1:49:49<2:09:11,  2.14s/it] 47%|████▋     | 3166/6790 [1:49:51<2:09:41,  2.15s/it]                                                       {'loss': 1.4992, 'learning_rate': 0.00022631473387097088, 'epoch': 0.47}
+ 47%|████▋     | 3166/6790 [1:49:51<2:09:41,  2.15s/it] 47%|████▋     | 3167/6790 [1:49:53<2:10:27,  2.16s/it]                                                       {'loss': 1.4936, 'learning_rate': 0.0002262216284052442, 'epoch': 0.47}
+ 47%|████▋     | 3167/6790 [1:49:53<2:10:27,  2.16s/it] 47%|████▋     | 3168/6790 [1:49:55<2:08:15,  2.12s/it]                                                       {'loss': 1.4554, 'learning_rate': 0.00022612851715713057, 'epoch': 0.47}
+ 47%|████▋     | 3168/6790 [1:49:55<2:08:15,  2.12s/it] 47%|████▋     | 3169/6790 [1:49:57<2:05:18,  2.08s/it]                                                       {'loss': 1.6564, 'learning_rate': 0.00022603540014716264, 'epoch': 0.47}
+ 47%|████▋     | 3169/6790 [1:49:57<2:05:18,  2.08s/it] 47%|████▋     | 3170/6790 [1:49:59<2:02:29,  2.03s/it]                                                       {'loss': 1.6251, 'learning_rate': 0.00022594227739587472, 'epoch': 0.47}
+ 47%|████▋     | 3170/6790 [1:49:59<2:02:29,  2.03s/it] 47%|████▋     | 3171/6790 [1:50:01<2:02:40,  2.03s/it]                                                       {'loss': 1.2451, 'learning_rate': 0.00022584914892380205, 'epoch': 0.47}
+ 47%|████▋     | 3171/6790 [1:50:01<2:02:40,  2.03s/it] 47%|████▋     | 3172/6790 [1:50:03<2:00:45,  2.00s/it]                                                       {'loss': 1.5377, 'learning_rate': 0.00022575601475148145, 'epoch': 0.47}
+ 47%|████▋     | 3172/6790 [1:50:03<2:00:45,  2.00s/it] 47%|████▋     | 3173/6790 [1:50:05<2:08:45,  2.14s/it]                                                       {'loss': 1.5124, 'learning_rate': 0.0002256628748994508, 'epoch': 0.47}
+ 47%|████▋     | 3173/6790 [1:50:05<2:08:45,  2.14s/it] 47%|████▋     | 3174/6790 [1:50:07<2:04:06,  2.06s/it]                                                       {'loss': 1.5247, 'learning_rate': 0.0002255697293882492, 'epoch': 0.47}
+ 47%|████▋     | 3174/6790 [1:50:07<2:04:06,  2.06s/it] 47%|████▋     | 3175/6790 [1:50:09<2:05:49,  2.09s/it]                                                       {'loss': 1.4694, 'learning_rate': 0.00022547657823841717, 'epoch': 0.47}
+ 47%|████▋     | 3175/6790 [1:50:09<2:05:49,  2.09s/it] 47%|████▋     | 3176/6790 [1:50:11<2:07:54,  2.12s/it]                                                       {'loss': 1.3997, 'learning_rate': 0.00022538342147049631, 'epoch': 0.47}
+ 47%|████▋     | 3176/6790 [1:50:11<2:07:54,  2.12s/it] 47%|████▋     | 3177/6790 [1:50:13<2:05:48,  2.09s/it]                                                       {'loss': 1.3937, 'learning_rate': 0.00022529025910502957, 'epoch': 0.47}
+ 47%|████▋     | 3177/6790 [1:50:13<2:05:48,  2.09s/it] 47%|████▋     | 3178/6790 [1:50:15<2:03:50,  2.06s/it]                                                       {'loss': 1.3958, 'learning_rate': 0.00022519709116256107, 'epoch': 0.47}
+ 47%|████▋     | 3178/6790 [1:50:15<2:03:50,  2.06s/it] 47%|████▋     | 3179/6790 [1:50:18<2:20:25,  2.33s/it]                                                       {'loss': 1.3564, 'learning_rate': 0.0002251039176636362, 'epoch': 0.47}
+ 47%|████▋     | 3179/6790 [1:50:18<2:20:25,  2.33s/it] 47%|████▋     | 3180/6790 [1:50:20<2:13:11,  2.21s/it]                                                       {'loss': 1.71, 'learning_rate': 0.00022501073862880158, 'epoch': 0.47}
+ 47%|████▋     | 3180/6790 [1:50:20<2:13:11,  2.21s/it] 47%|████▋     | 3181/6790 [1:50:23<2:12:40,  2.21s/it]                                                       {'loss': 1.5089, 'learning_rate': 0.00022491755407860495, 'epoch': 0.47}
+ 47%|████▋     | 3181/6790 [1:50:23<2:12:40,  2.21s/it] 47%|████▋     | 3182/6790 [1:50:24<2:06:58,  2.11s/it]                                                       {'loss': 1.3593, 'learning_rate': 0.00022482436403359546, 'epoch': 0.47}
+ 47%|████▋     | 3182/6790 [1:50:24<2:06:58,  2.11s/it] 47%|████▋     | 3183/6790 [1:50:27<2:07:15,  2.12s/it]                                                       {'loss': 1.424, 'learning_rate': 0.0002247311685143232, 'epoch': 0.47}
+ 47%|████▋     | 3183/6790 [1:50:27<2:07:15,  2.12s/it] 47%|████▋     | 3184/6790 [1:50:28<1:59:15,  1.98s/it]                                                       {'loss': 1.4532, 'learning_rate': 0.00022463796754133974, 'epoch': 0.47}
+ 47%|████▋     | 3184/6790 [1:50:28<1:59:15,  1.98s/it] 47%|████▋     | 3185/6790 [1:50:30<1:55:22,  1.92s/it]                                                       {'loss': 1.4238, 'learning_rate': 0.0002245447611351977, 'epoch': 0.47}
+ 47%|████▋     | 3185/6790 [1:50:30<1:55:22,  1.92s/it] 47%|████▋     | 3186/6790 [1:50:32<1:52:40,  1.88s/it]                                                       {'loss': 1.3488, 'learning_rate': 0.000224451549316451, 'epoch': 0.47}
+ 47%|████▋     | 3186/6790 [1:50:32<1:52:40,  1.88s/it] 47%|████▋     | 3187/6790 [1:50:34<1:56:49,  1.95s/it]                                                       {'loss': 1.3641, 'learning_rate': 0.00022435833210565455, 'epoch': 0.47}
+ 47%|████▋     | 3187/6790 [1:50:34<1:56:49,  1.95s/it] 47%|████▋     | 3188/6790 [1:50:36<1:57:51,  1.96s/it]                                                       {'loss': 1.521, 'learning_rate': 0.00022426510952336474, 'epoch': 0.47}
+ 47%|████▋     | 3188/6790 [1:50:36<1:57:51,  1.96s/it] 47%|████▋     | 3189/6790 [1:50:38<2:01:44,  2.03s/it]                                                       {'loss': 1.5656, 'learning_rate': 0.0002241718815901389, 'epoch': 0.47}
+ 47%|████▋     | 3189/6790 [1:50:38<2:01:44,  2.03s/it] 47%|████▋     | 3190/6790 [1:50:40<2:04:20,  2.07s/it]                                                       {'loss': 1.5815, 'learning_rate': 0.00022407864832653558, 'epoch': 0.47}
+ 47%|████▋     | 3190/6790 [1:50:40<2:04:20,  2.07s/it] 47%|████▋     | 3191/6790 [1:50:43<2:11:05,  2.19s/it]                                                       {'loss': 1.2533, 'learning_rate': 0.00022398540975311472, 'epoch': 0.47}
+ 47%|████▋     | 3191/6790 [1:50:43<2:11:05,  2.19s/it] 47%|████▋     | 3192/6790 [1:50:44<2:01:47,  2.03s/it]                                                       {'loss': 1.2384, 'learning_rate': 0.00022389216589043708, 'epoch': 0.47}
+ 47%|████▋     | 3192/6790 [1:50:44<2:01:47,  2.03s/it] 47%|████▋     | 3193/6790 [1:50:46<2:00:21,  2.01s/it]                                                       {'loss': 1.452, 'learning_rate': 0.00022379891675906492, 'epoch': 0.47}
+ 47%|████▋     | 3193/6790 [1:50:46<2:00:21,  2.01s/it] 47%|████▋     | 3194/6790 [1:50:48<1:59:56,  2.00s/it]                                                       {'loss': 1.3144, 'learning_rate': 0.00022370566237956142, 'epoch': 0.47}
+ 47%|████▋     | 3194/6790 [1:50:48<1:59:56,  2.00s/it] 47%|████▋     | 3195/6790 [1:50:50<1:58:57,  1.99s/it]                                                       {'loss': 1.448, 'learning_rate': 0.00022361240277249107, 'epoch': 0.47}
+ 47%|████▋     | 3195/6790 [1:50:50<1:58:57,  1.99s/it] 47%|████▋     | 3196/6790 [1:50:52<1:59:58,  2.00s/it]                                                       {'loss': 1.6691, 'learning_rate': 0.00022351913795841947, 'epoch': 0.47}
+ 47%|████▋     | 3196/6790 [1:50:52<1:59:58,  2.00s/it] 47%|████▋     | 3197/6790 [1:50:54<2:00:19,  2.01s/it]                                                       {'loss': 1.4887, 'learning_rate': 0.0002234258679579133, 'epoch': 0.47}
+ 47%|████▋     | 3197/6790 [1:50:54<2:00:19,  2.01s/it] 47%|████▋     | 3198/6790 [1:50:56<2:02:19,  2.04s/it]                                                       {'loss': 1.4186, 'learning_rate': 0.0002233325927915405, 'epoch': 0.47}
+ 47%|████▋     | 3198/6790 [1:50:56<2:02:19,  2.04s/it] 47%|████▋     | 3199/6790 [1:50:58<1:57:58,  1.97s/it]                                                       {'loss': 1.4299, 'learning_rate': 0.00022323931247986996, 'epoch': 0.47}
+ 47%|████▋     | 3199/6790 [1:50:58<1:57:58,  1.97s/it] 47%|████▋     | 3200/6790 [1:51:00<1:55:06,  1.92s/it]                                                       {'loss': 1.3309, 'learning_rate': 0.00022314602704347203, 'epoch': 0.47}
+ 47%|████▋     | 3200/6790 [1:51:00<1:55:06,  1.92s/it] 47%|████▋     | 3201/6790 [1:51:02<1:54:14,  1.91s/it]                                                       {'loss': 1.5214, 'learning_rate': 0.00022305273650291777, 'epoch': 0.47}
+ 47%|████▋     | 3201/6790 [1:51:02<1:54:14,  1.91s/it] 47%|████▋     | 3202/6790 [1:51:04<1:55:59,  1.94s/it]                                                       {'loss': 1.4141, 'learning_rate': 0.00022295944087877975, 'epoch': 0.47}
+ 47%|████▋     | 3202/6790 [1:51:04<1:55:59,  1.94s/it] 47%|████▋     | 3203/6790 [1:51:06<1:57:18,  1.96s/it]                                                       {'loss': 1.6604, 'learning_rate': 0.00022286614019163145, 'epoch': 0.47}
+ 47%|████▋     | 3203/6790 [1:51:06<1:57:18,  1.96s/it] 47%|████▋     | 3204/6790 [1:51:08<1:57:36,  1.97s/it]                                                       {'loss': 1.6776, 'learning_rate': 0.00022277283446204744, 'epoch': 0.47}
+ 47%|████▋     | 3204/6790 [1:51:08<1:57:36,  1.97s/it] 47%|████▋     | 3205/6790 [1:51:10<2:01:49,  2.04s/it]                                                       {'loss': 1.5363, 'learning_rate': 0.00022267952371060362, 'epoch': 0.47}
+ 47%|████▋     | 3205/6790 [1:51:10<2:01:49,  2.04s/it] 47%|████▋     | 3206/6790 [1:51:12<1:59:38,  2.00s/it]                                                       {'loss': 1.5241, 'learning_rate': 0.0002225862079578768, 'epoch': 0.47}
+ 47%|████▋     | 3206/6790 [1:51:12<1:59:38,  2.00s/it] 47%|████▋     | 3207/6790 [1:51:14<1:55:04,  1.93s/it]                                                       {'loss': 1.326, 'learning_rate': 0.0002224928872244449, 'epoch': 0.47}
+ 47%|████▋     | 3207/6790 [1:51:14<1:55:04,  1.93s/it] 47%|████▋     | 3208/6790 [1:51:16<1:53:49,  1.91s/it]                                                       {'loss': 1.4701, 'learning_rate': 0.00022239956153088702, 'epoch': 0.47}
+ 47%|████▋     | 3208/6790 [1:51:16<1:53:49,  1.91s/it] 47%|████▋     | 3209/6790 [1:51:18<1:57:47,  1.97s/it]                                                       {'loss': 1.4015, 'learning_rate': 0.00022230623089778328, 'epoch': 0.47}
+ 47%|████▋     | 3209/6790 [1:51:18<1:57:47,  1.97s/it] 47%|████▋     | 3210/6790 [1:51:20<1:56:42,  1.96s/it]                                                       {'loss': 1.5758, 'learning_rate': 0.000222212895345715, 'epoch': 0.47}
+ 47%|████▋     | 3210/6790 [1:51:20<1:56:42,  1.96s/it] 47%|████▋     | 3211/6790 [1:51:22<1:55:54,  1.94s/it]                                                       {'loss': 1.5139, 'learning_rate': 0.00022211955489526443, 'epoch': 0.47}
+ 47%|████▋     | 3211/6790 [1:51:22<1:55:54,  1.94s/it] 47%|████▋     | 3212/6790 [1:51:24<1:55:03,  1.93s/it]                                                       {'loss': 1.4665, 'learning_rate': 0.0002220262095670151, 'epoch': 0.47}
+ 47%|████▋     | 3212/6790 [1:51:24<1:55:03,  1.93s/it] 47%|████▋     | 3213/6790 [1:51:25<1:52:49,  1.89s/it]                                                       {'loss': 1.6276, 'learning_rate': 0.00022193285938155137, 'epoch': 0.47}
+ 47%|████▋     | 3213/6790 [1:51:25<1:52:49,  1.89s/it] 47%|████▋     | 3214/6790 [1:51:28<1:58:27,  1.99s/it]                                                       {'loss': 1.8528, 'learning_rate': 0.00022183950435945886, 'epoch': 0.47}
+ 47%|████▋     | 3214/6790 [1:51:28<1:58:27,  1.99s/it] 47%|████▋     | 3215/6790 [1:51:30<2:01:27,  2.04s/it]                                                       {'loss': 1.4858, 'learning_rate': 0.0002217461445213242, 'epoch': 0.47}
+ 47%|████▋     | 3215/6790 [1:51:30<2:01:27,  2.04s/it] 47%|████▋     | 3216/6790 [1:51:32<2:00:07,  2.02s/it]                                                       {'loss': 1.5668, 'learning_rate': 0.00022165277988773512, 'epoch': 0.47}
+ 47%|████▋     | 3216/6790 [1:51:32<2:00:07,  2.02s/it] 47%|████▋     | 3217/6790 [1:51:34<2:01:33,  2.04s/it]                                                       {'loss': 1.5537, 'learning_rate': 0.00022155941047928023, 'epoch': 0.47}
+ 47%|████▋     | 3217/6790 [1:51:34<2:01:33,  2.04s/it] 47%|████▋     | 3218/6790 [1:51:36<2:01:51,  2.05s/it]                                                       {'loss': 1.487, 'learning_rate': 0.00022146603631654946, 'epoch': 0.47}
+ 47%|████▋     | 3218/6790 [1:51:36<2:01:51,  2.05s/it] 47%|████▋     | 3219/6790 [1:51:38<2:04:42,  2.10s/it]                                                       {'loss': 1.6238, 'learning_rate': 0.00022137265742013358, 'epoch': 0.47}
+ 47%|████▋     | 3219/6790 [1:51:38<2:04:42,  2.10s/it] 47%|████▋     | 3220/6790 [1:51:40<2:00:05,  2.02s/it]                                                       {'loss': 1.373, 'learning_rate': 0.0002212792738106246, 'epoch': 0.47}
+ 47%|████▋     | 3220/6790 [1:51:40<2:00:05,  2.02s/it] 47%|████▋     | 3221/6790 [1:51:42<2:05:21,  2.11s/it]                                                       {'loss': 1.6258, 'learning_rate': 0.0002211858855086153, 'epoch': 0.47}
+ 47%|████▋     | 3221/6790 [1:51:42<2:05:21,  2.11s/it] 47%|████▋     | 3222/6790 [1:51:44<2:07:23,  2.14s/it]                                                       {'loss': 1.5688, 'learning_rate': 0.00022109249253469967, 'epoch': 0.47}
+ 47%|████▋     | 3222/6790 [1:51:44<2:07:23,  2.14s/it] 47%|████▋     | 3223/6790 [1:51:47<2:08:15,  2.16s/it]                                                       {'loss': 1.3963, 'learning_rate': 0.00022099909490947285, 'epoch': 0.47}
+ 47%|████▋     | 3223/6790 [1:51:47<2:08:15,  2.16s/it] 47%|████▋     | 3224/6790 [1:51:49<2:09:44,  2.18s/it]                                                       {'loss': 1.6596, 'learning_rate': 0.00022090569265353072, 'epoch': 0.47}
+ 47%|████▋     | 3224/6790 [1:51:49<2:09:44,  2.18s/it] 47%|████▋     | 3225/6790 [1:51:51<2:03:39,  2.08s/it]                                                       {'loss': 1.3374, 'learning_rate': 0.00022081228578747038, 'epoch': 0.47}
+ 47%|████▋     | 3225/6790 [1:51:51<2:03:39,  2.08s/it] 48%|████▊     | 3226/6790 [1:51:53<2:00:59,  2.04s/it]                                                       {'loss': 1.5858, 'learning_rate': 0.0002207188743318898, 'epoch': 0.48}
+ 48%|████▊     | 3226/6790 [1:51:53<2:00:59,  2.04s/it] 48%|████▊     | 3227/6790 [1:51:55<2:01:09,  2.04s/it]                                                       {'loss': 1.3095, 'learning_rate': 0.0002206254583073882, 'epoch': 0.48}
+ 48%|████▊     | 3227/6790 [1:51:55<2:01:09,  2.04s/it] 48%|████▊     | 3228/6790 [1:51:57<1:57:27,  1.98s/it]                                                       {'loss': 1.3889, 'learning_rate': 0.00022053203773456556, 'epoch': 0.48}
+ 48%|████▊     | 3228/6790 [1:51:57<1:57:27,  1.98s/it] 48%|████▊     | 3229/6790 [1:51:58<1:56:22,  1.96s/it]                                                       {'loss': 1.4067, 'learning_rate': 0.00022043861263402296, 'epoch': 0.48}
+ 48%|████▊     | 3229/6790 [1:51:58<1:56:22,  1.96s/it] 48%|████▊     | 3230/6790 [1:52:00<1:56:43,  1.97s/it]                                                       {'loss': 1.5934, 'learning_rate': 0.00022034518302636253, 'epoch': 0.48}
+ 48%|████▊     | 3230/6790 [1:52:00<1:56:43,  1.97s/it] 48%|████▊     | 3231/6790 [1:52:03<1:58:45,  2.00s/it]                                                       {'loss': 1.439, 'learning_rate': 0.00022025174893218727, 'epoch': 0.48}
+ 48%|████▊     | 3231/6790 [1:52:03<1:58:45,  2.00s/it] 48%|████▊     | 3232/6790 [1:52:04<1:58:09,  1.99s/it]                                                       {'loss': 1.4352, 'learning_rate': 0.00022015831037210134, 'epoch': 0.48}
+ 48%|████▊     | 3232/6790 [1:52:04<1:58:09,  1.99s/it] 48%|████▊     | 3233/6790 [1:52:06<1:57:40,  1.98s/it]                                                       {'loss': 1.4913, 'learning_rate': 0.00022006486736670975, 'epoch': 0.48}
+ 48%|████▊     | 3233/6790 [1:52:06<1:57:40,  1.98s/it] 48%|████▊     | 3234/6790 [1:52:08<1:54:45,  1.94s/it]                                                       {'loss': 1.3519, 'learning_rate': 0.00021997141993661848, 'epoch': 0.48}
+ 48%|████▊     | 3234/6790 [1:52:08<1:54:45,  1.94s/it] 48%|████▊     | 3235/6790 [1:52:10<1:53:12,  1.91s/it]                                                       {'loss': 1.3736, 'learning_rate': 0.00021987796810243456, 'epoch': 0.48}
+ 48%|████▊     | 3235/6790 [1:52:10<1:53:12,  1.91s/it] 48%|████▊     | 3236/6790 [1:52:12<1:52:53,  1.91s/it]                                                       {'loss': 1.5752, 'learning_rate': 0.00021978451188476604, 'epoch': 0.48}
+ 48%|████▊     | 3236/6790 [1:52:12<1:52:53,  1.91s/it] 48%|████▊     | 3237/6790 [1:52:14<1:56:19,  1.96s/it]                                                       {'loss': 1.4871, 'learning_rate': 0.00021969105130422177, 'epoch': 0.48}
+ 48%|████▊     | 3237/6790 [1:52:14<1:56:19,  1.96s/it] 48%|████▊     | 3238/6790 [1:52:16<1:56:21,  1.97s/it]                                                       {'loss': 1.6028, 'learning_rate': 0.0002195975863814116, 'epoch': 0.48}
+ 48%|████▊     | 3238/6790 [1:52:16<1:56:21,  1.97s/it] 48%|████▊     | 3239/6790 [1:52:18<2:03:16,  2.08s/it]                                                       {'loss': 1.4483, 'learning_rate': 0.0002195041171369466, 'epoch': 0.48}
+ 48%|████▊     | 3239/6790 [1:52:18<2:03:16,  2.08s/it] 48%|████▊     | 3240/6790 [1:52:20<1:59:53,  2.03s/it]                                                       {'loss': 1.3213, 'learning_rate': 0.00021941064359143843, 'epoch': 0.48}
+ 48%|████▊     | 3240/6790 [1:52:20<1:59:53,  2.03s/it] 48%|████▊     | 3241/6790 [1:52:22<1:59:14,  2.02s/it]                                                       {'loss': 1.2323, 'learning_rate': 0.0002193171657654999, 'epoch': 0.48}
+ 48%|████▊     | 3241/6790 [1:52:22<1:59:14,  2.02s/it] 48%|████▊     | 3242/6790 [1:52:25<2:04:32,  2.11s/it]                                                       {'loss': 1.6199, 'learning_rate': 0.00021922368367974465, 'epoch': 0.48}
+ 48%|████▊     | 3242/6790 [1:52:25<2:04:32,  2.11s/it] 48%|████▊     | 3243/6790 [1:52:27<2:06:31,  2.14s/it]                                                       {'loss': 1.5917, 'learning_rate': 0.00021913019735478746, 'epoch': 0.48}
+ 48%|████▊     | 3243/6790 [1:52:27<2:06:31,  2.14s/it] 48%|████▊     | 3244/6790 [1:52:29<2:06:36,  2.14s/it]                                                       {'loss': 1.5713, 'learning_rate': 0.00021903670681124374, 'epoch': 0.48}
+ 48%|████▊     | 3244/6790 [1:52:29<2:06:36,  2.14s/it] 48%|████▊     | 3245/6790 [1:52:31<2:04:28,  2.11s/it]                                                       {'loss': 1.3313, 'learning_rate': 0.0002189432120697301, 'epoch': 0.48}
+ 48%|████▊     | 3245/6790 [1:52:31<2:04:28,  2.11s/it] 48%|████▊     | 3246/6790 [1:52:33<2:03:25,  2.09s/it]                                                       {'loss': 1.4835, 'learning_rate': 0.00021884971315086404, 'epoch': 0.48}
+ 48%|████▊     | 3246/6790 [1:52:33<2:03:25,  2.09s/it] 48%|████▊     | 3247/6790 [1:52:35<2:02:14,  2.07s/it]                                                       {'loss': 1.3442, 'learning_rate': 0.00021875621007526382, 'epoch': 0.48}
+ 48%|████▊     | 3247/6790 [1:52:35<2:02:14,  2.07s/it] 48%|████▊     | 3248/6790 [1:52:37<2:03:46,  2.10s/it]                                                       {'loss': 1.3806, 'learning_rate': 0.00021866270286354875, 'epoch': 0.48}
+ 48%|████▊     | 3248/6790 [1:52:37<2:03:46,  2.10s/it] 48%|████▊     | 3249/6790 [1:52:39<2:05:13,  2.12s/it]                                                       {'loss': 1.4992, 'learning_rate': 0.00021856919153633895, 'epoch': 0.48}
+ 48%|████▊     | 3249/6790 [1:52:39<2:05:13,  2.12s/it] 48%|████▊     | 3250/6790 [1:52:41<2:02:18,  2.07s/it]                                                       {'loss': 1.1651, 'learning_rate': 0.00021847567611425569, 'epoch': 0.48}
+ 48%|████▊     | 3250/6790 [1:52:41<2:02:18,  2.07s/it] 48%|████▊     | 3251/6790 [1:52:43<2:00:34,  2.04s/it]                                                       {'loss': 1.5147, 'learning_rate': 0.00021838215661792076, 'epoch': 0.48}
+ 48%|████▊     | 3251/6790 [1:52:43<2:00:34,  2.04s/it] 48%|████▊     | 3252/6790 [1:52:45<1:58:11,  2.00s/it]                                                       {'loss': 1.495, 'learning_rate': 0.00021828863306795713, 'epoch': 0.48}
+ 48%|████▊     | 3252/6790 [1:52:45<1:58:11,  2.00s/it] 48%|████▊     | 3253/6790 [1:52:47<1:58:52,  2.02s/it]                                                       {'loss': 1.6071, 'learning_rate': 0.00021819510548498866, 'epoch': 0.48}
+ 48%|████▊     | 3253/6790 [1:52:47<1:58:52,  2.02s/it] 48%|████▊     | 3254/6790 [1:52:50<2:04:35,  2.11s/it]                                                       {'loss': 1.3831, 'learning_rate': 0.00021810157388963997, 'epoch': 0.48}
+ 48%|████▊     | 3254/6790 [1:52:50<2:04:35,  2.11s/it] 48%|████▊     | 3255/6790 [1:52:52<2:02:31,  2.08s/it]                                                       {'loss': 1.3828, 'learning_rate': 0.00021800803830253666, 'epoch': 0.48}
+ 48%|████▊     | 3255/6790 [1:52:52<2:02:31,  2.08s/it] 48%|████▊     | 3256/6790 [1:52:54<2:09:38,  2.20s/it]                                                       {'loss': 1.2186, 'learning_rate': 0.0002179144987443051, 'epoch': 0.48}
+ 48%|████▊     | 3256/6790 [1:52:54<2:09:38,  2.20s/it] 48%|████▊     | 3257/6790 [1:52:56<2:05:46,  2.14s/it]                                                       {'loss': 1.4267, 'learning_rate': 0.00021782095523557274, 'epoch': 0.48}
+ 48%|████▊     | 3257/6790 [1:52:56<2:05:46,  2.14s/it] 48%|████▊     | 3258/6790 [1:52:58<2:01:44,  2.07s/it]                                                       {'loss': 1.5035, 'learning_rate': 0.00021772740779696763, 'epoch': 0.48}
+ 48%|████▊     | 3258/6790 [1:52:58<2:01:44,  2.07s/it] 48%|████▊     | 3259/6790 [1:53:00<2:05:18,  2.13s/it]                                                       {'loss': 1.5715, 'learning_rate': 0.00021763385644911894, 'epoch': 0.48}
+ 48%|████▊     | 3259/6790 [1:53:00<2:05:18,  2.13s/it] 48%|████▊     | 3260/6790 [1:53:02<1:59:25,  2.03s/it]                                                       {'loss': 1.2847, 'learning_rate': 0.0002175403012126565, 'epoch': 0.48}
+ 48%|████▊     | 3260/6790 [1:53:02<1:59:25,  2.03s/it] 48%|████▊     | 3261/6790 [1:53:04<1:57:37,  2.00s/it]                                                       {'loss': 1.351, 'learning_rate': 0.0002174467421082111, 'epoch': 0.48}
+ 48%|████▊     | 3261/6790 [1:53:04<1:57:37,  2.00s/it] 48%|████▊     | 3262/6790 [1:53:06<1:58:27,  2.01s/it]                                                       {'loss': 1.566, 'learning_rate': 0.00021735317915641447, 'epoch': 0.48}
+ 48%|████▊     | 3262/6790 [1:53:06<1:58:27,  2.01s/it] 48%|████▊     | 3263/6790 [1:53:08<2:05:08,  2.13s/it]                                                       {'loss': 1.4017, 'learning_rate': 0.000217259612377899, 'epoch': 0.48}
+ 48%|████▊     | 3263/6790 [1:53:09<2:05:08,  2.13s/it] 48%|████▊     | 3264/6790 [1:53:11<2:07:03,  2.16s/it]                                                       {'loss': 1.4468, 'learning_rate': 0.000217166041793298, 'epoch': 0.48}
+ 48%|████▊     | 3264/6790 [1:53:11<2:07:03,  2.16s/it] 48%|████▊     | 3265/6790 [1:53:13<2:03:43,  2.11s/it]                                                       {'loss': 1.5444, 'learning_rate': 0.00021707246742324568, 'epoch': 0.48}
+ 48%|████▊     | 3265/6790 [1:53:13<2:03:43,  2.11s/it] 48%|████▊     | 3266/6790 [1:53:14<1:57:28,  2.00s/it]                                                       {'loss': 1.511, 'learning_rate': 0.00021697888928837706, 'epoch': 0.48}
+ 48%|████▊     | 3266/6790 [1:53:14<1:57:28,  2.00s/it] 48%|████▊     | 3267/6790 [1:53:16<1:54:34,  1.95s/it]                                                       {'loss': 1.2569, 'learning_rate': 0.00021688530740932786, 'epoch': 0.48}
+ 48%|████▊     | 3267/6790 [1:53:16<1:54:34,  1.95s/it] 48%|████▊     | 3268/6790 [1:53:18<1:56:41,  1.99s/it]                                                       {'loss': 1.6451, 'learning_rate': 0.00021679172180673483, 'epoch': 0.48}
+ 48%|████▊     | 3268/6790 [1:53:18<1:56:41,  1.99s/it] 48%|████▊     | 3269/6790 [1:53:20<1:58:52,  2.03s/it]                                                       {'loss': 1.6356, 'learning_rate': 0.00021669813250123538, 'epoch': 0.48}
+ 48%|████▊     | 3269/6790 [1:53:21<1:58:52,  2.03s/it] 48%|████▊     | 3270/6790 [1:53:23<2:03:34,  2.11s/it]                                                       {'loss': 1.4577, 'learning_rate': 0.00021660453951346788, 'epoch': 0.48}
+ 48%|████▊     | 3270/6790 [1:53:23<2:03:34,  2.11s/it] 48%|████▊     | 3271/6790 [1:53:25<2:09:17,  2.20s/it]                                                       {'loss': 1.3282, 'learning_rate': 0.00021651094286407143, 'epoch': 0.48}
+ 48%|████▊     | 3271/6790 [1:53:25<2:09:17,  2.20s/it] 48%|████▊     | 3272/6790 [1:53:28<2:10:56,  2.23s/it]                                                       {'loss': 1.5421, 'learning_rate': 0.00021641734257368583, 'epoch': 0.48}
+ 48%|████▊     | 3272/6790 [1:53:28<2:10:56,  2.23s/it] 48%|████▊     | 3273/6790 [1:53:30<2:10:36,  2.23s/it]                                                       {'loss': 1.3798, 'learning_rate': 0.0002163237386629519, 'epoch': 0.48}
+ 48%|████▊     | 3273/6790 [1:53:30<2:10:36,  2.23s/it] 48%|████▊     | 3274/6790 [1:53:32<2:05:03,  2.13s/it]                                                       {'loss': 1.225, 'learning_rate': 0.0002162301311525111, 'epoch': 0.48}
+ 48%|████▊     | 3274/6790 [1:53:32<2:05:03,  2.13s/it] 48%|████▊     | 3275/6790 [1:53:34<2:03:02,  2.10s/it]                                                       {'loss': 1.66, 'learning_rate': 0.0002161365200630058, 'epoch': 0.48}
+ 48%|████▊     | 3275/6790 [1:53:34<2:03:02,  2.10s/it] 48%|████▊     | 3276/6790 [1:53:36<2:00:56,  2.07s/it]                                                       {'loss': 1.3666, 'learning_rate': 0.000216042905415079, 'epoch': 0.48}
+ 48%|████▊     | 3276/6790 [1:53:36<2:00:56,  2.07s/it] 48%|████▊     | 3277/6790 [1:53:38<1:59:31,  2.04s/it]                                                       {'loss': 1.3543, 'learning_rate': 0.0002159492872293746, 'epoch': 0.48}
+ 48%|████▊     | 3277/6790 [1:53:38<1:59:31,  2.04s/it] 48%|████▊     | 3278/6790 [1:53:40<1:58:55,  2.03s/it]                                                       {'loss': 1.5218, 'learning_rate': 0.00021585566552653732, 'epoch': 0.48}
+ 48%|████▊     | 3278/6790 [1:53:40<1:58:55,  2.03s/it] 48%|████▊     | 3279/6790 [1:53:42<2:01:25,  2.08s/it]                                                       {'loss': 1.6022, 'learning_rate': 0.00021576204032721253, 'epoch': 0.48}
+ 48%|████▊     | 3279/6790 [1:53:42<2:01:25,  2.08s/it] 48%|████▊     | 3280/6790 [1:53:44<1:58:24,  2.02s/it]                                                       {'loss': 1.3646, 'learning_rate': 0.0002156684116520465, 'epoch': 0.48}
+ 48%|████▊     | 3280/6790 [1:53:44<1:58:24,  2.02s/it] 48%|████▊     | 3281/6790 [1:53:46<1:56:35,  1.99s/it]                                                       {'loss': 1.484, 'learning_rate': 0.00021557477952168617, 'epoch': 0.48}
+ 48%|████▊     | 3281/6790 [1:53:46<1:56:35,  1.99s/it] 48%|████▊     | 3282/6790 [1:53:47<1:53:55,  1.95s/it]                                                       {'loss': 1.5282, 'learning_rate': 0.00021548114395677926, 'epoch': 0.48}
+ 48%|████▊     | 3282/6790 [1:53:48<1:53:55,  1.95s/it] 48%|████▊     | 3283/6790 [1:53:50<1:57:37,  2.01s/it]                                                       {'loss': 1.437, 'learning_rate': 0.00021538750497797425, 'epoch': 0.48}
+ 48%|████▊     | 3283/6790 [1:53:50<1:57:37,  2.01s/it] 48%|████▊     | 3284/6790 [1:53:52<1:58:56,  2.04s/it]                                                       {'loss': 1.4393, 'learning_rate': 0.0002152938626059204, 'epoch': 0.48}
+ 48%|████▊     | 3284/6790 [1:53:52<1:58:56,  2.04s/it] 48%|████▊     | 3285/6790 [1:53:54<1:56:42,  2.00s/it]                                                       {'loss': 1.5964, 'learning_rate': 0.0002152002168612677, 'epoch': 0.48}
+ 48%|████▊     | 3285/6790 [1:53:54<1:56:42,  2.00s/it] 48%|████▊     | 3286/6790 [1:53:56<1:56:51,  2.00s/it]                                                       {'loss': 1.3314, 'learning_rate': 0.00021510656776466692, 'epoch': 0.48}
+ 48%|████▊     | 3286/6790 [1:53:56<1:56:51,  2.00s/it] 48%|████▊     | 3287/6790 [1:53:58<1:56:23,  1.99s/it]                                                       {'loss': 1.4291, 'learning_rate': 0.00021501291533676954, 'epoch': 0.48}
+ 48%|████▊     | 3287/6790 [1:53:58<1:56:23,  1.99s/it] 48%|████▊     | 3288/6790 [1:54:00<2:01:14,  2.08s/it]                                                       {'loss': 1.5728, 'learning_rate': 0.00021491925959822773, 'epoch': 0.48}
+ 48%|████▊     | 3288/6790 [1:54:00<2:01:14,  2.08s/it] 48%|████▊     | 3289/6790 [1:54:02<1:58:55,  2.04s/it]                                                       {'loss': 1.4993, 'learning_rate': 0.00021482560056969443, 'epoch': 0.48}
+ 48%|████▊     | 3289/6790 [1:54:02<1:58:55,  2.04s/it] 48%|████▊     | 3290/6790 [1:54:04<1:59:48,  2.05s/it]                                                       {'loss': 1.3302, 'learning_rate': 0.00021473193827182332, 'epoch': 0.48}
+ 48%|████▊     | 3290/6790 [1:54:04<1:59:48,  2.05s/it] 48%|████▊     | 3291/6790 [1:54:06<2:00:13,  2.06s/it]                                                       {'loss': 1.7345, 'learning_rate': 0.00021463827272526884, 'epoch': 0.48}
+ 48%|████▊     | 3291/6790 [1:54:06<2:00:13,  2.06s/it] 48%|████▊     | 3292/6790 [1:54:08<1:59:51,  2.06s/it]                                                       {'loss': 1.3079, 'learning_rate': 0.00021454460395068598, 'epoch': 0.48}
+ 48%|████▊     | 3292/6790 [1:54:08<1:59:51,  2.06s/it] 48%|████▊     | 3293/6790 [1:54:10<1:57:03,  2.01s/it]                                                       {'loss': 1.5179, 'learning_rate': 0.00021445093196873058, 'epoch': 0.48}
+ 48%|████▊     | 3293/6790 [1:54:10<1:57:03,  2.01s/it] 49%|████▊     | 3294/6790 [1:54:14<2:24:37,  2.48s/it]                                                       {'loss': 1.443, 'learning_rate': 0.0002143572568000593, 'epoch': 0.49}
+ 49%|████▊     | 3294/6790 [1:54:14<2:24:37,  2.48s/it] 49%|████▊     | 3295/6790 [1:54:16<2:16:29,  2.34s/it]                                                       {'loss': 1.3913, 'learning_rate': 0.0002142635784653292, 'epoch': 0.49}
+ 49%|████▊     | 3295/6790 [1:54:16<2:16:29,  2.34s/it] 49%|████▊     | 3296/6790 [1:54:17<2:08:42,  2.21s/it]                                                       {'loss': 1.3597, 'learning_rate': 0.0002141698969851983, 'epoch': 0.49}
+ 49%|████▊     | 3296/6790 [1:54:17<2:08:42,  2.21s/it] 49%|████▊     | 3297/6790 [1:54:19<2:01:16,  2.08s/it]                                                       {'loss': 1.6395, 'learning_rate': 0.0002140762123803252, 'epoch': 0.49}
+ 49%|████▊     | 3297/6790 [1:54:19<2:01:16,  2.08s/it] 49%|████▊     | 3298/6790 [1:54:21<1:59:57,  2.06s/it]                                                       {'loss': 1.6796, 'learning_rate': 0.00021398252467136913, 'epoch': 0.49}
+ 49%|████▊     | 3298/6790 [1:54:21<1:59:57,  2.06s/it] 49%|████▊     | 3299/6790 [1:54:23<1:59:11,  2.05s/it]                                                       {'loss': 1.5334, 'learning_rate': 0.00021388883387899016, 'epoch': 0.49}
+ 49%|████▊     | 3299/6790 [1:54:23<1:59:11,  2.05s/it] 49%|████▊     | 3300/6790 [1:54:25<2:01:49,  2.09s/it]                                                       {'loss': 1.4029, 'learning_rate': 0.00021379514002384893, 'epoch': 0.49}
+ 49%|████▊     | 3300/6790 [1:54:26<2:01:49,  2.09s/it] 49%|████▊     | 3301/6790 [1:54:28<2:02:15,  2.10s/it]                                                       {'loss': 1.5003, 'learning_rate': 0.00021370144312660684, 'epoch': 0.49}
+ 49%|████▊     | 3301/6790 [1:54:28<2:02:15,  2.10s/it] 49%|████▊     | 3302/6790 [1:54:30<2:03:50,  2.13s/it]                                                       {'loss': 1.4076, 'learning_rate': 0.00021360774320792586, 'epoch': 0.49}
+ 49%|████▊     | 3302/6790 [1:54:30<2:03:50,  2.13s/it] 49%|████▊     | 3303/6790 [1:54:32<2:02:53,  2.11s/it]                                                       {'loss': 1.4523, 'learning_rate': 0.00021351404028846865, 'epoch': 0.49}
+ 49%|████▊     | 3303/6790 [1:54:32<2:02:53,  2.11s/it] 49%|████▊     | 3304/6790 [1:54:34<2:05:25,  2.16s/it]                                                       {'loss': 1.5187, 'learning_rate': 0.00021342033438889857, 'epoch': 0.49}
+ 49%|████▊     | 3304/6790 [1:54:34<2:05:25,  2.16s/it] 49%|████▊     | 3305/6790 [1:54:38<2:27:45,  2.54s/it]                                                       {'loss': 1.0828, 'learning_rate': 0.00021332662552987967, 'epoch': 0.49}
+ 49%|████▊     | 3305/6790 [1:54:38<2:27:45,  2.54s/it] 49%|████▊     | 3306/6790 [1:54:40<2:20:42,  2.42s/it]                                                       {'loss': 1.3643, 'learning_rate': 0.00021323291373207654, 'epoch': 0.49}
+ 49%|████▊     | 3306/6790 [1:54:40<2:20:42,  2.42s/it] 49%|████▊     | 3307/6790 [1:54:42<2:19:54,  2.41s/it]                                                       {'loss': 1.2249, 'learning_rate': 0.00021313919901615457, 'epoch': 0.49}
+ 49%|████▊     | 3307/6790 [1:54:42<2:19:54,  2.41s/it] 49%|████▊     | 3308/6790 [1:54:44<2:11:47,  2.27s/it]                                                       {'loss': 1.6569, 'learning_rate': 0.00021304548140277957, 'epoch': 0.49}
+ 49%|████▊     | 3308/6790 [1:54:44<2:11:47,  2.27s/it] 49%|████▊     | 3309/6790 [1:54:46<2:10:51,  2.26s/it]                                                       {'loss': 1.6204, 'learning_rate': 0.00021295176091261827, 'epoch': 0.49}
+ 49%|████▊     | 3309/6790 [1:54:46<2:10:51,  2.26s/it] 49%|████▊     | 3310/6790 [1:54:48<2:04:32,  2.15s/it]                                                       {'loss': 1.4242, 'learning_rate': 0.00021285803756633778, 'epoch': 0.49}
+ 49%|████▊     | 3310/6790 [1:54:48<2:04:32,  2.15s/it] 49%|████▉     | 3311/6790 [1:54:50<1:59:36,  2.06s/it]                                                       {'loss': 1.4654, 'learning_rate': 0.00021276431138460598, 'epoch': 0.49}
+ 49%|████▉     | 3311/6790 [1:54:50<1:59:36,  2.06s/it] 49%|████▉     | 3312/6790 [1:54:52<1:59:35,  2.06s/it]                                                       {'loss': 1.5498, 'learning_rate': 0.0002126705823880914, 'epoch': 0.49}
+ 49%|████▉     | 3312/6790 [1:54:52<1:59:35,  2.06s/it] 49%|████▉     | 3313/6790 [1:54:54<1:56:54,  2.02s/it]                                                       {'loss': 1.3662, 'learning_rate': 0.00021257685059746306, 'epoch': 0.49}
+ 49%|████▉     | 3313/6790 [1:54:54<1:56:54,  2.02s/it] 49%|████▉     | 3314/6790 [1:54:56<1:56:57,  2.02s/it]                                                       {'loss': 1.4937, 'learning_rate': 0.00021248311603339076, 'epoch': 0.49}
+ 49%|████▉     | 3314/6790 [1:54:56<1:56:57,  2.02s/it] 49%|████▉     | 3315/6790 [1:54:58<1:55:30,  1.99s/it]                                                       {'loss': 1.4215, 'learning_rate': 0.0002123893787165447, 'epoch': 0.49}
+ 49%|████▉     | 3315/6790 [1:54:58<1:55:30,  1.99s/it] 49%|████▉     | 3316/6790 [1:55:00<1:55:26,  1.99s/it]                                                       {'loss': 1.4272, 'learning_rate': 0.00021229563866759593, 'epoch': 0.49}
+ 49%|████▉     | 3316/6790 [1:55:00<1:55:26,  1.99s/it] 49%|████▉     | 3317/6790 [1:55:02<1:53:41,  1.96s/it]                                                       {'loss': 1.243, 'learning_rate': 0.0002122018959072159, 'epoch': 0.49}
+ 49%|████▉     | 3317/6790 [1:55:02<1:53:41,  1.96s/it] 49%|████▉     | 3318/6790 [1:55:04<1:55:32,  2.00s/it]                                                       {'loss': 1.3493, 'learning_rate': 0.00021210815045607677, 'epoch': 0.49}
+ 49%|████▉     | 3318/6790 [1:55:04<1:55:32,  2.00s/it] 49%|████▉     | 3319/6790 [1:55:06<1:50:23,  1.91s/it]                                                       {'loss': 1.352, 'learning_rate': 0.0002120144023348513, 'epoch': 0.49}
+ 49%|████▉     | 3319/6790 [1:55:06<1:50:23,  1.91s/it] 49%|████▉     | 3320/6790 [1:55:08<1:51:36,  1.93s/it]                                                       {'loss': 1.371, 'learning_rate': 0.00021192065156421265, 'epoch': 0.49}
+ 49%|████▉     | 3320/6790 [1:55:08<1:51:36,  1.93s/it] 49%|████▉     | 3321/6790 [1:55:10<1:55:16,  1.99s/it]                                                       {'loss': 1.4649, 'learning_rate': 0.00021182689816483493, 'epoch': 0.49}
+ 49%|████▉     | 3321/6790 [1:55:10<1:55:16,  1.99s/it] 49%|████▉     | 3322/6790 [1:55:12<1:57:35,  2.03s/it]                                                       {'loss': 1.4334, 'learning_rate': 0.00021173314215739252, 'epoch': 0.49}
+ 49%|████▉     | 3322/6790 [1:55:12<1:57:35,  2.03s/it] 49%|████▉     | 3323/6790 [1:55:14<1:59:33,  2.07s/it]                                                       {'loss': 1.4118, 'learning_rate': 0.00021163938356256047, 'epoch': 0.49}
+ 49%|████▉     | 3323/6790 [1:55:14<1:59:33,  2.07s/it] 49%|████▉     | 3324/6790 [1:55:16<1:58:30,  2.05s/it]                                                       {'loss': 1.263, 'learning_rate': 0.00021154562240101438, 'epoch': 0.49}
+ 49%|████▉     | 3324/6790 [1:55:16<1:58:30,  2.05s/it] 49%|████▉     | 3325/6790 [1:55:18<1:59:57,  2.08s/it]                                                       {'loss': 1.7381, 'learning_rate': 0.00021145185869343052, 'epoch': 0.49}
+ 49%|████▉     | 3325/6790 [1:55:18<1:59:57,  2.08s/it] 49%|████▉     | 3326/6790 [1:55:20<1:59:48,  2.08s/it]                                                       {'loss': 1.5526, 'learning_rate': 0.00021135809246048553, 'epoch': 0.49}
+ 49%|████▉     | 3326/6790 [1:55:20<1:59:48,  2.08s/it] 49%|████▉     | 3327/6790 [1:55:23<2:02:41,  2.13s/it]                                                       {'loss': 1.5065, 'learning_rate': 0.00021126432372285678, 'epoch': 0.49}
+ 49%|████▉     | 3327/6790 [1:55:23<2:02:41,  2.13s/it] 49%|████▉     | 3328/6790 [1:55:24<1:58:34,  2.06s/it]                                                       {'loss': 1.592, 'learning_rate': 0.00021117055250122215, 'epoch': 0.49}
+ 49%|████▉     | 3328/6790 [1:55:24<1:58:34,  2.06s/it] 49%|████▉     | 3329/6790 [1:55:26<1:57:55,  2.04s/it]                                                       {'loss': 1.5077, 'learning_rate': 0.00021107677881625997, 'epoch': 0.49}
+ 49%|████▉     | 3329/6790 [1:55:26<1:57:55,  2.04s/it] 49%|████▉     | 3330/6790 [1:55:29<2:00:40,  2.09s/it]                                                       {'loss': 1.4896, 'learning_rate': 0.00021098300268864928, 'epoch': 0.49}
+ 49%|████▉     | 3330/6790 [1:55:29<2:00:40,  2.09s/it] 49%|████▉     | 3331/6790 [1:55:31<1:59:04,  2.07s/it]                                                       {'loss': 1.4342, 'learning_rate': 0.00021088922413906952, 'epoch': 0.49}
+ 49%|████▉     | 3331/6790 [1:55:31<1:59:04,  2.07s/it] 49%|████▉     | 3332/6790 [1:55:33<1:57:47,  2.04s/it]                                                       {'loss': 1.3754, 'learning_rate': 0.00021079544318820071, 'epoch': 0.49}
+ 49%|████▉     | 3332/6790 [1:55:33<1:57:47,  2.04s/it] 49%|████▉     | 3333/6790 [1:55:35<2:01:24,  2.11s/it]                                                       {'loss': 1.3636, 'learning_rate': 0.0002107016598567234, 'epoch': 0.49}
+ 49%|████▉     | 3333/6790 [1:55:35<2:01:24,  2.11s/it] 49%|████▉     | 3334/6790 [1:55:37<2:01:46,  2.11s/it]                                                       {'loss': 1.6193, 'learning_rate': 0.0002106078741653186, 'epoch': 0.49}
+ 49%|████▉     | 3334/6790 [1:55:37<2:01:46,  2.11s/it] 49%|████▉     | 3335/6790 [1:55:39<2:00:26,  2.09s/it]                                                       {'loss': 1.3429, 'learning_rate': 0.0002105140861346681, 'epoch': 0.49}
+ 49%|████▉     | 3335/6790 [1:55:39<2:00:26,  2.09s/it] 49%|████▉     | 3336/6790 [1:55:41<1:58:23,  2.06s/it]                                                       {'loss': 1.398, 'learning_rate': 0.0002104202957854539, 'epoch': 0.49}
+ 49%|████▉     | 3336/6790 [1:55:41<1:58:23,  2.06s/it] 49%|████▉     | 3337/6790 [1:55:43<1:58:03,  2.05s/it]                                                       {'loss': 1.4952, 'learning_rate': 0.00021032650313835852, 'epoch': 0.49}
+ 49%|████▉     | 3337/6790 [1:55:43<1:58:03,  2.05s/it] 49%|████▉     | 3338/6790 [1:55:45<1:54:47,  2.00s/it]                                                       {'loss': 1.3688, 'learning_rate': 0.00021023270821406525, 'epoch': 0.49}
+ 49%|████▉     | 3338/6790 [1:55:45<1:54:47,  2.00s/it] 49%|████▉     | 3339/6790 [1:55:47<1:48:20,  1.88s/it]                                                       {'loss': 1.2289, 'learning_rate': 0.00021013891103325772, 'epoch': 0.49}
+ 49%|████▉     | 3339/6790 [1:55:47<1:48:20,  1.88s/it] 49%|████▉     | 3340/6790 [1:55:49<1:49:39,  1.91s/it]                                                       {'loss': 1.4125, 'learning_rate': 0.00021004511161661996, 'epoch': 0.49}
+ 49%|████▉     | 3340/6790 [1:55:49<1:49:39,  1.91s/it] 49%|████▉     | 3341/6790 [1:55:51<1:51:21,  1.94s/it]                                                       {'loss': 1.5116, 'learning_rate': 0.00020995130998483665, 'epoch': 0.49}
+ 49%|████▉     | 3341/6790 [1:55:51<1:51:21,  1.94s/it] 49%|████▉     | 3342/6790 [1:55:52<1:49:26,  1.90s/it]                                                       {'loss': 1.3925, 'learning_rate': 0.00020985750615859288, 'epoch': 0.49}
+ 49%|████▉     | 3342/6790 [1:55:52<1:49:26,  1.90s/it] 49%|████▉     | 3343/6790 [1:55:54<1:50:44,  1.93s/it]                                                       {'loss': 1.3106, 'learning_rate': 0.00020976370015857426, 'epoch': 0.49}
+ 49%|████▉     | 3343/6790 [1:55:54<1:50:44,  1.93s/it] 49%|████▉     | 3344/6790 [1:55:56<1:49:37,  1.91s/it]                                                       {'loss': 1.3369, 'learning_rate': 0.00020966989200546694, 'epoch': 0.49}
+ 49%|████▉     | 3344/6790 [1:55:56<1:49:37,  1.91s/it] 49%|████▉     | 3345/6790 [1:55:58<1:52:39,  1.96s/it]                                                       {'loss': 1.6139, 'learning_rate': 0.00020957608171995733, 'epoch': 0.49}
+ 49%|████▉     | 3345/6790 [1:55:58<1:52:39,  1.96s/it] 49%|████▉     | 3346/6790 [1:56:01<2:01:06,  2.11s/it]                                                       {'loss': 1.6698, 'learning_rate': 0.00020948226932273256, 'epoch': 0.49}
+ 49%|████▉     | 3346/6790 [1:56:01<2:01:06,  2.11s/it] 49%|████▉     | 3347/6790 [1:56:03<2:01:46,  2.12s/it]                                                       {'loss': 1.4465, 'learning_rate': 0.00020938845483448005, 'epoch': 0.49}
+ 49%|████▉     | 3347/6790 [1:56:03<2:01:46,  2.12s/it] 49%|████▉     | 3348/6790 [1:56:05<1:59:56,  2.09s/it]                                                       {'loss': 1.4162, 'learning_rate': 0.00020929463827588785, 'epoch': 0.49}
+ 49%|████▉     | 3348/6790 [1:56:05<1:59:56,  2.09s/it] 49%|████▉     | 3349/6790 [1:56:07<1:56:51,  2.04s/it]                                                       {'loss': 1.4922, 'learning_rate': 0.00020920081966764419, 'epoch': 0.49}
+ 49%|████▉     | 3349/6790 [1:56:07<1:56:51,  2.04s/it] 49%|████▉     | 3350/6790 [1:56:09<1:58:28,  2.07s/it]                                                       {'loss': 1.2607, 'learning_rate': 0.00020910699903043805, 'epoch': 0.49}
+ 49%|████▉     | 3350/6790 [1:56:09<1:58:28,  2.07s/it] 49%|████▉     | 3351/6790 [1:56:11<2:00:06,  2.10s/it]                                                       {'loss': 1.445, 'learning_rate': 0.00020901317638495878, 'epoch': 0.49}
+ 49%|████▉     | 3351/6790 [1:56:11<2:00:06,  2.10s/it] 49%|████▉     | 3352/6790 [1:56:13<1:59:19,  2.08s/it]                                                       {'loss': 1.2716, 'learning_rate': 0.000208919351751896, 'epoch': 0.49}
+ 49%|████▉     | 3352/6790 [1:56:13<1:59:19,  2.08s/it] 49%|████▉     | 3353/6790 [1:56:15<1:57:42,  2.05s/it]                                                       {'loss': 1.3808, 'learning_rate': 0.00020882552515194, 'epoch': 0.49}
+ 49%|████▉     | 3353/6790 [1:56:15<1:57:42,  2.05s/it] 49%|████▉     | 3354/6790 [1:56:17<1:55:32,  2.02s/it]                                                       {'loss': 1.6711, 'learning_rate': 0.00020873169660578126, 'epoch': 0.49}
+ 49%|████▉     | 3354/6790 [1:56:17<1:55:32,  2.02s/it] 49%|████▉     | 3355/6790 [1:56:19<1:53:51,  1.99s/it]                                                       {'loss': 1.7704, 'learning_rate': 0.00020863786613411098, 'epoch': 0.49}
+ 49%|████▉     | 3355/6790 [1:56:19<1:53:51,  1.99s/it] 49%|████▉     | 3356/6790 [1:56:21<1:50:28,  1.93s/it]                                                       {'loss': 1.516, 'learning_rate': 0.0002085440337576206, 'epoch': 0.49}
+ 49%|████▉     | 3356/6790 [1:56:21<1:50:28,  1.93s/it] 49%|████▉     | 3357/6790 [1:56:23<1:51:38,  1.95s/it]                                                       {'loss': 1.3072, 'learning_rate': 0.00020845019949700198, 'epoch': 0.49}
+ 49%|████▉     | 3357/6790 [1:56:23<1:51:38,  1.95s/it] 49%|████▉     | 3358/6790 [1:56:25<1:58:29,  2.07s/it]                                                       {'loss': 1.5349, 'learning_rate': 0.0002083563633729474, 'epoch': 0.49}
+ 49%|████▉     | 3358/6790 [1:56:25<1:58:29,  2.07s/it] 49%|████▉     | 3359/6790 [1:56:27<1:56:41,  2.04s/it]                                                       {'loss': 1.3915, 'learning_rate': 0.00020826252540614962, 'epoch': 0.49}
+ 49%|████▉     | 3359/6790 [1:56:27<1:56:41,  2.04s/it] 49%|████▉     | 3360/6790 [1:56:29<1:54:41,  2.01s/it]                                                       {'loss': 1.3614, 'learning_rate': 0.00020816868561730179, 'epoch': 0.49}
+ 49%|████▉     | 3360/6790 [1:56:29<1:54:41,  2.01s/it] 49%|████▉     | 3361/6790 [1:56:31<1:56:33,  2.04s/it]                                                       {'loss': 1.4322, 'learning_rate': 0.00020807484402709739, 'epoch': 0.49}
+ 49%|████▉     | 3361/6790 [1:56:31<1:56:33,  2.04s/it] 50%|████▉     | 3362/6790 [1:56:33<1:56:59,  2.05s/it]                                                       {'loss': 1.495, 'learning_rate': 0.00020798100065623037, 'epoch': 0.5}
+ 50%|████▉     | 3362/6790 [1:56:33<1:56:59,  2.05s/it] 50%|████▉     | 3363/6790 [1:56:36<2:03:47,  2.17s/it]                                                       {'loss': 1.337, 'learning_rate': 0.000207887155525395, 'epoch': 0.5}
+ 50%|████▉     | 3363/6790 [1:56:36<2:03:47,  2.17s/it] 50%|████▉     | 3364/6790 [1:56:38<2:06:35,  2.22s/it]                                                       {'loss': 1.1892, 'learning_rate': 0.00020779330865528607, 'epoch': 0.5}
+ 50%|████▉     | 3364/6790 [1:56:38<2:06:35,  2.22s/it] 50%|████▉     | 3365/6790 [1:56:40<2:06:13,  2.21s/it]                                                       {'loss': 1.4234, 'learning_rate': 0.0002076994600665986, 'epoch': 0.5}
+ 50%|████▉     | 3365/6790 [1:56:40<2:06:13,  2.21s/it] 50%|████▉     | 3366/6790 [1:56:42<1:57:35,  2.06s/it]                                                       {'loss': 1.4365, 'learning_rate': 0.00020760560978002807, 'epoch': 0.5}
+ 50%|████▉     | 3366/6790 [1:56:42<1:57:35,  2.06s/it] 50%|████▉     | 3367/6790 [1:56:44<1:57:29,  2.06s/it]                                                       {'loss': 1.3232, 'learning_rate': 0.00020751175781627036, 'epoch': 0.5}
+ 50%|████▉     | 3367/6790 [1:56:44<1:57:29,  2.06s/it] 50%|████▉     | 3368/6790 [1:56:46<1:57:38,  2.06s/it]                                                       {'loss': 1.6024, 'learning_rate': 0.00020741790419602163, 'epoch': 0.5}
+ 50%|████▉     | 3368/6790 [1:56:46<1:57:38,  2.06s/it] 50%|████▉     | 3369/6790 [1:56:48<1:54:46,  2.01s/it]                                                       {'loss': 1.4187, 'learning_rate': 0.00020732404893997853, 'epoch': 0.5}
+ 50%|████▉     | 3369/6790 [1:56:48<1:54:46,  2.01s/it] 50%|████▉     | 3370/6790 [1:56:50<1:59:55,  2.10s/it]                                                       {'loss': 1.1901, 'learning_rate': 0.0002072301920688379, 'epoch': 0.5}
+ 50%|████▉     | 3370/6790 [1:56:50<1:59:55,  2.10s/it] 50%|████▉     | 3371/6790 [1:56:52<1:57:35,  2.06s/it]                                                       {'loss': 1.4108, 'learning_rate': 0.00020713633360329708, 'epoch': 0.5}
+ 50%|████▉     | 3371/6790 [1:56:52<1:57:35,  2.06s/it] 50%|████▉     | 3372/6790 [1:56:54<2:00:20,  2.11s/it]                                                       {'loss': 1.8073, 'learning_rate': 0.0002070424735640537, 'epoch': 0.5}
+ 50%|████▉     | 3372/6790 [1:56:54<2:00:20,  2.11s/it] 50%|████▉     | 3373/6790 [1:56:56<1:58:13,  2.08s/it]                                                       {'loss': 1.4523, 'learning_rate': 0.00020694861197180587, 'epoch': 0.5}
+ 50%|████▉     | 3373/6790 [1:56:56<1:58:13,  2.08s/it] 50%|████▉     | 3374/6790 [1:56:59<2:01:26,  2.13s/it]                                                       {'loss': 1.2239, 'learning_rate': 0.00020685474884725173, 'epoch': 0.5}
+ 50%|████▉     | 3374/6790 [1:56:59<2:01:26,  2.13s/it] 50%|████▉     | 3375/6790 [1:57:01<1:57:43,  2.07s/it]                                                       {'loss': 1.1935, 'learning_rate': 0.0002067608842110901, 'epoch': 0.5}
+ 50%|████▉     | 3375/6790 [1:57:01<1:57:43,  2.07s/it] 50%|████▉     | 3376/6790 [1:57:03<1:58:34,  2.08s/it]                                                       {'loss': 1.5544, 'learning_rate': 0.00020666701808401996, 'epoch': 0.5}
+ 50%|████▉     | 3376/6790 [1:57:03<1:58:34,  2.08s/it] 50%|████▉     | 3377/6790 [1:57:05<1:57:40,  2.07s/it]                                                       {'loss': 1.5539, 'learning_rate': 0.00020657315048674057, 'epoch': 0.5}
+ 50%|████▉     | 3377/6790 [1:57:05<1:57:40,  2.07s/it] 50%|████▉     | 3378/6790 [1:57:07<1:55:39,  2.03s/it]                                                       {'loss': 1.5637, 'learning_rate': 0.0002064792814399517, 'epoch': 0.5}
+ 50%|████▉     | 3378/6790 [1:57:07<1:55:39,  2.03s/it] 50%|████▉     | 3379/6790 [1:57:09<1:53:46,  2.00s/it]                                                       {'loss': 1.4767, 'learning_rate': 0.00020638541096435322, 'epoch': 0.5}
+ 50%|████▉     | 3379/6790 [1:57:09<1:53:46,  2.00s/it] 50%|████▉     | 3380/6790 [1:57:11<1:52:42,  1.98s/it]                                                       {'loss': 1.5302, 'learning_rate': 0.00020629153908064551, 'epoch': 0.5}
+ 50%|████▉     | 3380/6790 [1:57:11<1:52:42,  1.98s/it] 50%|████▉     | 3381/6790 [1:57:13<1:54:14,  2.01s/it]                                                       {'loss': 1.637, 'learning_rate': 0.00020619766580952912, 'epoch': 0.5}
+ 50%|████▉     | 3381/6790 [1:57:13<1:54:14,  2.01s/it] 50%|████▉     | 3382/6790 [1:57:15<1:58:06,  2.08s/it]                                                       {'loss': 1.7188, 'learning_rate': 0.00020610379117170496, 'epoch': 0.5}
+ 50%|████▉     | 3382/6790 [1:57:15<1:58:06,  2.08s/it] 50%|████▉     | 3383/6790 [1:57:17<2:00:31,  2.12s/it]                                                       {'loss': 1.2621, 'learning_rate': 0.00020600991518787432, 'epoch': 0.5}
+ 50%|████▉     | 3383/6790 [1:57:17<2:00:31,  2.12s/it] 50%|████▉     | 3384/6790 [1:57:19<1:57:40,  2.07s/it]                                                       {'loss': 1.5259, 'learning_rate': 0.00020591603787873864, 'epoch': 0.5}
+ 50%|████▉     | 3384/6790 [1:57:19<1:57:40,  2.07s/it] 50%|████▉     | 3385/6790 [1:57:22<2:13:51,  2.36s/it]                                                       {'loss': 1.5251, 'learning_rate': 0.00020582215926499972, 'epoch': 0.5}
+ 50%|████▉     | 3385/6790 [1:57:22<2:13:51,  2.36s/it] 50%|████▉     | 3386/6790 [1:57:24<2:05:42,  2.22s/it]                                                       {'loss': 1.5052, 'learning_rate': 0.00020572827936735964, 'epoch': 0.5}
+ 50%|████▉     | 3386/6790 [1:57:24<2:05:42,  2.22s/it] 50%|████▉     | 3387/6790 [1:57:26<2:01:34,  2.14s/it]                                                       {'loss': 1.5836, 'learning_rate': 0.00020563439820652085, 'epoch': 0.5}
+ 50%|████▉     | 3387/6790 [1:57:26<2:01:34,  2.14s/it] 50%|████▉     | 3388/6790 [1:57:28<2:04:19,  2.19s/it]                                                       {'loss': 1.1373, 'learning_rate': 0.00020554051580318588, 'epoch': 0.5}
+ 50%|████▉     | 3388/6790 [1:57:28<2:04:19,  2.19s/it] 50%|���███▉     | 3389/6790 [1:57:30<1:56:31,  2.06s/it]                                                       {'loss': 1.3328, 'learning_rate': 0.00020544663217805776, 'epoch': 0.5}
+ 50%|████▉     | 3389/6790 [1:57:30<1:56:31,  2.06s/it] 50%|████▉     | 3390/6790 [1:57:32<2:03:14,  2.17s/it]                                                       {'loss': 1.4298, 'learning_rate': 0.00020535274735183966, 'epoch': 0.5}
+ 50%|████▉     | 3390/6790 [1:57:32<2:03:14,  2.17s/it] 50%|████▉     | 3391/6790 [1:57:35<2:04:51,  2.20s/it]                                                       {'loss': 1.6353, 'learning_rate': 0.000205258861345235, 'epoch': 0.5}
+ 50%|████▉     | 3391/6790 [1:57:35<2:04:51,  2.20s/it] 50%|████▉     | 3392/6790 [1:57:37<2:01:56,  2.15s/it]                                                       {'loss': 1.5716, 'learning_rate': 0.0002051649741789475, 'epoch': 0.5}
+ 50%|████▉     | 3392/6790 [1:57:37<2:01:56,  2.15s/it] 50%|████▉     | 3393/6790 [1:57:39<1:58:00,  2.08s/it]                                                       {'loss': 1.6959, 'learning_rate': 0.0002050710858736812, 'epoch': 0.5}
+ 50%|████▉     | 3393/6790 [1:57:39<1:58:00,  2.08s/it] 50%|████▉     | 3394/6790 [1:57:41<1:53:43,  2.01s/it]                                                       {'loss': 1.4229, 'learning_rate': 0.00020497719645014032, 'epoch': 0.5}
+ 50%|████▉     | 3394/6790 [1:57:41<1:53:43,  2.01s/it] 50%|█████     | 3395/6790 [1:57:42<1:48:39,  1.92s/it]                                                       {'loss': 1.4719, 'learning_rate': 0.0002048833059290292, 'epoch': 0.5}
+ 50%|█████     | 3395/6790 [1:57:42<1:48:39,  1.92s/it] 50%|█████     | 3396/6790 [1:57:45<1:55:45,  2.05s/it]                                                       {'loss': 1.5632, 'learning_rate': 0.00020478941433105274, 'epoch': 0.5}
+ 50%|█████     | 3396/6790 [1:57:45<1:55:45,  2.05s/it] 50%|█████     | 3397/6790 [1:57:47<1:56:54,  2.07s/it]                                                       {'loss': 1.55, 'learning_rate': 0.00020469552167691574, 'epoch': 0.5}
+ 50%|█████     | 3397/6790 [1:57:47<1:56:54,  2.07s/it] 50%|█████     | 3398/6790 [1:57:49<2:00:01,  2.12s/it]                                                       {'loss': 1.4819, 'learning_rate': 0.00020460162798732347, 'epoch': 0.5}
+ 50%|█████     | 3398/6790 [1:57:49<2:00:01,  2.12s/it] 50%|█████     | 3399/6790 [1:57:51<2:03:16,  2.18s/it]                                                       {'loss': 1.6565, 'learning_rate': 0.00020450773328298136, 'epoch': 0.5}
+ 50%|█████     | 3399/6790 [1:57:51<2:03:16,  2.18s/it] 50%|█████     | 3400/6790 [1:57:53<1:59:13,  2.11s/it]                                                       {'loss': 1.4314, 'learning_rate': 0.00020441383758459494, 'epoch': 0.5}
+ 50%|█████     | 3400/6790 [1:57:53<1:59:13,  2.11s/it] 50%|█████     | 3401/6790 [1:57:55<1:56:15,  2.06s/it]                                                       {'loss': 1.6098, 'learning_rate': 0.00020431994091287022, 'epoch': 0.5}
+ 50%|█████     | 3401/6790 [1:57:55<1:56:15,  2.06s/it] 50%|█████     | 3402/6790 [1:57:57<1:58:03,  2.09s/it]                                                       {'loss': 1.451, 'learning_rate': 0.0002042260432885131, 'epoch': 0.5}
+ 50%|█████     | 3402/6790 [1:57:57<1:58:03,  2.09s/it] 50%|█████     | 3403/6790 [1:57:59<1:56:20,  2.06s/it]                                                       {'loss': 1.4233, 'learning_rate': 0.00020413214473223002, 'epoch': 0.5}
+ 50%|█████     | 3403/6790 [1:57:59<1:56:20,  2.06s/it] 50%|█████     | 3404/6790 [1:58:01<1:52:20,  1.99s/it]                                                       {'loss': 1.587, 'learning_rate': 0.0002040382452647273, 'epoch': 0.5}
+ 50%|█████     | 3404/6790 [1:58:01<1:52:20,  1.99s/it] 50%|█████     | 3405/6790 [1:58:03<1:51:55,  1.98s/it]                                                       {'loss': 1.4471, 'learning_rate': 0.00020394434490671182, 'epoch': 0.5}
+ 50%|█████     | 3405/6790 [1:58:03<1:51:55,  1.98s/it] 50%|█████     | 3406/6790 [1:58:06<2:00:43,  2.14s/it]                                                       {'loss': 1.5384, 'learning_rate': 0.0002038504436788903, 'epoch': 0.5}
+ 50%|█████     | 3406/6790 [1:58:06<2:00:43,  2.14s/it] 50%|█████     | 3407/6790 [1:58:08<1:59:00,  2.11s/it]                                                       {'loss': 1.3955, 'learning_rate': 0.00020375654160196996, 'epoch': 0.5}
+ 50%|█████     | 3407/6790 [1:58:08<1:59:00,  2.11s/it] 50%|█████     | 3408/6790 [1:58:10<1:58:30,  2.10s/it]                                                       {'loss': 1.5427, 'learning_rate': 0.0002036626386966579, 'epoch': 0.5}
+ 50%|█████     | 3408/6790 [1:58:10<1:58:30,  2.10s/it] 50%|█████     | 3409/6790 [1:58:12<1:56:31,  2.07s/it]                                                       {'loss': 1.4926, 'learning_rate': 0.00020356873498366166, 'epoch': 0.5}
+ 50%|█████     | 3409/6790 [1:58:12<1:56:31,  2.07s/it] 50%|█████     | 3410/6790 [1:58:14<1:59:08,  2.11s/it]                                                       {'loss': 1.4493, 'learning_rate': 0.0002034748304836889, 'epoch': 0.5}
+ 50%|█████     | 3410/6790 [1:58:14<1:59:08,  2.11s/it] 50%|█████     | 3411/6790 [1:58:16<2:01:04,  2.15s/it]                                                       {'loss': 1.4659, 'learning_rate': 0.00020338092521744736, 'epoch': 0.5}
+ 50%|█████     | 3411/6790 [1:58:16<2:01:04,  2.15s/it] 50%|█████     | 3412/6790 [1:58:18<2:02:21,  2.17s/it]                                                       {'loss': 1.395, 'learning_rate': 0.00020328701920564504, 'epoch': 0.5}
+ 50%|█████     | 3412/6790 [1:58:18<2:02:21,  2.17s/it] 50%|█████     | 3413/6790 [1:58:20<1:52:52,  2.01s/it]                                                       {'loss': 1.5147, 'learning_rate': 0.00020319311246899, 'epoch': 0.5}
+ 50%|█████     | 3413/6790 [1:58:20<1:52:52,  2.01s/it] 50%|█████     | 3414/6790 [1:58:22<1:52:42,  2.00s/it]                                                       {'loss': 1.4268, 'learning_rate': 0.00020309920502819062, 'epoch': 0.5}
+ 50%|█████     | 3414/6790 [1:58:22<1:52:42,  2.00s/it] 50%|█████     | 3415/6790 [1:58:24<1:52:43,  2.00s/it]                                                       {'loss': 1.6258, 'learning_rate': 0.00020300529690395528, 'epoch': 0.5}
+ 50%|█████     | 3415/6790 [1:58:24<1:52:43,  2.00s/it] 50%|█████     | 3416/6790 [1:58:26<1:54:52,  2.04s/it]                                                       {'loss': 1.5956, 'learning_rate': 0.00020291138811699257, 'epoch': 0.5}
+ 50%|█████     | 3416/6790 [1:58:26<1:54:52,  2.04s/it] 50%|█████     | 3417/6790 [1:58:28<1:54:31,  2.04s/it]                                                       {'loss': 1.441, 'learning_rate': 0.00020281747868801134, 'epoch': 0.5}
+ 50%|█████     | 3417/6790 [1:58:28<1:54:31,  2.04s/it] 50%|█████     | 3418/6790 [1:58:30<1:54:25,  2.04s/it]                                                       {'loss': 1.4121, 'learning_rate': 0.00020272356863772038, 'epoch': 0.5}
+ 50%|█████     | 3418/6790 [1:58:30<1:54:25,  2.04s/it] 50%|█████     | 3419/6790 [1:58:32<1:54:52,  2.04s/it]                                                       {'loss': 1.4509, 'learning_rate': 0.00020262965798682872, 'epoch': 0.5}
+ 50%|█████     | 3419/6790 [1:58:32<1:54:52,  2.04s/it] 50%|█████     | 3420/6790 [1:58:34<1:55:14,  2.05s/it]                                                       {'loss': 1.4144, 'learning_rate': 0.0002025357467560455, 'epoch': 0.5}
+ 50%|█████     | 3420/6790 [1:58:34<1:55:14,  2.05s/it] 50%|█████     | 3421/6790 [1:58:36<1:55:46,  2.06s/it]                                                       {'loss': 1.6757, 'learning_rate': 0.00020244183496608004, 'epoch': 0.5}
+ 50%|█████     | 3421/6790 [1:58:36<1:55:46,  2.06s/it] 50%|█████     | 3422/6790 [1:58:39<1:58:20,  2.11s/it]                                                       {'loss': 1.6586, 'learning_rate': 0.00020234792263764174, 'epoch': 0.5}
+ 50%|█████     | 3422/6790 [1:58:39<1:58:20,  2.11s/it] 50%|█████     | 3423/6790 [1:58:40<1:51:49,  1.99s/it]                                                       {'loss': 1.6226, 'learning_rate': 0.00020225400979144008, 'epoch': 0.5}
+ 50%|█████     | 3423/6790 [1:58:40<1:51:49,  1.99s/it] 50%|█████     | 3424/6790 [1:58:42<1:51:27,  1.99s/it]                                                       {'loss': 1.4983, 'learning_rate': 0.00020216009644818475, 'epoch': 0.5}
+ 50%|█████     | 3424/6790 [1:58:42<1:51:27,  1.99s/it] 50%|█████     | 3425/6790 [1:58:44<1:51:48,  1.99s/it]                                                       {'loss': 1.2512, 'learning_rate': 0.0002020661826285855, 'epoch': 0.5}
+ 50%|█████     | 3425/6790 [1:58:44<1:51:48,  1.99s/it] 50%|█████     | 3426/6790 [1:58:47<2:07:50,  2.28s/it]                                                       {'loss': 1.5106, 'learning_rate': 0.00020197226835335218, 'epoch': 0.5}
+ 50%|█████     | 3426/6790 [1:58:47<2:07:50,  2.28s/it] 50%|█████     | 3427/6790 [1:58:49<2:05:53,  2.25s/it]                                                       {'loss': 1.4492, 'learning_rate': 0.0002018783536431947, 'epoch': 0.5}
+ 50%|█████     | 3427/6790 [1:58:49<2:05:53,  2.25s/it] 50%|█████     | 3428/6790 [1:58:51<2:01:34,  2.17s/it]                                                       {'loss': 1.4819, 'learning_rate': 0.00020178443851882313, 'epoch': 0.5}
+ 50%|█████     | 3428/6790 [1:58:51<2:01:34,  2.17s/it] 51%|█████     | 3429/6790 [1:58:54<2:09:37,  2.31s/it]                                                       {'loss': 1.5536, 'learning_rate': 0.0002016905230009476, 'epoch': 0.51}
+ 51%|█████     | 3429/6790 [1:58:54<2:09:37,  2.31s/it] 51%|█████     | 3430/6790 [1:58:56<2:02:46,  2.19s/it]                                                       {'loss': 1.3814, 'learning_rate': 0.0002015966071102784, 'epoch': 0.51}
+ 51%|█████     | 3430/6790 [1:58:56<2:02:46,  2.19s/it] 51%|█████     | 3431/6790 [1:58:58<1:59:41,  2.14s/it]                                                       {'loss': 1.368, 'learning_rate': 0.00020150269086752575, 'epoch': 0.51}
+ 51%|█████     | 3431/6790 [1:58:58<1:59:41,  2.14s/it] 51%|█████     | 3432/6790 [1:59:00<1:58:25,  2.12s/it]                                                       {'loss': 1.3233, 'learning_rate': 0.00020140877429340005, 'epoch': 0.51}
+ 51%|█████     | 3432/6790 [1:59:00<1:58:25,  2.12s/it] 51%|█████     | 3433/6790 [1:59:02<1:57:49,  2.11s/it]                                                       {'loss': 1.4376, 'learning_rate': 0.0002013148574086119, 'epoch': 0.51}
+ 51%|█████     | 3433/6790 [1:59:02<1:57:49,  2.11s/it] 51%|█████     | 3434/6790 [1:59:04<1:53:23,  2.03s/it]                                                       {'loss': 1.5402, 'learning_rate': 0.0002012209402338716, 'epoch': 0.51}
+ 51%|█████     | 3434/6790 [1:59:04<1:53:23,  2.03s/it] 51%|█████     | 3435/6790 [1:59:06<1:54:04,  2.04s/it]                                                       {'loss': 1.5709, 'learning_rate': 0.00020112702278988996, 'epoch': 0.51}
+ 51%|█████     | 3435/6790 [1:59:06<1:54:04,  2.04s/it] 51%|█████     | 3436/6790 [1:59:08<1:52:50,  2.02s/it]                                                       {'loss': 1.2618, 'learning_rate': 0.0002010331050973774, 'epoch': 0.51}
+ 51%|█████     | 3436/6790 [1:59:08<1:52:50,  2.02s/it] 51%|█████     | 3437/6790 [1:59:10<1:50:41,  1.98s/it]                                                       {'loss': 1.2464, 'learning_rate': 0.00020093918717704488, 'epoch': 0.51}
+ 51%|█████     | 3437/6790 [1:59:10<1:50:41,  1.98s/it] 51%|█████     | 3438/6790 [1:59:12<1:47:27,  1.92s/it]                                                       {'loss': 1.3257, 'learning_rate': 0.00020084526904960294, 'epoch': 0.51}
+ 51%|█████     | 3438/6790 [1:59:12<1:47:27,  1.92s/it] 51%|█████     | 3439/6790 [1:59:14<1:46:11,  1.90s/it]                                                       {'loss': 1.3132, 'learning_rate': 0.00020075135073576253, 'epoch': 0.51}
+ 51%|█████     | 3439/6790 [1:59:14<1:46:11,  1.90s/it] 51%|█████     | 3440/6790 [1:59:16<1:50:30,  1.98s/it]                                                       {'loss': 1.5267, 'learning_rate': 0.00020065743225623441, 'epoch': 0.51}
+ 51%|█████     | 3440/6790 [1:59:16<1:50:30,  1.98s/it] 51%|█████     | 3441/6790 [1:59:18<1:50:57,  1.99s/it]                                                       {'loss': 1.7704, 'learning_rate': 0.00020056351363172947, 'epoch': 0.51}
+ 51%|█████     | 3441/6790 [1:59:18<1:50:57,  1.99s/it] 51%|█████     | 3442/6790 [1:59:20<1:48:22,  1.94s/it]                                                       {'loss': 1.262, 'learning_rate': 0.00020046959488295872, 'epoch': 0.51}
+ 51%|█████     | 3442/6790 [1:59:20<1:48:22,  1.94s/it] 51%|█████     | 3443/6790 [1:59:21<1:46:57,  1.92s/it]                                                       {'loss': 1.3893, 'learning_rate': 0.00020037567603063295, 'epoch': 0.51}
+ 51%|█████     | 3443/6790 [1:59:21<1:46:57,  1.92s/it] 51%|█████     | 3444/6790 [1:59:23<1:48:31,  1.95s/it]                                                       {'loss': 1.3381, 'learning_rate': 0.00020028175709546324, 'epoch': 0.51}
+ 51%|█████     | 3444/6790 [1:59:23<1:48:31,  1.95s/it] 51%|█████     | 3445/6790 [1:59:26<1:52:29,  2.02s/it]                                                       {'loss': 1.6744, 'learning_rate': 0.0002001878380981605, 'epoch': 0.51}
+ 51%|█████     | 3445/6790 [1:59:26<1:52:29,  2.02s/it] 51%|█████     | 3446/6790 [1:59:28<1:51:06,  1.99s/it]                                                       {'loss': 1.1899, 'learning_rate': 0.0002000939190594358, 'epoch': 0.51}
+ 51%|█████     | 3446/6790 [1:59:28<1:51:06,  1.99s/it] 51%|█████     | 3447/6790 [1:59:30<1:56:18,  2.09s/it]                                                       {'loss': 1.4267, 'learning_rate': 0.0002, 'epoch': 0.51}
+ 51%|█████     | 3447/6790 [1:59:30<1:56:18,  2.09s/it] 51%|█████     | 3448/6790 [1:59:32<1:52:33,  2.02s/it]                                                       {'loss': 1.4414, 'learning_rate': 0.00019990608094056425, 'epoch': 0.51}
+ 51%|█████     | 3448/6790 [1:59:32<1:52:33,  2.02s/it] 51%|█████     | 3449/6790 [1:59:34<1:53:38,  2.04s/it]                                                       {'loss': 1.5146, 'learning_rate': 0.00019981216190183954, 'epoch': 0.51}
+ 51%|█████     | 3449/6790 [1:59:34<1:53:38,  2.04s/it] 51%|█████     | 3450/6790 [1:59:36<1:53:50,  2.05s/it]                                                       {'loss': 1.5898, 'learning_rate': 0.00019971824290453672, 'epoch': 0.51}
+ 51%|█████     | 3450/6790 [1:59:36<1:53:50,  2.05s/it] 51%|█████     | 3451/6790 [1:59:38<1:51:09,  2.00s/it]                                                       {'loss': 1.4582, 'learning_rate': 0.00019962432396936706, 'epoch': 0.51}
+ 51%|█████     | 3451/6790 [1:59:38<1:51:09,  2.00s/it] 51%|█████     | 3452/6790 [1:59:40<1:51:47,  2.01s/it]                                                       {'loss': 1.6195, 'learning_rate': 0.0001995304051170413, 'epoch': 0.51}
+ 51%|█████     | 3452/6790 [1:59:40<1:51:47,  2.01s/it] 51%|█████     | 3453/6790 [1:59:42<2:01:04,  2.18s/it]                                                       {'loss': 1.4174, 'learning_rate': 0.00019943648636827057, 'epoch': 0.51}
+ 51%|█████     | 3453/6790 [1:59:42<2:01:04,  2.18s/it] 51%|█████     | 3454/6790 [1:59:45<2:03:37,  2.22s/it]                                                       {'loss': 1.3316, 'learning_rate': 0.0001993425677437656, 'epoch': 0.51}
+ 51%|█████     | 3454/6790 [1:59:45<2:03:37,  2.22s/it] 51%|█████     | 3455/6790 [1:59:46<1:55:25,  2.08s/it]                                                       {'loss': 1.2891, 'learning_rate': 0.00019924864926423752, 'epoch': 0.51}
+ 51%|█████     | 3455/6790 [1:59:46<1:55:25,  2.08s/it] 51%|█████     | 3456/6790 [1:59:49<1:56:06,  2.09s/it]                                                       {'loss': 1.4178, 'learning_rate': 0.00019915473095039708, 'epoch': 0.51}
+ 51%|█████     | 3456/6790 [1:59:49<1:56:06,  2.09s/it] 51%|█████     | 3457/6790 [1:59:51<1:54:14,  2.06s/it]                                                       {'loss': 1.6494, 'learning_rate': 0.00019906081282295522, 'epoch': 0.51}
+ 51%|█████     | 3457/6790 [1:59:51<1:54:14,  2.06s/it] 51%|█████     | 3458/6790 [1:59:52<1:52:04,  2.02s/it]                                                       {'loss': 1.4759, 'learning_rate': 0.00019896689490262262, 'epoch': 0.51}
+ 51%|█████     | 3458/6790 [1:59:52<1:52:04,  2.02s/it] 51%|█████     | 3459/6790 [1:59:54<1:50:47,  2.00s/it]                                                       {'loss': 1.5744, 'learning_rate': 0.00019887297721011014, 'epoch': 0.51}
+ 51%|█████     | 3459/6790 [1:59:54<1:50:47,  2.00s/it] 51%|█████     | 3460/6790 [1:59:57<1:55:48,  2.09s/it]                                                       {'loss': 1.36, 'learning_rate': 0.00019877905976612846, 'epoch': 0.51}
+ 51%|█████     | 3460/6790 [1:59:57<1:55:48,  2.09s/it] 51%|█████     | 3461/6790 [1:59:59<2:04:16,  2.24s/it]                                                       {'loss': 1.3996, 'learning_rate': 0.00019868514259138823, 'epoch': 0.51}
+ 51%|█████     | 3461/6790 [1:59:59<2:04:16,  2.24s/it] 51%|█████     | 3462/6790 [2:00:01<1:58:37,  2.14s/it]                                                       {'loss': 1.41, 'learning_rate': 0.00019859122570659997, 'epoch': 0.51}
+ 51%|█████     | 3462/6790 [2:00:01<1:58:37,  2.14s/it] 51%|█████     | 3463/6790 [2:00:03<1:54:37,  2.07s/it]                                                       {'loss': 1.7267, 'learning_rate': 0.00019849730913247432, 'epoch': 0.51}
+ 51%|█████     | 3463/6790 [2:00:03<1:54:37,  2.07s/it] 51%|█████     | 3464/6790 [2:00:05<1:54:21,  2.06s/it]                                                       {'loss': 1.4497, 'learning_rate': 0.00019840339288972162, 'epoch': 0.51}
+ 51%|█████     | 3464/6790 [2:00:05<1:54:21,  2.06s/it] 51%|█████     | 3465/6790 [2:00:07<1:53:55,  2.06s/it]                                                       {'loss': 1.4615, 'learning_rate': 0.00019830947699905237, 'epoch': 0.51}
+ 51%|█████     | 3465/6790 [2:00:07<1:53:55,  2.06s/it] 51%|█████     | 3466/6790 [2:00:09<1:52:14,  2.03s/it]                                                       {'loss': 1.5179, 'learning_rate': 0.0001982155614811769, 'epoch': 0.51}
+ 51%|█████     | 3466/6790 [2:00:09<1:52:14,  2.03s/it] 51%|█████     | 3467/6790 [2:00:11<1:52:36,  2.03s/it]                                                       {'loss': 1.6862, 'learning_rate': 0.00019812164635680531, 'epoch': 0.51}
+ 51%|█████     | 3467/6790 [2:00:11<1:52:36,  2.03s/it] 51%|█████     | 3468/6790 [2:00:13<1:51:09,  2.01s/it]                                                       {'loss': 1.524, 'learning_rate': 0.00019802773164664787, 'epoch': 0.51}
+ 51%|█████     | 3468/6790 [2:00:13<1:51:09,  2.01s/it] 51%|█████     | 3469/6790 [2:00:16<1:56:43,  2.11s/it]                                                       {'loss': 1.5758, 'learning_rate': 0.0001979338173714145, 'epoch': 0.51}
+ 51%|█████     | 3469/6790 [2:00:16<1:56:43,  2.11s/it] 51%|█████     | 3470/6790 [2:00:18<2:00:49,  2.18s/it]                                                       {'loss': 1.2212, 'learning_rate': 0.00019783990355181526, 'epoch': 0.51}
+ 51%|█████     | 3470/6790 [2:00:18<2:00:49,  2.18s/it] 51%|█████     | 3471/6790 [2:00:20<1:58:18,  2.14s/it]                                                       {'loss': 1.6342, 'learning_rate': 0.00019774599020855993, 'epoch': 0.51}
+ 51%|█████     | 3471/6790 [2:00:20<1:58:18,  2.14s/it] 51%|█████     | 3472/6790 [2:00:22<1:54:47,  2.08s/it]                                                       {'loss': 1.3827, 'learning_rate': 0.00019765207736235834, 'epoch': 0.51}
+ 51%|█████     | 3472/6790 [2:00:22<1:54:47,  2.08s/it] 51%|█████     | 3473/6790 [2:00:24<1:50:30,  2.00s/it]                                                       {'loss': 1.42, 'learning_rate': 0.00019755816503392, 'epoch': 0.51}
+ 51%|█████     | 3473/6790 [2:00:24<1:50:30,  2.00s/it] 51%|█████     | 3474/6790 [2:00:26<1:55:04,  2.08s/it]                                                       {'loss': 1.5513, 'learning_rate': 0.0001974642532439546, 'epoch': 0.51}
+ 51%|█████     | 3474/6790 [2:00:26<1:55:04,  2.08s/it] 51%|█████     | 3475/6790 [2:00:29<2:05:26,  2.27s/it]                                                       {'loss': 1.4571, 'learning_rate': 0.00019737034201317133, 'epoch': 0.51}
+ 51%|█████     | 3475/6790 [2:00:29<2:05:26,  2.27s/it] 51%|█████     | 3476/6790 [2:00:31<2:03:38,  2.24s/it]                                                       {'loss': 1.38, 'learning_rate': 0.00019727643136227974, 'epoch': 0.51}
+ 51%|█████     | 3476/6790 [2:00:31<2:03:38,  2.24s/it] 51%|█████     | 3477/6790 [2:00:33<2:01:40,  2.20s/it]                                                       {'loss': 1.4189, 'learning_rate': 0.00019718252131198868, 'epoch': 0.51}
+ 51%|█████     | 3477/6790 [2:00:33<2:01:40,  2.20s/it] 51%|█████     | 3478/6790 [2:00:35<2:06:43,  2.30s/it]                                                       {'loss': 1.5015, 'learning_rate': 0.00019708861188300745, 'epoch': 0.51}
+ 51%|█████     | 3478/6790 [2:00:35<2:06:43,  2.30s/it] 51%|█████     | 3479/6790 [2:00:38<2:04:15,  2.25s/it]                                                       {'loss': 1.6329, 'learning_rate': 0.00019699470309604477, 'epoch': 0.51}
+ 51%|█████     | 3479/6790 [2:00:38<2:04:15,  2.25s/it] 51%|█████▏    | 3480/6790 [2:00:40<2:03:01,  2.23s/it]                                                       {'loss': 1.7699, 'learning_rate': 0.00019690079497180945, 'epoch': 0.51}
+ 51%|█████▏    | 3480/6790 [2:00:40<2:03:01,  2.23s/it] 51%|█████▏    | 3481/6790 [2:00:42<1:58:44,  2.15s/it]                                                       {'loss': 1.3971, 'learning_rate': 0.00019680688753101003, 'epoch': 0.51}
+ 51%|█████▏    | 3481/6790 [2:00:42<1:58:44,  2.15s/it] 51%|█████▏    | 3482/6790 [2:00:44<1:55:31,  2.10s/it]                                                       {'loss': 1.3949, 'learning_rate': 0.000196712980794355, 'epoch': 0.51}
+ 51%|█████▏    | 3482/6790 [2:00:44<1:55:31,  2.10s/it] 51%|█████▏    | 3483/6790 [2:00:46<1:50:36,  2.01s/it]                                                       {'loss': 1.5877, 'learning_rate': 0.0001966190747825527, 'epoch': 0.51}
+ 51%|█████▏    | 3483/6790 [2:00:46<1:50:36,  2.01s/it] 51%|█████▏    | 3484/6790 [2:00:48<1:52:03,  2.03s/it]                                                       {'loss': 1.5971, 'learning_rate': 0.00019652516951631108, 'epoch': 0.51}
+ 51%|█████▏    | 3484/6790 [2:00:48<1:52:03,  2.03s/it] 51%|█████▏    | 3485/6790 [2:00:50<1:52:16,  2.04s/it]                                                       {'loss': 1.5184, 'learning_rate': 0.00019643126501633836, 'epoch': 0.51}
+ 51%|█████▏    | 3485/6790 [2:00:50<1:52:16,  2.04s/it] 51%|█████▏    | 3486/6790 [2:00:52<1:53:08,  2.05s/it]                                                       {'loss': 1.5698, 'learning_rate': 0.0001963373613033421, 'epoch': 0.51}
+ 51%|█████▏    | 3486/6790 [2:00:52<1:53:08,  2.05s/it] 51%|█████▏    | 3487/6790 [2:00:53<1:46:33,  1.94s/it]                                                       {'loss': 1.3053, 'learning_rate': 0.00019624345839803012, 'epoch': 0.51}
+ 51%|█████▏    | 3487/6790 [2:00:53<1:46:33,  1.94s/it] 51%|█████▏    | 3488/6790 [2:00:55<1:45:48,  1.92s/it]                                                       {'loss': 1.733, 'learning_rate': 0.00019614955632110968, 'epoch': 0.51}
+ 51%|█████▏    | 3488/6790 [2:00:55<1:45:48,  1.92s/it] 51%|█████▏    | 3489/6790 [2:00:57<1:49:24,  1.99s/it]                                                       {'loss': 1.6144, 'learning_rate': 0.00019605565509328826, 'epoch': 0.51}
+ 51%|█████▏    | 3489/6790 [2:00:57<1:49:24,  1.99s/it] 51%|█████▏    | 3490/6790 [2:01:00<1:51:44,  2.03s/it]                                                       {'loss': 1.4383, 'learning_rate': 0.0001959617547352727, 'epoch': 0.51}
+ 51%|█████▏    | 3490/6790 [2:01:00<1:51:44,  2.03s/it] 51%|█████▏    | 3491/6790 [2:01:02<1:53:54,  2.07s/it]                                                       {'loss': 1.5438, 'learning_rate': 0.00019586785526777009, 'epoch': 0.51}
+ 51%|█████▏    | 3491/6790 [2:01:02<1:53:54,  2.07s/it] 51%|█████▏    | 3492/6790 [2:01:04<1:52:54,  2.05s/it]                                                       {'loss': 1.5491, 'learning_rate': 0.00019577395671148694, 'epoch': 0.51}
+ 51%|█████▏    | 3492/6790 [2:01:04<1:52:54,  2.05s/it] 51%|█████▏    | 3493/6790 [2:01:06<1:55:28,  2.10s/it]                                                       {'loss': 1.4859, 'learning_rate': 0.0001956800590871299, 'epoch': 0.51}
+ 51%|█████▏    | 3493/6790 [2:01:06<1:55:28,  2.10s/it] 51%|█████▏    | 3494/6790 [2:01:08<1:53:47,  2.07s/it]                                                       {'loss': 1.3013, 'learning_rate': 0.0001955861624154051, 'epoch': 0.51}
+ 51%|█████▏    | 3494/6790 [2:01:08<1:53:47,  2.07s/it] 51%|█████▏    | 3495/6790 [2:01:10<1:54:36,  2.09s/it]                                                       {'loss': 1.6414, 'learning_rate': 0.00019549226671701874, 'epoch': 0.51}
+ 51%|█████▏    | 3495/6790 [2:01:10<1:54:36,  2.09s/it] 51%|█████▏    | 3496/6790 [2:01:12<1:57:55,  2.15s/it]                                                       {'loss': 1.5158, 'learning_rate': 0.00019539837201267658, 'epoch': 0.51}
+ 51%|█████▏    | 3496/6790 [2:01:12<1:57:55,  2.15s/it] 52%|█████▏    | 3497/6790 [2:01:14<1:55:18,  2.10s/it]                                                       {'loss': 1.6411, 'learning_rate': 0.00019530447832308433, 'epoch': 0.52}
+ 52%|█████▏    | 3497/6790 [2:01:14<1:55:18,  2.10s/it] 52%|█████▏    | 3498/6790 [2:01:17<1:56:35,  2.12s/it]                                                       {'loss': 1.5443, 'learning_rate': 0.0001952105856689473, 'epoch': 0.52}
+ 52%|█████▏    | 3498/6790 [2:01:17<1:56:35,  2.12s/it] 52%|█████▏    | 3499/6790 [2:01:19<1:57:37,  2.14s/it]                                                       {'loss': 1.1671, 'learning_rate': 0.0001951166940709708, 'epoch': 0.52}
+ 52%|█████▏    | 3499/6790 [2:01:19<1:57:37,  2.14s/it] 52%|█████▏    | 3500/6790 [2:01:21<1:54:32,  2.09s/it]                                                       {'loss': 1.5172, 'learning_rate': 0.00019502280354985975, 'epoch': 0.52}
+ 52%|█████▏    | 3500/6790 [2:01:21<1:54:32,  2.09s/it] 52%|█████▏    | 3501/6790 [2:01:23<1:56:01,  2.12s/it]                                                       {'loss': 1.6549, 'learning_rate': 0.0001949289141263188, 'epoch': 0.52}
+ 52%|█████▏    | 3501/6790 [2:01:23<1:56:01,  2.12s/it] 52%|█████▏    | 3502/6790 [2:01:25<1:56:09,  2.12s/it]                                                       {'loss': 1.5727, 'learning_rate': 0.00019483502582105252, 'epoch': 0.52}
+ 52%|█████▏    | 3502/6790 [2:01:25<1:56:09,  2.12s/it] 52%|█████▏    | 3503/6790 [2:01:27<1:57:13,  2.14s/it]                                                       {'loss': 1.299, 'learning_rate': 0.000194741138654765, 'epoch': 0.52}
+ 52%|█████▏    | 3503/6790 [2:01:27<1:57:13,  2.14s/it] 52%|█████▏    | 3504/6790 [2:01:30<2:00:29,  2.20s/it]                                                       {'loss': 1.4621, 'learning_rate': 0.00019464725264816042, 'epoch': 0.52}
+ 52%|█████▏    | 3504/6790 [2:01:30<2:00:29,  2.20s/it] 52%|█████▏    | 3505/6790 [2:01:32<1:58:04,  2.16s/it]                                                       {'loss': 1.538, 'learning_rate': 0.00019455336782194226, 'epoch': 0.52}
+ 52%|█████▏    | 3505/6790 [2:01:32<1:58:04,  2.16s/it] 52%|█████▏    | 3506/6790 [2:01:34<1:59:08,  2.18s/it]                                                       {'loss': 1.6543, 'learning_rate': 0.00019445948419681417, 'epoch': 0.52}
+ 52%|█████▏    | 3506/6790 [2:01:34<1:59:08,  2.18s/it] 52%|█████▏    | 3507/6790 [2:01:36<2:00:45,  2.21s/it]                                                       {'loss': 1.4214, 'learning_rate': 0.00019436560179347917, 'epoch': 0.52}
+ 52%|█████▏    | 3507/6790 [2:01:36<2:00:45,  2.21s/it] 52%|█████▏    | 3508/6790 [2:01:38<1:54:10,  2.09s/it]                                                       {'loss': 1.3656, 'learning_rate': 0.00019427172063264043, 'epoch': 0.52}
+ 52%|█████▏    | 3508/6790 [2:01:38<1:54:10,  2.09s/it] 52%|█████▏    | 3509/6790 [2:01:40<1:49:18,  2.00s/it]                                                       {'loss': 1.1357, 'learning_rate': 0.0001941778407350003, 'epoch': 0.52}
+ 52%|█████▏    | 3509/6790 [2:01:40<1:49:18,  2.00s/it] 52%|█████▏    | 3510/6790 [2:01:42<1:51:15,  2.04s/it]                                                       {'loss': 1.5178, 'learning_rate': 0.00019408396212126144, 'epoch': 0.52}
+ 52%|█████▏    | 3510/6790 [2:01:42<1:51:15,  2.04s/it] 52%|█████▏    | 3511/6790 [2:01:44<1:50:07,  2.02s/it]                                                       {'loss': 1.5097, 'learning_rate': 0.00019399008481212572, 'epoch': 0.52}
+ 52%|█████▏    | 3511/6790 [2:01:44<1:50:07,  2.02s/it] 52%|█████▏    | 3512/6790 [2:01:46<1:45:40,  1.93s/it]                                                       {'loss': 1.3267, 'learning_rate': 0.00019389620882829508, 'epoch': 0.52}
+ 52%|█████▏    | 3512/6790 [2:01:46<1:45:40,  1.93s/it] 52%|█████▏    | 3513/6790 [2:01:48<1:47:11,  1.96s/it]                                                       {'loss': 1.3226, 'learning_rate': 0.00019380233419047092, 'epoch': 0.52}
+ 52%|█████▏    | 3513/6790 [2:01:48<1:47:11,  1.96s/it] 52%|█████▏    | 3514/6790 [2:01:50<1:51:24,  2.04s/it]                                                       {'loss': 1.4646, 'learning_rate': 0.00019370846091935459, 'epoch': 0.52}
+ 52%|█████▏    | 3514/6790 [2:01:50<1:51:24,  2.04s/it] 52%|█████▏    | 3515/6790 [2:01:52<1:47:41,  1.97s/it]                                                       {'loss': 1.3792, 'learning_rate': 0.00019361458903564683, 'epoch': 0.52}
+ 52%|█████▏    | 3515/6790 [2:01:52<1:47:41,  1.97s/it] 52%|█████▏    | 3516/6790 [2:01:54<1:47:52,  1.98s/it]                                                       {'loss': 1.4395, 'learning_rate': 0.00019352071856004833, 'epoch': 0.52}
+ 52%|█████▏    | 3516/6790 [2:01:54<1:47:52,  1.98s/it] 52%|█████▏    | 3517/6790 [2:01:56<1:53:51,  2.09s/it]                                                       {'loss': 1.479, 'learning_rate': 0.0001934268495132595, 'epoch': 0.52}
+ 52%|█████▏    | 3517/6790 [2:01:56<1:53:51,  2.09s/it] 52%|█████▏    | 3518/6790 [2:01:58<1:56:04,  2.13s/it]                                                       {'loss': 1.6198, 'learning_rate': 0.00019333298191598006, 'epoch': 0.52}
+ 52%|█████▏    | 3518/6790 [2:01:58<1:56:04,  2.13s/it] 52%|█████▏    | 3519/6790 [2:02:00<1:48:57,  2.00s/it]                                                       {'loss': 1.3731, 'learning_rate': 0.00019323911578890995, 'epoch': 0.52}
+ 52%|█████▏    | 3519/6790 [2:02:00<1:48:57,  2.00s/it] 52%|█████▏    | 3520/6790 [2:02:02<1:47:48,  1.98s/it]                                                       {'loss': 1.2347, 'learning_rate': 0.00019314525115274824, 'epoch': 0.52}
+ 52%|█████▏    | 3520/6790 [2:02:02<1:47:48,  1.98s/it] 52%|█████▏    | 3521/6790 [2:02:04<1:49:43,  2.01s/it]                                                       {'loss': 1.5135, 'learning_rate': 0.00019305138802819418, 'epoch': 0.52}
+ 52%|█████▏    | 3521/6790 [2:02:04<1:49:43,  2.01s/it] 52%|█████▏    | 3522/6790 [2:02:06<1:51:00,  2.04s/it]                                                       {'loss': 1.319, 'learning_rate': 0.00019295752643594627, 'epoch': 0.52}
+ 52%|█████▏    | 3522/6790 [2:02:06<1:51:00,  2.04s/it] 52%|█████▏    | 3523/6790 [2:02:08<1:56:10,  2.13s/it]                                                       {'loss': 1.604, 'learning_rate': 0.00019286366639670297, 'epoch': 0.52}
+ 52%|█████▏    | 3523/6790 [2:02:08<1:56:10,  2.13s/it] 52%|█████▏    | 3524/6790 [2:02:10<1:52:26,  2.07s/it]                                                       {'loss': 1.3078, 'learning_rate': 0.00019276980793116215, 'epoch': 0.52}
+ 52%|█████▏    | 3524/6790 [2:02:10<1:52:26,  2.07s/it] 52%|█████��    | 3525/6790 [2:02:12<1:52:47,  2.07s/it]                                                       {'loss': 1.4658, 'learning_rate': 0.00019267595106002154, 'epoch': 0.52}
+ 52%|█████▏    | 3525/6790 [2:02:12<1:52:47,  2.07s/it] 52%|█████▏    | 3526/6790 [2:02:14<1:52:07,  2.06s/it]                                                       {'loss': 1.2569, 'learning_rate': 0.0001925820958039784, 'epoch': 0.52}
+ 52%|█████▏    | 3526/6790 [2:02:14<1:52:07,  2.06s/it] 52%|█████▏    | 3527/6790 [2:02:16<1:53:08,  2.08s/it]                                                       {'loss': 1.4584, 'learning_rate': 0.00019248824218372969, 'epoch': 0.52}
+ 52%|█████▏    | 3527/6790 [2:02:16<1:53:08,  2.08s/it] 52%|█████▏    | 3528/6790 [2:02:18<1:49:55,  2.02s/it]                                                       {'loss': 1.401, 'learning_rate': 0.00019239439021997198, 'epoch': 0.52}
+ 52%|█████▏    | 3528/6790 [2:02:18<1:49:55,  2.02s/it] 52%|█████▏    | 3529/6790 [2:02:21<1:52:22,  2.07s/it]                                                       {'loss': 1.5826, 'learning_rate': 0.00019230053993340147, 'epoch': 0.52}
+ 52%|█████▏    | 3529/6790 [2:02:21<1:52:22,  2.07s/it] 52%|█████▏    | 3530/6790 [2:02:22<1:48:47,  2.00s/it]                                                       {'loss': 1.3942, 'learning_rate': 0.00019220669134471395, 'epoch': 0.52}
+ 52%|█████▏    | 3530/6790 [2:02:22<1:48:47,  2.00s/it] 52%|█████▏    | 3531/6790 [2:02:24<1:49:36,  2.02s/it]                                                       {'loss': 1.6092, 'learning_rate': 0.00019211284447460508, 'epoch': 0.52}
+ 52%|█████▏    | 3531/6790 [2:02:24<1:49:36,  2.02s/it] 52%|█████▏    | 3532/6790 [2:02:26<1:49:54,  2.02s/it]                                                       {'loss': 1.5233, 'learning_rate': 0.00019201899934376967, 'epoch': 0.52}
+ 52%|█████▏    | 3532/6790 [2:02:26<1:49:54,  2.02s/it] 52%|█████▏    | 3533/6790 [2:02:29<1:51:36,  2.06s/it]                                                       {'loss': 1.6646, 'learning_rate': 0.0001919251559729026, 'epoch': 0.52}
+ 52%|█████▏    | 3533/6790 [2:02:29<1:51:36,  2.06s/it] 52%|█████▏    | 3534/6790 [2:02:31<1:59:51,  2.21s/it]                                                       {'loss': 1.5225, 'learning_rate': 0.00019183131438269826, 'epoch': 0.52}
+ 52%|█████▏    | 3534/6790 [2:02:31<1:59:51,  2.21s/it] 52%|█████▏    | 3535/6790 [2:02:33<1:54:27,  2.11s/it]                                                       {'loss': 1.2881, 'learning_rate': 0.0001917374745938504, 'epoch': 0.52}
+ 52%|█████▏    | 3535/6790 [2:02:33<1:54:27,  2.11s/it] 52%|█████▏    | 3536/6790 [2:02:35<1:52:24,  2.07s/it]                                                       {'loss': 1.477, 'learning_rate': 0.00019164363662705264, 'epoch': 0.52}
+ 52%|█████▏    | 3536/6790 [2:02:35<1:52:24,  2.07s/it] 52%|█████▏    | 3537/6790 [2:02:38<1:59:59,  2.21s/it]                                                       {'loss': 1.4684, 'learning_rate': 0.00019154980050299807, 'epoch': 0.52}
+ 52%|█████▏    | 3537/6790 [2:02:38<1:59:59,  2.21s/it] 52%|█████▏    | 3538/6790 [2:02:39<1:51:39,  2.06s/it]                                                       {'loss': 1.3738, 'learning_rate': 0.00019145596624237947, 'epoch': 0.52}
+ 52%|█████▏    | 3538/6790 [2:02:39<1:51:39,  2.06s/it] 52%|█████▏    | 3539/6790 [2:02:41<1:47:28,  1.98s/it]                                                       {'loss': 1.4262, 'learning_rate': 0.00019136213386588898, 'epoch': 0.52}
+ 52%|█████▏    | 3539/6790 [2:02:41<1:47:28,  1.98s/it] 52%|█████▏    | 3540/6790 [2:02:43<1:45:23,  1.95s/it]                                                       {'loss': 1.284, 'learning_rate': 0.0001912683033942188, 'epoch': 0.52}
+ 52%|█████▏    | 3540/6790 [2:02:43<1:45:23,  1.95s/it] 52%|█████▏    | 3541/6790 [2:02:45<1:46:01,  1.96s/it]                                                       {'loss': 1.3823, 'learning_rate': 0.00019117447484806005, 'epoch': 0.52}
+ 52%|█████▏    | 3541/6790 [2:02:45<1:46:01,  1.96s/it] 52%|█████▏    | 3542/6790 [2:02:48<1:57:47,  2.18s/it]                                                       {'loss': 1.2839, 'learning_rate': 0.0001910806482481041, 'epoch': 0.52}
+ 52%|█████▏    | 3542/6790 [2:02:48<1:57:47,  2.18s/it] 52%|█████▏    | 3543/6790 [2:02:50<1:55:55,  2.14s/it]                                                       {'loss': 1.253, 'learning_rate': 0.00019098682361504127, 'epoch': 0.52}
+ 52%|█████▏    | 3543/6790 [2:02:50<1:55:55,  2.14s/it] 52%|█████▏    | 3544/6790 [2:02:52<1:54:21,  2.11s/it]                                                       {'loss': 1.3364, 'learning_rate': 0.00019089300096956197, 'epoch': 0.52}
+ 52%|█████▏    | 3544/6790 [2:02:52<1:54:21,  2.11s/it] 52%|█████▏    | 3545/6790 [2:02:54<1:53:57,  2.11s/it]                                                       {'loss': 1.469, 'learning_rate': 0.00019079918033235583, 'epoch': 0.52}
+ 52%|█████▏    | 3545/6790 [2:02:54<1:53:57,  2.11s/it] 52%|█████▏    | 3546/6790 [2:02:56<1:48:24,  2.01s/it]                                                       {'loss': 1.1669, 'learning_rate': 0.00019070536172411228, 'epoch': 0.52}
+ 52%|█████▏    | 3546/6790 [2:02:56<1:48:24,  2.01s/it] 52%|█████▏    | 3547/6790 [2:02:58<1:57:38,  2.18s/it]                                                       {'loss': 1.5722, 'learning_rate': 0.00019061154516551997, 'epoch': 0.52}
+ 52%|█████▏    | 3547/6790 [2:02:58<1:57:38,  2.18s/it] 52%|█████▏    | 3548/6790 [2:03:00<1:53:13,  2.10s/it]                                                       {'loss': 1.3722, 'learning_rate': 0.00019051773067726752, 'epoch': 0.52}
+ 52%|█████▏    | 3548/6790 [2:03:00<1:53:13,  2.10s/it] 52%|█████▏    | 3549/6790 [2:03:02<1:52:56,  2.09s/it]                                                       {'loss': 1.347, 'learning_rate': 0.00019042391828004272, 'epoch': 0.52}
+ 52%|█████▏    | 3549/6790 [2:03:02<1:52:56,  2.09s/it] 52%|█████▏    | 3550/6790 [2:03:04<1:56:57,  2.17s/it]                                                       {'loss': 1.4844, 'learning_rate': 0.00019033010799453308, 'epoch': 0.52}
+ 52%|█████▏    | 3550/6790 [2:03:05<1:56:57,  2.17s/it] 52%|█████▏    | 3551/6790 [2:03:07<1:57:17,  2.17s/it]                                                       {'loss': 1.6101, 'learning_rate': 0.00019023629984142576, 'epoch': 0.52}
+ 52%|█████▏    | 3551/6790 [2:03:07<1:57:17,  2.17s/it] 52%|█████▏    | 3552/6790 [2:03:09<1:55:32,  2.14s/it]                                                       {'loss': 1.5685, 'learning_rate': 0.0001901424938414071, 'epoch': 0.52}
+ 52%|█████▏    | 3552/6790 [2:03:09<1:55:32,  2.14s/it] 52%|█████▏    | 3553/6790 [2:03:11<1:59:19,  2.21s/it]                                                       {'loss': 1.4698, 'learning_rate': 0.0001900486900151634, 'epoch': 0.52}
+ 52%|█████▏    | 3553/6790 [2:03:11<1:59:19,  2.21s/it] 52%|█████▏    | 3554/6790 [2:03:13<1:57:13,  2.17s/it]                                                       {'loss': 1.4333, 'learning_rate': 0.00018995488838338006, 'epoch': 0.52}
+ 52%|█████▏    | 3554/6790 [2:03:13<1:57:13,  2.17s/it] 52%|█████▏    | 3555/6790 [2:03:15<1:53:10,  2.10s/it]                                                       {'loss': 1.2694, 'learning_rate': 0.00018986108896674236, 'epoch': 0.52}
+ 52%|█████▏    | 3555/6790 [2:03:15<1:53:10,  2.10s/it] 52%|█████▏    | 3556/6790 [2:03:17<1:47:15,  1.99s/it]                                                       {'loss': 1.3964, 'learning_rate': 0.00018976729178593474, 'epoch': 0.52}
+ 52%|█████▏    | 3556/6790 [2:03:17<1:47:15,  1.99s/it] 52%|█████▏    | 3557/6790 [2:03:19<1:49:22,  2.03s/it]                                                       {'loss': 1.3768, 'learning_rate': 0.0001896734968616415, 'epoch': 0.52}
+ 52%|█████▏    | 3557/6790 [2:03:19<1:49:22,  2.03s/it] 52%|█████▏    | 3558/6790 [2:03:21<1:48:28,  2.01s/it]                                                       {'loss': 1.3675, 'learning_rate': 0.00018957970421454618, 'epoch': 0.52}
+ 52%|█████▏    | 3558/6790 [2:03:21<1:48:28,  2.01s/it] 52%|█████▏    | 3559/6790 [2:03:23<1:48:17,  2.01s/it]                                                       {'loss': 1.5105, 'learning_rate': 0.00018948591386533197, 'epoch': 0.52}
+ 52%|█████▏    | 3559/6790 [2:03:23<1:48:17,  2.01s/it] 52%|█████▏    | 3560/6790 [2:03:25<1:45:24,  1.96s/it]                                                       {'loss': 1.494, 'learning_rate': 0.0001893921258346814, 'epoch': 0.52}
+ 52%|█████▏    | 3560/6790 [2:03:25<1:45:24,  1.96s/it] 52%|█████▏    | 3561/6790 [2:03:27<1:45:26,  1.96s/it]                                                       {'loss': 1.4588, 'learning_rate': 0.0001892983401432767, 'epoch': 0.52}
+ 52%|█████▏    | 3561/6790 [2:03:27<1:45:26,  1.96s/it] 52%|█████▏    | 3562/6790 [2:03:29<1:42:19,  1.90s/it]                                                       {'loss': 1.4066, 'learning_rate': 0.00018920455681179933, 'epoch': 0.52}
+ 52%|█████▏    | 3562/6790 [2:03:29<1:42:19,  1.90s/it] 52%|█████▏    | 3563/6790 [2:03:31<1:45:54,  1.97s/it]                                                       {'loss': 1.4732, 'learning_rate': 0.0001891107758609306, 'epoch': 0.52}
+ 52%|█████▏    | 3563/6790 [2:03:31<1:45:54,  1.97s/it] 52%|█████▏    | 3564/6790 [2:03:33<1:55:42,  2.15s/it]                                                       {'loss': 1.4711, 'learning_rate': 0.00018901699731135074, 'epoch': 0.52}
+ 52%|█████▏    | 3564/6790 [2:03:33<1:55:42,  2.15s/it] 53%|█████▎    | 3565/6790 [2:03:35<1:54:38,  2.13s/it]                                                       {'loss': 1.5395, 'learning_rate': 0.0001889232211837401, 'epoch': 0.53}
+ 53%|█████▎    | 3565/6790 [2:03:35<1:54:38,  2.13s/it] 53%|█████▎    | 3566/6790 [2:03:37<1:51:03,  2.07s/it]                                                       {'loss': 1.326, 'learning_rate': 0.0001888294474987779, 'epoch': 0.53}
+ 53%|█████▎    | 3566/6790 [2:03:37<1:51:03,  2.07s/it] 53%|█████▎    | 3567/6790 [2:03:39<1:46:42,  1.99s/it]                                                       {'loss': 1.3515, 'learning_rate': 0.00018873567627714321, 'epoch': 0.53}
+ 53%|█████▎    | 3567/6790 [2:03:39<1:46:42,  1.99s/it] 53%|█████▎    | 3568/6790 [2:03:41<1:48:43,  2.02s/it]                                                       {'loss': 1.3692, 'learning_rate': 0.00018864190753951448, 'epoch': 0.53}
+ 53%|█████▎    | 3568/6790 [2:03:41<1:48:43,  2.02s/it] 53%|█████▎    | 3569/6790 [2:03:43<1:47:53,  2.01s/it]                                                       {'loss': 1.6288, 'learning_rate': 0.0001885481413065695, 'epoch': 0.53}
+ 53%|█████▎    | 3569/6790 [2:03:43<1:47:53,  2.01s/it] 53%|█████▎    | 3570/6790 [2:03:45<1:45:06,  1.96s/it]                                                       {'loss': 1.3668, 'learning_rate': 0.00018845437759898564, 'epoch': 0.53}
+ 53%|█████▎    | 3570/6790 [2:03:45<1:45:06,  1.96s/it] 53%|█████▎    | 3571/6790 [2:03:47<1:52:49,  2.10s/it]                                                       {'loss': 1.4791, 'learning_rate': 0.00018836061643743955, 'epoch': 0.53}
+ 53%|█████▎    | 3571/6790 [2:03:47<1:52:49,  2.10s/it] 53%|█████▎    | 3572/6790 [2:03:49<1:51:59,  2.09s/it]                                                       {'loss': 1.4855, 'learning_rate': 0.00018826685784260753, 'epoch': 0.53}
+ 53%|█████▎    | 3572/6790 [2:03:49<1:51:59,  2.09s/it] 53%|█████▎    | 3573/6790 [2:03:51<1:50:48,  2.07s/it]                                                       {'loss': 1.702, 'learning_rate': 0.00018817310183516503, 'epoch': 0.53}
+ 53%|█████▎    | 3573/6790 [2:03:51<1:50:48,  2.07s/it] 53%|█████▎    | 3574/6790 [2:03:53<1:48:59,  2.03s/it]                                                       {'loss': 1.5062, 'learning_rate': 0.00018807934843578737, 'epoch': 0.53}
+ 53%|█████▎    | 3574/6790 [2:03:53<1:48:59,  2.03s/it] 53%|█████▎    | 3575/6790 [2:03:56<1:51:33,  2.08s/it]                                                       {'loss': 1.425, 'learning_rate': 0.00018798559766514876, 'epoch': 0.53}
+ 53%|█████▎    | 3575/6790 [2:03:56<1:51:33,  2.08s/it] 53%|█████▎    | 3576/6790 [2:03:57<1:47:37,  2.01s/it]                                                       {'loss': 1.2828, 'learning_rate': 0.00018789184954392328, 'epoch': 0.53}
+ 53%|█████▎    | 3576/6790 [2:03:57<1:47:37,  2.01s/it] 53%|█████▎    | 3577/6790 [2:04:00<1:51:40,  2.09s/it]                                                       {'loss': 1.4183, 'learning_rate': 0.00018779810409278412, 'epoch': 0.53}
+ 53%|█████▎    | 3577/6790 [2:04:00<1:51:40,  2.09s/it] 53%|█████▎    | 3578/6790 [2:04:02<1:51:23,  2.08s/it]                                                       {'loss': 1.4378, 'learning_rate': 0.00018770436133240415, 'epoch': 0.53}
+ 53%|█████▎    | 3578/6790 [2:04:02<1:51:23,  2.08s/it] 53%|█████▎    | 3579/6790 [2:04:04<1:52:29,  2.10s/it]                                                       {'loss': 1.5622, 'learning_rate': 0.00018761062128345532, 'epoch': 0.53}
+ 53%|█████▎    | 3579/6790 [2:04:04<1:52:29,  2.10s/it] 53%|█████▎    | 3580/6790 [2:04:06<1:48:52,  2.03s/it]                                                       {'loss': 1.4181, 'learning_rate': 0.00018751688396660931, 'epoch': 0.53}
+ 53%|█████▎    | 3580/6790 [2:04:06<1:48:52,  2.03s/it] 53%|█████▎    | 3581/6790 [2:04:08<1:47:29,  2.01s/it]                                                       {'loss': 1.2908, 'learning_rate': 0.00018742314940253696, 'epoch': 0.53}
+ 53%|█████▎    | 3581/6790 [2:04:08<1:47:29,  2.01s/it] 53%|█████▎    | 3582/6790 [2:04:10<1:45:42,  1.98s/it]                                                       {'loss': 1.6148, 'learning_rate': 0.00018732941761190867, 'epoch': 0.53}
+ 53%|█████▎    | 3582/6790 [2:04:10<1:45:42,  1.98s/it] 53%|█████▎    | 3583/6790 [2:04:11<1:42:47,  1.92s/it]                                                       {'loss': 1.3825, 'learning_rate': 0.00018723568861539404, 'epoch': 0.53}
+ 53%|█████▎    | 3583/6790 [2:04:11<1:42:47,  1.92s/it] 53%|█████▎    | 3584/6790 [2:04:14<1:48:07,  2.02s/it]                                                       {'loss': 1.7409, 'learning_rate': 0.00018714196243366221, 'epoch': 0.53}
+ 53%|█████▎    | 3584/6790 [2:04:14<1:48:07,  2.02s/it] 53%|█████▎    | 3585/6790 [2:04:16<1:49:29,  2.05s/it]                                                       {'loss': 1.4178, 'learning_rate': 0.00018704823908738177, 'epoch': 0.53}
+ 53%|█████▎    | 3585/6790 [2:04:16<1:49:29,  2.05s/it] 53%|█████▎    | 3586/6790 [2:04:18<1:46:21,  1.99s/it]                                                       {'loss': 1.1976, 'learning_rate': 0.00018695451859722042, 'epoch': 0.53}
+ 53%|█████▎    | 3586/6790 [2:04:18<1:46:21,  1.99s/it] 53%|█████▎    | 3587/6790 [2:04:20<1:43:26,  1.94s/it]                                                       {'loss': 1.451, 'learning_rate': 0.00018686080098384548, 'epoch': 0.53}
+ 53%|█████▎    | 3587/6790 [2:04:20<1:43:26,  1.94s/it] 53%|█████▎    | 3588/6790 [2:04:22<1:44:21,  1.96s/it]                                                       {'loss': 1.3662, 'learning_rate': 0.00018676708626792345, 'epoch': 0.53}
+ 53%|█████▎    | 3588/6790 [2:04:22<1:44:21,  1.96s/it] 53%|█████▎    | 3589/6790 [2:04:24<1:44:55,  1.97s/it]                                                       {'loss': 1.7593, 'learning_rate': 0.00018667337447012038, 'epoch': 0.53}
+ 53%|█████▎    | 3589/6790 [2:04:24<1:44:55,  1.97s/it] 53%|█████▎    | 3590/6790 [2:04:26<1:46:51,  2.00s/it]                                                       {'loss': 1.6199, 'learning_rate': 0.00018657966561110145, 'epoch': 0.53}
+ 53%|█████▎    | 3590/6790 [2:04:26<1:46:51,  2.00s/it] 53%|█████▎    | 3591/6790 [2:04:27<1:44:01,  1.95s/it]                                                       {'loss': 1.4157, 'learning_rate': 0.00018648595971153142, 'epoch': 0.53}
+ 53%|█████▎    | 3591/6790 [2:04:27<1:44:01,  1.95s/it] 53%|█████▎    | 3592/6790 [2:04:29<1:45:36,  1.98s/it]                                                       {'loss': 1.5963, 'learning_rate': 0.0001863922567920742, 'epoch': 0.53}
+ 53%|█████▎    | 3592/6790 [2:04:30<1:45:36,  1.98s/it] 53%|█████▎    | 3593/6790 [2:04:31<1:43:41,  1.95s/it]                                                       {'loss': 1.4608, 'learning_rate': 0.00018629855687339323, 'epoch': 0.53}
+ 53%|█████▎    | 3593/6790 [2:04:31<1:43:41,  1.95s/it] 53%|█████▎    | 3594/6790 [2:04:34<1:49:21,  2.05s/it]                                                       {'loss': 1.2655, 'learning_rate': 0.0001862048599761511, 'epoch': 0.53}
+ 53%|█████▎    | 3594/6790 [2:04:34<1:49:21,  2.05s/it] 53%|█████▎    | 3595/6790 [2:04:36<1:51:01,  2.08s/it]                                                       {'loss': 1.598, 'learning_rate': 0.0001861111661210099, 'epoch': 0.53}
+ 53%|█████▎    | 3595/6790 [2:04:36<1:51:01,  2.08s/it] 53%|█████▎    | 3596/6790 [2:04:38<1:46:16,  2.00s/it]                                                       {'loss': 1.401, 'learning_rate': 0.00018601747532863088, 'epoch': 0.53}
+ 53%|█████▎    | 3596/6790 [2:04:38<1:46:16,  2.00s/it] 53%|█████▎    | 3597/6790 [2:04:40<1:48:58,  2.05s/it]                                                       {'loss': 1.499, 'learning_rate': 0.00018592378761967494, 'epoch': 0.53}
+ 53%|█████▎    | 3597/6790 [2:04:40<1:48:58,  2.05s/it] 53%|█████▎    | 3598/6790 [2:04:42<1:48:39,  2.04s/it]                                                       {'loss': 1.5004, 'learning_rate': 0.00018583010301480171, 'epoch': 0.53}
+ 53%|█████▎    | 3598/6790 [2:04:42<1:48:39,  2.04s/it] 53%|█████▎    | 3599/6790 [2:04:44<1:48:03,  2.03s/it]                                                       {'loss': 1.6075, 'learning_rate': 0.00018573642153467084, 'epoch': 0.53}
+ 53%|█████▎    | 3599/6790 [2:04:44<1:48:03,  2.03s/it] 53%|█████▎    | 3600/6790 [2:04:46<1:50:31,  2.08s/it]                                                       {'loss': 1.5927, 'learning_rate': 0.00018564274319994074, 'epoch': 0.53}
+ 53%|█████▎    | 3600/6790 [2:04:46<1:50:31,  2.08s/it] 53%|█████▎    | 3601/6790 [2:04:48<1:46:42,  2.01s/it]                                                       {'loss': 1.5468, 'learning_rate': 0.0001855490680312694, 'epoch': 0.53}
+ 53%|█████▎    | 3601/6790 [2:04:48<1:46:42,  2.01s/it] 53%|█████▎    | 3602/6790 [2:04:50<1:45:27,  1.98s/it]                                                       {'loss': 1.2445, 'learning_rate': 0.0001854553960493141, 'epoch': 0.53}
+ 53%|█████▎    | 3602/6790 [2:04:50<1:45:27,  1.98s/it] 53%|█████▎    | 3603/6790 [2:04:52<1:56:23,  2.19s/it]                                                       {'loss': 1.4718, 'learning_rate': 0.00018536172727473123, 'epoch': 0.53}
+ 53%|█████▎    | 3603/6790 [2:04:52<1:56:23,  2.19s/it] 53%|█████▎    | 3604/6790 [2:04:54<1:50:17,  2.08s/it]                                                       {'loss': 1.4699, 'learning_rate': 0.00018526806172817673, 'epoch': 0.53}
+ 53%|█████▎    | 3604/6790 [2:04:54<1:50:17,  2.08s/it] 53%|█████▎    | 3605/6790 [2:04:56<1:45:55,  2.00s/it]                                                       {'loss': 1.456, 'learning_rate': 0.00018517439943030554, 'epoch': 0.53}
+ 53%|█████▎    | 3605/6790 [2:04:56<1:45:55,  2.00s/it] 53%|█████▎    | 3606/6790 [2:04:58<1:45:31,  1.99s/it]                                                       {'loss': 1.4742, 'learning_rate': 0.00018508074040177235, 'epoch': 0.53}
+ 53%|█████▎    | 3606/6790 [2:04:58<1:45:31,  1.99s/it] 53%|█████▎    | 3607/6790 [2:05:00<1:47:28,  2.03s/it]                                                       {'loss': 1.1504, 'learning_rate': 0.00018498708466323046, 'epoch': 0.53}
+ 53%|█████▎    | 3607/6790 [2:05:00<1:47:28,  2.03s/it] 53%|█████▎    | 3608/6790 [2:05:02<1:44:52,  1.98s/it]                                                       {'loss': 1.665, 'learning_rate': 0.00018489343223533313, 'epoch': 0.53}
+ 53%|█████▎    | 3608/6790 [2:05:02<1:44:52,  1.98s/it] 53%|█████▎    | 3609/6790 [2:05:04<1:49:23,  2.06s/it]                                                       {'loss': 1.3263, 'learning_rate': 0.0001847997831387323, 'epoch': 0.53}
+ 53%|█████▎    | 3609/6790 [2:05:04<1:49:23,  2.06s/it] 53%|█████▎    | 3610/6790 [2:05:06<1:48:24,  2.05s/it]                                                       {'loss': 1.4121, 'learning_rate': 0.00018470613739407965, 'epoch': 0.53}
+ 53%|█████▎    | 3610/6790 [2:05:06<1:48:24,  2.05s/it] 53%|█████▎    | 3611/6790 [2:05:08<1:50:46,  2.09s/it]                                                       {'loss': 1.67, 'learning_rate': 0.0001846124950220258, 'epoch': 0.53}
+ 53%|█████▎    | 3611/6790 [2:05:08<1:50:46,  2.09s/it] 53%|█████▎    | 3612/6790 [2:05:10<1:45:46,  2.00s/it]                                                       {'loss': 1.3614, 'learning_rate': 0.00018451885604322084, 'epoch': 0.53}
+ 53%|█████▎    | 3612/6790 [2:05:10<1:45:46,  2.00s/it] 53%|█████▎    | 3613/6790 [2:05:12<1:42:48,  1.94s/it]                                                       {'loss': 1.4562, 'learning_rate': 0.0001844252204783139, 'epoch': 0.53}
+ 53%|█████▎    | 3613/6790 [2:05:12<1:42:48,  1.94s/it] 53%|█████▎    | 3614/6790 [2:05:14<1:40:17,  1.89s/it]                                                       {'loss': 1.333, 'learning_rate': 0.00018433158834795356, 'epoch': 0.53}
+ 53%|█████▎    | 3614/6790 [2:05:14<1:40:17,  1.89s/it] 53%|█████▎    | 3615/6790 [2:05:16<1:39:50,  1.89s/it]                                                       {'loss': 1.5278, 'learning_rate': 0.0001842379596727875, 'epoch': 0.53}
+ 53%|█████▎    | 3615/6790 [2:05:16<1:39:50,  1.89s/it] 53%|█████▎    | 3616/6790 [2:05:18<1:44:57,  1.98s/it]                                                       {'loss': 1.3722, 'learning_rate': 0.00018414433447346275, 'epoch': 0.53}
+ 53%|█████▎    | 3616/6790 [2:05:18<1:44:57,  1.98s/it] 53%|█████▎    | 3617/6790 [2:05:20<1:45:19,  1.99s/it]                                                       {'loss': 1.4852, 'learning_rate': 0.00018405071277062545, 'epoch': 0.53}
+ 53%|█████▎    | 3617/6790 [2:05:20<1:45:19,  1.99s/it] 53%|█████▎    | 3618/6790 [2:05:22<1:39:18,  1.88s/it]                                                       {'loss': 1.3215, 'learning_rate': 0.000183957094584921, 'epoch': 0.53}
+ 53%|█████▎    | 3618/6790 [2:05:22<1:39:18,  1.88s/it] 53%|█████▎    | 3619/6790 [2:05:24<1:44:28,  1.98s/it]                                                       {'loss': 1.6243, 'learning_rate': 0.00018386347993699424, 'epoch': 0.53}
+ 53%|█████▎    | 3619/6790 [2:05:24<1:44:28,  1.98s/it] 53%|█████▎    | 3620/6790 [2:05:26<1:48:48,  2.06s/it]                                                       {'loss': 1.3411, 'learning_rate': 0.00018376986884748888, 'epoch': 0.53}
+ 53%|█████▎    | 3620/6790 [2:05:26<1:48:48,  2.06s/it] 53%|█████▎    | 3621/6790 [2:05:28<1:48:08,  2.05s/it]                                                       {'loss': 1.5707, 'learning_rate': 0.0001836762613370481, 'epoch': 0.53}
+ 53%|█████▎    | 3621/6790 [2:05:28<1:48:08,  2.05s/it] 53%|█████▎    | 3622/6790 [2:05:30<1:49:13,  2.07s/it]                                                       {'loss': 1.4804, 'learning_rate': 0.00018358265742631416, 'epoch': 0.53}
+ 53%|█████▎    | 3622/6790 [2:05:30<1:49:13,  2.07s/it] 53%|█████▎    | 3623/6790 [2:05:32<1:48:37,  2.06s/it]                                                       {'loss': 1.2851, 'learning_rate': 0.00018348905713592862, 'epoch': 0.53}
+ 53%|█████▎    | 3623/6790 [2:05:32<1:48:37,  2.06s/it] 53%|█████▎    | 3624/6790 [2:05:34<1:50:27,  2.09s/it]                                                       {'loss': 1.1895, 'learning_rate': 0.0001833954604865321, 'epoch': 0.53}
+ 53%|█████▎    | 3624/6790 [2:05:34<1:50:27,  2.09s/it] 53%|█████▎    | 3625/6790 [2:05:37<1:51:19,  2.11s/it]                                                       {'loss': 1.7503, 'learning_rate': 0.00018330186749876463, 'epoch': 0.53}
+ 53%|█████▎    | 3625/6790 [2:05:37<1:51:19,  2.11s/it] 53%|█████▎    | 3626/6790 [2:05:39<1:50:36,  2.10s/it]                                                       {'loss': 1.4416, 'learning_rate': 0.00018320827819326522, 'epoch': 0.53}
+ 53%|█████▎    | 3626/6790 [2:05:39<1:50:36,  2.10s/it] 53%|█████▎    | 3627/6790 [2:05:41<1:48:52,  2.07s/it]                                                       {'loss': 1.5993, 'learning_rate': 0.00018311469259067221, 'epoch': 0.53}
+ 53%|█████▎    | 3627/6790 [2:05:41<1:48:52,  2.07s/it] 53%|█████▎    | 3628/6790 [2:05:43<1:51:09,  2.11s/it]                                                       {'loss': 1.4267, 'learning_rate': 0.000183021110711623, 'epoch': 0.53}
+ 53%|█████▎    | 3628/6790 [2:05:43<1:51:09,  2.11s/it] 53%|█████▎    | 3629/6790 [2:05:45<1:54:46,  2.18s/it]                                                       {'loss': 1.6687, 'learning_rate': 0.00018292753257675442, 'epoch': 0.53}
+ 53%|█████▎    | 3629/6790 [2:05:45<1:54:46,  2.18s/it] 53%|█████▎    | 3630/6790 [2:05:47<1:50:01,  2.09s/it]                                                       {'loss': 1.4204, 'learning_rate': 0.00018283395820670203, 'epoch': 0.53}
+ 53%|█████▎    | 3630/6790 [2:05:47<1:50:01,  2.09s/it] 53%|█████▎    | 3631/6790 [2:05:49<1:47:52,  2.05s/it]                                                       {'loss': 1.3839, 'learning_rate': 0.00018274038762210114, 'epoch': 0.53}
+ 53%|█████▎    | 3631/6790 [2:05:49<1:47:52,  2.05s/it] 53%|█████▎    | 3632/6790 [2:05:51<1:47:58,  2.05s/it]                                                       {'loss': 1.4549, 'learning_rate': 0.00018264682084358558, 'epoch': 0.53}
+ 53%|█████▎    | 3632/6790 [2:05:51<1:47:58,  2.05s/it] 54%|█████▎    | 3633/6790 [2:05:53<1:44:46,  1.99s/it]                                                       {'loss': 1.5895, 'learning_rate': 0.00018255325789178894, 'epoch': 0.54}
+ 54%|█████▎    | 3633/6790 [2:05:53<1:44:46,  1.99s/it] 54%|█████▎    | 3634/6790 [2:05:55<1:45:46,  2.01s/it]                                                       {'loss': 1.5206, 'learning_rate': 0.00018245969878734358, 'epoch': 0.54}
+ 54%|█████▎    | 3634/6790 [2:05:55<1:45:46,  2.01s/it] 54%|█████▎    | 3635/6790 [2:05:57<1:42:20,  1.95s/it]                                                       {'loss': 1.3865, 'learning_rate': 0.0001823661435508811, 'epoch': 0.54}
+ 54%|█████▎    | 3635/6790 [2:05:57<1:42:20,  1.95s/it] 54%|█████▎    | 3636/6790 [2:05:59<1:39:56,  1.90s/it]                                                       {'loss': 1.5038, 'learning_rate': 0.00018227259220303241, 'epoch': 0.54}
+ 54%|█████▎    | 3636/6790 [2:05:59<1:39:56,  1.90s/it] 54%|█████▎    | 3637/6790 [2:06:00<1:37:26,  1.85s/it]                                                       {'loss': 1.4459, 'learning_rate': 0.0001821790447644273, 'epoch': 0.54}
+ 54%|█████▎    | 3637/6790 [2:06:00<1:37:26,  1.85s/it] 54%|█████▎    | 3638/6790 [2:06:02<1:38:42,  1.88s/it]                                                       {'loss': 1.3324, 'learning_rate': 0.00018208550125569493, 'epoch': 0.54}
+ 54%|█████▎    | 3638/6790 [2:06:02<1:38:42,  1.88s/it] 54%|█████▎    | 3639/6790 [2:06:05<1:55:16,  2.20s/it]                                                       {'loss': 1.3851, 'learning_rate': 0.00018199196169746336, 'epoch': 0.54}
+ 54%|█████▎    | 3639/6790 [2:06:05<1:55:16,  2.20s/it] 54%|█████▎    | 3640/6790 [2:06:08<2:00:23,  2.29s/it]                                                       {'loss': 1.1415, 'learning_rate': 0.0001818984261103601, 'epoch': 0.54}
+ 54%|█████▎    | 3640/6790 [2:06:08<2:00:23,  2.29s/it] 54%|█████▎    | 3641/6790 [2:06:10<1:56:05,  2.21s/it]                                                       {'loss': 1.0758, 'learning_rate': 0.00018180489451501136, 'epoch': 0.54}
+ 54%|█████▎    | 3641/6790 [2:06:10<1:56:05,  2.21s/it] 54%|█████▎    | 3642/6790 [2:06:11<1:50:02,  2.10s/it]                                                       {'loss': 1.6153, 'learning_rate': 0.0001817113669320429, 'epoch': 0.54}
+ 54%|█████▎    | 3642/6790 [2:06:12<1:50:02,  2.10s/it] 54%|█████▎    | 3643/6790 [2:06:13<1:46:33,  2.03s/it]                                                       {'loss': 1.5651, 'learning_rate': 0.0001816178433820793, 'epoch': 0.54}
+ 54%|█████▎    | 3643/6790 [2:06:13<1:46:33,  2.03s/it] 54%|█████▎    | 3644/6790 [2:06:16<1:48:42,  2.07s/it]                                                       {'loss': 1.3644, 'learning_rate': 0.00018152432388574444, 'epoch': 0.54}
+ 54%|█████▎    | 3644/6790 [2:06:16<1:48:42,  2.07s/it] 54%|█████▎    | 3645/6790 [2:06:18<1:47:12,  2.05s/it]                                                       {'loss': 1.4522, 'learning_rate': 0.00018143080846366106, 'epoch': 0.54}
+ 54%|█████▎    | 3645/6790 [2:06:18<1:47:12,  2.05s/it] 54%|█████▎    | 3646/6790 [2:06:20<1:49:59,  2.10s/it]                                                       {'loss': 1.521, 'learning_rate': 0.00018133729713645135, 'epoch': 0.54}
+ 54%|█████▎    | 3646/6790 [2:06:20<1:49:59,  2.10s/it] 54%|█████▎    | 3647/6790 [2:06:22<1:55:12,  2.20s/it]                                                       {'loss': 1.2852, 'learning_rate': 0.00018124378992473626, 'epoch': 0.54}
+ 54%|█████▎    | 3647/6790 [2:06:22<1:55:12,  2.20s/it] 54%|█████▎    | 3648/6790 [2:06:24<1:51:18,  2.13s/it]                                                       {'loss': 1.6442, 'learning_rate': 0.00018115028684913604, 'epoch': 0.54}
+ 54%|█████▎    | 3648/6790 [2:06:24<1:51:18,  2.13s/it] 54%|█████▎    | 3649/6790 [2:06:26<1:49:02,  2.08s/it]                                                       {'loss': 1.4695, 'learning_rate': 0.00018105678793026994, 'epoch': 0.54}
+ 54%|█████▎    | 3649/6790 [2:06:26<1:49:02,  2.08s/it] 54%|█████▍    | 3650/6790 [2:06:28<1:46:12,  2.03s/it]                                                       {'loss': 1.5783, 'learning_rate': 0.00018096329318875634, 'epoch': 0.54}
+ 54%|█████▍    | 3650/6790 [2:06:28<1:46:12,  2.03s/it] 54%|█████▍    | 3651/6790 [2:06:30<1:47:05,  2.05s/it]                                                       {'loss': 1.596, 'learning_rate': 0.00018086980264521262, 'epoch': 0.54}
+ 54%|█████▍    | 3651/6790 [2:06:30<1:47:05,  2.05s/it] 54%|█████▍    | 3652/6790 [2:06:32<1:43:53,  1.99s/it]                                                       {'loss': 1.6445, 'learning_rate': 0.00018077631632025534, 'epoch': 0.54}
+ 54%|█████▍    | 3652/6790 [2:06:32<1:43:53,  1.99s/it] 54%|█████▍    | 3653/6790 [2:06:34<1:42:40,  1.96s/it]                                                       {'loss': 1.531, 'learning_rate': 0.00018068283423450015, 'epoch': 0.54}
+ 54%|█████▍    | 3653/6790 [2:06:34<1:42:40,  1.96s/it] 54%|█████▍    | 3654/6790 [2:06:36<1:45:16,  2.01s/it]                                                       {'loss': 1.3696, 'learning_rate': 0.0001805893564085616, 'epoch': 0.54}
+ 54%|█████▍    | 3654/6790 [2:06:36<1:45:16,  2.01s/it] 54%|█████▍    | 3655/6790 [2:06:38<1:47:11,  2.05s/it]                                                       {'loss': 1.4743, 'learning_rate': 0.00018049588286305342, 'epoch': 0.54}
+ 54%|█████▍    | 3655/6790 [2:06:38<1:47:11,  2.05s/it] 54%|█████▍    | 3656/6790 [2:06:40<1:49:19,  2.09s/it]                                                       {'loss': 1.3333, 'learning_rate': 0.00018040241361858835, 'epoch': 0.54}
+ 54%|█████▍    | 3656/6790 [2:06:40<1:49:19,  2.09s/it] 54%|█████▍    | 3657/6790 [2:06:43<1:52:15,  2.15s/it]                                                       {'loss': 1.5639, 'learning_rate': 0.0001803089486957783, 'epoch': 0.54}
+ 54%|█████▍    | 3657/6790 [2:06:43<1:52:15,  2.15s/it] 54%|█████▍    | 3658/6790 [2:06:45<1:56:23,  2.23s/it]                                                       {'loss': 1.4279, 'learning_rate': 0.000180215488115234, 'epoch': 0.54}
+ 54%|█████▍    | 3658/6790 [2:06:45<1:56:23,  2.23s/it] 54%|█████▍    | 3659/6790 [2:06:47<1:55:34,  2.21s/it]                                                       {'loss': 1.4206, 'learning_rate': 0.0001801220318975655, 'epoch': 0.54}
+ 54%|█████▍    | 3659/6790 [2:06:47<1:55:34,  2.21s/it] 54%|█████▍    | 3660/6790 [2:06:49<1:53:34,  2.18s/it]                                                       {'loss': 1.533, 'learning_rate': 0.00018002858006338157, 'epoch': 0.54}
+ 54%|█████▍    | 3660/6790 [2:06:49<1:53:34,  2.18s/it] 54%|█████▍    | 3661/6790 [2:06:51<1:53:31,  2.18s/it]                                                       {'loss': 1.6151, 'learning_rate': 0.00017993513263329035, 'epoch': 0.54}
+ 54%|█████▍    | 3661/6790 [2:06:51<1:53:31,  2.18s/it] 54%|█████▍    | 3662/6790 [2:06:53<1:50:53,  2.13s/it]                                                       {'loss': 1.5427, 'learning_rate': 0.00017984168962789868, 'epoch': 0.54}
+ 54%|█████▍    | 3662/6790 [2:06:53<1:50:53,  2.13s/it] 54%|█████▍    | 3663/6790 [2:06:55<1:48:57,  2.09s/it]                                                       {'loss': 1.1644, 'learning_rate': 0.00017974825106781278, 'epoch': 0.54}
+ 54%|█████▍    | 3663/6790 [2:06:55<1:48:57,  2.09s/it] 54%|█████▍    | 3664/6790 [2:06:58<1:52:39,  2.16s/it]                                                       {'loss': 1.534, 'learning_rate': 0.00017965481697363752, 'epoch': 0.54}
+ 54%|█████▍    | 3664/6790 [2:06:58<1:52:39,  2.16s/it] 54%|█████▍    | 3665/6790 [2:07:00<1:54:04,  2.19s/it]                                                       {'loss': 1.2437, 'learning_rate': 0.0001795613873659771, 'epoch': 0.54}
+ 54%|█████▍    | 3665/6790 [2:07:00<1:54:04,  2.19s/it] 54%|█████▍    | 3666/6790 [2:07:02<1:46:17,  2.04s/it]                                                       {'loss': 1.2831, 'learning_rate': 0.00017946796226543448, 'epoch': 0.54}
+ 54%|█████▍    | 3666/6790 [2:07:02<1:46:17,  2.04s/it] 54%|█████▍    | 3667/6790 [2:07:04<1:44:27,  2.01s/it]                                                       {'loss': 1.4001, 'learning_rate': 0.00017937454169261188, 'epoch': 0.54}
+ 54%|█████▍    | 3667/6790 [2:07:04<1:44:27,  2.01s/it] 54%|█████▍    | 3668/6790 [2:07:06<1:46:14,  2.04s/it]                                                       {'loss': 1.6179, 'learning_rate': 0.00017928112566811022, 'epoch': 0.54}
+ 54%|█████▍    | 3668/6790 [2:07:06<1:46:14,  2.04s/it] 54%|█████▍    | 3669/6790 [2:07:08<1:42:47,  1.98s/it]                                                       {'loss': 1.3082, 'learning_rate': 0.0001791877142125297, 'epoch': 0.54}
+ 54%|█████▍    | 3669/6790 [2:07:08<1:42:47,  1.98s/it] 54%|█████▍    | 3670/6790 [2:07:10<1:46:36,  2.05s/it]                                                       {'loss': 1.4029, 'learning_rate': 0.00017909430734646935, 'epoch': 0.54}
+ 54%|█████▍    | 3670/6790 [2:07:10<1:46:36,  2.05s/it] 54%|█████▍    | 3671/6790 [2:07:12<1:49:31,  2.11s/it]                                                       {'loss': 1.2826, 'learning_rate': 0.00017900090509052714, 'epoch': 0.54}
+ 54%|█████▍    | 3671/6790 [2:07:12<1:49:31,  2.11s/it] 54%|█████▍    | 3672/6790 [2:07:14<1:51:16,  2.14s/it]                                                       {'loss': 1.4571, 'learning_rate': 0.00017890750746530034, 'epoch': 0.54}
+ 54%|█████▍    | 3672/6790 [2:07:14<1:51:16,  2.14s/it] 54%|█████▍    | 3673/6790 [2:07:17<1:55:00,  2.21s/it]                                                       {'loss': 1.2009, 'learning_rate': 0.00017881411449138473, 'epoch': 0.54}
+ 54%|█████▍    | 3673/6790 [2:07:17<1:55:00,  2.21s/it] 54%|█████▍    | 3674/6790 [2:07:19<1:51:20,  2.14s/it]                                                       {'loss': 1.4809, 'learning_rate': 0.00017872072618937545, 'epoch': 0.54}
+ 54%|█████▍    | 3674/6790 [2:07:19<1:51:20,  2.14s/it] 54%|█████▍    | 3675/6790 [2:07:21<1:46:23,  2.05s/it]                                                       {'loss': 1.4999, 'learning_rate': 0.0001786273425798664, 'epoch': 0.54}
+ 54%|█████▍    | 3675/6790 [2:07:21<1:46:23,  2.05s/it] 54%|█████▍    | 3676/6790 [2:07:22<1:44:25,  2.01s/it]                                                       {'loss': 1.5286, 'learning_rate': 0.0001785339636834506, 'epoch': 0.54}
+ 54%|█████▍    | 3676/6790 [2:07:22<1:44:25,  2.01s/it] 54%|█████▍    | 3677/6790 [2:07:24<1:42:39,  1.98s/it]                                                       {'loss': 1.4906, 'learning_rate': 0.0001784405895207198, 'epoch': 0.54}
+ 54%|█████▍    | 3677/6790 [2:07:24<1:42:39,  1.98s/it] 54%|█████▍    | 3678/6790 [2:07:26<1:41:55,  1.97s/it]                                                       {'loss': 1.6479, 'learning_rate': 0.00017834722011226498, 'epoch': 0.54}
+ 54%|█████▍    | 3678/6790 [2:07:26<1:41:55,  1.97s/it] 54%|█████▍    | 3679/6790 [2:07:28<1:43:35,  2.00s/it]                                                       {'loss': 1.614, 'learning_rate': 0.00017825385547867584, 'epoch': 0.54}
+ 54%|█████▍    | 3679/6790 [2:07:28<1:43:35,  2.00s/it] 54%|█████▍    | 3680/6790 [2:07:30<1:43:50,  2.00s/it]                                                       {'loss': 1.2393, 'learning_rate': 0.0001781604956405412, 'epoch': 0.54}
+ 54%|█████▍    | 3680/6790 [2:07:30<1:43:50,  2.00s/it] 54%|█████▍    | 3681/6790 [2:07:32<1:45:26,  2.04s/it]                                                       {'loss': 1.5663, 'learning_rate': 0.0001780671406184487, 'epoch': 0.54}
+ 54%|█████▍    | 3681/6790 [2:07:32<1:45:26,  2.04s/it] 54%|█████▍    | 3682/6790 [2:07:35<1:48:55,  2.10s/it]                                                       {'loss': 1.3122, 'learning_rate': 0.00017797379043298501, 'epoch': 0.54}
+ 54%|█████▍    | 3682/6790 [2:07:35<1:48:55,  2.10s/it] 54%|█████▍    | 3683/6790 [2:07:37<1:45:50,  2.04s/it]                                                       {'loss': 1.485, 'learning_rate': 0.0001778804451047356, 'epoch': 0.54}
+ 54%|█████▍    | 3683/6790 [2:07:37<1:45:50,  2.04s/it] 54%|█████▍    | 3684/6790 [2:07:39<1:46:08,  2.05s/it]                                                       {'loss': 1.3881, 'learning_rate': 0.0001777871046542851, 'epoch': 0.54}
+ 54%|█████▍    | 3684/6790 [2:07:39<1:46:08,  2.05s/it] 54%|█████▍    | 3685/6790 [2:07:41<1:43:44,  2.00s/it]                                                       {'loss': 1.5274, 'learning_rate': 0.00017769376910221674, 'epoch': 0.54}
+ 54%|█████▍    | 3685/6790 [2:07:41<1:43:44,  2.00s/it] 54%|█████▍    | 3686/6790 [2:07:43<1:45:55,  2.05s/it]                                                       {'loss': 1.3143, 'learning_rate': 0.000177600438469113, 'epoch': 0.54}
+ 54%|█████▍    | 3686/6790 [2:07:43<1:45:55,  2.05s/it] 54%|█████▍    | 3687/6790 [2:07:45<1:44:04,  2.01s/it]                                                       {'loss': 1.7434, 'learning_rate': 0.00017750711277555515, 'epoch': 0.54}
+ 54%|█████▍    | 3687/6790 [2:07:45<1:44:04,  2.01s/it] 54%|█████▍    | 3688/6790 [2:07:47<1:42:58,  1.99s/it]                                                       {'loss': 1.3662, 'learning_rate': 0.00017741379204212323, 'epoch': 0.54}
+ 54%|█████▍    | 3688/6790 [2:07:47<1:42:58,  1.99s/it] 54%|█████▍    | 3689/6790 [2:07:48<1:40:32,  1.95s/it]                                                       {'loss': 1.4299, 'learning_rate': 0.00017732047628939642, 'epoch': 0.54}
+ 54%|█████▍    | 3689/6790 [2:07:48<1:40:32,  1.95s/it] 54%|█████▍    | 3690/6790 [2:07:50<1:40:19,  1.94s/it]                                                       {'loss': 1.3854, 'learning_rate': 0.00017722716553795256, 'epoch': 0.54}
+ 54%|█████▍    | 3690/6790 [2:07:50<1:40:19,  1.94s/it] 54%|█████▍    | 3691/6790 [2:07:52<1:41:46,  1.97s/it]                                                       {'loss': 1.4622, 'learning_rate': 0.00017713385980836863, 'epoch': 0.54}
+ 54%|█████▍    | 3691/6790 [2:07:52<1:41:46,  1.97s/it] 54%|█████▍    | 3692/6790 [2:07:54<1:41:30,  1.97s/it]                                                       {'loss': 1.6199, 'learning_rate': 0.0001770405591212203, 'epoch': 0.54}
+ 54%|█████▍    | 3692/6790 [2:07:54<1:41:30,  1.97s/it] 54%|█████▍    | 3693/6790 [2:07:56<1:41:12,  1.96s/it]                                                       {'loss': 1.4102, 'learning_rate': 0.0001769472634970823, 'epoch': 0.54}
+ 54%|█████▍    | 3693/6790 [2:07:56<1:41:12,  1.96s/it] 54%|█████▍    | 3694/6790 [2:07:58<1:39:14,  1.92s/it]                                                       {'loss': 1.2267, 'learning_rate': 0.00017685397295652804, 'epoch': 0.54}
+ 54%|█████▍    | 3694/6790 [2:07:58<1:39:14,  1.92s/it] 54%|█████▍    | 3695/6790 [2:08:00<1:37:56,  1.90s/it]                                                       {'loss': 1.3416, 'learning_rate': 0.0001767606875201301, 'epoch': 0.54}
+ 54%|█████▍    | 3695/6790 [2:08:00<1:37:56,  1.90s/it] 54%|█████▍    | 3696/6790 [2:08:02<1:42:53,  2.00s/it]                                                       {'loss': 1.5479, 'learning_rate': 0.00017666740720845956, 'epoch': 0.54}
+ 54%|█████▍    | 3696/6790 [2:08:02<1:42:53,  2.00s/it] 54%|█████▍    | 3697/6790 [2:08:04<1:40:16,  1.95s/it]                                                       {'loss': 1.3505, 'learning_rate': 0.00017657413204208674, 'epoch': 0.54}
+ 54%|█████▍    | 3697/6790 [2:08:04<1:40:16,  1.95s/it] 54%|█████▍    | 3698/6790 [2:08:06<1:41:31,  1.97s/it]                                                       {'loss': 1.4348, 'learning_rate': 0.00017648086204158055, 'epoch': 0.54}
+ 54%|█████▍    | 3698/6790 [2:08:06<1:41:31,  1.97s/it] 54%|█████▍    | 3699/6790 [2:08:08<1:44:23,  2.03s/it]                                                       {'loss': 1.4262, 'learning_rate': 0.00017638759722750895, 'epoch': 0.54}
+ 54%|█████▍    | 3699/6790 [2:08:08<1:44:23,  2.03s/it] 54%|█████▍    | 3700/6790 [2:08:10<1:43:35,  2.01s/it]                                                       {'loss': 1.4625, 'learning_rate': 0.00017629433762043862, 'epoch': 0.54}
+ 54%|█████▍    | 3700/6790 [2:08:10<1:43:35,  2.01s/it] 55%|█████▍    | 3701/6790 [2:08:12<1:42:58,  2.00s/it]                                                       {'loss': 1.4374, 'learning_rate': 0.00017620108324093516, 'epoch': 0.55}
+ 55%|█████▍    | 3701/6790 [2:08:12<1:42:58,  2.00s/it] 55%|█████▍    | 3702/6790 [2:08:14<1:40:33,  1.95s/it]                                                       {'loss': 1.4246, 'learning_rate': 0.00017610783410956294, 'epoch': 0.55}
+ 55%|█████▍    | 3702/6790 [2:08:14<1:40:33,  1.95s/it] 55%|█████▍    | 3703/6790 [2:08:16<1:41:43,  1.98s/it]                                                       {'loss': 1.1806, 'learning_rate': 0.0001760145902468853, 'epoch': 0.55}
+ 55%|█████▍    | 3703/6790 [2:08:16<1:41:43,  1.98s/it] 55%|█████▍    | 3704/6790 [2:08:18<1:40:45,  1.96s/it]                                                       {'loss': 1.5397, 'learning_rate': 0.00017592135167346446, 'epoch': 0.55}
+ 55%|█████▍    | 3704/6790 [2:08:18<1:40:45,  1.96s/it] 55%|█████▍    | 3705/6790 [2:08:20<1:44:51,  2.04s/it]                                                       {'loss': 1.4094, 'learning_rate': 0.00017582811840986112, 'epoch': 0.55}
+ 55%|█████▍    | 3705/6790 [2:08:20<1:44:51,  2.04s/it] 55%|█████▍    | 3706/6790 [2:08:22<1:45:44,  2.06s/it]                                                       {'loss': 1.4526, 'learning_rate': 0.00017573489047663534, 'epoch': 0.55}
+ 55%|█████▍    | 3706/6790 [2:08:22<1:45:44,  2.06s/it] 55%|█████▍    | 3707/6790 [2:08:24<1:41:36,  1.98s/it]                                                       {'loss': 1.2876, 'learning_rate': 0.00017564166789434544, 'epoch': 0.55}
+ 55%|█████▍    | 3707/6790 [2:08:24<1:41:36,  1.98s/it] 55%|█████▍    | 3708/6790 [2:08:26<1:46:23,  2.07s/it]                                                       {'loss': 1.6941, 'learning_rate': 0.00017554845068354905, 'epoch': 0.55}
+ 55%|█████▍    | 3708/6790 [2:08:26<1:46:23,  2.07s/it] 55%|█████▍    | 3709/6790 [2:08:28<1:45:33,  2.06s/it]                                                       {'loss': 1.4479, 'learning_rate': 0.0001754552388648023, 'epoch': 0.55}
+ 55%|█████▍    | 3709/6790 [2:08:28<1:45:33,  2.06s/it] 55%|█████▍    | 3710/6790 [2:08:30<1:44:38,  2.04s/it]                                                       {'loss': 1.4684, 'learning_rate': 0.0001753620324586603, 'epoch': 0.55}
+ 55%|█████▍    | 3710/6790 [2:08:30<1:44:38,  2.04s/it] 55%|█████▍    | 3711/6790 [2:08:32<1:43:11,  2.01s/it]                                                       {'loss': 1.3978, 'learning_rate': 0.00017526883148567682, 'epoch': 0.55}
+ 55%|█████▍    | 3711/6790 [2:08:32<1:43:11,  2.01s/it] 55%|█████▍    | 3712/6790 [2:08:34<1:41:25,  1.98s/it]                                                       {'loss': 1.6162, 'learning_rate': 0.00017517563596640466, 'epoch': 0.55}
+ 55%|█████▍    | 3712/6790 [2:08:34<1:41:25,  1.98s/it] 55%|█████▍    | 3713/6790 [2:08:36<1:39:39,  1.94s/it]                                                       {'loss': 1.3785, 'learning_rate': 0.0001750824459213951, 'epoch': 0.55}
+ 55%|█████▍    | 3713/6790 [2:08:36<1:39:39,  1.94s/it] 55%|█████▍    | 3714/6790 [2:08:38<1:41:31,  1.98s/it]                                                       {'loss': 1.3874, 'learning_rate': 0.00017498926137119852, 'epoch': 0.55}
+ 55%|█████▍    | 3714/6790 [2:08:38<1:41:31,  1.98s/it] 55%|█████▍    | 3715/6790 [2:08:40<1:44:54,  2.05s/it]                                                       {'loss': 1.5013, 'learning_rate': 0.00017489608233636384, 'epoch': 0.55}
+ 55%|█████▍    | 3715/6790 [2:08:40<1:44:54,  2.05s/it] 55%|█████▍    | 3716/6790 [2:08:42<1:45:03,  2.05s/it]                                                       {'loss': 1.5097, 'learning_rate': 0.000174802908837439, 'epoch': 0.55}
+ 55%|█████▍    | 3716/6790 [2:08:42<1:45:03,  2.05s/it] 55%|█████▍    | 3717/6790 [2:08:45<1:47:47,  2.10s/it]                                                       {'loss': 1.6127, 'learning_rate': 0.00017470974089497045, 'epoch': 0.55}
+ 55%|█████▍    | 3717/6790 [2:08:45<1:47:47,  2.10s/it] 55%|█████▍    | 3718/6790 [2:08:47<1:50:26,  2.16s/it]                                                       {'loss': 1.4182, 'learning_rate': 0.00017461657852950379, 'epoch': 0.55}
+ 55%|█████▍    | 3718/6790 [2:08:47<1:50:26,  2.16s/it] 55%|█████▍    | 3719/6790 [2:08:49<1:49:00,  2.13s/it]                                                       {'loss': 1.5645, 'learning_rate': 0.00017452342176158288, 'epoch': 0.55}
+ 55%|█████▍    | 3719/6790 [2:08:49<1:49:00,  2.13s/it] 55%|█████▍    | 3720/6790 [2:08:51<1:48:53,  2.13s/it]                                                       {'loss': 1.3734, 'learning_rate': 0.0001744302706117508, 'epoch': 0.55}
+ 55%|█████▍    | 3720/6790 [2:08:51<1:48:53,  2.13s/it] 55%|█████▍    | 3721/6790 [2:08:53<1:46:03,  2.07s/it]                                                       {'loss': 1.5109, 'learning_rate': 0.00017433712510054927, 'epoch': 0.55}
+ 55%|█████▍    | 3721/6790 [2:08:53<1:46:03,  2.07s/it] 55%|█████▍    | 3722/6790 [2:08:55<1:46:19,  2.08s/it]                                                       {'loss': 1.2866, 'learning_rate': 0.00017424398524851854, 'epoch': 0.55}
+ 55%|█████▍    | 3722/6790 [2:08:55<1:46:19,  2.08s/it] 55%|█████▍    | 3723/6790 [2:08:57<1:46:14,  2.08s/it]                                                       {'loss': 1.5304, 'learning_rate': 0.00017415085107619796, 'epoch': 0.55}
+ 55%|█████▍    | 3723/6790 [2:08:57<1:46:14,  2.08s/it] 55%|█████▍    | 3724/6790 [2:08:59<1:45:24,  2.06s/it]                                                       {'loss': 1.3401, 'learning_rate': 0.00017405772260412533, 'epoch': 0.55}
+ 55%|█████▍    | 3724/6790 [2:08:59<1:45:24,  2.06s/it] 55%|█████▍    | 3725/6790 [2:09:01<1:45:07,  2.06s/it]                                                       {'loss': 1.5118, 'learning_rate': 0.00017396459985283738, 'epoch': 0.55}
+ 55%|█████▍    | 3725/6790 [2:09:01<1:45:07,  2.06s/it] 55%|█████▍    | 3726/6790 [2:09:03<1:45:51,  2.07s/it]                                                       {'loss': 1.439, 'learning_rate': 0.00017387148284286942, 'epoch': 0.55}
+ 55%|█████▍    | 3726/6790 [2:09:03<1:45:51,  2.07s/it] 55%|█████▍    | 3727/6790 [2:09:06<1:49:16,  2.14s/it]                                                       {'loss': 1.6858, 'learning_rate': 0.0001737783715947558, 'epoch': 0.55}
+ 55%|█████▍    | 3727/6790 [2:09:06<1:49:16,  2.14s/it] 55%|█████▍    | 3728/6790 [2:09:08<1:46:50,  2.09s/it]                                                       {'loss': 1.5324, 'learning_rate': 0.00017368526612902916, 'epoch': 0.55}
+ 55%|█████▍    | 3728/6790 [2:09:08<1:46:50,  2.09s/it] 55%|█████▍    | 3729/6790 [2:09:10<1:51:02,  2.18s/it]                                                       {'loss': 1.4981, 'learning_rate': 0.0001735921664662213, 'epoch': 0.55}
+ 55%|█████▍    | 3729/6790 [2:09:10<1:51:02,  2.18s/it] 55%|█████▍    | 3730/6790 [2:09:12<1:47:09,  2.10s/it]                                                       {'loss': 1.4727, 'learning_rate': 0.0001734990726268623, 'epoch': 0.55}
+ 55%|█████▍    | 3730/6790 [2:09:12<1:47:09,  2.10s/it] 55%|█████▍    | 3731/6790 [2:09:14<1:45:21,  2.07s/it]                                                       {'loss': 1.3022, 'learning_rate': 0.00017340598463148142, 'epoch': 0.55}
+ 55%|█████▍    | 3731/6790 [2:09:14<1:45:21,  2.07s/it] 55%|█████▍    | 3732/6790 [2:09:16<1:44:45,  2.06s/it]                                                       {'loss': 1.4258, 'learning_rate': 0.00017331290250060621, 'epoch': 0.55}
+ 55%|█████▍    | 3732/6790 [2:09:16<1:44:45,  2.06s/it] 55%|█████▍    | 3733/6790 [2:09:18<1:40:57,  1.98s/it]                                                       {'loss': 1.5375, 'learning_rate': 0.0001732198262547633, 'epoch': 0.55}
+ 55%|█████▍    | 3733/6790 [2:09:18<1:40:57,  1.98s/it] 55%|█████▍    | 3734/6790 [2:09:20<1:46:26,  2.09s/it]                                                       {'loss': 1.5744, 'learning_rate': 0.0001731267559144777, 'epoch': 0.55}
+ 55%|█████▍    | 3734/6790 [2:09:20<1:46:26,  2.09s/it] 55%|█████▌    | 3735/6790 [2:09:22<1:44:23,  2.05s/it]                                                       {'loss': 1.4614, 'learning_rate': 0.00017303369150027334, 'epoch': 0.55}
+ 55%|█████▌    | 3735/6790 [2:09:22<1:44:23,  2.05s/it] 55%|█████▌    | 3736/6790 [2:09:24<1:45:21,  2.07s/it]                                                       {'loss': 1.2381, 'learning_rate': 0.0001729406330326727, 'epoch': 0.55}
+ 55%|█████▌    | 3736/6790 [2:09:24<1:45:21,  2.07s/it] 55%|█████▌    | 3737/6790 [2:09:27<1:53:04,  2.22s/it]                                                       {'loss': 1.3975, 'learning_rate': 0.00017284758053219697, 'epoch': 0.55}
+ 55%|█████▌    | 3737/6790 [2:09:27<1:53:04,  2.22s/it] 55%|█████▌    | 3738/6790 [2:09:29<1:48:13,  2.13s/it]                                                       {'loss': 1.4678, 'learning_rate': 0.0001727545340193663, 'epoch': 0.55}
+ 55%|█████▌    | 3738/6790 [2:09:29<1:48:13,  2.13s/it] 55%|█████▌    | 3739/6790 [2:09:31<1:48:32,  2.13s/it]                                                       {'loss': 1.6308, 'learning_rate': 0.00017266149351469898, 'epoch': 0.55}
+ 55%|█████▌    | 3739/6790 [2:09:31<1:48:32,  2.13s/it] 55%|█████▌    | 3740/6790 [2:09:33<1:44:34,  2.06s/it]                                                       {'loss': 1.3744, 'learning_rate': 0.0001725684590387125, 'epoch': 0.55}
+ 55%|█████▌    | 3740/6790 [2:09:33<1:44:34,  2.06s/it] 55%|█████▌    | 3741/6790 [2:09:35<1:43:13,  2.03s/it]                                                       {'loss': 1.4771, 'learning_rate': 0.00017247543061192267, 'epoch': 0.55}
+ 55%|█████▌    | 3741/6790 [2:09:35<1:43:13,  2.03s/it] 55%|█████▌    | 3742/6790 [2:09:37<1:43:58,  2.05s/it]                                                       {'loss': 1.2911, 'learning_rate': 0.00017238240825484424, 'epoch': 0.55}
+ 55%|█████▌    | 3742/6790 [2:09:37<1:43:58,  2.05s/it] 55%|█████▌    | 3743/6790 [2:09:39<1:46:13,  2.09s/it]                                                       {'loss': 1.4236, 'learning_rate': 0.0001722893919879903, 'epoch': 0.55}
+ 55%|█████▌    | 3743/6790 [2:09:39<1:46:13,  2.09s/it] 55%|█████▌    | 3744/6790 [2:09:41<1:42:16,  2.01s/it]                                                       {'loss': 1.5266, 'learning_rate': 0.0001721963818318729, 'epoch': 0.55}
+ 55%|█████▌    | 3744/6790 [2:09:41<1:42:16,  2.01s/it] 55%|█████▌    | 3745/6790 [2:09:43<1:43:14,  2.03s/it]                                                       {'loss': 1.5195, 'learning_rate': 0.0001721033778070025, 'epoch': 0.55}
+ 55%|█████▌    | 3745/6790 [2:09:43<1:43:14,  2.03s/it] 55%|█████▌    | 3746/6790 [2:09:45<1:42:25,  2.02s/it]                                                       {'loss': 1.2341, 'learning_rate': 0.00017201037993388852, 'epoch': 0.55}
+ 55%|█████▌    | 3746/6790 [2:09:45<1:42:25,  2.02s/it] 55%|█████▌    | 3747/6790 [2:09:47<1:43:24,  2.04s/it]                                                       {'loss': 1.341, 'learning_rate': 0.00017191738823303863, 'epoch': 0.55}
+ 55%|█████▌    | 3747/6790 [2:09:47<1:43:24,  2.04s/it] 55%|█████▌    | 3748/6790 [2:09:49<1:43:48,  2.05s/it]                                                       {'loss': 1.4769, 'learning_rate': 0.00017182440272495942, 'epoch': 0.55}
+ 55%|█████▌    | 3748/6790 [2:09:49<1:43:48,  2.05s/it] 55%|█████▌    | 3749/6790 [2:09:52<1:51:47,  2.21s/it]                                                       {'loss': 1.6219, 'learning_rate': 0.00017173142343015598, 'epoch': 0.55}
+ 55%|█████▌    | 3749/6790 [2:09:52<1:51:47,  2.21s/it] 55%|█████▌    | 3750/6790 [2:09:54<1:49:34,  2.16s/it]                                                       {'loss': 1.3345, 'learning_rate': 0.00017163845036913226, 'epoch': 0.55}
+ 55%|█████▌    | 3750/6790 [2:09:54<1:49:34,  2.16s/it] 55%|█████▌    | 3751/6790 [2:09:56<1:47:11,  2.12s/it]                                                       {'loss': 1.4534, 'learning_rate': 0.00017154548356239038, 'epoch': 0.55}
+ 55%|█████▌    | 3751/6790 [2:09:56<1:47:11,  2.12s/it] 55%|█████▌    | 3752/6790 [2:09:58<1:41:58,  2.01s/it]                                                       {'loss': 1.5673, 'learning_rate': 0.00017145252303043163, 'epoch': 0.55}
+ 55%|█████▌    | 3752/6790 [2:09:58<1:41:58,  2.01s/it] 55%|█████▌    | 3753/6790 [2:10:00<1:42:50,  2.03s/it]                                                       {'loss': 1.546, 'learning_rate': 0.0001713595687937554, 'epoch': 0.55}
+ 55%|█████▌    | 3753/6790 [2:10:00<1:42:50,  2.03s/it] 55%|█████▌    | 3754/6790 [2:10:02<1:50:16,  2.18s/it]                                                       {'loss': 1.5918, 'learning_rate': 0.00017126662087286007, 'epoch': 0.55}
+ 55%|█████▌    | 3754/6790 [2:10:02<1:50:16,  2.18s/it] 55%|█████▌    | 3755/6790 [2:10:04<1:49:22,  2.16s/it]                                                       {'loss': 1.4186, 'learning_rate': 0.00017117367928824254, 'epoch': 0.55}
+ 55%|█████▌    | 3755/6790 [2:10:04<1:49:22,  2.16s/it] 55%|█████▌    | 3756/6790 [2:10:06<1:46:31,  2.11s/it]                                                       {'loss': 1.3886, 'learning_rate': 0.00017108074406039814, 'epoch': 0.55}
+ 55%|█████▌    | 3756/6790 [2:10:06<1:46:31,  2.11s/it] 55%|█████▌    | 3757/6790 [2:10:08<1:44:51,  2.07s/it]                                                       {'loss': 1.5131, 'learning_rate': 0.00017098781520982103, 'epoch': 0.55}
+ 55%|█████▌    | 3757/6790 [2:10:08<1:44:51,  2.07s/it] 55%|█████▌    | 3758/6790 [2:10:10<1:45:13,  2.08s/it]                                                       {'loss': 1.4016, 'learning_rate': 0.00017089489275700376, 'epoch': 0.55}
+ 55%|█████▌    | 3758/6790 [2:10:10<1:45:13,  2.08s/it] 55%|█████▌    | 3759/6790 [2:10:12<1:44:47,  2.07s/it]                                                       {'loss': 1.4917, 'learning_rate': 0.00017080197672243768, 'epoch': 0.55}
+ 55%|█████▌    | 3759/6790 [2:10:12<1:44:47,  2.07s/it] 55%|█████▌    | 3760/6790 [2:10:14<1:45:18,  2.09s/it]                                                       {'loss': 1.3416, 'learning_rate': 0.00017070906712661246, 'epoch': 0.55}
+ 55%|█████▌    | 3760/6790 [2:10:14<1:45:18,  2.09s/it] 55%|█████▌    | 3761/6790 [2:10:16<1:42:36,  2.03s/it]                                                       {'loss': 1.5693, 'learning_rate': 0.0001706161639900167, 'epoch': 0.55}
+ 55%|█████▌    | 3761/6790 [2:10:16<1:42:36,  2.03s/it] 55%|█████▌    | 3762/6790 [2:10:18<1:41:07,  2.00s/it]                                                       {'loss': 1.3407, 'learning_rate': 0.00017052326733313716, 'epoch': 0.55}
+ 55%|█████▌    | 3762/6790 [2:10:18<1:41:07,  2.00s/it] 55%|█████▌    | 3763/6790 [2:10:21<1:44:19,  2.07s/it]                                                       {'loss': 1.4562, 'learning_rate': 0.00017043037717645956, 'epoch': 0.55}
+ 55%|█████▌    | 3763/6790 [2:10:21<1:44:19,  2.07s/it] 55%|█████▌    | 3764/6790 [2:10:23<1:52:23,  2.23s/it]                                                       {'loss': 1.3788, 'learning_rate': 0.0001703374935404679, 'epoch': 0.55}
+ 55%|█████▌    | 3764/6790 [2:10:23<1:52:23,  2.23s/it] 55%|█████▌    | 3765/6790 [2:10:26<1:55:53,  2.30s/it]                                                       {'loss': 1.4814, 'learning_rate': 0.00017024461644564497, 'epoch': 0.55}
+ 55%|█████▌    | 3765/6790 [2:10:26<1:55:53,  2.30s/it] 55%|█████▌    | 3766/6790 [2:10:27<1:49:46,  2.18s/it]                                                       {'loss': 1.4798, 'learning_rate': 0.0001701517459124719, 'epoch': 0.55}
+ 55%|█████▌    | 3766/6790 [2:10:28<1:49:46,  2.18s/it] 55%|█████▌    | 3767/6790 [2:10:30<1:52:30,  2.23s/it]                                                       {'loss': 1.531, 'learning_rate': 0.00017005888196142854, 'epoch': 0.55}
+ 55%|█████▌    | 3767/6790 [2:10:30<1:52:30,  2.23s/it] 55%|█████▌    | 3768/6790 [2:10:32<1:47:53,  2.14s/it]                                                       {'loss': 1.262, 'learning_rate': 0.00016996602461299317, 'epoch': 0.55}
+ 55%|█████▌    | 3768/6790 [2:10:32<1:47:53,  2.14s/it] 56%|█████▌    | 3769/6790 [2:10:34<1:44:04,  2.07s/it]                                                       {'loss': 1.5031, 'learning_rate': 0.00016987317388764277, 'epoch': 0.56}
+ 56%|█████▌    | 3769/6790 [2:10:34<1:44:04,  2.07s/it] 56%|█████▌    | 3770/6790 [2:10:35<1:40:10,  1.99s/it]                                                       {'loss': 1.3687, 'learning_rate': 0.00016978032980585262, 'epoch': 0.56}
+ 56%|█████▌    | 3770/6790 [2:10:35<1:40:10,  1.99s/it] 56%|█████▌    | 3771/6790 [2:10:38<1:43:03,  2.05s/it]                                                       {'loss': 1.3055, 'learning_rate': 0.0001696874923880967, 'epoch': 0.56}
+ 56%|█████▌    | 3771/6790 [2:10:38<1:43:03,  2.05s/it] 56%|█████▌    | 3772/6790 [2:10:40<1:44:24,  2.08s/it]                                                       {'loss': 1.3966, 'learning_rate': 0.00016959466165484768, 'epoch': 0.56}
+ 56%|█████▌    | 3772/6790 [2:10:40<1:44:24,  2.08s/it] 56%|█████▌    | 3773/6790 [2:10:42<1:50:45,  2.20s/it]                                                       {'loss': 1.4191, 'learning_rate': 0.0001695018376265763, 'epoch': 0.56}
+ 56%|█████▌    | 3773/6790 [2:10:42<1:50:45,  2.20s/it] 56%|█████▌    | 3774/6790 [2:10:44<1:46:08,  2.11s/it]                                                       {'loss': 1.3824, 'learning_rate': 0.0001694090203237523, 'epoch': 0.56}
+ 56%|█���███▌    | 3774/6790 [2:10:44<1:46:08,  2.11s/it] 56%|█████▌    | 3775/6790 [2:10:47<1:49:10,  2.17s/it]                                                       {'loss': 1.3579, 'learning_rate': 0.0001693162097668436, 'epoch': 0.56}
+ 56%|█████▌    | 3775/6790 [2:10:47<1:49:10,  2.17s/it] 56%|█████▌    | 3776/6790 [2:10:49<1:46:11,  2.11s/it]                                                       {'loss': 1.5564, 'learning_rate': 0.00016922340597631688, 'epoch': 0.56}
+ 56%|█████▌    | 3776/6790 [2:10:49<1:46:11,  2.11s/it] 56%|█████▌    | 3777/6790 [2:10:51<1:50:47,  2.21s/it]                                                       {'loss': 1.255, 'learning_rate': 0.0001691306089726371, 'epoch': 0.56}
+ 56%|█████▌    | 3777/6790 [2:10:51<1:50:47,  2.21s/it] 56%|█████▌    | 3778/6790 [2:10:53<1:50:09,  2.19s/it]                                                       {'loss': 1.4952, 'learning_rate': 0.00016903781877626792, 'epoch': 0.56}
+ 56%|█████▌    | 3778/6790 [2:10:53<1:50:09,  2.19s/it] 56%|█████▌    | 3779/6790 [2:10:55<1:45:32,  2.10s/it]                                                       {'loss': 1.5926, 'learning_rate': 0.00016894503540767133, 'epoch': 0.56}
+ 56%|█████▌    | 3779/6790 [2:10:55<1:45:32,  2.10s/it] 56%|█████▌    | 3780/6790 [2:10:57<1:41:45,  2.03s/it]                                                       {'loss': 1.5149, 'learning_rate': 0.00016885225888730796, 'epoch': 0.56}
+ 56%|█████▌    | 3780/6790 [2:10:57<1:41:45,  2.03s/it] 56%|█████▌    | 3781/6790 [2:10:59<1:40:03,  2.00s/it]                                                       {'loss': 1.5468, 'learning_rate': 0.0001687594892356368, 'epoch': 0.56}
+ 56%|█████▌    | 3781/6790 [2:10:59<1:40:03,  2.00s/it] 56%|█████▌    | 3782/6790 [2:11:01<1:39:13,  1.98s/it]                                                       {'loss': 1.4746, 'learning_rate': 0.00016866672647311548, 'epoch': 0.56}
+ 56%|█████▌    | 3782/6790 [2:11:01<1:39:13,  1.98s/it] 56%|█████▌    | 3783/6790 [2:11:02<1:35:29,  1.91s/it]                                                       {'loss': 1.4095, 'learning_rate': 0.00016857397062019987, 'epoch': 0.56}
+ 56%|█████▌    | 3783/6790 [2:11:02<1:35:29,  1.91s/it] 56%|█████▌    | 3784/6790 [2:11:04<1:37:08,  1.94s/it]                                                       {'loss': 1.5063, 'learning_rate': 0.00016848122169734467, 'epoch': 0.56}
+ 56%|█████▌    | 3784/6790 [2:11:04<1:37:08,  1.94s/it] 56%|█████▌    | 3785/6790 [2:11:07<1:42:25,  2.05s/it]                                                       {'loss': 1.4838, 'learning_rate': 0.00016838847972500267, 'epoch': 0.56}
+ 56%|█████▌    | 3785/6790 [2:11:07<1:42:25,  2.05s/it] 56%|█████▌    | 3786/6790 [2:11:09<1:40:57,  2.02s/it]                                                       {'loss': 1.3756, 'learning_rate': 0.00016829574472362546, 'epoch': 0.56}
+ 56%|█████▌    | 3786/6790 [2:11:09<1:40:57,  2.02s/it] 56%|█████▌    | 3787/6790 [2:11:11<1:39:23,  1.99s/it]                                                       {'loss': 1.4238, 'learning_rate': 0.0001682030167136628, 'epoch': 0.56}
+ 56%|█████▌    | 3787/6790 [2:11:11<1:39:23,  1.99s/it] 56%|█████▌    | 3788/6790 [2:11:13<1:38:34,  1.97s/it]                                                       {'loss': 1.4745, 'learning_rate': 0.00016811029571556314, 'epoch': 0.56}
+ 56%|█████▌    | 3788/6790 [2:11:13<1:38:34,  1.97s/it] 56%|█████▌    | 3789/6790 [2:11:14<1:35:16,  1.90s/it]                                                       {'loss': 1.468, 'learning_rate': 0.0001680175817497733, 'epoch': 0.56}
+ 56%|█████▌    | 3789/6790 [2:11:14<1:35:16,  1.90s/it] 56%|█████▌    | 3790/6790 [2:11:16<1:35:59,  1.92s/it]                                                       {'loss': 1.2754, 'learning_rate': 0.00016792487483673844, 'epoch': 0.56}
+ 56%|█████▌    | 3790/6790 [2:11:16<1:35:59,  1.92s/it] 56%|█████▌    | 3791/6790 [2:11:18<1:40:47,  2.02s/it]                                                       {'loss': 1.3574, 'learning_rate': 0.00016783217499690241, 'epoch': 0.56}
+ 56%|█████▌    | 3791/6790 [2:11:19<1:40:47,  2.02s/it] 56%|█████▌    | 3792/6790 [2:11:21<1:43:06,  2.06s/it]                                                       {'loss': 1.6624, 'learning_rate': 0.00016773948225070717, 'epoch': 0.56}
+ 56%|█████▌    | 3792/6790 [2:11:21<1:43:06,  2.06s/it] 56%|█████▌    | 3793/6790 [2:11:23<1:41:50,  2.04s/it]                                                       {'loss': 1.6925, 'learning_rate': 0.00016764679661859355, 'epoch': 0.56}
+ 56%|█████▌    | 3793/6790 [2:11:23<1:41:50,  2.04s/it] 56%|█████▌    | 3794/6790 [2:11:25<1:41:51,  2.04s/it]                                                       {'loss': 1.5826, 'learning_rate': 0.00016755411812100027, 'epoch': 0.56}
+ 56%|█████▌    | 3794/6790 [2:11:25<1:41:51,  2.04s/it] 56%|█████▌    | 3795/6790 [2:11:27<1:40:30,  2.01s/it]                                                       {'loss': 1.524, 'learning_rate': 0.00016746144677836508, 'epoch': 0.56}
+ 56%|█████▌    | 3795/6790 [2:11:27<1:40:30,  2.01s/it] 56%|█████▌    | 3796/6790 [2:11:29<1:40:49,  2.02s/it]                                                       {'loss': 1.4148, 'learning_rate': 0.00016736878261112354, 'epoch': 0.56}
+ 56%|█████▌    | 3796/6790 [2:11:29<1:40:49,  2.02s/it] 56%|█████▌    | 3797/6790 [2:11:31<1:38:18,  1.97s/it]                                                       {'loss': 1.3754, 'learning_rate': 0.00016727612563971017, 'epoch': 0.56}
+ 56%|█████▌    | 3797/6790 [2:11:31<1:38:18,  1.97s/it] 56%|█████▌    | 3798/6790 [2:11:33<1:39:19,  1.99s/it]                                                       {'loss': 1.3707, 'learning_rate': 0.0001671834758845575, 'epoch': 0.56}
+ 56%|█████▌    | 3798/6790 [2:11:33<1:39:19,  1.99s/it] 56%|█████▌    | 3799/6790 [2:11:35<1:41:35,  2.04s/it]                                                       {'loss': 1.4784, 'learning_rate': 0.00016709083336609675, 'epoch': 0.56}
+ 56%|█████▌    | 3799/6790 [2:11:35<1:41:35,  2.04s/it] 56%|█████▌    | 3800/6790 [2:11:37<1:45:51,  2.12s/it]                                                       {'loss': 1.4993, 'learning_rate': 0.00016699819810475736, 'epoch': 0.56}
+ 56%|█████▌    | 3800/6790 [2:11:37<1:45:51,  2.12s/it] 56%|█████▌    | 3801/6790 [2:11:39<1:43:52,  2.09s/it]                                                       {'loss': 1.6315, 'learning_rate': 0.00016690557012096727, 'epoch': 0.56}
+ 56%|█████▌    | 3801/6790 [2:11:39<1:43:52,  2.09s/it] 56%|█████▌    | 3802/6790 [2:11:41<1:40:44,  2.02s/it]                                                       {'loss': 1.5977, 'learning_rate': 0.00016681294943515272, 'epoch': 0.56}
+ 56%|█████▌    | 3802/6790 [2:11:41<1:40:44,  2.02s/it] 56%|█████▌    | 3803/6790 [2:11:43<1:39:41,  2.00s/it]                                                       {'loss': 1.6527, 'learning_rate': 0.00016672033606773847, 'epoch': 0.56}
+ 56%|█████▌    | 3803/6790 [2:11:43<1:39:41,  2.00s/it] 56%|█████▌    | 3804/6790 [2:11:45<1:43:31,  2.08s/it]                                                       {'loss': 1.4217, 'learning_rate': 0.00016662773003914754, 'epoch': 0.56}
+ 56%|█████▌    | 3804/6790 [2:11:45<1:43:31,  2.08s/it] 56%|█████▌    | 3805/6790 [2:11:47<1:38:35,  1.98s/it]                                                       {'loss': 1.28, 'learning_rate': 0.00016653513136980134, 'epoch': 0.56}
+ 56%|█████▌    | 3805/6790 [2:11:47<1:38:35,  1.98s/it] 56%|█████▌    | 3806/6790 [2:11:49<1:39:40,  2.00s/it]                                                       {'loss': 1.5495, 'learning_rate': 0.0001664425400801199, 'epoch': 0.56}
+ 56%|█████▌    | 3806/6790 [2:11:49<1:39:40,  2.00s/it] 56%|█████▌    | 3807/6790 [2:11:51<1:42:45,  2.07s/it]                                                       {'loss': 1.599, 'learning_rate': 0.00016634995619052126, 'epoch': 0.56}
+ 56%|█████▌    | 3807/6790 [2:11:51<1:42:45,  2.07s/it] 56%|█████▌    | 3808/6790 [2:11:53<1:42:21,  2.06s/it]                                                       {'loss': 1.6405, 'learning_rate': 0.00016625737972142206, 'epoch': 0.56}
+ 56%|█████▌    | 3808/6790 [2:11:53<1:42:21,  2.06s/it] 56%|█████▌    | 3809/6790 [2:11:55<1:41:50,  2.05s/it]                                                       {'loss': 1.5159, 'learning_rate': 0.0001661648106932372, 'epoch': 0.56}
+ 56%|█████▌    | 3809/6790 [2:11:55<1:41:50,  2.05s/it] 56%|█████▌    | 3810/6790 [2:11:57<1:43:27,  2.08s/it]                                                       {'loss': 1.2115, 'learning_rate': 0.00016607224912638005, 'epoch': 0.56}
+ 56%|█████▌    | 3810/6790 [2:11:57<1:43:27,  2.08s/it] 56%|█████▌    | 3811/6790 [2:11:59<1:43:03,  2.08s/it]                                                       {'loss': 1.5828, 'learning_rate': 0.00016597969504126222, 'epoch': 0.56}
+ 56%|█████▌    | 3811/6790 [2:11:59<1:43:03,  2.08s/it] 56%|█████▌    | 3812/6790 [2:12:01<1:40:42,  2.03s/it]                                                       {'loss': 1.5234, 'learning_rate': 0.0001658871484582937, 'epoch': 0.56}
+ 56%|█████▌    | 3812/6790 [2:12:01<1:40:42,  2.03s/it] 56%|█████▌    | 3813/6790 [2:12:03<1:40:24,  2.02s/it]                                                       {'loss': 1.5423, 'learning_rate': 0.00016579460939788286, 'epoch': 0.56}
+ 56%|█████▌    | 3813/6790 [2:12:03<1:40:24,  2.02s/it] 56%|█████▌    | 3814/6790 [2:12:05<1:40:14,  2.02s/it]                                                       {'loss': 1.5283, 'learning_rate': 0.0001657020778804364, 'epoch': 0.56}
+ 56%|█████▌    | 3814/6790 [2:12:05<1:40:14,  2.02s/it] 56%|█████▌    | 3815/6790 [2:12:07<1:37:11,  1.96s/it]                                                       {'loss': 1.3509, 'learning_rate': 0.00016560955392635923, 'epoch': 0.56}
+ 56%|█████▌    | 3815/6790 [2:12:07<1:37:11,  1.96s/it] 56%|█████▌    | 3816/6790 [2:12:09<1:37:51,  1.97s/it]                                                       {'loss': 1.3183, 'learning_rate': 0.00016551703755605495, 'epoch': 0.56}
+ 56%|█████▌    | 3816/6790 [2:12:09<1:37:51,  1.97s/it] 56%|█████▌    | 3817/6790 [2:12:11<1:38:56,  2.00s/it]                                                       {'loss': 1.4361, 'learning_rate': 0.000165424528789925, 'epoch': 0.56}
+ 56%|█████▌    | 3817/6790 [2:12:11<1:38:56,  2.00s/it] 56%|█████▌    | 3818/6790 [2:12:14<1:43:18,  2.09s/it]                                                       {'loss': 1.4687, 'learning_rate': 0.00016533202764836962, 'epoch': 0.56}
+ 56%|█████▌    | 3818/6790 [2:12:14<1:43:18,  2.09s/it] 56%|█████▌    | 3819/6790 [2:12:16<1:45:23,  2.13s/it]                                                       {'loss': 1.544, 'learning_rate': 0.0001652395341517869, 'epoch': 0.56}
+ 56%|█████▌    | 3819/6790 [2:12:16<1:45:23,  2.13s/it] 56%|█████▋    | 3820/6790 [2:12:18<1:48:05,  2.18s/it]                                                       {'loss': 1.3955, 'learning_rate': 0.00016514704832057365, 'epoch': 0.56}
+ 56%|█████▋    | 3820/6790 [2:12:18<1:48:05,  2.18s/it] 56%|█████▋    | 3821/6790 [2:12:20<1:43:10,  2.08s/it]                                                       {'loss': 1.4223, 'learning_rate': 0.0001650545701751248, 'epoch': 0.56}
+ 56%|█████▋    | 3821/6790 [2:12:20<1:43:10,  2.08s/it] 56%|█████▋    | 3822/6790 [2:12:22<1:44:56,  2.12s/it]                                                       {'loss': 1.4833, 'learning_rate': 0.00016496209973583352, 'epoch': 0.56}
+ 56%|█████▋    | 3822/6790 [2:12:22<1:44:56,  2.12s/it] 56%|█████▋    | 3823/6790 [2:12:24<1:42:45,  2.08s/it]                                                       {'loss': 1.5131, 'learning_rate': 0.0001648696370230915, 'epoch': 0.56}
+ 56%|█████▋    | 3823/6790 [2:12:24<1:42:45,  2.08s/it] 56%|█████▋    | 3824/6790 [2:12:26<1:41:29,  2.05s/it]                                                       {'loss': 1.5541, 'learning_rate': 0.0001647771820572885, 'epoch': 0.56}
+ 56%|█████▋    | 3824/6790 [2:12:26<1:41:29,  2.05s/it] 56%|█████▋    | 3825/6790 [2:12:28<1:43:53,  2.10s/it]                                                       {'loss': 1.4337, 'learning_rate': 0.0001646847348588127, 'epoch': 0.56}
+ 56%|█████▋    | 3825/6790 [2:12:28<1:43:53,  2.10s/it] 56%|█████▋    | 3826/6790 [2:12:31<1:45:31,  2.14s/it]                                                       {'loss': 1.5211, 'learning_rate': 0.00016459229544805046, 'epoch': 0.56}
+ 56%|█████▋    | 3826/6790 [2:12:31<1:45:31,  2.14s/it] 56%|█████▋    | 3827/6790 [2:12:32<1:40:23,  2.03s/it]                                                       {'loss': 1.333, 'learning_rate': 0.0001644998638453867, 'epoch': 0.56}
+ 56%|█████▋    | 3827/6790 [2:12:32<1:40:23,  2.03s/it] 56%|█████▋    | 3828/6790 [2:12:35<1:54:58,  2.33s/it]                                                       {'loss': 1.3747, 'learning_rate': 0.00016440744007120415, 'epoch': 0.56}
+ 56%|█████▋    | 3828/6790 [2:12:35<1:54:58,  2.33s/it] 56%|█████▋    | 3829/6790 [2:12:38<1:56:22,  2.36s/it]                                                       {'loss': 1.1768, 'learning_rate': 0.00016431502414588427, 'epoch': 0.56}
+ 56%|█████▋    | 3829/6790 [2:12:38<1:56:22,  2.36s/it] 56%|█████▋    | 3830/6790 [2:12:40<1:51:16,  2.26s/it]                                                       {'loss': 1.4446, 'learning_rate': 0.0001642226160898065, 'epoch': 0.56}
+ 56%|█████▋    | 3830/6790 [2:12:40<1:51:16,  2.26s/it] 56%|█████▋    | 3831/6790 [2:12:42<1:46:30,  2.16s/it]                                                       {'loss': 1.3206, 'learning_rate': 0.00016413021592334872, 'epoch': 0.56}
+ 56%|█████▋    | 3831/6790 [2:12:42<1:46:30,  2.16s/it] 56%|█████▋    | 3832/6790 [2:12:44<1:44:30,  2.12s/it]                                                       {'loss': 1.4766, 'learning_rate': 0.0001640378236668869, 'epoch': 0.56}
+ 56%|█████▋    | 3832/6790 [2:12:44<1:44:30,  2.12s/it] 56%|█████▋    | 3833/6790 [2:12:46<1:40:41,  2.04s/it]                                                       {'loss': 1.4543, 'learning_rate': 0.00016394543934079546, 'epoch': 0.56}
+ 56%|█████▋    | 3833/6790 [2:12:46<1:40:41,  2.04s/it] 56%|█████▋    | 3834/6790 [2:12:47<1:37:13,  1.97s/it]                                                       {'loss': 1.6452, 'learning_rate': 0.00016385306296544687, 'epoch': 0.56}
+ 56%|█████▋    | 3834/6790 [2:12:47<1:37:13,  1.97s/it] 56%|█████▋    | 3835/6790 [2:12:50<1:38:42,  2.00s/it]                                                       {'loss': 1.5049, 'learning_rate': 0.000163760694561212, 'epoch': 0.56}
+ 56%|█████▋    | 3835/6790 [2:12:50<1:38:42,  2.00s/it] 56%|█████▋    | 3836/6790 [2:12:52<1:39:45,  2.03s/it]                                                       {'loss': 1.3327, 'learning_rate': 0.0001636683341484599, 'epoch': 0.56}
+ 56%|█████▋    | 3836/6790 [2:12:52<1:39:45,  2.03s/it] 57%|█████▋    | 3837/6790 [2:12:54<1:45:11,  2.14s/it]                                                       {'loss': 1.4649, 'learning_rate': 0.00016357598174755787, 'epoch': 0.57}
+ 57%|█████▋    | 3837/6790 [2:12:54<1:45:11,  2.14s/it] 57%|█████▋    | 3838/6790 [2:12:56<1:42:39,  2.09s/it]                                                       {'loss': 1.2861, 'learning_rate': 0.00016348363737887138, 'epoch': 0.57}
+ 57%|█████▋    | 3838/6790 [2:12:56<1:42:39,  2.09s/it] 57%|█████▋    | 3839/6790 [2:12:58<1:39:35,  2.03s/it]                                                       {'loss': 1.5064, 'learning_rate': 0.00016339130106276425, 'epoch': 0.57}
+ 57%|█████▋    | 3839/6790 [2:12:58<1:39:35,  2.03s/it] 57%|█████▋    | 3840/6790 [2:13:00<1:38:29,  2.00s/it]                                                       {'loss': 1.3072, 'learning_rate': 0.0001632989728195985, 'epoch': 0.57}
+ 57%|█████▋    | 3840/6790 [2:13:00<1:38:29,  2.00s/it] 57%|█████▋    | 3841/6790 [2:13:02<1:35:31,  1.94s/it]                                                       {'loss': 1.3647, 'learning_rate': 0.00016320665266973428, 'epoch': 0.57}
+ 57%|█████▋    | 3841/6790 [2:13:02<1:35:31,  1.94s/it] 57%|█████▋    | 3842/6790 [2:13:04<1:39:54,  2.03s/it]                                                       {'loss': 1.481, 'learning_rate': 0.00016311434063353, 'epoch': 0.57}
+ 57%|█████▋    | 3842/6790 [2:13:04<1:39:54,  2.03s/it] 57%|█████▋    | 3843/6790 [2:13:06<1:42:23,  2.08s/it]                                                       {'loss': 1.42, 'learning_rate': 0.00016302203673134228, 'epoch': 0.57}
+ 57%|█████▋    | 3843/6790 [2:13:06<1:42:23,  2.08s/it] 57%|█████▋    | 3844/6790 [2:13:08<1:38:46,  2.01s/it]                                                       {'loss': 1.4914, 'learning_rate': 0.000162929740983526, 'epoch': 0.57}
+ 57%|█████▋    | 3844/6790 [2:13:08<1:38:46,  2.01s/it] 57%|█████▋    | 3845/6790 [2:13:10<1:38:06,  2.00s/it]                                                       {'loss': 1.5088, 'learning_rate': 0.00016283745341043413, 'epoch': 0.57}
+ 57%|█████▋    | 3845/6790 [2:13:10<1:38:06,  2.00s/it] 57%|█████▋    | 3846/6790 [2:13:12<1:44:34,  2.13s/it]                                                       {'loss': 1.5087, 'learning_rate': 0.00016274517403241798, 'epoch': 0.57}
+ 57%|█████▋    | 3846/6790 [2:13:12<1:44:34,  2.13s/it] 57%|█████▋    | 3847/6790 [2:13:14<1:43:34,  2.11s/it]                                                       {'loss': 1.5419, 'learning_rate': 0.00016265290286982692, 'epoch': 0.57}
+ 57%|█████▋    | 3847/6790 [2:13:14<1:43:34,  2.11s/it] 57%|█████▋    | 3848/6790 [2:13:16<1:42:49,  2.10s/it]                                                       {'loss': 1.4995, 'learning_rate': 0.0001625606399430086, 'epoch': 0.57}
+ 57%|█████▋    | 3848/6790 [2:13:16<1:42:49,  2.10s/it] 57%|█████▋    | 3849/6790 [2:13:18<1:39:20,  2.03s/it]                                                       {'loss': 1.6052, 'learning_rate': 0.0001624683852723087, 'epoch': 0.57}
+ 57%|█████▋    | 3849/6790 [2:13:18<1:39:20,  2.03s/it] 57%|█████▋    | 3850/6790 [2:13:20<1:38:40,  2.01s/it]                                                       {'loss': 1.2752, 'learning_rate': 0.00016237613887807144, 'epoch': 0.57}
+ 57%|█████▋    | 3850/6790 [2:13:20<1:38:40,  2.01s/it] 57%|█████▋    | 3851/6790 [2:13:22<1:36:11,  1.96s/it]                                                       {'loss': 1.5137, 'learning_rate': 0.00016228390078063868, 'epoch': 0.57}
+ 57%|█████▋    | 3851/6790 [2:13:22<1:36:11,  1.96s/it] 57%|█████▋    | 3852/6790 [2:13:24<1:37:01,  1.98s/it]                                                       {'loss': 1.3435, 'learning_rate': 0.000162191671000351, 'epoch': 0.57}
+ 57%|█████▋    | 3852/6790 [2:13:24<1:37:01,  1.98s/it] 57%|█████▋    | 3853/6790 [2:13:26<1:37:57,  2.00s/it]                                                       {'loss': 1.4484, 'learning_rate': 0.00016209944955754673, 'epoch': 0.57}
+ 57%|█████▋    | 3853/6790 [2:13:26<1:37:57,  2.00s/it] 57%|█████▋    | 3854/6790 [2:13:28<1:35:44,  1.96s/it]                                                       {'loss': 1.7031, 'learning_rate': 0.00016200723647256262, 'epoch': 0.57}
+ 57%|█████▋    | 3854/6790 [2:13:28<1:35:44,  1.96s/it] 57%|█████▋    | 3855/6790 [2:13:30<1:35:00,  1.94s/it]                                                       {'loss': 1.3559, 'learning_rate': 0.00016191503176573338, 'epoch': 0.57}
+ 57%|█████▋    | 3855/6790 [2:13:30<1:35:00,  1.94s/it] 57%|█████▋    | 3856/6790 [2:13:32<1:35:34,  1.95s/it]                                                       {'loss': 1.4148, 'learning_rate': 0.00016182283545739199, 'epoch': 0.57}
+ 57%|█████▋    | 3856/6790 [2:13:32<1:35:34,  1.95s/it] 57%|█████▋    | 3857/6790 [2:13:34<1:33:19,  1.91s/it]                                                       {'loss': 1.5083, 'learning_rate': 0.00016173064756786965, 'epoch': 0.57}
+ 57%|█████▋    | 3857/6790 [2:13:34<1:33:19,  1.91s/it] 57%|█████▋    | 3858/6790 [2:13:36<1:31:26,  1.87s/it]                                                       {'loss': 1.1208, 'learning_rate': 0.00016163846811749542, 'epoch': 0.57}
+ 57%|█████▋    | 3858/6790 [2:13:36<1:31:26,  1.87s/it] 57%|█████▋    | 3859/6790 [2:13:38<1:39:31,  2.04s/it]                                                       {'loss': 1.2748, 'learning_rate': 0.000161546297126597, 'epoch': 0.57}
+ 57%|█████▋    | 3859/6790 [2:13:38<1:39:31,  2.04s/it] 57%|█████▋    | 3860/6790 [2:13:40<1:42:50,  2.11s/it]                                                       {'loss': 1.4945, 'learning_rate': 0.00016145413461549958, 'epoch': 0.57}
+ 57%|█████▋    | 3860/6790 [2:13:40<1:42:50,  2.11s/it] 57%|█████▋    | 3861/6790 [2:13:42<1:39:17,  2.03s/it]                                                       {'loss': 1.3588, 'learning_rate': 0.000161361980604527, 'epoch': 0.57}
+ 57%|█████▋    | 3861/6790 [2:13:42<1:39:17,  2.03s/it] 57%|█████▋    | 3862/6790 [2:13:44<1:37:55,  2.01s/it]                                                       {'loss': 1.3677, 'learning_rate': 0.00016126983511400103, 'epoch': 0.57}
+ 57%|█████▋    | 3862/6790 [2:13:44<1:37:55,  2.01s/it] 57%|█████▋    | 3863/6790 [2:13:46<1:39:04,  2.03s/it]                                                       {'loss': 1.2158, 'learning_rate': 0.00016117769816424154, 'epoch': 0.57}
+ 57%|█████▋    | 3863/6790 [2:13:46<1:39:04,  2.03s/it] 57%|█████▋    | 3864/6790 [2:13:49<1:46:30,  2.18s/it]                                                       {'loss': 1.5144, 'learning_rate': 0.00016108556977556654, 'epoch': 0.57}
+ 57%|█████▋    | 3864/6790 [2:13:49<1:46:30,  2.18s/it] 57%|█████▋    | 3865/6790 [2:13:51<1:48:23,  2.22s/it]                                                       {'loss': 1.3052, 'learning_rate': 0.00016099344996829218, 'epoch': 0.57}
+ 57%|█████▋    | 3865/6790 [2:13:51<1:48:23,  2.22s/it] 57%|█████▋    | 3866/6790 [2:13:53<1:44:02,  2.14s/it]                                                       {'loss': 1.496, 'learning_rate': 0.00016090133876273265, 'epoch': 0.57}
+ 57%|█████▋    | 3866/6790 [2:13:53<1:44:02,  2.14s/it] 57%|█████▋    | 3867/6790 [2:13:55<1:41:16,  2.08s/it]                                                       {'loss': 1.3607, 'learning_rate': 0.0001608092361792004, 'epoch': 0.57}
+ 57%|█████▋    | 3867/6790 [2:13:55<1:41:16,  2.08s/it] 57%|█████▋    | 3868/6790 [2:13:57<1:42:25,  2.10s/it]                                                       {'loss': 1.7108, 'learning_rate': 0.00016071714223800574, 'epoch': 0.57}
+ 57%|█████▋    | 3868/6790 [2:13:57<1:42:25,  2.10s/it] 57%|█████▋    | 3869/6790 [2:13:59<1:39:09,  2.04s/it]                                                       {'loss': 1.3849, 'learning_rate': 0.0001606250569594573, 'epoch': 0.57}
+ 57%|█████▋    | 3869/6790 [2:13:59<1:39:09,  2.04s/it] 57%|█████▋    | 3870/6790 [2:14:01<1:42:25,  2.10s/it]                                                       {'loss': 1.3623, 'learning_rate': 0.00016053298036386158, 'epoch': 0.57}
+ 57%|█████▋    | 3870/6790 [2:14:01<1:42:25,  2.10s/it] 57%|█████▋    | 3871/6790 [2:14:03<1:41:28,  2.09s/it]                                                       {'loss': 1.4677, 'learning_rate': 0.00016044091247152347, 'epoch': 0.57}
+ 57%|█████▋    | 3871/6790 [2:14:03<1:41:28,  2.09s/it] 57%|█████▋    | 3872/6790 [2:14:06<1:44:51,  2.16s/it]                                                       {'loss': 1.2394, 'learning_rate': 0.00016034885330274556, 'epoch': 0.57}
+ 57%|█████▋    | 3872/6790 [2:14:06<1:44:51,  2.16s/it] 57%|█████▋    | 3873/6790 [2:14:07<1:41:50,  2.09s/it]                                                       {'loss': 1.5879, 'learning_rate': 0.00016025680287782887, 'epoch': 0.57}
+ 57%|█████▋    | 3873/6790 [2:14:07<1:41:50,  2.09s/it] 57%|█████▋    | 3874/6790 [2:14:10<1:41:09,  2.08s/it]                                                       {'loss': 1.3684, 'learning_rate': 0.0001601647612170723, 'epoch': 0.57}
+ 57%|█████▋    | 3874/6790 [2:14:10<1:41:09,  2.08s/it] 57%|█████▋    | 3875/6790 [2:14:11<1:38:43,  2.03s/it]                                                       {'loss': 1.5064, 'learning_rate': 0.00016007272834077282, 'epoch': 0.57}
+ 57%|█████▋    | 3875/6790 [2:14:11<1:38:43,  2.03s/it] 57%|█████▋    | 3876/6790 [2:14:13<1:35:35,  1.97s/it]                                                       {'loss': 1.2837, 'learning_rate': 0.00015998070426922556, 'epoch': 0.57}
+ 57%|█████▋    | 3876/6790 [2:14:13<1:35:35,  1.97s/it] 57%|█████▋    | 3877/6790 [2:14:15<1:33:54,  1.93s/it]                                                       {'loss': 1.3801, 'learning_rate': 0.00015988868902272355, 'epoch': 0.57}
+ 57%|█████▋    | 3877/6790 [2:14:15<1:33:54,  1.93s/it] 57%|█████▋    | 3878/6790 [2:14:17<1:35:04,  1.96s/it]                                                       {'loss': 1.4114, 'learning_rate': 0.00015979668262155807, 'epoch': 0.57}
+ 57%|█████▋    | 3878/6790 [2:14:17<1:35:04,  1.96s/it] 57%|█████▋    | 3879/6790 [2:14:19<1:35:38,  1.97s/it]                                                       {'loss': 1.5055, 'learning_rate': 0.00015970468508601823, 'epoch': 0.57}
+ 57%|█████▋    | 3879/6790 [2:14:19<1:35:38,  1.97s/it] 57%|█████▋    | 3880/6790 [2:14:21<1:34:35,  1.95s/it]                                                       {'loss': 1.6037, 'learning_rate': 0.00015961269643639144, 'epoch': 0.57}
+ 57%|█████▋    | 3880/6790 [2:14:21<1:34:35,  1.95s/it] 57%|█████▋    | 3881/6790 [2:14:23<1:41:53,  2.10s/it]                                                       {'loss': 1.4703, 'learning_rate': 0.00015952071669296286, 'epoch': 0.57}
+ 57%|█████▋    | 3881/6790 [2:14:23<1:41:53,  2.10s/it] 57%|█████▋    | 3882/6790 [2:14:26<1:40:56,  2.08s/it]                                                       {'loss': 1.4309, 'learning_rate': 0.00015942874587601607, 'epoch': 0.57}
+ 57%|█████▋    | 3882/6790 [2:14:26<1:40:56,  2.08s/it] 57%|█████▋    | 3883/6790 [2:14:28<1:39:55,  2.06s/it]                                                       {'loss': 1.4165, 'learning_rate': 0.00015933678400583217, 'epoch': 0.57}
+ 57%|█████▋    | 3883/6790 [2:14:28<1:39:55,  2.06s/it] 57%|█████▋    | 3884/6790 [2:14:30<1:45:38,  2.18s/it]                                                       {'loss': 1.5553, 'learning_rate': 0.0001592448311026908, 'epoch': 0.57}
+ 57%|█████▋    | 3884/6790 [2:14:30<1:45:38,  2.18s/it] 57%|█████▋    | 3885/6790 [2:14:32<1:42:55,  2.13s/it]                                                       {'loss': 1.3561, 'learning_rate': 0.00015915288718686924, 'epoch': 0.57}
+ 57%|█████▋    | 3885/6790 [2:14:32<1:42:55,  2.13s/it] 57%|█████▋    | 3886/6790 [2:14:34<1:42:57,  2.13s/it]                                                       {'loss': 1.5221, 'learning_rate': 0.00015906095227864308, 'epoch': 0.57}
+ 57%|█████▋    | 3886/6790 [2:14:34<1:42:57,  2.13s/it] 57%|█████▋    | 3887/6790 [2:14:36<1:44:44,  2.16s/it]                                                       {'loss': 1.5243, 'learning_rate': 0.00015896902639828565, 'epoch': 0.57}
+ 57%|█████▋    | 3887/6790 [2:14:36<1:44:44,  2.16s/it] 57%|█████▋    | 3888/6790 [2:14:38<1:39:09,  2.05s/it]                                                       {'loss': 1.4631, 'learning_rate': 0.0001588771095660685, 'epoch': 0.57}
+ 57%|█████▋    | 3888/6790 [2:14:38<1:39:09,  2.05s/it] 57%|█████▋    | 3889/6790 [2:14:41<1:47:52,  2.23s/it]                                                       {'loss': 1.6563, 'learning_rate': 0.00015878520180226106, 'epoch': 0.57}
+ 57%|█████▋    | 3889/6790 [2:14:41<1:47:52,  2.23s/it] 57%|█��███▋    | 3890/6790 [2:14:43<1:41:19,  2.10s/it]                                                       {'loss': 1.4543, 'learning_rate': 0.00015869330312713077, 'epoch': 0.57}
+ 57%|█████▋    | 3890/6790 [2:14:43<1:41:19,  2.10s/it] 57%|█████▋    | 3891/6790 [2:14:45<1:46:30,  2.20s/it]                                                       {'loss': 1.3859, 'learning_rate': 0.00015860141356094333, 'epoch': 0.57}
+ 57%|█████▋    | 3891/6790 [2:14:45<1:46:30,  2.20s/it] 57%|█████▋    | 3892/6790 [2:14:47<1:45:25,  2.18s/it]                                                       {'loss': 1.4383, 'learning_rate': 0.0001585095331239619, 'epoch': 0.57}
+ 57%|█████▋    | 3892/6790 [2:14:47<1:45:25,  2.18s/it] 57%|█████▋    | 3893/6790 [2:14:49<1:45:22,  2.18s/it]                                                       {'loss': 1.2907, 'learning_rate': 0.00015841766183644817, 'epoch': 0.57}
+ 57%|█████▋    | 3893/6790 [2:14:49<1:45:22,  2.18s/it] 57%|█████▋    | 3894/6790 [2:14:51<1:38:15,  2.04s/it]                                                       {'loss': 1.3133, 'learning_rate': 0.0001583257997186614, 'epoch': 0.57}
+ 57%|█████▋    | 3894/6790 [2:14:51<1:38:15,  2.04s/it] 57%|█████▋    | 3895/6790 [2:14:53<1:38:29,  2.04s/it]                                                       {'loss': 1.4119, 'learning_rate': 0.00015823394679085912, 'epoch': 0.57}
+ 57%|█████▋    | 3895/6790 [2:14:53<1:38:29,  2.04s/it] 57%|█████▋    | 3896/6790 [2:14:55<1:40:04,  2.07s/it]                                                       {'loss': 1.5526, 'learning_rate': 0.00015814210307329665, 'epoch': 0.57}
+ 57%|█████▋    | 3896/6790 [2:14:55<1:40:04,  2.07s/it] 57%|█████▋    | 3897/6790 [2:14:58<1:48:28,  2.25s/it]                                                       {'loss': 1.4463, 'learning_rate': 0.0001580502685862274, 'epoch': 0.57}
+ 57%|█████▋    | 3897/6790 [2:14:58<1:48:28,  2.25s/it] 57%|█████▋    | 3898/6790 [2:15:00<1:40:57,  2.09s/it]                                                       {'loss': 1.4398, 'learning_rate': 0.00015795844334990262, 'epoch': 0.57}
+ 57%|█████▋    | 3898/6790 [2:15:00<1:40:57,  2.09s/it] 57%|█████▋    | 3899/6790 [2:15:02<1:38:06,  2.04s/it]                                                       {'loss': 1.6007, 'learning_rate': 0.00015786662738457167, 'epoch': 0.57}
+ 57%|█████▋    | 3899/6790 [2:15:02<1:38:06,  2.04s/it] 57%|█████▋    | 3900/6790 [2:15:04<1:37:22,  2.02s/it]                                                       {'loss': 1.6081, 'learning_rate': 0.00015777482071048168, 'epoch': 0.57}
+ 57%|█████▋    | 3900/6790 [2:15:04<1:37:22,  2.02s/it] 57%|█████▋    | 3901/6790 [2:15:05<1:35:04,  1.97s/it]                                                       {'loss': 1.7558, 'learning_rate': 0.00015768302334787798, 'epoch': 0.57}
+ 57%|█████▋    | 3901/6790 [2:15:05<1:35:04,  1.97s/it] 57%|█████▋    | 3902/6790 [2:15:07<1:31:22,  1.90s/it]                                                       {'loss': 1.3625, 'learning_rate': 0.00015759123531700352, 'epoch': 0.57}
+ 57%|█████▋    | 3902/6790 [2:15:07<1:31:22,  1.90s/it] 57%|█████▋    | 3903/6790 [2:15:09<1:30:02,  1.87s/it]                                                       {'loss': 1.3287, 'learning_rate': 0.00015749945663809953, 'epoch': 0.57}
+ 57%|█████▋    | 3903/6790 [2:15:09<1:30:02,  1.87s/it] 57%|█████▋    | 3904/6790 [2:15:11<1:30:32,  1.88s/it]                                                       {'loss': 1.4921, 'learning_rate': 0.0001574076873314049, 'epoch': 0.57}
+ 57%|█████▋    | 3904/6790 [2:15:11<1:30:32,  1.88s/it] 58%|█████▊    | 3905/6790 [2:15:13<1:29:54,  1.87s/it]                                                       {'loss': 1.3357, 'learning_rate': 0.00015731592741715674, 'epoch': 0.58}
+ 58%|█████▊    | 3905/6790 [2:15:13<1:29:54,  1.87s/it] 58%|█████▊    | 3906/6790 [2:15:15<1:33:13,  1.94s/it]                                                       {'loss': 1.602, 'learning_rate': 0.00015722417691558968, 'epoch': 0.58}
+ 58%|█████▊    | 3906/6790 [2:15:15<1:33:13,  1.94s/it] 58%|█████▊    | 3907/6790 [2:15:17<1:35:21,  1.98s/it]                                                       {'loss': 1.0457, 'learning_rate': 0.00015713243584693673, 'epoch': 0.58}
+ 58%|█████▊    | 3907/6790 [2:15:17<1:35:21,  1.98s/it] 58%|█████▊    | 3908/6790 [2:15:19<1:32:23,  1.92s/it]                                                       {'loss': 1.1865, 'learning_rate': 0.00015704070423142857, 'epoch': 0.58}
+ 58%|█████▊    | 3908/6790 [2:15:19<1:32:23,  1.92s/it] 58%|█████▊    | 3909/6790 [2:15:21<1:33:36,  1.95s/it]                                                       {'loss': 1.6022, 'learning_rate': 0.00015694898208929377, 'epoch': 0.58}
+ 58%|█████▊    | 3909/6790 [2:15:21<1:33:36,  1.95s/it] 58%|█████▊    | 3910/6790 [2:15:23<1:35:12,  1.98s/it]                                                       {'loss': 1.5503, 'learning_rate': 0.00015685726944075895, 'epoch': 0.58}
+ 58%|█████▊    | 3910/6790 [2:15:23<1:35:12,  1.98s/it] 58%|█████▊    | 3911/6790 [2:15:25<1:41:23,  2.11s/it]                                                       {'loss': 1.4013, 'learning_rate': 0.00015676556630604845, 'epoch': 0.58}
+ 58%|█████▊    | 3911/6790 [2:15:25<1:41:23,  2.11s/it] 58%|█████▊    | 3912/6790 [2:15:27<1:38:04,  2.04s/it]                                                       {'loss': 1.5691, 'learning_rate': 0.0001566738727053847, 'epoch': 0.58}
+ 58%|█████▊    | 3912/6790 [2:15:27<1:38:04,  2.04s/it] 58%|█████▊    | 3913/6790 [2:15:29<1:35:42,  2.00s/it]                                                       {'loss': 1.4147, 'learning_rate': 0.0001565821886589879, 'epoch': 0.58}
+ 58%|█████▊    | 3913/6790 [2:15:29<1:35:42,  2.00s/it] 58%|█████▊    | 3914/6790 [2:15:31<1:32:51,  1.94s/it]                                                       {'loss': 1.3905, 'learning_rate': 0.00015649051418707637, 'epoch': 0.58}
+ 58%|█████▊    | 3914/6790 [2:15:31<1:32:51,  1.94s/it] 58%|█████▊    | 3915/6790 [2:15:33<1:31:11,  1.90s/it]                                                       {'loss': 1.5954, 'learning_rate': 0.00015639884930986585, 'epoch': 0.58}
+ 58%|█████▊    | 3915/6790 [2:15:33<1:31:11,  1.90s/it] 58%|█████▊    | 3916/6790 [2:15:35<1:41:17,  2.11s/it]                                                       {'loss': 1.5868, 'learning_rate': 0.00015630719404757055, 'epoch': 0.58}
+ 58%|█████▊    | 3916/6790 [2:15:35<1:41:17,  2.11s/it] 58%|█████▊    | 3917/6790 [2:15:37<1:37:28,  2.04s/it]                                                       {'loss': 1.3968, 'learning_rate': 0.000156215548420402, 'epoch': 0.58}
+ 58%|█████▊    | 3917/6790 [2:15:37<1:37:28,  2.04s/it] 58%|█████▊    | 3918/6790 [2:15:39<1:39:01,  2.07s/it]                                                       {'loss': 1.3334, 'learning_rate': 0.00015612391244857008, 'epoch': 0.58}
+ 58%|█████▊    | 3918/6790 [2:15:39<1:39:01,  2.07s/it] 58%|█████▊    | 3919/6790 [2:15:41<1:42:00,  2.13s/it]                                                       {'loss': 1.5883, 'learning_rate': 0.0001560322861522822, 'epoch': 0.58}
+ 58%|█████▊    | 3919/6790 [2:15:41<1:42:00,  2.13s/it] 58%|█████▊    | 3920/6790 [2:15:44<1:43:31,  2.16s/it]                                                       {'loss': 1.4765, 'learning_rate': 0.00015594066955174386, 'epoch': 0.58}
+ 58%|█████▊    | 3920/6790 [2:15:44<1:43:31,  2.16s/it] 58%|█████▊    | 3921/6790 [2:15:46<1:39:07,  2.07s/it]                                                       {'loss': 1.3468, 'learning_rate': 0.00015584906266715825, 'epoch': 0.58}
+ 58%|█████▊    | 3921/6790 [2:15:46<1:39:07,  2.07s/it] 58%|█████▊    | 3922/6790 [2:15:48<1:42:35,  2.15s/it]                                                       {'loss': 1.5827, 'learning_rate': 0.0001557574655187266, 'epoch': 0.58}
+ 58%|█████▊    | 3922/6790 [2:15:48<1:42:35,  2.15s/it] 58%|█████▊    | 3923/6790 [2:15:50<1:40:43,  2.11s/it]                                                       {'loss': 1.5872, 'learning_rate': 0.00015566587812664777, 'epoch': 0.58}
+ 58%|█████▊    | 3923/6790 [2:15:50<1:40:43,  2.11s/it] 58%|█████▊    | 3924/6790 [2:15:52<1:39:17,  2.08s/it]                                                       {'loss': 1.3055, 'learning_rate': 0.00015557430051111858, 'epoch': 0.58}
+ 58%|█████▊    | 3924/6790 [2:15:52<1:39:17,  2.08s/it] 58%|█████▊    | 3925/6790 [2:15:55<1:59:11,  2.50s/it]                                                       {'loss': 1.222, 'learning_rate': 0.00015548273269233394, 'epoch': 0.58}
+ 58%|█████▊    | 3925/6790 [2:15:55<1:59:11,  2.50s/it] 58%|█████▊    | 3926/6790 [2:15:57<1:54:16,  2.39s/it]                                                       {'loss': 1.547, 'learning_rate': 0.00015539117469048604, 'epoch': 0.58}
+ 58%|█████▊    | 3926/6790 [2:15:58<1:54:16,  2.39s/it] 58%|█████▊    | 3927/6790 [2:16:00<1:50:19,  2.31s/it]                                                       {'loss': 1.44, 'learning_rate': 0.00015529962652576545, 'epoch': 0.58}
+ 58%|█████▊    | 3927/6790 [2:16:00<1:50:19,  2.31s/it] 58%|█████▊    | 3928/6790 [2:16:02<1:46:12,  2.23s/it]                                                       {'loss': 1.3355, 'learning_rate': 0.0001552080882183603, 'epoch': 0.58}
+ 58%|█████▊    | 3928/6790 [2:16:02<1:46:12,  2.23s/it] 58%|█████▊    | 3929/6790 [2:16:04<1:43:01,  2.16s/it]                                                       {'loss': 1.443, 'learning_rate': 0.00015511655978845654, 'epoch': 0.58}
+ 58%|█████▊    | 3929/6790 [2:16:04<1:43:01,  2.16s/it] 58%|█████▊    | 3930/6790 [2:16:06<1:40:06,  2.10s/it]                                                       {'loss': 1.5233, 'learning_rate': 0.00015502504125623802, 'epoch': 0.58}
+ 58%|█████▊    | 3930/6790 [2:16:06<1:40:06,  2.10s/it] 58%|█████▊    | 3931/6790 [2:16:08<1:44:10,  2.19s/it]                                                       {'loss': 1.4485, 'learning_rate': 0.00015493353264188646, 'epoch': 0.58}
+ 58%|█████▊    | 3931/6790 [2:16:08<1:44:10,  2.19s/it] 58%|█████▊    | 3932/6790 [2:16:10<1:43:40,  2.18s/it]                                                       {'loss': 1.4701, 'learning_rate': 0.0001548420339655812, 'epoch': 0.58}
+ 58%|█████▊    | 3932/6790 [2:16:10<1:43:40,  2.18s/it] 58%|█████▊    | 3933/6790 [2:16:12<1:39:58,  2.10s/it]                                                       {'loss': 1.2966, 'learning_rate': 0.0001547505452474996, 'epoch': 0.58}
+ 58%|█████▊    | 3933/6790 [2:16:12<1:39:58,  2.10s/it] 58%|█████▊    | 3934/6790 [2:16:14<1:37:05,  2.04s/it]                                                       {'loss': 1.5997, 'learning_rate': 0.0001546590665078166, 'epoch': 0.58}
+ 58%|█████▊    | 3934/6790 [2:16:14<1:37:05,  2.04s/it] 58%|█████▊    | 3935/6790 [2:16:16<1:38:06,  2.06s/it]                                                       {'loss': 1.6566, 'learning_rate': 0.00015456759776670526, 'epoch': 0.58}
+ 58%|█████▊    | 3935/6790 [2:16:16<1:38:06,  2.06s/it] 58%|█████▊    | 3936/6790 [2:16:19<1:45:05,  2.21s/it]                                                       {'loss': 1.3635, 'learning_rate': 0.0001544761390443361, 'epoch': 0.58}
+ 58%|█████▊    | 3936/6790 [2:16:19<1:45:05,  2.21s/it] 58%|█████▊    | 3937/6790 [2:16:21<1:43:13,  2.17s/it]                                                       {'loss': 1.4599, 'learning_rate': 0.00015438469036087763, 'epoch': 0.58}
+ 58%|█████▊    | 3937/6790 [2:16:21<1:43:13,  2.17s/it] 58%|█████▊    | 3938/6790 [2:16:23<1:44:00,  2.19s/it]                                                       {'loss': 1.4238, 'learning_rate': 0.000154293251736496, 'epoch': 0.58}
+ 58%|█████▊    | 3938/6790 [2:16:23<1:44:00,  2.19s/it] 58%|█████▊    | 3939/6790 [2:16:25<1:45:29,  2.22s/it]                                                       {'loss': 1.3969, 'learning_rate': 0.00015420182319135546, 'epoch': 0.58}
+ 58%|█████▊    | 3939/6790 [2:16:25<1:45:29,  2.22s/it] 58%|█████▊    | 3940/6790 [2:16:28<1:56:46,  2.46s/it]                                                       {'loss': 1.3743, 'learning_rate': 0.0001541104047456175, 'epoch': 0.58}
+ 58%|█████▊    | 3940/6790 [2:16:28<1:56:46,  2.46s/it] 58%|█████▊    | 3941/6790 [2:16:30<1:50:48,  2.33s/it]                                                       {'loss': 1.3016, 'learning_rate': 0.00015401899641944193, 'epoch': 0.58}
+ 58%|█████▊    | 3941/6790 [2:16:30<1:50:48,  2.33s/it] 58%|█████▊    | 3942/6790 [2:16:33<1:54:46,  2.42s/it]                                                       {'loss': 1.346, 'learning_rate': 0.00015392759823298606, 'epoch': 0.58}
+ 58%|█████▊    | 3942/6790 [2:16:33<1:54:46,  2.42s/it] 58%|█████▊    | 3943/6790 [2:16:35<1:51:02,  2.34s/it]                                                       {'loss': 1.4975, 'learning_rate': 0.0001538362102064049, 'epoch': 0.58}
+ 58%|█████▊    | 3943/6790 [2:16:35<1:51:02,  2.34s/it] 58%|█████▊    | 3944/6790 [2:16:37<1:44:17,  2.20s/it]                                                       {'loss': 1.5042, 'learning_rate': 0.0001537448323598514, 'epoch': 0.58}
+ 58%|█████▊    | 3944/6790 [2:16:37<1:44:17,  2.20s/it] 58%|█████▊    | 3945/6790 [2:16:39<1:40:38,  2.12s/it]                                                       {'loss': 1.1579, 'learning_rate': 0.00015365346471347613, 'epoch': 0.58}
+ 58%|█████▊    | 3945/6790 [2:16:39<1:40:38,  2.12s/it] 58%|█████▊    | 3946/6790 [2:16:41<1:40:42,  2.12s/it]                                                       {'loss': 1.3804, 'learning_rate': 0.0001535621072874275, 'epoch': 0.58}
+ 58%|█████▊    | 3946/6790 [2:16:41<1:40:42,  2.12s/it] 58%|█████▊    | 3947/6790 [2:16:44<1:58:16,  2.50s/it]                                                       {'loss': 1.7045, 'learning_rate': 0.00015347076010185156, 'epoch': 0.58}
+ 58%|█████▊    | 3947/6790 [2:16:44<1:58:16,  2.50s/it] 58%|█████▊    | 3948/6790 [2:16:46<1:50:09,  2.33s/it]                                                       {'loss': 1.4637, 'learning_rate': 0.0001533794231768923, 'epoch': 0.58}
+ 58%|█████▊    | 3948/6790 [2:16:46<1:50:09,  2.33s/it] 58%|█████▊    | 3949/6790 [2:16:48<1:43:23,  2.18s/it]                                                       {'loss': 1.5597, 'learning_rate': 0.00015328809653269112, 'epoch': 0.58}
+ 58%|█████▊    | 3949/6790 [2:16:48<1:43:23,  2.18s/it] 58%|█████▊    | 3950/6790 [2:16:50<1:44:10,  2.20s/it]                                                       {'loss': 1.4709, 'learning_rate': 0.00015319678018938754, 'epoch': 0.58}
+ 58%|█████▊    | 3950/6790 [2:16:50<1:44:10,  2.20s/it] 58%|█████▊    | 3951/6790 [2:16:52<1:41:56,  2.15s/it]                                                       {'loss': 1.4817, 'learning_rate': 0.00015310547416711853, 'epoch': 0.58}
+ 58%|█████▊    | 3951/6790 [2:16:52<1:41:56,  2.15s/it] 58%|█████▊    | 3952/6790 [2:16:55<1:40:46,  2.13s/it]                                                       {'loss': 1.5771, 'learning_rate': 0.0001530141784860189, 'epoch': 0.58}
+ 58%|█████▊    | 3952/6790 [2:16:55<1:40:46,  2.13s/it] 58%|█████▊    | 3953/6790 [2:16:57<1:42:43,  2.17s/it]                                                       {'loss': 1.686, 'learning_rate': 0.00015292289316622107, 'epoch': 0.58}
+ 58%|█████▊    | 3953/6790 [2:16:57<1:42:43,  2.17s/it] 58%|█████▊    | 3954/6790 [2:16:59<1:39:41,  2.11s/it]                                                       {'loss': 1.4763, 'learning_rate': 0.00015283161822785538, 'epoch': 0.58}
+ 58%|█████▊    | 3954/6790 [2:16:59<1:39:41,  2.11s/it] 58%|█████▊    | 3955/6790 [2:17:01<1:40:49,  2.13s/it]                                                       {'loss': 1.5335, 'learning_rate': 0.00015274035369104965, 'epoch': 0.58}
+ 58%|█████▊    | 3955/6790 [2:17:01<1:40:49,  2.13s/it] 58%|█████▊    | 3956/6790 [2:17:03<1:38:44,  2.09s/it]                                                       {'loss': 1.4896, 'learning_rate': 0.00015264909957592962, 'epoch': 0.58}
+ 58%|█████▊    | 3956/6790 [2:17:03<1:38:44,  2.09s/it] 58%|█████▊    | 3957/6790 [2:17:05<1:40:20,  2.12s/it]                                                       {'loss': 1.1671, 'learning_rate': 0.0001525578559026185, 'epoch': 0.58}
+ 58%|█████▊    | 3957/6790 [2:17:05<1:40:20,  2.12s/it] 58%|█████▊    | 3958/6790 [2:17:07<1:36:29,  2.04s/it]                                                       {'loss': 1.2872, 'learning_rate': 0.00015246662269123736, 'epoch': 0.58}
+ 58%|█████▊    | 3958/6790 [2:17:07<1:36:29,  2.04s/it] 58%|█████▊    | 3959/6790 [2:17:09<1:37:27,  2.07s/it]                                                       {'loss': 1.619, 'learning_rate': 0.00015237539996190507, 'epoch': 0.58}
+ 58%|█████▊    | 3959/6790 [2:17:09<1:37:27,  2.07s/it] 58%|█████▊    | 3960/6790 [2:17:11<1:33:29,  1.98s/it]                                                       {'loss': 1.2967, 'learning_rate': 0.0001522841877347378, 'epoch': 0.58}
+ 58%|█████▊    | 3960/6790 [2:17:11<1:33:29,  1.98s/it] 58%|█████▊    | 3961/6790 [2:17:13<1:29:55,  1.91s/it]                                                       {'loss': 1.4011, 'learning_rate': 0.00015219298602984983, 'epoch': 0.58}
+ 58%|█████▊    | 3961/6790 [2:17:13<1:29:55,  1.91s/it] 58%|█████▊    | 3962/6790 [2:17:15<1:40:07,  2.12s/it]                                                       {'loss': 1.3928, 'learning_rate': 0.00015210179486735287, 'epoch': 0.58}
+ 58%|█████▊    | 3962/6790 [2:17:15<1:40:07,  2.12s/it] 58%|█████▊    | 3963/6790 [2:17:17<1:35:33,  2.03s/it]                                                       {'loss': 1.4269, 'learning_rate': 0.00015201061426735644, 'epoch': 0.58}
+ 58%|█████▊    | 3963/6790 [2:17:17<1:35:33,  2.03s/it] 58%|█████▊    | 3964/6790 [2:17:19<1:36:27,  2.05s/it]                                                       {'loss': 1.4544, 'learning_rate': 0.00015191944424996755, 'epoch': 0.58}
+ 58%|█████▊    | 3964/6790 [2:17:19<1:36:27,  2.05s/it] 58%|█████▊    | 3965/6790 [2:17:21<1:38:06,  2.08s/it]                                                       {'loss': 1.1863, 'learning_rate': 0.0001518282848352911, 'epoch': 0.58}
+ 58%|█████▊    | 3965/6790 [2:17:21<1:38:06,  2.08s/it] 58%|█████▊    | 3966/6790 [2:17:23<1:35:24,  2.03s/it]                                                       {'loss': 1.5975, 'learning_rate': 0.00015173713604342944, 'epoch': 0.58}
+ 58%|█████▊    | 3966/6790 [2:17:23<1:35:24,  2.03s/it] 58%|█████▊    | 3967/6790 [2:17:26<1:42:45,  2.18s/it]                                                       {'loss': 1.4002, 'learning_rate': 0.00015164599789448276, 'epoch': 0.58}
+ 58%|█████▊    | 3967/6790 [2:17:26<1:42:45,  2.18s/it] 58%|█████▊    | 3968/6790 [2:17:28<1:40:00,  2.13s/it]                                                       {'loss': 1.592, 'learning_rate': 0.00015155487040854876, 'epoch': 0.58}
+ 58%|█████▊    | 3968/6790 [2:17:28<1:40:00,  2.13s/it] 58%|█████▊    | 3969/6790 [2:17:30<1:37:18,  2.07s/it]                                                       {'loss': 1.3964, 'learning_rate': 0.00015146375360572295, 'epoch': 0.58}
+ 58%|█████▊    | 3969/6790 [2:17:30<1:37:18,  2.07s/it] 58%|█████▊    | 3970/6790 [2:17:32<1:34:16,  2.01s/it]                                                       {'loss': 1.4385, 'learning_rate': 0.00015137264750609818, 'epoch': 0.58}
+ 58%|█████▊    | 3970/6790 [2:17:32<1:34:16,  2.01s/it] 58%|█████▊    | 3971/6790 [2:17:34<1:37:21,  2.07s/it]                                                       {'loss': 1.5781, 'learning_rate': 0.00015128155212976545, 'epoch': 0.58}
+ 58%|█████▊    | 3971/6790 [2:17:34<1:37:21,  2.07s/it] 58%|█████▊    | 3972/6790 [2:17:36<1:43:45,  2.21s/it]                                                       {'loss': 1.3721, 'learning_rate': 0.0001511904674968128, 'epoch': 0.58}
+ 58%|█████▊    | 3972/6790 [2:17:36<1:43:45,  2.21s/it] 59%|█████▊    | 3973/6790 [2:17:38<1:42:33,  2.18s/it]                                                       {'loss': 1.4035, 'learning_rate': 0.00015109939362732634, 'epoch': 0.59}
+ 59%|█████▊    | 3973/6790 [2:17:38<1:42:33,  2.18s/it] 59%|█████▊    | 3974/6790 [2:17:41<1:41:27,  2.16s/it]                                                       {'loss': 1.4517, 'learning_rate': 0.00015100833054138964, 'epoch': 0.59}
+ 59%|█████▊    | 3974/6790 [2:17:41<1:41:27,  2.16s/it] 59%|█████▊    | 3975/6790 [2:17:42<1:37:32,  2.08s/it]                                                       {'loss': 1.3413, 'learning_rate': 0.0001509172782590839, 'epoch': 0.59}
+ 59%|█████▊    | 3975/6790 [2:17:42<1:37:32,  2.08s/it] 59%|█████▊    | 3976/6790 [2:17:44<1:35:37,  2.04s/it]                                                       {'loss': 1.4764, 'learning_rate': 0.00015082623680048797, 'epoch': 0.59}
+ 59%|█████▊    | 3976/6790 [2:17:44<1:35:37,  2.04s/it] 59%|█████▊    | 3977/6790 [2:17:46<1:36:00,  2.05s/it]                                                       {'loss': 1.4709, 'learning_rate': 0.00015073520618567824, 'epoch': 0.59}
+ 59%|█████▊    | 3977/6790 [2:17:46<1:36:00,  2.05s/it] 59%|█████▊    | 3978/6790 [2:17:48<1:32:45,  1.98s/it]                                                       {'loss': 1.2146, 'learning_rate': 0.0001506441864347288, 'epoch': 0.59}
+ 59%|█████▊    | 3978/6790 [2:17:48<1:32:45,  1.98s/it] 59%|█████▊    | 3979/6790 [2:17:51<1:38:11,  2.10s/it]                                                       {'loss': 1.4756, 'learning_rate': 0.00015055317756771126, 'epoch': 0.59}
+ 59%|█████▊    | 3979/6790 [2:17:51<1:38:11,  2.10s/it] 59%|█████▊    | 3980/6790 [2:17:52<1:34:01,  2.01s/it]                                                       {'loss': 1.1801, 'learning_rate': 0.000150462179604695, 'epoch': 0.59}
+ 59%|█████▊    | 3980/6790 [2:17:52<1:34:01,  2.01s/it] 59%|█████▊    | 3981/6790 [2:17:54<1:31:43,  1.96s/it]                                                       {'loss': 1.3945, 'learning_rate': 0.00015037119256574663, 'epoch': 0.59}
+ 59%|█████▊    | 3981/6790 [2:17:54<1:31:43,  1.96s/it] 59%|█████▊    | 3982/6790 [2:17:56<1:31:47,  1.96s/it]                                                       {'loss': 1.5291, 'learning_rate': 0.00015028021647093087, 'epoch': 0.59}
+ 59%|█████▊    | 3982/6790 [2:17:56<1:31:47,  1.96s/it] 59%|█████▊    | 3983/6790 [2:17:58<1:33:49,  2.01s/it]                                                       {'loss': 1.3246, 'learning_rate': 0.00015018925134030947, 'epoch': 0.59}
+ 59%|█████▊    | 3983/6790 [2:17:58<1:33:49,  2.01s/it] 59%|█████▊    | 3984/6790 [2:18:00<1:32:13,  1.97s/it]                                                       {'loss': 1.5777, 'learning_rate': 0.0001500982971939423, 'epoch': 0.59}
+ 59%|█████▊    | 3984/6790 [2:18:00<1:32:13,  1.97s/it] 59%|█████▊    | 3985/6790 [2:18:02<1:32:01,  1.97s/it]                                                       {'loss': 1.4263, 'learning_rate': 0.00015000735405188632, 'epoch': 0.59}
+ 59%|█████▊    | 3985/6790 [2:18:02<1:32:01,  1.97s/it] 59%|█████▊    | 3986/6790 [2:18:04<1:32:58,  1.99s/it]                                                       {'loss': 1.6574, 'learning_rate': 0.00014991642193419645, 'epoch': 0.59}
+ 59%|█████▊    | 3986/6790 [2:18:04<1:32:58,  1.99s/it] 59%|█████▊    | 3987/6790 [2:18:06<1:35:26,  2.04s/it]                                                       {'loss': 1.456, 'learning_rate': 0.00014982550086092492, 'epoch': 0.59}
+ 59%|█████▊    | 3987/6790 [2:18:06<1:35:26,  2.04s/it] 59%|█████▊    | 3988/6790 [2:18:08<1:34:18,  2.02s/it]                                                       {'loss': 1.5215, 'learning_rate': 0.00014973459085212173, 'epoch': 0.59}
+ 59%|█████▊    | 3988/6790 [2:18:08<1:34:18,  2.02s/it] 59%|█████▊    | 3989/6790 [2:18:10<1:32:33,  1.98s/it]                                                       {'loss': 1.4223, 'learning_rate': 0.0001496436919278342, 'epoch': 0.59}
+ 59%|█████▊    | 3989/6790 [2:18:10<1:32:33,  1.98s/it] 59%|█████▉    | 3990/6790 [2:18:13<1:38:40,  2.11s/it]                                                       {'loss': 1.4757, 'learning_rate': 0.00014955280410810745, 'epoch': 0.59}
+ 59%|█████▉    | 3990/6790 [2:18:13<1:38:40,  2.11s/it] 59%|█████▉    | 3991/6790 [2:18:15<1:36:56,  2.08s/it]                                                       {'loss': 1.4177, 'learning_rate': 0.00014946192741298396, 'epoch': 0.59}
+ 59%|█████▉    | 3991/6790 [2:18:15<1:36:56,  2.08s/it] 59%|█████▉    | 3992/6790 [2:18:17<1:36:39,  2.07s/it]                                                       {'loss': 1.3957, 'learning_rate': 0.0001493710618625038, 'epoch': 0.59}
+ 59%|█████▉    | 3992/6790 [2:18:17<1:36:39,  2.07s/it] 59%|█████▉    | 3993/6790 [2:18:19<1:38:18,  2.11s/it]                                                       {'loss': 1.5148, 'learning_rate': 0.00014928020747670482, 'epoch': 0.59}
+ 59%|█████▉    | 3993/6790 [2:18:19<1:38:18,  2.11s/it] 59%|█████▉    | 3994/6790 [2:18:21<1:34:28,  2.03s/it]                                                       {'loss': 1.3999, 'learning_rate': 0.000149189364275622, 'epoch': 0.59}
+ 59%|█████▉    | 3994/6790 [2:18:21<1:34:28,  2.03s/it] 59%|█████▉    | 3995/6790 [2:18:23<1:36:08,  2.06s/it]                                                       {'loss': 1.5666, 'learning_rate': 0.00014909853227928818, 'epoch': 0.59}
+ 59%|█████▉    | 3995/6790 [2:18:23<1:36:08,  2.06s/it] 59%|█████▉    | 3996/6790 [2:18:25<1:38:21,  2.11s/it]                                                       {'loss': 1.5765, 'learning_rate': 0.00014900771150773353, 'epoch': 0.59}
+ 59%|█████▉    | 3996/6790 [2:18:25<1:38:21,  2.11s/it] 59%|█████▉    | 3997/6790 [2:18:27<1:35:29,  2.05s/it]                                                       {'loss': 1.5927, 'learning_rate': 0.00014891690198098588, 'epoch': 0.59}
+ 59%|█████▉    | 3997/6790 [2:18:27<1:35:29,  2.05s/it] 59%|█████▉    | 3998/6790 [2:18:29<1:33:20,  2.01s/it]                                                       {'loss': 1.4599, 'learning_rate': 0.00014882610371907048, 'epoch': 0.59}
+ 59%|█████▉    | 3998/6790 [2:18:29<1:33:20,  2.01s/it] 59%|█████▉    | 3999/6790 [2:18:31<1:30:43,  1.95s/it]                                                       {'loss': 1.4095, 'learning_rate': 0.00014873531674201022, 'epoch': 0.59}
+ 59%|█████▉    | 3999/6790 [2:18:31<1:30:43,  1.95s/it] 59%|█████▉    | 4000/6790 [2:18:33<1:33:13,  2.00s/it]                                                       {'loss': 1.546, 'learning_rate': 0.0001486445410698253, 'epoch': 0.59}
+ 59%|█████▉    | 4000/6790 [2:18:33<1:33:13,  2.00s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 59%|█████▉    | 4001/6790 [2:18:35<1:40:49,  2.17s/it]                                                       {'loss': 1.4721, 'learning_rate': 0.0001485537767225337, 'epoch': 0.59}
+ 59%|█████▉    | 4001/6790 [2:18:35<1:40:49,  2.17s/it] 59%|█████▉    | 4002/6790 [2:18:37<1:36:26,  2.08s/it]                                                       {'loss': 1.5146, 'learning_rate': 0.00014846302372015054, 'epoch': 0.59}
+ 59%|█████▉    | 4002/6790 [2:18:37<1:36:26,  2.08s/it] 59%|█████▉    | 4003/6790 [2:18:39<1:36:58,  2.09s/it]                                                       {'loss': 1.3026, 'learning_rate': 0.00014837228208268893, 'epoch': 0.59}
+ 59%|█████▉    | 4003/6790 [2:18:39<1:36:58,  2.09s/it] 59%|█████▉    | 4004/6790 [2:18:42<1:36:47,  2.08s/it]                                                       {'loss': 1.3127, 'learning_rate': 0.00014828155183015888, 'epoch': 0.59}
+ 59%|█████▉    | 4004/6790 [2:18:42<1:36:47,  2.08s/it] 59%|█████▉    | 4005/6790 [2:18:43<1:32:51,  2.00s/it]                                                       {'loss': 1.3784, 'learning_rate': 0.00014819083298256853, 'epoch': 0.59}
+ 59%|█████▉    | 4005/6790 [2:18:43<1:32:51,  2.00s/it] 59%|█████▉    | 4006/6790 [2:18:45<1:32:31,  1.99s/it]                                                       {'loss': 1.4629, 'learning_rate': 0.0001481001255599229, 'epoch': 0.59}
+ 59%|█████▉    | 4006/6790 [2:18:45<1:32:31,  1.99s/it] 59%|█████▉    | 4007/6790 [2:18:47<1:33:47,  2.02s/it]                                                       {'loss': 1.4777, 'learning_rate': 0.00014800942958222493, 'epoch': 0.59}
+ 59%|█████▉    | 4007/6790 [2:18:47<1:33:47,  2.02s/it] 59%|█████▉    | 4008/6790 [2:18:49<1:34:25,  2.04s/it]                                                       {'loss': 1.525, 'learning_rate': 0.0001479187450694748, 'epoch': 0.59}
+ 59%|█████▉    | 4008/6790 [2:18:49<1:34:25,  2.04s/it] 59%|█████▉    | 4009/6790 [2:18:52<1:40:48,  2.17s/it]                                                       {'loss': 1.4217, 'learning_rate': 0.00014782807204167023, 'epoch': 0.59}
+ 59%|█████▉    | 4009/6790 [2:18:52<1:40:48,  2.17s/it] 59%|█████▉    | 4010/6790 [2:18:54<1:40:13,  2.16s/it]                                                       {'loss': 1.3679, 'learning_rate': 0.00014773741051880653, 'epoch': 0.59}
+ 59%|█████▉    | 4010/6790 [2:18:54<1:40:13,  2.16s/it] 59%|█████▉    | 4011/6790 [2:18:56<1:43:12,  2.23s/it]                                                       {'loss': 1.4404, 'learning_rate': 0.00014764676052087618, 'epoch': 0.59}
+ 59%|█████▉    | 4011/6790 [2:18:56<1:43:12,  2.23s/it] 59%|█████▉    | 4012/6790 [2:18:59<1:42:27,  2.21s/it]                                                       {'loss': 1.4544, 'learning_rate': 0.00014755612206786945, 'epoch': 0.59}
+ 59%|█████▉    | 4012/6790 [2:18:59<1:42:27,  2.21s/it] 59%|█████▉    | 4013/6790 [2:19:01<1:40:04,  2.16s/it]                                                       {'loss': 1.4064, 'learning_rate': 0.00014746549517977378, 'epoch': 0.59}
+ 59%|█████▉    | 4013/6790 [2:19:01<1:40:04,  2.16s/it] 59%|█████▉    | 4014/6790 [2:19:03<1:35:29,  2.06s/it]                                                       {'loss': 1.3097, 'learning_rate': 0.00014737487987657438, 'epoch': 0.59}
+ 59%|█████▉    | 4014/6790 [2:19:03<1:35:29,  2.06s/it] 59%|█████▉    | 4015/6790 [2:19:04<1:32:05,  1.99s/it]                                                       {'loss': 1.3996, 'learning_rate': 0.0001472842761782535, 'epoch': 0.59}
+ 59%|█████▉    | 4015/6790 [2:19:04<1:32:05,  1.99s/it] 59%|█████▉    | 4016/6790 [2:19:06<1:29:38,  1.94s/it]                                                       {'loss': 1.2374, 'learning_rate': 0.00014719368410479118, 'epoch': 0.59}
+ 59%|█████▉    | 4016/6790 [2:19:06<1:29:38,  1.94s/it] 59%|█████▉    | 4017/6790 [2:19:08<1:33:13,  2.02s/it]                                                       {'loss': 1.2583, 'learning_rate': 0.00014710310367616468, 'epoch': 0.59}
+ 59%|█████▉    | 4017/6790 [2:19:08<1:33:13,  2.02s/it] 59%|█████▉    | 4018/6790 [2:19:11<1:36:39,  2.09s/it]                                                       {'loss': 1.689, 'learning_rate': 0.00014701253491234884, 'epoch': 0.59}
+ 59%|█████▉    | 4018/6790 [2:19:11<1:36:39,  2.09s/it] 59%|█████▉    | 4019/6790 [2:19:13<1:37:26,  2.11s/it]                                                       {'loss': 1.3779, 'learning_rate': 0.00014692197783331584, 'epoch': 0.59}
+ 59%|█████▉    | 4019/6790 [2:19:13<1:37:26,  2.11s/it] 59%|█████▉    | 4020/6790 [2:19:15<1:34:28,  2.05s/it]                                                       {'loss': 1.501, 'learning_rate': 0.0001468314324590353, 'epoch': 0.59}
+ 59%|█████▉    | 4020/6790 [2:19:15<1:34:28,  2.05s/it] 59%|█████▉    | 4021/6790 [2:19:17<1:34:45,  2.05s/it]                                                       {'loss': 1.4598, 'learning_rate': 0.00014674089880947424, 'epoch': 0.59}
+ 59%|█████▉    | 4021/6790 [2:19:17<1:34:45,  2.05s/it] 59%|█████▉    | 4022/6790 [2:19:19<1:39:56,  2.17s/it]                                                       {'loss': 1.475, 'learning_rate': 0.00014665037690459717, 'epoch': 0.59}
+ 59%|█████▉    | 4022/6790 [2:19:19<1:39:56,  2.17s/it] 59%|█████▉    | 4023/6790 [2:19:22<1:45:55,  2.30s/it]                                                       {'loss': 1.5337, 'learning_rate': 0.0001465598667643659, 'epoch': 0.59}
+ 59%|█████▉    | 4023/6790 [2:19:22<1:45:55,  2.30s/it] 59%|█████▉    | 4024/6790 [2:19:24<1:45:42,  2.29s/it]                                                       {'loss': 1.2012, 'learning_rate': 0.00014646936840873975, 'epoch': 0.59}
+ 59%|█████▉    | 4024/6790 [2:19:24<1:45:42,  2.29s/it] 59%|█████▉    | 4025/6790 [2:19:26<1:41:26,  2.20s/it]                                                       {'loss': 1.5735, 'learning_rate': 0.00014637888185767533, 'epoch': 0.59}
+ 59%|█████▉    | 4025/6790 [2:19:26<1:41:26,  2.20s/it] 59%|█████▉    | 4026/6790 [2:19:28<1:42:08,  2.22s/it]                                                       {'loss': 1.5754, 'learning_rate': 0.0001462884071311268, 'epoch': 0.59}
+ 59%|█████▉    | 4026/6790 [2:19:28<1:42:08,  2.22s/it] 59%|█████▉    | 4027/6790 [2:19:31<1:41:50,  2.21s/it]                                                       {'loss': 1.5419, 'learning_rate': 0.00014619794424904558, 'epoch': 0.59}
+ 59%|█████▉    | 4027/6790 [2:19:31<1:41:50,  2.21s/it] 59%|█████▉    | 4028/6790 [2:19:32<1:35:58,  2.08s/it]                                                       {'loss': 1.363, 'learning_rate': 0.00014610749323138055, 'epoch': 0.59}
+ 59%|█████▉    | 4028/6790 [2:19:32<1:35:58,  2.08s/it] 59%|█████▉    | 4029/6790 [2:19:34<1:33:40,  2.04s/it]                                                       {'loss': 1.355, 'learning_rate': 0.00014601705409807793, 'epoch': 0.59}
+ 59%|█████▉    | 4029/6790 [2:19:34<1:33:40,  2.04s/it] 59%|█████▉    | 4030/6790 [2:19:36<1:34:13,  2.05s/it]                                                       {'loss': 1.4101, 'learning_rate': 0.0001459266268690813, 'epoch': 0.59}
+ 59%|█████▉    | 4030/6790 [2:19:36<1:34:13,  2.05s/it] 59%|█████▉    | 4031/6790 [2:19:38<1:35:40,  2.08s/it]                                                       {'loss': 1.3874, 'learning_rate': 0.00014583621156433172, 'epoch': 0.59}
+ 59%|█████▉    | 4031/6790 [2:19:38<1:35:40,  2.08s/it] 59%|█████▉    | 4032/6790 [2:19:41<1:35:38,  2.08s/it]                                                       {'loss': 1.5682, 'learning_rate': 0.00014574580820376747, 'epoch': 0.59}
+ 59%|█████▉    | 4032/6790 [2:19:41<1:35:38,  2.08s/it] 59%|█████▉    | 4033/6790 [2:19:43<1:34:46,  2.06s/it]                                                       {'loss': 1.519, 'learning_rate': 0.00014565541680732435, 'epoch': 0.59}
+ 59%|█████▉    | 4033/6790 [2:19:43<1:34:46,  2.06s/it] 59%|█████▉    | 4034/6790 [2:19:44<1:32:11,  2.01s/it]                                                       {'loss': 1.3361, 'learning_rate': 0.00014556503739493538, 'epoch': 0.59}
+ 59%|█████▉    | 4034/6790 [2:19:44<1:32:11,  2.01s/it] 59%|█████▉    | 4035/6790 [2:19:47<1:36:02,  2.09s/it]                                                       {'loss': 1.4448, 'learning_rate': 0.0001454746699865311, 'epoch': 0.59}
+ 59%|█████▉    | 4035/6790 [2:19:47<1:36:02,  2.09s/it] 59%|█████▉    | 4036/6790 [2:19:49<1:38:35,  2.15s/it]                                                       {'loss': 1.5179, 'learning_rate': 0.00014538431460203914, 'epoch': 0.59}
+ 59%|█████▉    | 4036/6790 [2:19:49<1:38:35,  2.15s/it] 59%|█████▉    | 4037/6790 [2:19:51<1:40:01,  2.18s/it]                                                       {'loss': 1.1576, 'learning_rate': 0.0001452939712613849, 'epoch': 0.59}
+ 59%|█████▉    | 4037/6790 [2:19:51<1:40:01,  2.18s/it] 59%|█████▉    | 4038/6790 [2:19:53<1:37:18,  2.12s/it]                                                       {'loss': 1.2798, 'learning_rate': 0.0001452036399844906, 'epoch': 0.59}
+ 59%|█████▉    | 4038/6790 [2:19:53<1:37:18,  2.12s/it] 59%|█████▉    | 4039/6790 [2:19:55<1:34:05,  2.05s/it]                                                       {'loss': 1.3621, 'learning_rate': 0.00014511332079127632, 'epoch': 0.59}
+ 59%|█████▉    | 4039/6790 [2:19:55<1:34:05,  2.05s/it] 59%|█████▉    | 4040/6790 [2:19:57<1:36:58,  2.12s/it]                                                       {'loss': 1.5725, 'learning_rate': 0.00014502301370165904, 'epoch': 0.59}
+ 59%|█████▉    | 4040/6790 [2:19:57<1:36:58,  2.12s/it] 60%|█████▉    | 4041/6790 [2:19:59<1:35:12,  2.08s/it]                                                       {'loss': 1.3383, 'learning_rate': 0.00014493271873555337, 'epoch': 0.6}
+ 60%|█████▉    | 4041/6790 [2:19:59<1:35:12,  2.08s/it] 60%|█████▉    | 4042/6790 [2:20:01<1:31:52,  2.01s/it]                                                       {'loss': 1.3511, 'learning_rate': 0.00014484243591287105, 'epoch': 0.6}
+ 60%|█████▉    | 4042/6790 [2:20:01<1:31:52,  2.01s/it] 60%|█████▉    | 4043/6790 [2:20:03<1:32:28,  2.02s/it]                                                       {'loss': 1.5054, 'learning_rate': 0.00014475216525352123, 'epoch': 0.6}
+ 60%|█████▉    | 4043/6790 [2:20:03<1:32:28,  2.02s/it] 60%|█████▉    | 4044/6790 [2:20:06<1:38:10,  2.15s/it]                                                       {'loss': 1.3032, 'learning_rate': 0.00014466190677741046, 'epoch': 0.6}
+ 60%|█████▉    | 4044/6790 [2:20:06<1:38:10,  2.15s/it] 60%|█████▉    | 4045/6790 [2:20:08<1:38:11,  2.15s/it]                                                       {'loss': 1.6976, 'learning_rate': 0.00014457166050444242, 'epoch': 0.6}
+ 60%|█████▉    | 4045/6790 [2:20:08<1:38:11,  2.15s/it] 60%|█████▉    | 4046/6790 [2:20:10<1:38:15,  2.15s/it]                                                       {'loss': 1.5473, 'learning_rate': 0.00014448142645451836, 'epoch': 0.6}
+ 60%|█████▉    | 4046/6790 [2:20:10<1:38:15,  2.15s/it] 60%|█████▉    | 4047/6790 [2:20:12<1:35:51,  2.10s/it]                                                       {'loss': 1.391, 'learning_rate': 0.00014439120464753642, 'epoch': 0.6}
+ 60%|█████▉    | 4047/6790 [2:20:12<1:35:51,  2.10s/it] 60%|█████▉    | 4048/6790 [2:20:15<1:44:47,  2.29s/it]                                                       {'loss': 1.4206, 'learning_rate': 0.00014430099510339247, 'epoch': 0.6}
+ 60%|█████▉    | 4048/6790 [2:20:15<1:44:47,  2.29s/it] 60%|█████▉    | 4049/6790 [2:20:17<1:39:55,  2.19s/it]                                                       {'loss': 1.2335, 'learning_rate': 0.00014421079784197947, 'epoch': 0.6}
+ 60%|█████▉    | 4049/6790 [2:20:17<1:39:55,  2.19s/it] 60%|█████▉    | 4050/6790 [2:20:19<1:38:37,  2.16s/it]                                                       {'loss': 1.5874, 'learning_rate': 0.00014412061288318766, 'epoch': 0.6}
+ 60%|█████▉    | 4050/6790 [2:20:19<1:38:37,  2.16s/it] 60%|█████▉    | 4051/6790 [2:20:21<1:38:39,  2.16s/it]                                                       {'loss': 1.5648, 'learning_rate': 0.0001440304402469046, 'epoch': 0.6}
+ 60%|█████▉    | 4051/6790 [2:20:21<1:38:39,  2.16s/it] 60%|█████▉    | 4052/6790 [2:20:23<1:35:28,  2.09s/it]                                                       {'loss': 1.4569, 'learning_rate': 0.00014394027995301523, 'epoch': 0.6}
+ 60%|█████▉    | 4052/6790 [2:20:23<1:35:28,  2.09s/it] 60%|█████▉    | 4053/6790 [2:20:25<1:35:06,  2.09s/it]                                                       {'loss': 1.626, 'learning_rate': 0.00014385013202140154, 'epoch': 0.6}
+ 60%|█████▉    | 4053/6790 [2:20:25<1:35:06,  2.09s/it] 60%|█████▉    | 4054/6790 [2:20:27<1:37:10,  2.13s/it]                                                       {'loss': 1.3524, 'learning_rate': 0.00014375999647194302, 'epoch': 0.6}
+ 60%|█████▉    | 4054/6790 [2:20:27<1:37:10,  2.13s/it] 60%|█████▉    | 4055/6790 [2:20:29<1:31:13,  2.00s/it]                                                       {'loss': 1.3486, 'learning_rate': 0.00014366987332451632, 'epoch': 0.6}
+ 60%|█████▉    | 4055/6790 [2:20:29<1:31:13,  2.00s/it] 60%|█████▉    | 4056/6790 [2:20:31<1:31:51,  2.02s/it]                                                       {'loss': 1.417, 'learning_rate': 0.00014357976259899536, 'epoch': 0.6}
+ 60%|█████▉    | 4056/6790 [2:20:31<1:31:51,  2.02s/it] 60%|█████▉    | 4057/6790 [2:20:33<1:36:27,  2.12s/it]                                                       {'loss': 1.4001, 'learning_rate': 0.00014348966431525136, 'epoch': 0.6}
+ 60%|█████▉    | 4057/6790 [2:20:33<1:36:27,  2.12s/it] 60%|█████▉    | 4058/6790 [2:20:35<1:32:19,  2.03s/it]                                                       {'loss': 1.4426, 'learning_rate': 0.00014339957849315277, 'epoch': 0.6}
+ 60%|█████▉    | 4058/6790 [2:20:35<1:32:19,  2.03s/it] 60%|█████▉    | 4059/6790 [2:20:37<1:33:58,  2.06s/it]                                                       {'loss': 1.3689, 'learning_rate': 0.0001433095051525652, 'epoch': 0.6}
+ 60%|█████▉    | 4059/6790 [2:20:37<1:33:58,  2.06s/it] 60%|█████▉    | 4060/6790 [2:20:40<1:38:42,  2.17s/it]                                                       {'loss': 1.5094, 'learning_rate': 0.0001432194443133517, 'epoch': 0.6}
+ 60%|█████▉    | 4060/6790 [2:20:40<1:38:42,  2.17s/it] 60%|█████▉    | 4061/6790 [2:20:42<1:41:12,  2.23s/it]                                                       {'loss': 1.6864, 'learning_rate': 0.0001431293959953725, 'epoch': 0.6}
+ 60%|█████▉    | 4061/6790 [2:20:42<1:41:12,  2.23s/it] 60%|█████▉    | 4062/6790 [2:20:44<1:40:33,  2.21s/it]                                                       {'loss': 1.6229, 'learning_rate': 0.00014303936021848497, 'epoch': 0.6}
+ 60%|█████▉    | 4062/6790 [2:20:44<1:40:33,  2.21s/it] 60%|█████▉    | 4063/6790 [2:20:46<1:37:27,  2.14s/it]                                                       {'loss': 1.3572, 'learning_rate': 0.00014294933700254378, 'epoch': 0.6}
+ 60%|█████▉    | 4063/6790 [2:20:46<1:37:27,  2.14s/it] 60%|█████▉    | 4064/6790 [2:20:48<1:36:47,  2.13s/it]                                                       {'loss': 1.4597, 'learning_rate': 0.00014285932636740083, 'epoch': 0.6}
+ 60%|█████▉    | 4064/6790 [2:20:48<1:36:47,  2.13s/it] 60%|█████▉    | 4065/6790 [2:20:50<1:35:59,  2.11s/it]                                                       {'loss': 1.3748, 'learning_rate': 0.00014276932833290527, 'epoch': 0.6}
+ 60%|█████▉    | 4065/6790 [2:20:50<1:35:59,  2.11s/it] 60%|█████▉    | 4066/6790 [2:20:52<1:30:29,  1.99s/it]                                                       {'loss': 1.3587, 'learning_rate': 0.00014267934291890336, 'epoch': 0.6}
+ 60%|█████▉    | 4066/6790 [2:20:52<1:30:29,  1.99s/it] 60%|█████▉    | 4067/6790 [2:20:54<1:31:40,  2.02s/it]                                                       {'loss': 1.5782, 'learning_rate': 0.0001425893701452388, 'epoch': 0.6}
+ 60%|█████▉    | 4067/6790 [2:20:54<1:31:40,  2.02s/it] 60%|█████▉    | 4068/6790 [2:20:56<1:30:21,  1.99s/it]                                                       {'loss': 1.6506, 'learning_rate': 0.00014249941003175218, 'epoch': 0.6}
+ 60%|█████▉    | 4068/6790 [2:20:56<1:30:21,  1.99s/it] 60%|█████▉    | 4069/6790 [2:20:58<1:30:32,  2.00s/it]                                                       {'loss': 1.4558, 'learning_rate': 0.00014240946259828173, 'epoch': 0.6}
+ 60%|█████▉    | 4069/6790 [2:20:58<1:30:32,  2.00s/it] 60%|█████▉    | 4070/6790 [2:21:00<1:33:15,  2.06s/it]                                                       {'loss': 1.4906, 'learning_rate': 0.00014231952786466234, 'epoch': 0.6}
+ 60%|█████▉    | 4070/6790 [2:21:00<1:33:15,  2.06s/it] 60%|█████▉    | 4071/6790 [2:21:02<1:30:27,  2.00s/it]                                                       {'loss': 1.5168, 'learning_rate': 0.00014222960585072672, 'epoch': 0.6}
+ 60%|█████▉    | 4071/6790 [2:21:02<1:30:27,  2.00s/it] 60%|█████▉    | 4072/6790 [2:21:04<1:29:23,  1.97s/it]                                                       {'loss': 1.4394, 'learning_rate': 0.00014213969657630413, 'epoch': 0.6}
+ 60%|█████▉    | 4072/6790 [2:21:04<1:29:23,  1.97s/it] 60%|█████▉    | 4073/6790 [2:21:06<1:29:30,  1.98s/it]                                                       {'loss': 1.2999, 'learning_rate': 0.00014204980006122156, 'epoch': 0.6}
+ 60%|█████▉    | 4073/6790 [2:21:06<1:29:30,  1.98s/it] 60%|██████    | 4074/6790 [2:21:08<1:28:32,  1.96s/it]                                                       {'loss': 1.3073, 'learning_rate': 0.00014195991632530287, 'epoch': 0.6}
+ 60%|██████    | 4074/6790 [2:21:08<1:28:32,  1.96s/it] 60%|██████    | 4075/6790 [2:21:10<1:31:05,  2.01s/it]                                                       {'loss': 1.4078, 'learning_rate': 0.00014187004538836927, 'epoch': 0.6}
+ 60%|██████    | 4075/6790 [2:21:10<1:31:05,  2.01s/it] 60%|██████    | 4076/6790 [2:21:12<1:29:03,  1.97s/it]                                                       {'loss': 1.5508, 'learning_rate': 0.00014178018727023902, 'epoch': 0.6}
+ 60%|██████    | 4076/6790 [2:21:12<1:29:03,  1.97s/it] 60%|██████    | 4077/6790 [2:21:14<1:33:03,  2.06s/it]                                                       {'loss': 1.4167, 'learning_rate': 0.00014169034199072755, 'epoch': 0.6}
+ 60%|██████    | 4077/6790 [2:21:14<1:33:03,  2.06s/it] 60%|██████    | 4078/6790 [2:21:17<1:39:20,  2.20s/it]                                                       {'loss': 1.6654, 'learning_rate': 0.00014160050956964773, 'epoch': 0.6}
+ 60%|██████    | 4078/6790 [2:21:17<1:39:20,  2.20s/it] 60%|██████    | 4079/6790 [2:21:19<1:35:36,  2.12s/it]                                                       {'loss': 1.1898, 'learning_rate': 0.00014151069002680915, 'epoch': 0.6}
+ 60%|██████    | 4079/6790 [2:21:19<1:35:36,  2.12s/it] 60%|██████    | 4080/6790 [2:21:21<1:37:06,  2.15s/it]                                                       {'loss': 1.5366, 'learning_rate': 0.00014142088338201897, 'epoch': 0.6}
+ 60%|██████    | 4080/6790 [2:21:21<1:37:06,  2.15s/it] 60%|██████    | 4081/6790 [2:21:24<1:43:12,  2.29s/it]                                                       {'loss': 1.3162, 'learning_rate': 0.00014133108965508115, 'epoch': 0.6}
+ 60%|██████    | 4081/6790 [2:21:24<1:43:12,  2.29s/it] 60%|██████    | 4082/6790 [2:21:26<1:39:39,  2.21s/it]                                                       {'loss': 1.6783, 'learning_rate': 0.00014124130886579718, 'epoch': 0.6}
+ 60%|██████    | 4082/6790 [2:21:26<1:39:39,  2.21s/it] 60%|██████    | 4083/6790 [2:21:28<1:39:20,  2.20s/it]                                                       {'loss': 1.5308, 'learning_rate': 0.00014115154103396535, 'epoch': 0.6}
+ 60%|██████    | 4083/6790 [2:21:28<1:39:20,  2.20s/it] 60%|██████    | 4084/6790 [2:21:30<1:37:39,  2.17s/it]                                                       {'loss': 1.4494, 'learning_rate': 0.00014106178617938133, 'epoch': 0.6}
+ 60%|██████    | 4084/6790 [2:21:30<1:37:39,  2.17s/it] 60%|██████    | 4085/6790 [2:21:32<1:32:48,  2.06s/it]                                                       {'loss': 1.4024, 'learning_rate': 0.00014097204432183774, 'epoch': 0.6}
+ 60%|██████    | 4085/6790 [2:21:32<1:32:48,  2.06s/it] 60%|██████    | 4086/6790 [2:21:34<1:38:32,  2.19s/it]                                                       {'loss': 1.5181, 'learning_rate': 0.00014088231548112457, 'epoch': 0.6}
+ 60%|██████    | 4086/6790 [2:21:34<1:38:32,  2.19s/it] 60%|██████    | 4087/6790 [2:21:36<1:36:23,  2.14s/it]                                                       {'loss': 1.192, 'learning_rate': 0.00014079259967702865, 'epoch': 0.6}
+ 60%|██████    | 4087/6790 [2:21:36<1:36:23,  2.14s/it] 60%|██████    | 4088/6790 [2:21:38<1:31:59,  2.04s/it]                                                       {'loss': 1.3928, 'learning_rate': 0.0001407028969293342, 'epoch': 0.6}
+ 60%|██████    | 4088/6790 [2:21:38<1:31:59,  2.04s/it] 60%|██████    | 4089/6790 [2:21:40<1:29:42,  1.99s/it]                                                       {'loss': 1.2224, 'learning_rate': 0.00014061320725782239, 'epoch': 0.6}
+ 60%|██████    | 4089/6790 [2:21:40<1:29:42,  1.99s/it] 60%|██████    | 4090/6790 [2:21:42<1:28:11,  1.96s/it]                                                       {'loss': 1.2262, 'learning_rate': 0.0001405235306822716, 'epoch': 0.6}
+ 60%|██████    | 4090/6790 [2:21:42<1:28:11,  1.96s/it] 60%|██████    | 4091/6790 [2:21:44<1:28:38,  1.97s/it]                                                       {'loss': 1.2806, 'learning_rate': 0.0001404338672224572, 'epoch': 0.6}
+ 60%|██████    | 4091/6790 [2:21:44<1:28:38,  1.97s/it] 60%|██████    | 4092/6790 [2:21:46<1:28:22,  1.97s/it]                                                       {'loss': 1.3579, 'learning_rate': 0.00014034421689815196, 'epoch': 0.6}
+ 60%|██████    | 4092/6790 [2:21:46<1:28:22,  1.97s/it] 60%|██████    | 4093/6790 [2:21:48<1:26:54,  1.93s/it]                                                       {'loss': 1.5083, 'learning_rate': 0.00014025457972912528, 'epoch': 0.6}
+ 60%|██████    | 4093/6790 [2:21:48<1:26:54,  1.93s/it] 60%|██████    | 4094/6790 [2:21:50<1:28:51,  1.98s/it]                                                       {'loss': 1.0533, 'learning_rate': 0.0001401649557351441, 'epoch': 0.6}
+ 60%|██████    | 4094/6790 [2:21:50<1:28:51,  1.98s/it] 60%|██████    | 4095/6790 [2:21:52<1:28:29,  1.97s/it]                                                       {'loss': 1.4872, 'learning_rate': 0.00014007534493597228, 'epoch': 0.6}
+ 60%|██████    | 4095/6790 [2:21:52<1:28:29,  1.97s/it] 60%|██████    | 4096/6790 [2:21:53<1:26:39,  1.93s/it]                                                       {'loss': 1.2764, 'learning_rate': 0.00013998574735137067, 'epoch': 0.6}
+ 60%|██████    | 4096/6790 [2:21:53<1:26:39,  1.93s/it] 60%|██████    | 4097/6790 [2:21:55<1:25:26,  1.90s/it]                                                       {'loss': 1.5377, 'learning_rate': 0.00013989616300109743, 'epoch': 0.6}
+ 60%|██████    | 4097/6790 [2:21:55<1:25:26,  1.90s/it] 60%|██████    | 4098/6790 [2:21:57<1:26:18,  1.92s/it]                                                       {'loss': 1.5388, 'learning_rate': 0.00013980659190490754, 'epoch': 0.6}
+ 60%|██████    | 4098/6790 [2:21:57<1:26:18,  1.92s/it] 60%|██████    | 4099/6790 [2:21:59<1:25:02,  1.90s/it]                                                       {'loss': 1.3951, 'learning_rate': 0.00013971703408255338, 'epoch': 0.6}
+ 60%|██████    | 4099/6790 [2:21:59<1:25:02,  1.90s/it] 60%|██████    | 4100/6790 [2:22:01<1:27:38,  1.95s/it]                                                       {'loss': 1.3062, 'learning_rate': 0.00013962748955378398, 'epoch': 0.6}
+ 60%|██████    | 4100/6790 [2:22:01<1:27:38,  1.95s/it] 60%|██████    | 4101/6790 [2:22:03<1:31:54,  2.05s/it]                                                       {'loss': 1.3837, 'learning_rate': 0.00013953795833834595, 'epoch': 0.6}
+ 60%|██████    | 4101/6790 [2:22:03<1:31:54,  2.05s/it] 60%|██████    | 4102/6790 [2:22:06<1:32:45,  2.07s/it]                                                       {'loss': 1.3684, 'learning_rate': 0.00013944844045598242, 'epoch': 0.6}
+ 60%|██████    | 4102/6790 [2:22:06<1:32:45,  2.07s/it] 60%|██████    | 4103/6790 [2:22:08<1:34:53,  2.12s/it]                                                       {'loss': 1.4094, 'learning_rate': 0.0001393589359264341, 'epoch': 0.6}
+ 60%|██████    | 4103/6790 [2:22:08<1:34:53,  2.12s/it] 60%|██████    | 4104/6790 [2:22:10<1:35:34,  2.14s/it]                                                       {'loss': 1.5443, 'learning_rate': 0.0001392694447694383, 'epoch': 0.6}
+ 60%|██████    | 4104/6790 [2:22:10<1:35:34,  2.14s/it] 60%|██████    | 4105/6790 [2:22:12<1:31:45,  2.05s/it]                                                       {'loss': 1.459, 'learning_rate': 0.00013917996700472973, 'epoch': 0.6}
+ 60%|██████    | 4105/6790 [2:22:12<1:31:45,  2.05s/it] 60%|██████    | 4106/6790 [2:22:14<1:29:16,  2.00s/it]                                                       {'loss': 1.283, 'learning_rate': 0.00013909050265203992, 'epoch': 0.6}
+ 60%|██████    | 4106/6790 [2:22:14<1:29:16,  2.00s/it] 60%|██████    | 4107/6790 [2:22:16<1:32:38,  2.07s/it]                                                       {'loss': 1.3704, 'learning_rate': 0.0001390010517310976, 'epoch': 0.6}
+ 60%|██████    | 4107/6790 [2:22:16<1:32:38,  2.07s/it] 61%|██████    | 4108/6790 [2:22:18<1:31:02,  2.04s/it]                                                       {'loss': 1.3909, 'learning_rate': 0.00013891161426162838, 'epoch': 0.61}
+ 61%|██████    | 4108/6790 [2:22:18<1:31:02,  2.04s/it] 61%|██████    | 4109/6790 [2:22:20<1:29:01,  1.99s/it]                                                       {'loss': 1.3977, 'learning_rate': 0.00013882219026335507, 'epoch': 0.61}
+ 61%|██████    | 4109/6790 [2:22:20<1:29:01,  1.99s/it] 61%|██████    | 4110/6790 [2:22:22<1:26:58,  1.95s/it]                                                       {'loss': 1.4394, 'learning_rate': 0.00013873277975599737, 'epoch': 0.61}
+ 61%|██████    | 4110/6790 [2:22:22<1:26:58,  1.95s/it] 61%|██████    | 4111/6790 [2:22:24<1:26:57,  1.95s/it]                                                       {'loss': 1.443, 'learning_rate': 0.00013864338275927204, 'epoch': 0.61}
+ 61%|██████    | 4111/6790 [2:22:24<1:26:57,  1.95s/it] 61%|██████    | 4112/6790 [2:22:26<1:28:48,  1.99s/it]                                                       {'loss': 1.5868, 'learning_rate': 0.00013855399929289304, 'epoch': 0.61}
+ 61%|██████    | 4112/6790 [2:22:26<1:28:48,  1.99s/it] 61%|██████    | 4113/6790 [2:22:28<1:28:43,  1.99s/it]                                                       {'loss': 1.4295, 'learning_rate': 0.00013846462937657097, 'epoch': 0.61}
+ 61%|██████    | 4113/6790 [2:22:28<1:28:43,  1.99s/it] 61%|██████    | 4114/6790 [2:22:30<1:31:38,  2.05s/it]                                                       {'loss': 1.4844, 'learning_rate': 0.00013837527303001384, 'epoch': 0.61}
+ 61%|██████    | 4114/6790 [2:22:30<1:31:38,  2.05s/it] 61%|██████    | 4115/6790 [2:22:32<1:31:36,  2.05s/it]                                                       {'loss': 1.5096, 'learning_rate': 0.00013828593027292638, 'epoch': 0.61}
+ 61%|██████    | 4115/6790 [2:22:32<1:31:36,  2.05s/it] 61%|██████    | 4116/6790 [2:22:34<1:30:22,  2.03s/it]                                                       {'loss': 1.3751, 'learning_rate': 0.00013819660112501054, 'epoch': 0.61}
+ 61%|██████    | 4116/6790 [2:22:34<1:30:22,  2.03s/it] 61%|██████    | 4117/6790 [2:22:36<1:29:29,  2.01s/it]                                                       {'loss': 1.3445, 'learning_rate': 0.00013810728560596504, 'epoch': 0.61}
+ 61%|██████    | 4117/6790 [2:22:36<1:29:29,  2.01s/it] 61%|██████    | 4118/6790 [2:22:38<1:30:48,  2.04s/it]                                                       {'loss': 1.3413, 'learning_rate': 0.0001380179837354858, 'epoch': 0.61}
+ 61%|██████    | 4118/6790 [2:22:38<1:30:48,  2.04s/it] 61%|██████    | 4119/6790 [2:22:40<1:29:55,  2.02s/it]                                                       {'loss': 1.5578, 'learning_rate': 0.00013792869553326558, 'epoch': 0.61}
+ 61%|██████    | 4119/6790 [2:22:40<1:29:55,  2.02s/it] 61%|██████    | 4120/6790 [2:22:42<1:26:01,  1.93s/it]                                                       {'loss': 1.6083, 'learning_rate': 0.0001378394210189943, 'epoch': 0.61}
+ 61%|██████    | 4120/6790 [2:22:42<1:26:01,  1.93s/it] 61%|██████    | 4121/6790 [2:22:43<1:24:10,  1.89s/it]                                                       {'loss': 1.4284, 'learning_rate': 0.0001377501602123586, 'epoch': 0.61}
+ 61%|██████    | 4121/6790 [2:22:43<1:24:10,  1.89s/it] 61%|██████    | 4122/6790 [2:22:45<1:24:40,  1.90s/it]                                                       {'loss': 1.4128, 'learning_rate': 0.00013766091313304244, 'epoch': 0.61}
+ 61%|██████    | 4122/6790 [2:22:45<1:24:40,  1.90s/it] 61%|██████    | 4123/6790 [2:22:47<1:26:54,  1.96s/it]                                                       {'loss': 1.4399, 'learning_rate': 0.00013757167980072636, 'epoch': 0.61}
+ 61%|██████    | 4123/6790 [2:22:47<1:26:54,  1.96s/it] 61%|██████    | 4124/6790 [2:22:49<1:26:39,  1.95s/it]                                                       {'loss': 1.4415, 'learning_rate': 0.00013748246023508824, 'epoch': 0.61}
+ 61%|██████    | 4124/6790 [2:22:49<1:26:39,  1.95s/it] 61%|██████    | 4125/6790 [2:22:52<1:38:39,  2.22s/it]                                                       {'loss': 1.4123, 'learning_rate': 0.00013739325445580262, 'epoch': 0.61}
+ 61%|██████    | 4125/6790 [2:22:52<1:38:39,  2.22s/it] 61%|██████    | 4126/6790 [2:22:54<1:36:48,  2.18s/it]                                                       {'loss': 1.6901, 'learning_rate': 0.00013730406248254132, 'epoch': 0.61}
+ 61%|██████    | 4126/6790 [2:22:54<1:36:48,  2.18s/it] 61%|██████    | 4127/6790 [2:22:56<1:34:10,  2.12s/it]                                                       {'loss': 1.3888, 'learning_rate': 0.0001372148843349727, 'epoch': 0.61}
+ 61%|██████    | 4127/6790 [2:22:56<1:34:10,  2.12s/it] 61%|██████    | 4128/6790 [2:22:58<1:28:29,  1.99s/it]                                                       {'loss': 1.2742, 'learning_rate': 0.00013712572003276246, 'epoch': 0.61}
+ 61%|██████    | 4128/6790 [2:22:58<1:28:29,  1.99s/it] 61%|██████    | 4129/6790 [2:23:00<1:28:48,  2.00s/it]                                                       {'loss': 1.4939, 'learning_rate': 0.00013703656959557307, 'epoch': 0.61}
+ 61%|██████    | 4129/6790 [2:23:00<1:28:48,  2.00s/it] 61%|██████    | 4130/6790 [2:23:02<1:28:14,  1.99s/it]                                                       {'loss': 1.386, 'learning_rate': 0.00013694743304306392, 'epoch': 0.61}
+ 61%|██████    | 4130/6790 [2:23:02<1:28:14,  1.99s/it] 61%|██████    | 4131/6790 [2:23:04<1:25:20,  1.93s/it]                                                       {'loss': 1.5251, 'learning_rate': 0.00013685831039489144, 'epoch': 0.61}
+ 61%|██████    | 4131/6790 [2:23:04<1:25:20,  1.93s/it] 61%|██████    | 4132/6790 [2:23:05<1:22:28,  1.86s/it]                                                       {'loss': 1.444, 'learning_rate': 0.0001367692016707089, 'epoch': 0.61}
+ 61%|██████    | 4132/6790 [2:23:05<1:22:28,  1.86s/it] 61%|██████    | 4133/6790 [2:23:08<1:28:30,  2.00s/it]                                                       {'loss': 1.4973, 'learning_rate': 0.00013668010689016656, 'epoch': 0.61}
+ 61%|██████    | 4133/6790 [2:23:08<1:28:30,  2.00s/it] 61%|██████    | 4134/6790 [2:23:10<1:26:40,  1.96s/it]                                                       {'loss': 1.3775, 'learning_rate': 0.00013659102607291144, 'epoch': 0.61}
+ 61%|██████    | 4134/6790 [2:23:10<1:26:40,  1.96s/it] 61%|██████    | 4135/6790 [2:23:11<1:25:03,  1.92s/it]                                                       {'loss': 1.5361, 'learning_rate': 0.00013650195923858787, 'epoch': 0.61}
+ 61%|██████    | 4135/6790 [2:23:11<1:25:03,  1.92s/it] 61%|██████    | 4136/6790 [2:23:13<1:26:13,  1.95s/it]                                                       {'loss': 1.4622, 'learning_rate': 0.00013641290640683659, 'epoch': 0.61}
+ 61%|██████    | 4136/6790 [2:23:13<1:26:13,  1.95s/it] 61%|██████    | 4137/6790 [2:23:16<1:27:43,  1.98s/it]                                                       {'loss': 1.2315, 'learning_rate': 0.00013632386759729573, 'epoch': 0.61}
+ 61%|██████    | 4137/6790 [2:23:16<1:27:43,  1.98s/it] 61%|██████    | 4138/6790 [2:23:18<1:29:30,  2.02s/it]                                                       {'loss': 1.4655, 'learning_rate': 0.00013623484282959992, 'epoch': 0.61}
+ 61%|██████    | 4138/6790 [2:23:18<1:29:30,  2.02s/it] 61%|██████    | 4139/6790 [2:23:19<1:26:48,  1.96s/it]                                                       {'loss': 1.2794, 'learning_rate': 0.00013614583212338103, 'epoch': 0.61}
+ 61%|██████    | 4139/6790 [2:23:19<1:26:48,  1.96s/it] 61%|██████    | 4140/6790 [2:23:21<1:26:13,  1.95s/it]                                                       {'loss': 1.416, 'learning_rate': 0.0001360568354982676, 'epoch': 0.61}
+ 61%|██████    | 4140/6790 [2:23:21<1:26:13,  1.95s/it] 61%|██████    | 4141/6790 [2:23:23<1:26:56,  1.97s/it]                                                       {'loss': 1.5032, 'learning_rate': 0.00013596785297388515, 'epoch': 0.61}
+ 61%|██████    | 4141/6790 [2:23:23<1:26:56,  1.97s/it] 61%|██████    | 4142/6790 [2:23:26<1:32:53,  2.10s/it]                                                       {'loss': 1.3916, 'learning_rate': 0.00013587888456985606, 'epoch': 0.61}
+ 61%|██████    | 4142/6790 [2:23:26<1:32:53,  2.10s/it] 61%|██████    | 4143/6790 [2:23:28<1:34:26,  2.14s/it]                                                       {'loss': 1.4817, 'learning_rate': 0.00013578993030579972, 'epoch': 0.61}
+ 61%|██████    | 4143/6790 [2:23:28<1:34:26,  2.14s/it] 61%|██████    | 4144/6790 [2:23:30<1:34:56,  2.15s/it]                                                       {'loss': 1.4351, 'learning_rate': 0.0001357009902013322, 'epoch': 0.61}
+ 61%|██████    | 4144/6790 [2:23:30<1:34:56,  2.15s/it] 61%|██████    | 4145/6790 [2:23:34<1:52:37,  2.55s/it]                                                       {'loss': 1.2832, 'learning_rate': 0.00013561206427606653, 'epoch': 0.61}
+ 61%|██████    | 4145/6790 [2:23:34<1:52:37,  2.55s/it] 61%|██████    | 4146/6790 [2:23:36<1:45:04,  2.38s/it]                                                       {'loss': 1.2948, 'learning_rate': 0.0001355231525496128, 'epoch': 0.61}
+ 61%|██████    | 4146/6790 [2:23:36<1:45:04,  2.38s/it] 61%|██████    | 4147/6790 [2:23:38<1:40:15,  2.28s/it]                                                       {'loss': 1.3117, 'learning_rate': 0.0001354342550415776, 'epoch': 0.61}
+ 61%|██████    | 4147/6790 [2:23:38<1:40:15,  2.28s/it] 61%|██████    | 4148/6790 [2:23:41<1:46:38,  2.42s/it]                                                       {'loss': 1.3539, 'learning_rate': 0.00013534537177156475, 'epoch': 0.61}
+ 61%|██████    | 4148/6790 [2:23:41<1:46:38,  2.42s/it] 61%|██████    | 4149/6790 [2:23:43<1:44:53,  2.38s/it]                                                       {'loss': 1.5672, 'learning_rate': 0.00013525650275917462, 'epoch': 0.61}
+ 61%|██████    | 4149/6790 [2:23:43<1:44:53,  2.38s/it] 61%|██████    | 4150/6790 [2:23:45<1:41:52,  2.32s/it]                                                       {'loss': 1.4126, 'learning_rate': 0.0001351676480240047, 'epoch': 0.61}
+ 61%|██████    | 4150/6790 [2:23:45<1:41:52,  2.32s/it] 61%|██████    | 4151/6790 [2:23:47<1:37:10,  2.21s/it]                                                       {'loss': 1.5884, 'learning_rate': 0.0001350788075856492, 'epoch': 0.61}
+ 61%|██████    | 4151/6790 [2:23:47<1:37:10,  2.21s/it] 61%|██████    | 4152/6790 [2:23:49<1:34:04,  2.14s/it]                                                       {'loss': 1.3408, 'learning_rate': 0.00013498998146369915, 'epoch': 0.61}
+ 61%|██████    | 4152/6790 [2:23:49<1:34:04,  2.14s/it] 61%|██████    | 4153/6790 [2:23:51<1:30:43,  2.06s/it]                                                       {'loss': 1.5279, 'learning_rate': 0.00013490116967774247, 'epoch': 0.61}
+ 61%|██████    | 4153/6790 [2:23:51<1:30:43,  2.06s/it] 61%|██████    | 4154/6790 [2:23:53<1:29:45,  2.04s/it]                                                       {'loss': 1.4442, 'learning_rate': 0.00013481237224736395, 'epoch': 0.61}
+ 61%|██████    | 4154/6790 [2:23:53<1:29:45,  2.04s/it] 61%|██████    | 4155/6790 [2:23:55<1:28:48,  2.02s/it]                                                       {'loss': 1.5106, 'learning_rate': 0.00013472358919214508, 'epoch': 0.61}
+ 61%|██████    | 4155/6790 [2:23:55<1:28:48,  2.02s/it] 61%|██████    | 4156/6790 [2:23:57<1:27:18,  1.99s/it]                                                       {'loss': 1.5932, 'learning_rate': 0.0001346348205316644, 'epoch': 0.61}
+ 61%|██████    | 4156/6790 [2:23:57<1:27:18,  1.99s/it] 61%|██████    | 4157/6790 [2:23:59<1:30:14,  2.06s/it]                                                       {'loss': 1.5247, 'learning_rate': 0.00013454606628549704, 'epoch': 0.61}
+ 61%|██████    | 4157/6790 [2:23:59<1:30:14,  2.06s/it] 61%|██████    | 4158/6790 [2:24:01<1:27:33,  2.00s/it]                                                       {'loss': 1.526, 'learning_rate': 0.00013445732647321523, 'epoch': 0.61}
+ 61%|██████    | 4158/6790 [2:24:01<1:27:33,  2.00s/it] 61%|██████▏   | 4159/6790 [2:24:03<1:29:08,  2.03s/it]                                                       {'loss': 1.4817, 'learning_rate': 0.00013436860111438765, 'epoch': 0.61}
+ 61%|██████▏   | 4159/6790 [2:24:03<1:29:08,  2.03s/it] 61%|██████▏   | 4160/6790 [2:24:05<1:29:34,  2.04s/it]                                                       {'loss': 1.2434, 'learning_rate': 0.00013427989022858015, 'epoch': 0.61}
+ 61%|██████▏   | 4160/6790 [2:24:05<1:29:34,  2.04s/it] 61%|██████▏   | 4161/6790 [2:24:07<1:26:59,  1.99s/it]                                                       {'loss': 1.4353, 'learning_rate': 0.00013419119383535513, 'epoch': 0.61}
+ 61%|██████▏   | 4161/6790 [2:24:07<1:26:59,  1.99s/it] 61%|██████▏   | 4162/6790 [2:24:09<1:28:32,  2.02s/it]                                                       {'loss': 1.3305, 'learning_rate': 0.00013410251195427196, 'epoch': 0.61}
+ 61%|██████▏   | 4162/6790 [2:24:09<1:28:32,  2.02s/it] 61%|██████▏   | 4163/6790 [2:24:11<1:30:23,  2.06s/it]                                                       {'loss': 1.4647, 'learning_rate': 0.00013401384460488678, 'epoch': 0.61}
+ 61%|██████▏   | 4163/6790 [2:24:11<1:30:23,  2.06s/it] 61%|██████▏   | 4164/6790 [2:24:13<1:28:49,  2.03s/it]                                                       {'loss': 1.2236, 'learning_rate': 0.00013392519180675235, 'epoch': 0.61}
+ 61%|██████▏   | 4164/6790 [2:24:13<1:28:49,  2.03s/it] 61%|██████▏   | 4165/6790 [2:24:15<1:26:05,  1.97s/it]                                                       {'loss': 1.4763, 'learning_rate': 0.00013383655357941852, 'epoch': 0.61}
+ 61%|██████▏   | 4165/6790 [2:24:15<1:26:05,  1.97s/it] 61%|██████▏   | 4166/6790 [2:24:17<1:25:09,  1.95s/it]                                                       {'loss': 1.2927, 'learning_rate': 0.00013374792994243163, 'epoch': 0.61}
+ 61%|██████▏   | 4166/6790 [2:24:17<1:25:09,  1.95s/it] 61%|██████▏   | 4167/6790 [2:24:19<1:25:55,  1.97s/it]                                                       {'loss': 1.4313, 'learning_rate': 0.00013365932091533516, 'epoch': 0.61}
+ 61%|██████▏   | 4167/6790 [2:24:19<1:25:55,  1.97s/it] 61%|██████▏   | 4168/6790 [2:24:21<1:27:25,  2.00s/it]                                                       {'loss': 1.4033, 'learning_rate': 0.00013357072651766884, 'epoch': 0.61}
+ 61%|██████▏   | 4168/6790 [2:24:21<1:27:25,  2.00s/it] 61%|██████▏   | 4169/6790 [2:24:23<1:27:39,  2.01s/it]                                                       {'loss': 1.2799, 'learning_rate': 0.0001334821467689698, 'epoch': 0.61}
+ 61%|██████▏   | 4169/6790 [2:24:23<1:27:39,  2.01s/it] 61%|██████▏   | 4170/6790 [2:24:25<1:30:27,  2.07s/it]                                                       {'loss': 1.3602, 'learning_rate': 0.00013339358168877133, 'epoch': 0.61}
+ 61%|██████▏   | 4170/6790 [2:24:25<1:30:27,  2.07s/it] 61%|██████▏   | 4171/6790 [2:24:27<1:29:49,  2.06s/it]                                                       {'loss': 1.5937, 'learning_rate': 0.00013330503129660402, 'epoch': 0.61}
+ 61%|██████▏   | 4171/6790 [2:24:27<1:29:49,  2.06s/it] 61%|██████▏   | 4172/6790 [2:24:29<1:28:17,  2.02s/it]                                                       {'loss': 1.3462, 'learning_rate': 0.00013321649561199488, 'epoch': 0.61}
+ 61%|██████▏   | 4172/6790 [2:24:29<1:28:17,  2.02s/it] 61%|██████▏   | 4173/6790 [2:24:31<1:30:12,  2.07s/it]                                                       {'loss': 1.3863, 'learning_rate': 0.0001331279746544678, 'epoch': 0.61}
+ 61%|██████▏   | 4173/6790 [2:24:31<1:30:12,  2.07s/it] 61%|██████▏   | 4174/6790 [2:24:34<1:33:42,  2.15s/it]                                                       {'loss': 1.4365, 'learning_rate': 0.00013303946844354334, 'epoch': 0.61}
+ 61%|██████▏   | 4174/6790 [2:24:34<1:33:42,  2.15s/it] 61%|██████▏   | 4175/6790 [2:24:36<1:31:36,  2.10s/it]                                                       {'loss': 1.3175, 'learning_rate': 0.00013295097699873897, 'epoch': 0.61}
+ 61%|██████▏   | 4175/6790 [2:24:36<1:31:36,  2.10s/it] 62%|██████▏   | 4176/6790 [2:24:38<1:37:35,  2.24s/it]                                                       {'loss': 1.3862, 'learning_rate': 0.0001328625003395687, 'epoch': 0.62}
+ 62%|██████▏   | 4176/6790 [2:24:38<1:37:35,  2.24s/it] 62%|██████▏   | 4177/6790 [2:24:40<1:33:09,  2.14s/it]                                                       {'loss': 1.2749, 'learning_rate': 0.00013277403848554347, 'epoch': 0.62}
+ 62%|██████▏   | 4177/6790 [2:24:40<1:33:09,  2.14s/it] 62%|██████▏   | 4178/6790 [2:24:42<1:31:05,  2.09s/it]                                                       {'loss': 1.3735, 'learning_rate': 0.00013268559145617075, 'epoch': 0.62}
+ 62%|██████▏   | 4178/6790 [2:24:42<1:31:05,  2.09s/it] 62%|██████▏   | 4179/6790 [2:24:44<1:33:48,  2.16s/it]                                                       {'loss': 1.4545, 'learning_rate': 0.0001325971592709549, 'epoch': 0.62}
+ 62%|██████▏   | 4179/6790 [2:24:44<1:33:48,  2.16s/it] 62%|██████▏   | 4180/6790 [2:24:46<1:34:32,  2.17s/it]                                                       {'loss': 1.453, 'learning_rate': 0.0001325087419493971, 'epoch': 0.62}
+ 62%|██████▏   | 4180/6790 [2:24:46<1:34:32,  2.17s/it] 62%|██████▏   | 4181/6790 [2:24:49<1:33:42,  2.16s/it]                                                       {'loss': 1.3253, 'learning_rate': 0.00013242033951099496, 'epoch': 0.62}
+ 62%|██████▏   | 4181/6790 [2:24:49<1:33:42,  2.16s/it] 62%|██████▏   | 4182/6790 [2:24:51<1:38:56,  2.28s/it]                                                       {'loss': 1.4904, 'learning_rate': 0.000132331951975243, 'epoch': 0.62}
+ 62%|██████▏   | 4182/6790 [2:24:51<1:38:56,  2.28s/it] 62%|██████▏   | 4183/6790 [2:24:53<1:34:57,  2.19s/it]                                                       {'loss': 1.5006, 'learning_rate': 0.00013224357936163247, 'epoch': 0.62}
+ 62%|██████▏   | 4183/6790 [2:24:53<1:34:57,  2.19s/it] 62%|██████▏   | 4184/6790 [2:24:55<1:34:46,  2.18s/it]                                                       {'loss': 1.4799, 'learning_rate': 0.00013215522168965124, 'epoch': 0.62}
+ 62%|██████▏   | 4184/6790 [2:24:55<1:34:46,  2.18s/it] 62%|██████▏   | 4185/6790 [2:24:57<1:33:12,  2.15s/it]                                                       {'loss': 1.5781, 'learning_rate': 0.0001320668789787839, 'epoch': 0.62}
+ 62%|██████▏   | 4185/6790 [2:24:57<1:33:12,  2.15s/it] 62%|██████▏   | 4186/6790 [2:24:59<1:29:10,  2.05s/it]                                                       {'loss': 1.4123, 'learning_rate': 0.0001319785512485118, 'epoch': 0.62}
+ 62%|██████▏   | 4186/6790 [2:24:59<1:29:10,  2.05s/it] 62%|██████▏   | 4187/6790 [2:25:01<1:25:53,  1.98s/it]                                                       {'loss': 1.3535, 'learning_rate': 0.00013189023851831292, 'epoch': 0.62}
+ 62%|██████▏   | 4187/6790 [2:25:01<1:25:53,  1.98s/it] 62%|██████▏   | 4188/6790 [2:25:03<1:25:28,  1.97s/it]                                                       {'loss': 1.496, 'learning_rate': 0.00013180194080766197, 'epoch': 0.62}
+ 62%|██████▏   | 4188/6790 [2:25:03<1:25:28,  1.97s/it] 62%|██████▏   | 4189/6790 [2:25:05<1:23:22,  1.92s/it]                                                       {'loss': 1.3635, 'learning_rate': 0.0001317136581360303, 'epoch': 0.62}
+ 62%|██████▏   | 4189/6790 [2:25:05<1:23:22,  1.92s/it] 62%|██████▏   | 4190/6790 [2:25:07<1:26:14,  1.99s/it]                                                       {'loss': 1.7743, 'learning_rate': 0.00013162539052288615, 'epoch': 0.62}
+ 62%|██████▏   | 4190/6790 [2:25:07<1:26:14,  1.99s/it] 62%|██████▏   | 4191/6790 [2:25:09<1:26:40,  2.00s/it]                                                       {'loss': 1.4197, 'learning_rate': 0.000131537137987694, 'epoch': 0.62}
+ 62%|██████▏   | 4191/6790 [2:25:09<1:26:40,  2.00s/it] 62%|██████▏   | 4192/6790 [2:25:11<1:25:36,  1.98s/it]                                                       {'loss': 1.2918, 'learning_rate': 0.00013144890054991558, 'epoch': 0.62}
+ 62%|██████▏   | 4192/6790 [2:25:11<1:25:36,  1.98s/it] 62%|██████▏   | 4193/6790 [2:25:13<1:28:12,  2.04s/it]                                                       {'loss': 1.2159, 'learning_rate': 0.0001313606782290087, 'epoch': 0.62}
+ 62%|██████▏   | 4193/6790 [2:25:13<1:28:12,  2.04s/it] 62%|██████▏   | 4194/6790 [2:25:15<1:27:23,  2.02s/it]                                                       {'loss': 1.4458, 'learning_rate': 0.00013127247104442836, 'epoch': 0.62}
+ 62%|██████▏   | 4194/6790 [2:25:15<1:27:23,  2.02s/it] 62%|██████▏   | 4195/6790 [2:25:17<1:28:01,  2.04s/it]                                                       {'loss': 1.4626, 'learning_rate': 0.00013118427901562583, 'epoch': 0.62}
+ 62%|██████▏   | 4195/6790 [2:25:17<1:28:01,  2.04s/it] 62%|██████▏   | 4196/6790 [2:25:19<1:27:36,  2.03s/it]                                                       {'loss': 1.5021, 'learning_rate': 0.00013109610216204923, 'epoch': 0.62}
+ 62%|██████▏   | 4196/6790 [2:25:19<1:27:36,  2.03s/it] 62%|██████▏   | 4197/6790 [2:25:21<1:26:28,  2.00s/it]                                                       {'loss': 1.1234, 'learning_rate': 0.00013100794050314337, 'epoch': 0.62}
+ 62%|██████▏   | 4197/6790 [2:25:21<1:26:28,  2.00s/it] 62%|██████▏   | 4198/6790 [2:25:23<1:25:54,  1.99s/it]                                                       {'loss': 1.5599, 'learning_rate': 0.00013091979405834958, 'epoch': 0.62}
+ 62%|██████▏   | 4198/6790 [2:25:23<1:25:54,  1.99s/it] 62%|██████▏   | 4199/6790 [2:25:25<1:27:30,  2.03s/it]                                                       {'loss': 1.3212, 'learning_rate': 0.00013083166284710593, 'epoch': 0.62}
+ 62%|██████▏   | 4199/6790 [2:25:25<1:27:30,  2.03s/it] 62%|██████▏   | 4200/6790 [2:25:27<1:26:15,  2.00s/it]                                                       {'loss': 1.3623, 'learning_rate': 0.00013074354688884696, 'epoch': 0.62}
+ 62%|██████▏   | 4200/6790 [2:25:27<1:26:15,  2.00s/it] 62%|██████▏   | 4201/6790 [2:25:29<1:30:07,  2.09s/it]                                                       {'loss': 1.3424, 'learning_rate': 0.0001306554462030042, 'epoch': 0.62}
+ 62%|██████▏   | 4201/6790 [2:25:29<1:30:07,  2.09s/it] 62%|██████▏   | 4202/6790 [2:25:31<1:30:03,  2.09s/it]                                                       {'loss': 1.5376, 'learning_rate': 0.00013056736080900537, 'epoch': 0.62}
+ 62%|██████▏   | 4202/6790 [2:25:31<1:30:03,  2.09s/it] 62%|██████▏   | 4203/6790 [2:25:33<1:26:29,  2.01s/it]                                                       {'loss': 1.3847, 'learning_rate': 0.00013047929072627522, 'epoch': 0.62}
+ 62%|██████▏   | 4203/6790 [2:25:33<1:26:29,  2.01s/it] 62%|██████▏   | 4204/6790 [2:25:35<1:27:10,  2.02s/it]                                                       {'loss': 1.4111, 'learning_rate': 0.00013039123597423483, 'epoch': 0.62}
+ 62%|██████▏   | 4204/6790 [2:25:35<1:27:10,  2.02s/it] 62%|██████▏   | 4205/6790 [2:25:38<1:30:09,  2.09s/it]                                                       {'loss': 1.2838, 'learning_rate': 0.0001303031965723021, 'epoch': 0.62}
+ 62%|██████▏   | 4205/6790 [2:25:38<1:30:09,  2.09s/it] 62%|██████▏   | 4206/6790 [2:25:39<1:27:38,  2.03s/it]                                                       {'loss': 1.1769, 'learning_rate': 0.00013021517253989135, 'epoch': 0.62}
+ 62%|██████▏   | 4206/6790 [2:25:39<1:27:38,  2.03s/it] 62%|██████▏   | 4207/6790 [2:25:41<1:24:24,  1.96s/it]                                                       {'loss': 1.3277, 'learning_rate': 0.0001301271638964137, 'epoch': 0.62}
+ 62%|██████▏   | 4207/6790 [2:25:41<1:24:24,  1.96s/it] 62%|██████▏   | 4208/6790 [2:25:43<1:22:36,  1.92s/it]                                                       {'loss': 1.3136, 'learning_rate': 0.00013003917066127678, 'epoch': 0.62}
+ 62%|██████▏   | 4208/6790 [2:25:43<1:22:36,  1.92s/it] 62%|██████▏   | 4209/6790 [2:25:46<1:30:06,  2.09s/it]                                                       {'loss': 1.5382, 'learning_rate': 0.00012995119285388483, 'epoch': 0.62}
+ 62%|██████▏   | 4209/6790 [2:25:46<1:30:06,  2.09s/it] 62%|██████▏   | 4210/6790 [2:25:48<1:31:42,  2.13s/it]                                                       {'loss': 1.4289, 'learning_rate': 0.00012986323049363863, 'epoch': 0.62}
+ 62%|██████▏   | 4210/6790 [2:25:48<1:31:42,  2.13s/it] 62%|██████▏   | 4211/6790 [2:25:50<1:27:48,  2.04s/it]                                                       {'loss': 1.2661, 'learning_rate': 0.00012977528359993574, 'epoch': 0.62}
+ 62%|██████▏   | 4211/6790 [2:25:50<1:27:48,  2.04s/it] 62%|██████▏   | 4212/6790 [2:25:52<1:30:16,  2.10s/it]                                                       {'loss': 1.544, 'learning_rate': 0.00012968735219217006, 'epoch': 0.62}
+ 62%|██████▏   | 4212/6790 [2:25:52<1:30:16,  2.10s/it] 62%|██████▏   | 4213/6790 [2:25:54<1:27:49,  2.04s/it]                                                       {'loss': 1.3432, 'learning_rate': 0.00012959943628973228, 'epoch': 0.62}
+ 62%|██████▏   | 4213/6790 [2:25:54<1:27:49,  2.04s/it] 62%|██████���   | 4214/6790 [2:25:56<1:27:11,  2.03s/it]                                                       {'loss': 1.6017, 'learning_rate': 0.00012951153591200963, 'epoch': 0.62}
+ 62%|██████▏   | 4214/6790 [2:25:56<1:27:11,  2.03s/it] 62%|██████▏   | 4215/6790 [2:25:58<1:29:04,  2.08s/it]                                                       {'loss': 1.454, 'learning_rate': 0.00012942365107838582, 'epoch': 0.62}
+ 62%|██████▏   | 4215/6790 [2:25:58<1:29:04,  2.08s/it] 62%|██████▏   | 4216/6790 [2:26:00<1:27:20,  2.04s/it]                                                       {'loss': 1.3108, 'learning_rate': 0.0001293357818082412, 'epoch': 0.62}
+ 62%|██████▏   | 4216/6790 [2:26:00<1:27:20,  2.04s/it] 62%|██████▏   | 4217/6790 [2:26:02<1:27:20,  2.04s/it]                                                       {'loss': 1.4731, 'learning_rate': 0.00012924792812095268, 'epoch': 0.62}
+ 62%|██████▏   | 4217/6790 [2:26:02<1:27:20,  2.04s/it] 62%|██████▏   | 4218/6790 [2:26:04<1:32:46,  2.16s/it]                                                       {'loss': 1.4617, 'learning_rate': 0.00012916009003589374, 'epoch': 0.62}
+ 62%|██████▏   | 4218/6790 [2:26:04<1:32:46,  2.16s/it] 62%|██████▏   | 4219/6790 [2:26:07<1:37:16,  2.27s/it]                                                       {'loss': 1.4111, 'learning_rate': 0.00012907226757243444, 'epoch': 0.62}
+ 62%|██████▏   | 4219/6790 [2:26:07<1:37:16,  2.27s/it] 62%|██████▏   | 4220/6790 [2:26:09<1:35:09,  2.22s/it]                                                       {'loss': 1.3247, 'learning_rate': 0.0001289844607499413, 'epoch': 0.62}
+ 62%|██████▏   | 4220/6790 [2:26:09<1:35:09,  2.22s/it] 62%|██████▏   | 4221/6790 [2:26:11<1:32:59,  2.17s/it]                                                       {'loss': 1.6429, 'learning_rate': 0.00012889666958777748, 'epoch': 0.62}
+ 62%|██████▏   | 4221/6790 [2:26:11<1:32:59,  2.17s/it] 62%|██████▏   | 4222/6790 [2:26:13<1:31:54,  2.15s/it]                                                       {'loss': 1.5138, 'learning_rate': 0.0001288088941053027, 'epoch': 0.62}
+ 62%|██████▏   | 4222/6790 [2:26:13<1:31:54,  2.15s/it] 62%|██████▏   | 4223/6790 [2:26:15<1:29:08,  2.08s/it]                                                       {'loss': 1.2302, 'learning_rate': 0.00012872113432187317, 'epoch': 0.62}
+ 62%|██████▏   | 4223/6790 [2:26:15<1:29:08,  2.08s/it] 62%|██████▏   | 4224/6790 [2:26:17<1:26:45,  2.03s/it]                                                       {'loss': 1.3034, 'learning_rate': 0.00012863339025684172, 'epoch': 0.62}
+ 62%|██████▏   | 4224/6790 [2:26:17<1:26:45,  2.03s/it] 62%|██████▏   | 4225/6790 [2:26:19<1:28:01,  2.06s/it]                                                       {'loss': 1.3346, 'learning_rate': 0.00012854566192955748, 'epoch': 0.62}
+ 62%|██████▏   | 4225/6790 [2:26:19<1:28:01,  2.06s/it] 62%|██████▏   | 4226/6790 [2:26:21<1:30:06,  2.11s/it]                                                       {'loss': 1.3913, 'learning_rate': 0.00012845794935936646, 'epoch': 0.62}
+ 62%|██████▏   | 4226/6790 [2:26:21<1:30:06,  2.11s/it] 62%|██████▏   | 4227/6790 [2:26:23<1:29:07,  2.09s/it]                                                       {'loss': 1.4029, 'learning_rate': 0.0001283702525656109, 'epoch': 0.62}
+ 62%|██████▏   | 4227/6790 [2:26:23<1:29:07,  2.09s/it] 62%|██████▏   | 4228/6790 [2:26:25<1:26:46,  2.03s/it]                                                       {'loss': 1.3983, 'learning_rate': 0.00012828257156762972, 'epoch': 0.62}
+ 62%|██████▏   | 4228/6790 [2:26:25<1:26:46,  2.03s/it] 62%|██████▏   | 4229/6790 [2:26:27<1:23:50,  1.96s/it]                                                       {'loss': 1.5253, 'learning_rate': 0.00012819490638475833, 'epoch': 0.62}
+ 62%|██████▏   | 4229/6790 [2:26:27<1:23:50,  1.96s/it] 62%|██████▏   | 4230/6790 [2:26:29<1:26:36,  2.03s/it]                                                       {'loss': 1.446, 'learning_rate': 0.00012810725703632858, 'epoch': 0.62}
+ 62%|██████▏   | 4230/6790 [2:26:29<1:26:36,  2.03s/it] 62%|██████▏   | 4231/6790 [2:26:31<1:27:50,  2.06s/it]                                                       {'loss': 1.3592, 'learning_rate': 0.00012801962354166898, 'epoch': 0.62}
+ 62%|██████▏   | 4231/6790 [2:26:31<1:27:50,  2.06s/it] 62%|██████▏   | 4232/6790 [2:26:34<1:28:46,  2.08s/it]                                                       {'loss': 1.4538, 'learning_rate': 0.00012793200592010426, 'epoch': 0.62}
+ 62%|██████▏   | 4232/6790 [2:26:34<1:28:46,  2.08s/it] 62%|██████▏   | 4233/6790 [2:26:36<1:31:04,  2.14s/it]                                                       {'loss': 1.5118, 'learning_rate': 0.0001278444041909561, 'epoch': 0.62}
+ 62%|██████▏   | 4233/6790 [2:26:36<1:31:04,  2.14s/it] 62%|██████▏   | 4234/6790 [2:26:38<1:29:33,  2.10s/it]                                                       {'loss': 1.4665, 'learning_rate': 0.00012775681837354217, 'epoch': 0.62}
+ 62%|██████▏   | 4234/6790 [2:26:38<1:29:33,  2.10s/it] 62%|██████▏   | 4235/6790 [2:26:40<1:25:38,  2.01s/it]                                                       {'loss': 1.4096, 'learning_rate': 0.00012766924848717706, 'epoch': 0.62}
+ 62%|██████▏   | 4235/6790 [2:26:40<1:25:38,  2.01s/it] 62%|██████▏   | 4236/6790 [2:26:42<1:24:45,  1.99s/it]                                                       {'loss': 1.6136, 'learning_rate': 0.00012758169455117147, 'epoch': 0.62}
+ 62%|██████▏   | 4236/6790 [2:26:42<1:24:45,  1.99s/it] 62%|██████▏   | 4237/6790 [2:26:44<1:23:37,  1.97s/it]                                                       {'loss': 1.269, 'learning_rate': 0.00012749415658483296, 'epoch': 0.62}
+ 62%|██████▏   | 4237/6790 [2:26:44<1:23:37,  1.97s/it] 62%|██████▏   | 4238/6790 [2:26:46<1:25:49,  2.02s/it]                                                       {'loss': 1.5011, 'learning_rate': 0.00012740663460746526, 'epoch': 0.62}
+ 62%|██████▏   | 4238/6790 [2:26:46<1:25:49,  2.02s/it] 62%|██████▏   | 4239/6790 [2:26:47<1:23:09,  1.96s/it]                                                       {'loss': 1.4092, 'learning_rate': 0.00012731912863836876, 'epoch': 0.62}
+ 62%|██████▏   | 4239/6790 [2:26:47<1:23:09,  1.96s/it] 62%|██████▏   | 4240/6790 [2:26:49<1:22:48,  1.95s/it]                                                       {'loss': 1.3091, 'learning_rate': 0.00012723163869684018, 'epoch': 0.62}
+ 62%|██████▏   | 4240/6790 [2:26:49<1:22:48,  1.95s/it] 62%|██████▏   | 4241/6790 [2:26:52<1:25:41,  2.02s/it]                                                       {'loss': 1.4337, 'learning_rate': 0.00012714416480217287, 'epoch': 0.62}
+ 62%|██████▏   | 4241/6790 [2:26:52<1:25:41,  2.02s/it] 62%|██████▏   | 4242/6790 [2:26:54<1:26:40,  2.04s/it]                                                       {'loss': 1.5291, 'learning_rate': 0.00012705670697365647, 'epoch': 0.62}
+ 62%|██████▏   | 4242/6790 [2:26:54<1:26:40,  2.04s/it] 62%|██████▏   | 4243/6790 [2:26:56<1:28:52,  2.09s/it]                                                       {'loss': 1.385, 'learning_rate': 0.00012696926523057727, 'epoch': 0.62}
+ 62%|██████▏   | 4243/6790 [2:26:56<1:28:52,  2.09s/it] 63%|██████▎   | 4244/6790 [2:26:58<1:26:15,  2.03s/it]                                                       {'loss': 1.5216, 'learning_rate': 0.00012688183959221776, 'epoch': 0.63}
+ 63%|██████▎   | 4244/6790 [2:26:58<1:26:15,  2.03s/it] 63%|██████▎   | 4245/6790 [2:27:00<1:24:44,  2.00s/it]                                                       {'loss': 1.431, 'learning_rate': 0.00012679443007785715, 'epoch': 0.63}
+ 63%|██████▎   | 4245/6790 [2:27:00<1:24:44,  2.00s/it] 63%|██████▎   | 4246/6790 [2:27:02<1:29:24,  2.11s/it]                                                       {'loss': 1.619, 'learning_rate': 0.00012670703670677083, 'epoch': 0.63}
+ 63%|██████▎   | 4246/6790 [2:27:02<1:29:24,  2.11s/it] 63%|██████▎   | 4247/6790 [2:27:04<1:28:53,  2.10s/it]                                                       {'loss': 1.5466, 'learning_rate': 0.00012661965949823084, 'epoch': 0.63}
+ 63%|██████▎   | 4247/6790 [2:27:04<1:28:53,  2.10s/it] 63%|██████▎   | 4248/6790 [2:27:06<1:25:51,  2.03s/it]                                                       {'loss': 1.5093, 'learning_rate': 0.00012653229847150565, 'epoch': 0.63}
+ 63%|██████▎   | 4248/6790 [2:27:06<1:25:51,  2.03s/it] 63%|██████▎   | 4249/6790 [2:27:08<1:26:35,  2.04s/it]                                                       {'loss': 1.336, 'learning_rate': 0.00012644495364585998, 'epoch': 0.63}
+ 63%|██████▎   | 4249/6790 [2:27:08<1:26:35,  2.04s/it] 63%|██████▎   | 4250/6790 [2:27:10<1:26:05,  2.03s/it]                                                       {'loss': 1.3527, 'learning_rate': 0.00012635762504055516, 'epoch': 0.63}
+ 63%|██████▎   | 4250/6790 [2:27:10<1:26:05,  2.03s/it] 63%|██████▎   | 4251/6790 [2:27:12<1:23:55,  1.98s/it]                                                       {'loss': 1.4285, 'learning_rate': 0.0001262703126748488, 'epoch': 0.63}
+ 63%|██████▎   | 4251/6790 [2:27:12<1:23:55,  1.98s/it] 63%|██████▎   | 4252/6790 [2:27:14<1:23:51,  1.98s/it]                                                       {'loss': 1.5427, 'learning_rate': 0.00012618301656799509, 'epoch': 0.63}
+ 63%|██████▎   | 4252/6790 [2:27:14<1:23:51,  1.98s/it] 63%|██████▎   | 4253/6790 [2:27:16<1:25:18,  2.02s/it]                                                       {'loss': 1.6709, 'learning_rate': 0.00012609573673924449, 'epoch': 0.63}
+ 63%|██████▎   | 4253/6790 [2:27:16<1:25:18,  2.02s/it] 63%|██████▎   | 4254/6790 [2:27:18<1:25:03,  2.01s/it]                                                       {'loss': 1.5119, 'learning_rate': 0.00012600847320784397, 'epoch': 0.63}
+ 63%|██████▎   | 4254/6790 [2:27:18<1:25:03,  2.01s/it] 63%|██████▎   | 4255/6790 [2:27:20<1:29:31,  2.12s/it]                                                       {'loss': 1.3768, 'learning_rate': 0.00012592122599303673, 'epoch': 0.63}
+ 63%|██████▎   | 4255/6790 [2:27:20<1:29:31,  2.12s/it] 63%|██████▎   | 4256/6790 [2:27:22<1:26:53,  2.06s/it]                                                       {'loss': 1.3384, 'learning_rate': 0.00012583399511406277, 'epoch': 0.63}
+ 63%|██████▎   | 4256/6790 [2:27:22<1:26:53,  2.06s/it] 63%|██████▎   | 4257/6790 [2:27:24<1:27:01,  2.06s/it]                                                       {'loss': 1.5113, 'learning_rate': 0.00012574678059015787, 'epoch': 0.63}
+ 63%|██████▎   | 4257/6790 [2:27:24<1:27:01,  2.06s/it] 63%|██████▎   | 4258/6790 [2:27:26<1:24:05,  1.99s/it]                                                       {'loss': 1.236, 'learning_rate': 0.0001256595824405549, 'epoch': 0.63}
+ 63%|██████▎   | 4258/6790 [2:27:26<1:24:05,  1.99s/it] 63%|██████▎   | 4259/6790 [2:27:28<1:23:04,  1.97s/it]                                                       {'loss': 1.5722, 'learning_rate': 0.0001255724006844825, 'epoch': 0.63}
+ 63%|██████▎   | 4259/6790 [2:27:28<1:23:04,  1.97s/it] 63%|██████▎   | 4260/6790 [2:27:30<1:27:47,  2.08s/it]                                                       {'loss': 1.4242, 'learning_rate': 0.00012548523534116617, 'epoch': 0.63}
+ 63%|██████▎   | 4260/6790 [2:27:30<1:27:47,  2.08s/it] 63%|██████▎   | 4261/6790 [2:27:32<1:25:36,  2.03s/it]                                                       {'loss': 1.6749, 'learning_rate': 0.00012539808642982747, 'epoch': 0.63}
+ 63%|██████▎   | 4261/6790 [2:27:32<1:25:36,  2.03s/it] 63%|██████▎   | 4262/6790 [2:27:34<1:21:57,  1.95s/it]                                                       {'loss': 1.1931, 'learning_rate': 0.00012531095396968453, 'epoch': 0.63}
+ 63%|██████▎   | 4262/6790 [2:27:34<1:21:57,  1.95s/it] 63%|██████▎   | 4263/6790 [2:27:36<1:23:20,  1.98s/it]                                                       {'loss': 1.6093, 'learning_rate': 0.0001252238379799517, 'epoch': 0.63}
+ 63%|██████▎   | 4263/6790 [2:27:36<1:23:20,  1.98s/it] 63%|██████▎   | 4264/6790 [2:27:38<1:23:24,  1.98s/it]                                                       {'loss': 1.5424, 'learning_rate': 0.00012513673847983978, 'epoch': 0.63}
+ 63%|██████▎   | 4264/6790 [2:27:38<1:23:24,  1.98s/it] 63%|██████▎   | 4265/6790 [2:27:40<1:22:22,  1.96s/it]                                                       {'loss': 1.5897, 'learning_rate': 0.00012504965548855608, 'epoch': 0.63}
+ 63%|██████▎   | 4265/6790 [2:27:40<1:22:22,  1.96s/it] 63%|██████▎   | 4266/6790 [2:27:42<1:22:24,  1.96s/it]                                                       {'loss': 1.4477, 'learning_rate': 0.0001249625890253039, 'epoch': 0.63}
+ 63%|██████▎   | 4266/6790 [2:27:42<1:22:24,  1.96s/it] 63%|██████▎   | 4267/6790 [2:27:44<1:21:33,  1.94s/it]                                                       {'loss': 1.2188, 'learning_rate': 0.00012487553910928338, 'epoch': 0.63}
+ 63%|██████▎   | 4267/6790 [2:27:44<1:21:33,  1.94s/it] 63%|██████▎   | 4268/6790 [2:27:46<1:23:51,  1.99s/it]                                                       {'loss': 1.3908, 'learning_rate': 0.00012478850575969042, 'epoch': 0.63}
+ 63%|██████▎   | 4268/6790 [2:27:46<1:23:51,  1.99s/it] 63%|██████▎   | 4269/6790 [2:27:48<1:23:18,  1.98s/it]                                                       {'loss': 1.3214, 'learning_rate': 0.00012470148899571787, 'epoch': 0.63}
+ 63%|██████▎   | 4269/6790 [2:27:48<1:23:18,  1.98s/it] 63%|██████▎   | 4270/6790 [2:27:50<1:23:53,  2.00s/it]                                                       {'loss': 1.3832, 'learning_rate': 0.00012461448883655448, 'epoch': 0.63}
+ 63%|██████��   | 4270/6790 [2:27:50<1:23:53,  2.00s/it] 63%|██████▎   | 4271/6790 [2:27:52<1:22:36,  1.97s/it]                                                       {'loss': 1.3532, 'learning_rate': 0.00012452750530138565, 'epoch': 0.63}
+ 63%|██████▎   | 4271/6790 [2:27:52<1:22:36,  1.97s/it] 63%|██████▎   | 4272/6790 [2:27:54<1:22:30,  1.97s/it]                                                       {'loss': 1.5133, 'learning_rate': 0.0001244405384093928, 'epoch': 0.63}
+ 63%|██████▎   | 4272/6790 [2:27:54<1:22:30,  1.97s/it] 63%|██████▎   | 4273/6790 [2:27:56<1:18:57,  1.88s/it]                                                       {'loss': 1.238, 'learning_rate': 0.000124353588179754, 'epoch': 0.63}
+ 63%|██████▎   | 4273/6790 [2:27:56<1:18:57,  1.88s/it] 63%|██████▎   | 4274/6790 [2:27:58<1:19:41,  1.90s/it]                                                       {'loss': 1.4714, 'learning_rate': 0.00012426665463164335, 'epoch': 0.63}
+ 63%|██████▎   | 4274/6790 [2:27:58<1:19:41,  1.90s/it] 63%|██████▎   | 4275/6790 [2:27:59<1:16:21,  1.82s/it]                                                       {'loss': 1.2851, 'learning_rate': 0.00012417973778423153, 'epoch': 0.63}
+ 63%|██████▎   | 4275/6790 [2:27:59<1:16:21,  1.82s/it] 63%|██████▎   | 4276/6790 [2:28:01<1:17:49,  1.86s/it]                                                       {'loss': 1.2859, 'learning_rate': 0.00012409283765668535, 'epoch': 0.63}
+ 63%|██████▎   | 4276/6790 [2:28:01<1:17:49,  1.86s/it] 63%|██████▎   | 4277/6790 [2:28:03<1:19:42,  1.90s/it]                                                       {'loss': 1.4669, 'learning_rate': 0.0001240059542681681, 'epoch': 0.63}
+ 63%|██████▎   | 4277/6790 [2:28:03<1:19:42,  1.90s/it] 63%|██████▎   | 4278/6790 [2:28:05<1:24:55,  2.03s/it]                                                       {'loss': 1.3611, 'learning_rate': 0.0001239190876378391, 'epoch': 0.63}
+ 63%|██████▎   | 4278/6790 [2:28:05<1:24:55,  2.03s/it] 63%|██████▎   | 4279/6790 [2:28:07<1:22:16,  1.97s/it]                                                       {'loss': 1.557, 'learning_rate': 0.00012383223778485443, 'epoch': 0.63}
+ 63%|██████▎   | 4279/6790 [2:28:07<1:22:16,  1.97s/it] 63%|██████▎   | 4280/6790 [2:28:10<1:25:48,  2.05s/it]                                                       {'loss': 1.4775, 'learning_rate': 0.00012374540472836592, 'epoch': 0.63}
+ 63%|██████▎   | 4280/6790 [2:28:10<1:25:48,  2.05s/it] 63%|██████▎   | 4281/6790 [2:28:12<1:28:29,  2.12s/it]                                                       {'loss': 1.4763, 'learning_rate': 0.0001236585884875221, 'epoch': 0.63}
+ 63%|██████▎   | 4281/6790 [2:28:12<1:28:29,  2.12s/it] 63%|██████▎   | 4282/6790 [2:28:14<1:25:19,  2.04s/it]                                                       {'loss': 1.1961, 'learning_rate': 0.00012357178908146773, 'epoch': 0.63}
+ 63%|██████▎   | 4282/6790 [2:28:14<1:25:19,  2.04s/it] 63%|██████▎   | 4283/6790 [2:28:16<1:26:08,  2.06s/it]                                                       {'loss': 1.5508, 'learning_rate': 0.00012348500652934372, 'epoch': 0.63}
+ 63%|██████▎   | 4283/6790 [2:28:16<1:26:08,  2.06s/it] 63%|██████▎   | 4284/6790 [2:28:18<1:23:33,  2.00s/it]                                                       {'loss': 1.4637, 'learning_rate': 0.00012339824085028735, 'epoch': 0.63}
+ 63%|██████▎   | 4284/6790 [2:28:18<1:23:33,  2.00s/it] 63%|██████▎   | 4285/6790 [2:28:20<1:25:31,  2.05s/it]                                                       {'loss': 1.3625, 'learning_rate': 0.00012331149206343213, 'epoch': 0.63}
+ 63%|██████▎   | 4285/6790 [2:28:20<1:25:31,  2.05s/it] 63%|██████▎   | 4286/6790 [2:28:22<1:23:24,  2.00s/it]                                                       {'loss': 1.5032, 'learning_rate': 0.00012322476018790794, 'epoch': 0.63}
+ 63%|██████▎   | 4286/6790 [2:28:22<1:23:24,  2.00s/it] 63%|██████▎   | 4287/6790 [2:28:24<1:25:14,  2.04s/it]                                                       {'loss': 1.5781, 'learning_rate': 0.00012313804524284082, 'epoch': 0.63}
+ 63%|██████▎   | 4287/6790 [2:28:24<1:25:14,  2.04s/it] 63%|██████▎   | 4288/6790 [2:28:26<1:23:53,  2.01s/it]                                                       {'loss': 1.32, 'learning_rate': 0.0001230513472473532, 'epoch': 0.63}
+ 63%|██████▎   | 4288/6790 [2:28:26<1:23:53,  2.01s/it] 63%|██████▎   | 4289/6790 [2:28:28<1:22:55,  1.99s/it]                                                       {'loss': 1.232, 'learning_rate': 0.00012296466622056356, 'epoch': 0.63}
+ 63%|██████▎   | 4289/6790 [2:28:28<1:22:55,  1.99s/it] 63%|██████▎   | 4290/6790 [2:28:30<1:20:51,  1.94s/it]                                                       {'loss': 1.2693, 'learning_rate': 0.000122878002181587, 'epoch': 0.63}
+ 63%|██████▎   | 4290/6790 [2:28:30<1:20:51,  1.94s/it] 63%|██████▎   | 4291/6790 [2:28:32<1:23:04,  1.99s/it]                                                       {'loss': 1.6021, 'learning_rate': 0.00012279135514953443, 'epoch': 0.63}
+ 63%|██████▎   | 4291/6790 [2:28:32<1:23:04,  1.99s/it] 63%|██████▎   | 4292/6790 [2:28:34<1:24:20,  2.03s/it]                                                       {'loss': 1.4783, 'learning_rate': 0.00012270472514351336, 'epoch': 0.63}
+ 63%|██████▎   | 4292/6790 [2:28:34<1:24:20,  2.03s/it] 63%|██████▎   | 4293/6790 [2:28:36<1:22:46,  1.99s/it]                                                       {'loss': 1.4317, 'learning_rate': 0.0001226181121826274, 'epoch': 0.63}
+ 63%|██████▎   | 4293/6790 [2:28:36<1:22:46,  1.99s/it] 63%|██████▎   | 4294/6790 [2:28:38<1:26:56,  2.09s/it]                                                       {'loss': 1.323, 'learning_rate': 0.00012253151628597642, 'epoch': 0.63}
+ 63%|██████▎   | 4294/6790 [2:28:38<1:26:56,  2.09s/it] 63%|██████▎   | 4295/6790 [2:28:42<1:48:52,  2.62s/it]                                                       {'loss': 1.4237, 'learning_rate': 0.00012244493747265645, 'epoch': 0.63}
+ 63%|██████▎   | 4295/6790 [2:28:42<1:48:52,  2.62s/it] 63%|██████▎   | 4296/6790 [2:28:44<1:40:38,  2.42s/it]                                                       {'loss': 1.4708, 'learning_rate': 0.0001223583757617599, 'epoch': 0.63}
+ 63%|██████▎   | 4296/6790 [2:28:44<1:40:38,  2.42s/it] 63%|██████▎   | 4297/6790 [2:28:46<1:36:46,  2.33s/it]                                                       {'loss': 1.5456, 'learning_rate': 0.0001222718311723754, 'epoch': 0.63}
+ 63%|██████▎   | 4297/6790 [2:28:46<1:36:46,  2.33s/it] 63%|██████▎   | 4298/6790 [2:28:48<1:30:38,  2.18s/it]                                                       {'loss': 1.3263, 'learning_rate': 0.00012218530372358756, 'epoch': 0.63}
+ 63%|██████▎   | 4298/6790 [2:28:48<1:30:38,  2.18s/it] 63%|██████▎   | 4299/6790 [2:28:50<1:27:10,  2.10s/it]                                                       {'loss': 1.3483, 'learning_rate': 0.00012209879343447763, 'epoch': 0.63}
+ 63%|██████▎   | 4299/6790 [2:28:50<1:27:10,  2.10s/it] 63%|██████▎   | 4300/6790 [2:28:52<1:27:46,  2.12s/it]                                                       {'loss': 1.3215, 'learning_rate': 0.00012201230032412257, 'epoch': 0.63}
+ 63%|██████▎   | 4300/6790 [2:28:52<1:27:46,  2.12s/it] 63%|██████▎   | 4301/6790 [2:28:54<1:30:15,  2.18s/it]                                                       {'loss': 1.4685, 'learning_rate': 0.00012192582441159606, 'epoch': 0.63}
+ 63%|██████▎   | 4301/6790 [2:28:54<1:30:15,  2.18s/it] 63%|██████▎   | 4302/6790 [2:28:56<1:32:31,  2.23s/it]                                                       {'loss': 1.5713, 'learning_rate': 0.00012183936571596758, 'epoch': 0.63}
+ 63%|██████▎   | 4302/6790 [2:28:56<1:32:31,  2.23s/it] 63%|██████▎   | 4303/6790 [2:28:58<1:29:57,  2.17s/it]                                                       {'loss': 1.595, 'learning_rate': 0.00012175292425630313, 'epoch': 0.63}
+ 63%|██████▎   | 4303/6790 [2:28:58<1:29:57,  2.17s/it] 63%|██████▎   | 4304/6790 [2:29:01<1:29:28,  2.16s/it]                                                       {'loss': 1.481, 'learning_rate': 0.0001216665000516646, 'epoch': 0.63}
+ 63%|██████▎   | 4304/6790 [2:29:01<1:29:28,  2.16s/it] 63%|██████▎   | 4305/6790 [2:29:03<1:32:13,  2.23s/it]                                                       {'loss': 1.5155, 'learning_rate': 0.00012158009312111036, 'epoch': 0.63}
+ 63%|██████▎   | 4305/6790 [2:29:03<1:32:13,  2.23s/it] 63%|██████▎   | 4306/6790 [2:29:05<1:29:03,  2.15s/it]                                                       {'loss': 1.4808, 'learning_rate': 0.00012149370348369476, 'epoch': 0.63}
+ 63%|██████▎   | 4306/6790 [2:29:05<1:29:03,  2.15s/it] 63%|██████▎   | 4307/6790 [2:29:07<1:25:27,  2.06s/it]                                                       {'loss': 1.5088, 'learning_rate': 0.00012140733115846847, 'epoch': 0.63}
+ 63%|██████▎   | 4307/6790 [2:29:07<1:25:27,  2.06s/it] 63%|██████▎   | 4308/6790 [2:29:09<1:28:02,  2.13s/it]                                                       {'loss': 1.2301, 'learning_rate': 0.00012132097616447828, 'epoch': 0.63}
+ 63%|██████▎   | 4308/6790 [2:29:09<1:28:02,  2.13s/it] 63%|██████▎   | 4309/6790 [2:29:12<1:36:39,  2.34s/it]                                                       {'loss': 1.4324, 'learning_rate': 0.00012123463852076717, 'epoch': 0.63}
+ 63%|██████▎   | 4309/6790 [2:29:12<1:36:39,  2.34s/it] 63%|██████▎   | 4310/6790 [2:29:14<1:31:28,  2.21s/it]                                                       {'loss': 1.4184, 'learning_rate': 0.0001211483182463743, 'epoch': 0.63}
+ 63%|██████▎   | 4310/6790 [2:29:14<1:31:28,  2.21s/it] 63%|██████▎   | 4311/6790 [2:29:16<1:30:02,  2.18s/it]                                                       {'loss': 1.5074, 'learning_rate': 0.00012106201536033501, 'epoch': 0.63}
+ 63%|██████▎   | 4311/6790 [2:29:16<1:30:02,  2.18s/it] 64%|██████▎   | 4312/6790 [2:29:18<1:28:01,  2.13s/it]                                                       {'loss': 1.5277, 'learning_rate': 0.00012097572988168072, 'epoch': 0.64}
+ 64%|██████▎   | 4312/6790 [2:29:18<1:28:01,  2.13s/it] 64%|██████▎   | 4313/6790 [2:29:20<1:27:41,  2.12s/it]                                                       {'loss': 1.4734, 'learning_rate': 0.00012088946182943914, 'epoch': 0.64}
+ 64%|██████▎   | 4313/6790 [2:29:20<1:27:41,  2.12s/it] 64%|██████▎   | 4314/6790 [2:29:22<1:27:07,  2.11s/it]                                                       {'loss': 1.5725, 'learning_rate': 0.00012080321122263414, 'epoch': 0.64}
+ 64%|██████▎   | 4314/6790 [2:29:22<1:27:07,  2.11s/it] 64%|██████▎   | 4315/6790 [2:29:24<1:22:55,  2.01s/it]                                                       {'loss': 1.2035, 'learning_rate': 0.00012071697808028557, 'epoch': 0.64}
+ 64%|██████▎   | 4315/6790 [2:29:24<1:22:55,  2.01s/it] 64%|██████▎   | 4316/6790 [2:29:26<1:21:52,  1.99s/it]                                                       {'loss': 1.4649, 'learning_rate': 0.00012063076242140967, 'epoch': 0.64}
+ 64%|██████▎   | 4316/6790 [2:29:26<1:21:52,  1.99s/it] 64%|██████▎   | 4317/6790 [2:29:28<1:20:19,  1.95s/it]                                                       {'loss': 1.3006, 'learning_rate': 0.00012054456426501852, 'epoch': 0.64}
+ 64%|██████▎   | 4317/6790 [2:29:28<1:20:19,  1.95s/it] 64%|██████▎   | 4318/6790 [2:29:30<1:24:27,  2.05s/it]                                                       {'loss': 1.3756, 'learning_rate': 0.0001204583836301207, 'epoch': 0.64}
+ 64%|██████▎   | 4318/6790 [2:29:30<1:24:27,  2.05s/it] 64%|██████▎   | 4319/6790 [2:29:32<1:23:41,  2.03s/it]                                                       {'loss': 1.3542, 'learning_rate': 0.00012037222053572059, 'epoch': 0.64}
+ 64%|██████▎   | 4319/6790 [2:29:32<1:23:41,  2.03s/it] 64%|██████▎   | 4320/6790 [2:29:34<1:22:45,  2.01s/it]                                                       {'loss': 1.584, 'learning_rate': 0.00012028607500081898, 'epoch': 0.64}
+ 64%|██████▎   | 4320/6790 [2:29:34<1:22:45,  2.01s/it] 64%|██████▎   | 4321/6790 [2:29:36<1:24:04,  2.04s/it]                                                       {'loss': 1.6489, 'learning_rate': 0.00012019994704441253, 'epoch': 0.64}
+ 64%|██████▎   | 4321/6790 [2:29:36<1:24:04,  2.04s/it] 64%|██████▎   | 4322/6790 [2:29:38<1:23:35,  2.03s/it]                                                       {'loss': 1.4246, 'learning_rate': 0.00012011383668549432, 'epoch': 0.64}
+ 64%|██████▎   | 4322/6790 [2:29:38<1:23:35,  2.03s/it] 64%|██████▎   | 4323/6790 [2:29:40<1:27:22,  2.13s/it]                                                       {'loss': 1.4131, 'learning_rate': 0.0001200277439430532, 'epoch': 0.64}
+ 64%|██████▎   | 4323/6790 [2:29:40<1:27:22,  2.13s/it] 64%|██████▎   | 4324/6790 [2:29:43<1:27:32,  2.13s/it]                                                       {'loss': 1.3749, 'learning_rate': 0.00011994166883607449, 'epoch': 0.64}
+ 64%|██████▎   | 4324/6790 [2:29:43<1:27:32,  2.13s/it] 64%|██████▎   | 4325/6790 [2:29:45<1:27:24,  2.13s/it]                                                       {'loss': 1.521, 'learning_rate': 0.00011985561138353936, 'epoch': 0.64}
+ 64%|██████▎   | 4325/6790 [2:29:45<1:27:24,  2.13s/it] 64%|██████▎   | 4326/6790 [2:29:47<1:26:00,  2.09s/it]                                                       {'loss': 1.6786, 'learning_rate': 0.0001197695716044252, 'epoch': 0.64}
+ 64%|██████▎   | 4326/6790 [2:29:47<1:26:00,  2.09s/it] 64%|██████▎   | 4327/6790 [2:29:49<1:27:00,  2.12s/it]                                                       {'loss': 1.2756, 'learning_rate': 0.00011968354951770544, 'epoch': 0.64}
+ 64%|██████▎   | 4327/6790 [2:29:49<1:27:00,  2.12s/it] 64%|██████▎   | 4328/6790 [2:29:51<1:25:39,  2.09s/it]                                                       {'loss': 1.3084, 'learning_rate': 0.00011959754514234973, 'epoch': 0.64}
+ 64%|██████▎   | 4328/6790 [2:29:51<1:25:39,  2.09s/it] 64%|██████▍   | 4329/6790 [2:29:53<1:20:51,  1.97s/it]                                                       {'loss': 1.4947, 'learning_rate': 0.00011951155849732365, 'epoch': 0.64}
+ 64%|██████▍   | 4329/6790 [2:29:53<1:20:51,  1.97s/it] 64%|██████▍   | 4330/6790 [2:29:55<1:20:07,  1.95s/it]                                                       {'loss': 1.3608, 'learning_rate': 0.00011942558960158896, 'epoch': 0.64}
+ 64%|██████▍   | 4330/6790 [2:29:55<1:20:07,  1.95s/it] 64%|██████▍   | 4331/6790 [2:29:57<1:23:52,  2.05s/it]                                                       {'loss': 1.3635, 'learning_rate': 0.00011933963847410366, 'epoch': 0.64}
+ 64%|██████▍   | 4331/6790 [2:29:57<1:23:52,  2.05s/it] 64%|██████▍   | 4332/6790 [2:29:59<1:28:39,  2.16s/it]                                                       {'loss': 1.4182, 'learning_rate': 0.00011925370513382141, 'epoch': 0.64}
+ 64%|██████▍   | 4332/6790 [2:29:59<1:28:39,  2.16s/it] 64%|██████▍   | 4333/6790 [2:30:01<1:29:16,  2.18s/it]                                                       {'loss': 1.4099, 'learning_rate': 0.00011916778959969248, 'epoch': 0.64}
+ 64%|██████▍   | 4333/6790 [2:30:01<1:29:16,  2.18s/it] 64%|██████▍   | 4334/6790 [2:30:03<1:27:13,  2.13s/it]                                                       {'loss': 1.1892, 'learning_rate': 0.00011908189189066268, 'epoch': 0.64}
+ 64%|██████▍   | 4334/6790 [2:30:03<1:27:13,  2.13s/it] 64%|██████▍   | 4335/6790 [2:30:05<1:24:56,  2.08s/it]                                                       {'loss': 1.4964, 'learning_rate': 0.00011899601202567434, 'epoch': 0.64}
+ 64%|██████▍   | 4335/6790 [2:30:05<1:24:56,  2.08s/it] 64%|██████▍   | 4336/6790 [2:30:08<1:25:24,  2.09s/it]                                                       {'loss': 1.3493, 'learning_rate': 0.0001189101500236656, 'epoch': 0.64}
+ 64%|██████▍   | 4336/6790 [2:30:08<1:25:24,  2.09s/it] 64%|██████▍   | 4337/6790 [2:30:10<1:28:32,  2.17s/it]                                                       {'loss': 1.197, 'learning_rate': 0.00011882430590357074, 'epoch': 0.64}
+ 64%|██████▍   | 4337/6790 [2:30:10<1:28:32,  2.17s/it] 64%|██████▍   | 4338/6790 [2:30:13<1:37:54,  2.40s/it]                                                       {'loss': 1.4022, 'learning_rate': 0.00011873847968432006, 'epoch': 0.64}
+ 64%|██████▍   | 4338/6790 [2:30:13<1:37:54,  2.40s/it] 64%|██████▍   | 4339/6790 [2:30:15<1:32:05,  2.25s/it]                                                       {'loss': 1.316, 'learning_rate': 0.00011865267138483999, 'epoch': 0.64}
+ 64%|██████▍   | 4339/6790 [2:30:15<1:32:05,  2.25s/it] 64%|██████▍   | 4340/6790 [2:30:17<1:26:52,  2.13s/it]                                                       {'loss': 1.3347, 'learning_rate': 0.00011856688102405287, 'epoch': 0.64}
+ 64%|██████▍   | 4340/6790 [2:30:17<1:26:52,  2.13s/it] 64%|██████▍   | 4341/6790 [2:30:19<1:27:12,  2.14s/it]                                                       {'loss': 1.455, 'learning_rate': 0.00011848110862087729, 'epoch': 0.64}
+ 64%|██████▍   | 4341/6790 [2:30:19<1:27:12,  2.14s/it] 64%|██████▍   | 4342/6790 [2:30:21<1:30:19,  2.21s/it]                                                       {'loss': 1.3964, 'learning_rate': 0.00011839535419422763, 'epoch': 0.64}
+ 64%|██████▍   | 4342/6790 [2:30:21<1:30:19,  2.21s/it] 64%|██████▍   | 4343/6790 [2:30:23<1:25:53,  2.11s/it]                                                       {'loss': 1.3377, 'learning_rate': 0.00011830961776301453, 'epoch': 0.64}
+ 64%|██████▍   | 4343/6790 [2:30:23<1:25:53,  2.11s/it] 64%|██████▍   | 4344/6790 [2:30:25<1:22:05,  2.01s/it]                                                       {'loss': 1.4097, 'learning_rate': 0.00011822389934614441, 'epoch': 0.64}
+ 64%|██████▍   | 4344/6790 [2:30:25<1:22:05,  2.01s/it] 64%|██████▍   | 4345/6790 [2:30:27<1:21:22,  2.00s/it]                                                       {'loss': 1.4702, 'learning_rate': 0.00011813819896252019, 'epoch': 0.64}
+ 64%|██████▍   | 4345/6790 [2:30:27<1:21:22,  2.00s/it] 64%|██████▍   | 4346/6790 [2:30:29<1:23:43,  2.06s/it]                                                       {'loss': 1.3874, 'learning_rate': 0.00011805251663104013, 'epoch': 0.64}
+ 64%|██████▍   | 4346/6790 [2:30:29<1:23:43,  2.06s/it] 64%|██████▍   | 4347/6790 [2:30:31<1:21:15,  2.00s/it]                                                       {'loss': 1.4534, 'learning_rate': 0.0001179668523705991, 'epoch': 0.64}
+ 64%|██████▍   | 4347/6790 [2:30:31<1:21:15,  2.00s/it] 64%|██████▍   | 4348/6790 [2:30:33<1:24:17,  2.07s/it]                                                       {'loss': 1.6284, 'learning_rate': 0.00011788120620008776, 'epoch': 0.64}
+ 64%|██████▍   | 4348/6790 [2:30:33<1:24:17,  2.07s/it] 64%|██████▍   | 4349/6790 [2:30:35<1:22:32,  2.03s/it]                                                       {'loss': 1.4947, 'learning_rate': 0.00011779557813839268, 'epoch': 0.64}
+ 64%|██████▍   | 4349/6790 [2:30:35<1:22:32,  2.03s/it] 64%|██████▍   | 4350/6790 [2:30:37<1:20:27,  1.98s/it]                                                       {'loss': 1.4208, 'learning_rate': 0.00011770996820439664, 'epoch': 0.64}
+ 64%|██████▍   | 4350/6790 [2:30:37<1:20:27,  1.98s/it] 64%|██████▍   | 4351/6790 [2:30:39<1:18:19,  1.93s/it]                                                       {'loss': 1.6158, 'learning_rate': 0.00011762437641697826, 'epoch': 0.64}
+ 64%|██████▍   | 4351/6790 [2:30:39<1:18:19,  1.93s/it] 64%|██████▍   | 4352/6790 [2:30:41<1:22:51,  2.04s/it]                                                       {'loss': 1.3955, 'learning_rate': 0.00011753880279501224, 'epoch': 0.64}
+ 64%|██████▍   | 4352/6790 [2:30:41<1:22:51,  2.04s/it] 64%|██████▍   | 4353/6790 [2:30:43<1:21:15,  2.00s/it]                                                       {'loss': 1.4783, 'learning_rate': 0.00011745324735736918, 'epoch': 0.64}
+ 64%|██████▍   | 4353/6790 [2:30:43<1:21:15,  2.00s/it] 64%|██████▍   | 4354/6790 [2:30:45<1:23:28,  2.06s/it]                                                       {'loss': 1.3542, 'learning_rate': 0.00011736771012291594, 'epoch': 0.64}
+ 64%|██████▍   | 4354/6790 [2:30:45<1:23:28,  2.06s/it] 64%|██████▍   | 4355/6790 [2:30:47<1:21:33,  2.01s/it]                                                       {'loss': 1.57, 'learning_rate': 0.00011728219111051491, 'epoch': 0.64}
+ 64%|██████▍   | 4355/6790 [2:30:47<1:21:33,  2.01s/it] 64%|██████▍   | 4356/6790 [2:30:49<1:21:30,  2.01s/it]                                                       {'loss': 1.3957, 'learning_rate': 0.00011719669033902497, 'epoch': 0.64}
+ 64%|██████▍   | 4356/6790 [2:30:49<1:21:30,  2.01s/it] 64%|██████▍   | 4357/6790 [2:30:51<1:20:31,  1.99s/it]                                                       {'loss': 1.4009, 'learning_rate': 0.00011711120782730049, 'epoch': 0.64}
+ 64%|██████▍   | 4357/6790 [2:30:51<1:20:31,  1.99s/it] 64%|██████▍   | 4358/6790 [2:30:53<1:17:51,  1.92s/it]                                                       {'loss': 1.1789, 'learning_rate': 0.0001170257435941923, 'epoch': 0.64}
+ 64%|██████▍   | 4358/6790 [2:30:53<1:17:51,  1.92s/it] 64%|██████▍   | 4359/6790 [2:30:55<1:19:47,  1.97s/it]                                                       {'loss': 1.4662, 'learning_rate': 0.00011694029765854675, 'epoch': 0.64}
+ 64%|██████▍   | 4359/6790 [2:30:55<1:19:47,  1.97s/it] 64%|██████▍   | 4360/6790 [2:30:57<1:24:01,  2.07s/it]                                                       {'loss': 1.4846, 'learning_rate': 0.00011685487003920648, 'epoch': 0.64}
+ 64%|██████▍   | 4360/6790 [2:30:57<1:24:01,  2.07s/it] 64%|██████▍   | 4361/6790 [2:31:00<1:30:20,  2.23s/it]                                                       {'loss': 1.2525, 'learning_rate': 0.00011676946075500984, 'epoch': 0.64}
+ 64%|██████▍   | 4361/6790 [2:31:00<1:30:20,  2.23s/it] 64%|██████▍   | 4362/6790 [2:31:03<1:47:23,  2.65s/it]                                                       {'loss': 1.4866, 'learning_rate': 0.00011668406982479148, 'epoch': 0.64}
+ 64%|██████▍   | 4362/6790 [2:31:03<1:47:23,  2.65s/it] 64%|██████▍   | 4363/6790 [2:31:05<1:40:40,  2.49s/it]                                                       {'loss': 1.5372, 'learning_rate': 0.00011659869726738155, 'epoch': 0.64}
+ 64%|██████▍   | 4363/6790 [2:31:05<1:40:40,  2.49s/it] 64%|██████▍   | 4364/6790 [2:31:07<1:35:55,  2.37s/it]                                                       {'loss': 1.3851, 'learning_rate': 0.00011651334310160651, 'epoch': 0.64}
+ 64%|██████▍   | 4364/6790 [2:31:07<1:35:55,  2.37s/it] 64%|██████▍   | 4365/6790 [2:31:10<1:32:59,  2.30s/it]                                                       {'loss': 1.6052, 'learning_rate': 0.00011642800734628862, 'epoch': 0.64}
+ 64%|██████▍   | 4365/6790 [2:31:10<1:32:59,  2.30s/it] 64%|██████▍   | 4366/6790 [2:31:11<1:27:53,  2.18s/it]                                                       {'loss': 1.3262, 'learning_rate': 0.00011634269002024609, 'epoch': 0.64}
+ 64%|██████▍   | 4366/6790 [2:31:11<1:27:53,  2.18s/it] 64%|██████▍   | 4367/6790 [2:31:13<1:24:04,  2.08s/it]                                                       {'loss': 1.3953, 'learning_rate': 0.00011625739114229316, 'epoch': 0.64}
+ 64%|██████▍   | 4367/6790 [2:31:13<1:24:04,  2.08s/it] 64%|██████▍   | 4368/6790 [2:31:15<1:24:23,  2.09s/it]                                                       {'loss': 1.5429, 'learning_rate': 0.00011617211073123977, 'epoch': 0.64}
+ 64%|██████▍   | 4368/6790 [2:31:15<1:24:23,  2.09s/it] 64%|██████▍   | 4369/6790 [2:31:17<1:23:20,  2.07s/it]                                                       {'loss': 1.4319, 'learning_rate': 0.00011608684880589203, 'epoch': 0.64}
+ 64%|██████▍   | 4369/6790 [2:31:17<1:23:20,  2.07s/it] 64%|██████▍   | 4370/6790 [2:31:20<1:24:22,  2.09s/it]                                                       {'loss': 1.3278, 'learning_rate': 0.0001160016053850518, 'epoch': 0.64}
+ 64%|██████▍   | 4370/6790 [2:31:20<1:24:22,  2.09s/it] 64%|██████▍   | 4371/6790 [2:31:22<1:23:38,  2.07s/it]                                                       {'loss': 1.581, 'learning_rate': 0.00011591638048751714, 'epoch': 0.64}
+ 64%|██████▍   | 4371/6790 [2:31:22<1:23:38,  2.07s/it] 64%|██████▍   | 4372/6790 [2:31:24<1:26:34,  2.15s/it]                                                       {'loss': 1.3854, 'learning_rate': 0.00011583117413208149, 'epoch': 0.64}
+ 64%|██████▍   | 4372/6790 [2:31:24<1:26:34,  2.15s/it] 64%|██████▍   | 4373/6790 [2:31:26<1:26:10,  2.14s/it]                                                       {'loss': 1.4162, 'learning_rate': 0.00011574598633753488, 'epoch': 0.64}
+ 64%|██████▍   | 4373/6790 [2:31:26<1:26:10,  2.14s/it] 64%|██████▍   | 4374/6790 [2:31:29<1:29:33,  2.22s/it]                                                       {'loss': 1.3609, 'learning_rate': 0.00011566081712266265, 'epoch': 0.64}
+ 64%|██████▍   | 4374/6790 [2:31:29<1:29:33,  2.22s/it] 64%|██████▍   | 4375/6790 [2:31:31<1:31:50,  2.28s/it]                                                       {'loss': 1.5203, 'learning_rate': 0.00011557566650624641, 'epoch': 0.64}
+ 64%|██████▍   | 4375/6790 [2:31:31<1:31:50,  2.28s/it] 64%|██████▍   | 4376/6790 [2:31:33<1:30:49,  2.26s/it]                                                       {'loss': 1.4895, 'learning_rate': 0.00011549053450706355, 'epoch': 0.64}
+ 64%|██████▍   | 4376/6790 [2:31:33<1:30:49,  2.26s/it] 64%|██████▍   | 4377/6790 [2:31:36<1:33:01,  2.31s/it]                                                       {'loss': 1.3025, 'learning_rate': 0.00011540542114388739, 'epoch': 0.64}
+ 64%|██████▍   | 4377/6790 [2:31:36<1:33:01,  2.31s/it] 64%|██████▍   | 4378/6790 [2:31:37<1:25:52,  2.14s/it]                                                       {'loss': 1.3553, 'learning_rate': 0.00011532032643548699, 'epoch': 0.64}
+ 64%|██████▍   | 4378/6790 [2:31:37<1:25:52,  2.14s/it] 64%|██████▍   | 4379/6790 [2:31:39<1:23:52,  2.09s/it]                                                       {'loss': 1.3474, 'learning_rate': 0.00011523525040062746, 'epoch': 0.64}
+ 64%|██████▍   | 4379/6790 [2:31:39<1:23:52,  2.09s/it] 65%|██████▍   | 4380/6790 [2:31:41<1:21:22,  2.03s/it]                                                       {'loss': 1.6392, 'learning_rate': 0.0001151501930580698, 'epoch': 0.65}
+ 65%|██████▍   | 4380/6790 [2:31:41<1:21:22,  2.03s/it] 65%|██████▍   | 4381/6790 [2:31:43<1:24:33,  2.11s/it]                                                       {'loss': 1.5818, 'learning_rate': 0.0001150651544265708, 'epoch': 0.65}
+ 65%|██████▍   | 4381/6790 [2:31:43<1:24:33,  2.11s/it] 65%|██████▍   | 4382/6790 [2:31:46<1:25:35,  2.13s/it]                                                       {'loss': 1.5031, 'learning_rate': 0.00011498013452488323, 'epoch': 0.65}
+ 65%|██████▍   | 4382/6790 [2:31:46<1:25:35,  2.13s/it] 65%|██████▍   | 4383/6790 [2:31:48<1:22:33,  2.06s/it]                                                       {'loss': 1.2948, 'learning_rate': 0.00011489513337175544, 'epoch': 0.65}
+ 65%|██████▍   | 4383/6790 [2:31:48<1:22:33,  2.06s/it] 65%|██████▍   | 4384/6790 [2:31:49<1:20:13,  2.00s/it]                                                       {'loss': 1.3366, 'learning_rate': 0.00011481015098593215, 'epoch': 0.65}
+ 65%|██████▍   | 4384/6790 [2:31:49<1:20:13,  2.00s/it] 65%|██████▍   | 4385/6790 [2:31:51<1:20:41,  2.01s/it]                                                       {'loss': 1.4105, 'learning_rate': 0.00011472518738615345, 'epoch': 0.65}
+ 65%|██████▍   | 4385/6790 [2:31:51<1:20:41,  2.01s/it] 65%|██████▍   | 4386/6790 [2:31:53<1:19:56,  2.00s/it]                                                       {'loss': 1.3779, 'learning_rate': 0.00011464024259115558, 'epoch': 0.65}
+ 65%|██████▍   | 4386/6790 [2:31:53<1:19:56,  2.00s/it] 65%|██████▍   | 4387/6790 [2:31:56<1:21:50,  2.04s/it]                                                       {'loss': 1.449, 'learning_rate': 0.0001145553166196705, 'epoch': 0.65}
+ 65%|██████▍   | 4387/6790 [2:31:56<1:21:50,  2.04s/it] 65%|██████▍   | 4388/6790 [2:31:57<1:19:26,  1.98s/it]                                                       {'loss': 1.3783, 'learning_rate': 0.00011447040949042618, 'epoch': 0.65}
+ 65%|██████▍   | 4388/6790 [2:31:57<1:19:26,  1.98s/it] 65%|██████▍   | 4389/6790 [2:32:00<1:23:29,  2.09s/it]                                                       {'loss': 1.5115, 'learning_rate': 0.00011438552122214617, 'epoch': 0.65}
+ 65%|██████▍   | 4389/6790 [2:32:00<1:23:29,  2.09s/it] 65%|██████▍   | 4390/6790 [2:32:02<1:20:23,  2.01s/it]                                                       {'loss': 1.3167, 'learning_rate': 0.00011430065183355003, 'epoch': 0.65}
+ 65%|██████▍   | 4390/6790 [2:32:02<1:20:23,  2.01s/it] 65%|██████▍   | 4391/6790 [2:32:03<1:19:42,  1.99s/it]                                                       {'loss': 1.4183, 'learning_rate': 0.0001142158013433532, 'epoch': 0.65}
+ 65%|██████▍   | 4391/6790 [2:32:04<1:19:42,  1.99s/it] 65%|██████▍   | 4392/6790 [2:32:06<1:26:07,  2.16s/it]                                                       {'loss': 1.3565, 'learning_rate': 0.00011413096977026693, 'epoch': 0.65}
+ 65%|██████▍   | 4392/6790 [2:32:06<1:26:07,  2.16s/it] 65%|██████▍   | 4393/6790 [2:32:08<1:24:24,  2.11s/it]                                                       {'loss': 1.3204, 'learning_rate': 0.00011404615713299805, 'epoch': 0.65}
+ 65%|██████▍   | 4393/6790 [2:32:08<1:24:24,  2.11s/it] 65%|██████▍   | 4394/6790 [2:32:10<1:20:45,  2.02s/it]                                                       {'loss': 1.6272, 'learning_rate': 0.0001139613634502497, 'epoch': 0.65}
+ 65%|██████▍   | 4394/6790 [2:32:10<1:20:45,  2.02s/it] 65%|██████▍   | 4395/6790 [2:32:12<1:21:21,  2.04s/it]                                                       {'loss': 1.5089, 'learning_rate': 0.00011387658874072038, 'epoch': 0.65}
+ 65%|██████▍   | 4395/6790 [2:32:12<1:21:21,  2.04s/it] 65%|██████▍   | 4396/6790 [2:32:14<1:20:28,  2.02s/it]                                                       {'loss': 1.2854, 'learning_rate': 0.0001137918330231047, 'epoch': 0.65}
+ 65%|██████▍   | 4396/6790 [2:32:14<1:20:28,  2.02s/it] 65%|██████▍   | 4397/6790 [2:32:16<1:22:49,  2.08s/it]                                                       {'loss': 1.4682, 'learning_rate': 0.00011370709631609276, 'epoch': 0.65}
+ 65%|██████▍   | 4397/6790 [2:32:16<1:22:49,  2.08s/it] 65%|██████▍   | 4398/6790 [2:32:18<1:22:10,  2.06s/it]                                                       {'loss': 1.3993, 'learning_rate': 0.00011362237863837086, 'epoch': 0.65}
+ 65%|██████▍   | 4398/6790 [2:32:18<1:22:10,  2.06s/it] 65%|██████▍   | 4399/6790 [2:32:21<1:27:59,  2.21s/it]                                                       {'loss': 1.3975, 'learning_rate': 0.00011353768000862102, 'epoch': 0.65}
+ 65%|██████▍   | 4399/6790 [2:32:21<1:27:59,  2.21s/it] 65%|██████▍   | 4400/6790 [2:32:22<1:22:53,  2.08s/it]                                                       {'loss': 1.3953, 'learning_rate': 0.00011345300044552072, 'epoch': 0.65}
+ 65%|██████▍   | 4400/6790 [2:32:22<1:22:53,  2.08s/it] 65%|██████▍   | 4401/6790 [2:32:25<1:23:53,  2.11s/it]                                                       {'loss': 1.446, 'learning_rate': 0.00011336833996774356, 'epoch': 0.65}
+ 65%|██████▍   | 4401/6790 [2:32:25<1:23:53,  2.11s/it] 65%|██████▍   | 4402/6790 [2:32:27<1:24:02,  2.11s/it]                                                       {'loss': 1.4509, 'learning_rate': 0.0001132836985939589, 'epoch': 0.65}
+ 65%|██████▍   | 4402/6790 [2:32:27<1:24:02,  2.11s/it] 65%|██████▍   | 4403/6790 [2:32:30<1:35:33,  2.40s/it]                                                       {'loss': 1.5127, 'learning_rate': 0.00011319907634283189, 'epoch': 0.65}
+ 65%|██████▍   | 4403/6790 [2:32:30<1:35:33,  2.40s/it] 65%|██████▍   | 4404/6790 [2:32:32<1:29:43,  2.26s/it]                                                       {'loss': 1.5164, 'learning_rate': 0.00011311447323302315, 'epoch': 0.65}
+ 65%|██████▍   | 4404/6790 [2:32:32<1:29:43,  2.26s/it] 65%|██████▍   | 4405/6790 [2:32:34<1:27:05,  2.19s/it]                                                       {'loss': 1.2968, 'learning_rate': 0.00011302988928318967, 'epoch': 0.65}
+ 65%|██████▍   | 4405/6790 [2:32:34<1:27:05,  2.19s/it] 65%|██████▍   | 4406/6790 [2:32:36<1:29:23,  2.25s/it]                                                       {'loss': 1.3739, 'learning_rate': 0.00011294532451198367, 'epoch': 0.65}
+ 65%|██████▍   | 4406/6790 [2:32:36<1:29:23,  2.25s/it] 65%|██████▍   | 4407/6790 [2:32:40<1:43:13,  2.60s/it]                                                       {'loss': 1.3586, 'learning_rate': 0.00011286077893805335, 'epoch': 0.65}
+ 65%|██████▍   | 4407/6790 [2:32:40<1:43:13,  2.60s/it] 65%|██████▍   | 4408/6790 [2:32:42<1:35:03,  2.39s/it]                                                       {'loss': 1.6629, 'learning_rate': 0.00011277625258004278, 'epoch': 0.65}
+ 65%|██████▍   | 4408/6790 [2:32:42<1:35:03,  2.39s/it] 65%|██████▍   | 4409/6790 [2:32:44<1:34:30,  2.38s/it]                                                       {'loss': 1.5977, 'learning_rate': 0.00011269174545659171, 'epoch': 0.65}
+ 65%|██████▍   | 4409/6790 [2:32:44<1:34:30,  2.38s/it] 65%|██████▍   | 4410/6790 [2:32:46<1:36:46,  2.44s/it]                                                       {'loss': 1.2847, 'learning_rate': 0.0001126072575863355, 'epoch': 0.65}
+ 65%|██████▍   | 4410/6790 [2:32:46<1:36:46,  2.44s/it] 65%|██████▍   | 4411/6790 [2:32:48<1:27:38,  2.21s/it]                                                       {'loss': 1.2718, 'learning_rate': 0.00011252278898790546, 'epoch': 0.65}
+ 65%|██████▍   | 4411/6790 [2:32:48<1:27:38,  2.21s/it] 65%|██████▍   | 4412/6790 [2:32:50<1:25:55,  2.17s/it]                                                       {'loss': 1.5737, 'learning_rate': 0.00011243833967992858, 'epoch': 0.65}
+ 65%|██████▍   | 4412/6790 [2:32:50<1:25:55,  2.17s/it] 65%|██████▍   | 4413/6790 [2:32:52<1:23:04,  2.10s/it]                                                       {'loss': 1.6657, 'learning_rate': 0.00011235390968102768, 'epoch': 0.65}
+ 65%|██████▍   | 4413/6790 [2:32:52<1:23:04,  2.10s/it] 65%|██████▌   | 4414/6790 [2:32:54<1:22:22,  2.08s/it]                                                       {'loss': 1.3434, 'learning_rate': 0.00011226949900982111, 'epoch': 0.65}
+ 65%|██████▌   | 4414/6790 [2:32:54<1:22:22,  2.08s/it] 65%|██████▌   | 4415/6790 [2:32:56<1:20:17,  2.03s/it]                                                       {'loss': 1.4893, 'learning_rate': 0.00011218510768492306, 'epoch': 0.65}
+ 65%|██████▌   | 4415/6790 [2:32:56<1:20:17,  2.03s/it] 65%|██████▌   | 4416/6790 [2:32:58<1:20:25,  2.03s/it]                                                       {'loss': 1.4993, 'learning_rate': 0.00011210073572494371, 'epoch': 0.65}
+ 65%|██████▌   | 4416/6790 [2:32:58<1:20:25,  2.03s/it] 65%|██████▌   | 4417/6790 [2:33:00<1:21:00,  2.05s/it]                                                       {'loss': 1.1413, 'learning_rate': 0.00011201638314848854, 'epoch': 0.65}
+ 65%|██████▌   | 4417/6790 [2:33:00<1:21:00,  2.05s/it] 65%|██████▌   | 4418/6790 [2:33:02<1:21:21,  2.06s/it]                                                       {'loss': 1.3289, 'learning_rate': 0.00011193204997415905, 'epoch': 0.65}
+ 65%|██████▌   | 4418/6790 [2:33:02<1:21:21,  2.06s/it] 65%|██████▌   | 4419/6790 [2:33:04<1:17:53,  1.97s/it]                                                       {'loss': 1.5738, 'learning_rate': 0.00011184773622055234, 'epoch': 0.65}
+ 65%|██████▌   | 4419/6790 [2:33:04<1:17:53,  1.97s/it] 65%|██████▌   | 4420/6790 [2:33:06<1:17:20,  1.96s/it]                                                       {'loss': 1.2357, 'learning_rate': 0.00011176344190626133, 'epoch': 0.65}
+ 65%|██████▌   | 4420/6790 [2:33:06<1:17:20,  1.96s/it] 65%|██████▌   | 4421/6790 [2:33:08<1:16:34,  1.94s/it]                                                       {'loss': 1.3426, 'learning_rate': 0.00011167916704987442, 'epoch': 0.65}
+ 65%|██████▌   | 4421/6790 [2:33:08<1:16:34,  1.94s/it] 65%|██████▌   | 4422/6790 [2:33:10<1:19:19,  2.01s/it]                                                       {'loss': 1.3703, 'learning_rate': 0.00011159491166997602, 'epoch': 0.65}
+ 65%|██████▌   | 4422/6790 [2:33:10<1:19:19,  2.01s/it] 65%|██████▌   | 4423/6790 [2:33:12<1:18:08,  1.98s/it]                                                       {'loss': 1.4258, 'learning_rate': 0.00011151067578514607, 'epoch': 0.65}
+ 65%|██████▌   | 4423/6790 [2:33:12<1:18:08,  1.98s/it] 65%|██████▌   | 4424/6790 [2:33:15<1:25:35,  2.17s/it]                                                       {'loss': 1.5245, 'learning_rate': 0.00011142645941396028, 'epoch': 0.65}
+ 65%|██████▌   | 4424/6790 [2:33:15<1:25:35,  2.17s/it] 65%|██████▌   | 4425/6790 [2:33:17<1:23:50,  2.13s/it]                                                       {'loss': 1.6451, 'learning_rate': 0.00011134226257498994, 'epoch': 0.65}
+ 65%|██████▌   | 4425/6790 [2:33:17<1:23:50,  2.13s/it] 65%|██████▌   | 4426/6790 [2:33:19<1:23:00,  2.11s/it]                                                       {'loss': 1.3878, 'learning_rate': 0.00011125808528680215, 'epoch': 0.65}
+ 65%|██████▌   | 4426/6790 [2:33:19<1:23:00,  2.11s/it] 65%|██████▌   | 4427/6790 [2:33:20<1:19:23,  2.02s/it]                                                       {'loss': 1.2096, 'learning_rate': 0.00011117392756795966, 'epoch': 0.65}
+ 65%|██████▌   | 4427/6790 [2:33:20<1:19:23,  2.02s/it] 65%|██████▌   | 4428/6790 [2:33:23<1:20:18,  2.04s/it]                                                       {'loss': 1.2473, 'learning_rate': 0.00011108978943702104, 'epoch': 0.65}
+ 65%|██████▌   | 4428/6790 [2:33:23<1:20:18,  2.04s/it] 65%|██████▌   | 4429/6790 [2:33:25<1:21:32,  2.07s/it]                                                       {'loss': 1.164, 'learning_rate': 0.00011100567091254012, 'epoch': 0.65}
+ 65%|██████▌   | 4429/6790 [2:33:25<1:21:32,  2.07s/it] 65%|██████▌   | 4430/6790 [2:33:27<1:23:02,  2.11s/it]                                                       {'loss': 1.4803, 'learning_rate': 0.00011092157201306702, 'epoch': 0.65}
+ 65%|██████▌   | 4430/6790 [2:33:27<1:23:02,  2.11s/it] 65%|██████▌   | 4431/6790 [2:33:29<1:21:44,  2.08s/it]                                                       {'loss': 1.271, 'learning_rate': 0.00011083749275714699, 'epoch': 0.65}
+ 65%|██████▌   | 4431/6790 [2:33:29<1:21:44,  2.08s/it] 65%|██████▌   | 4432/6790 [2:33:31<1:19:03,  2.01s/it]                                                       {'loss': 1.4944, 'learning_rate': 0.00011075343316332125, 'epoch': 0.65}
+ 65%|██████▌   | 4432/6790 [2:33:31<1:19:03,  2.01s/it] 65%|██████▌   | 4433/6790 [2:33:33<1:18:49,  2.01s/it]                                                       {'loss': 1.3548, 'learning_rate': 0.00011066939325012657, 'epoch': 0.65}
+ 65%|██████▌   | 4433/6790 [2:33:33<1:18:49,  2.01s/it] 65%|██████▌   | 4434/6790 [2:33:35<1:21:59,  2.09s/it]                                                       {'loss': 1.7251, 'learning_rate': 0.00011058537303609546, 'epoch': 0.65}
+ 65%|██████▌   | 4434/6790 [2:33:35<1:21:59,  2.09s/it] 65%|██████▌   | 4435/6790 [2:33:37<1:20:03,  2.04s/it]                                                       {'loss': 1.4626, 'learning_rate': 0.00011050137253975605, 'epoch': 0.65}
+ 65%|██████▌   | 4435/6790 [2:33:37<1:20:03,  2.04s/it] 65%|██████▌   | 4436/6790 [2:33:39<1:24:39,  2.16s/it]                                                       {'loss': 1.3995, 'learning_rate': 0.00011041739177963193, 'epoch': 0.65}
+ 65%|██████▌   | 4436/6790 [2:33:39<1:24:39,  2.16s/it] 65%|██████▌   | 4437/6790 [2:33:41<1:23:12,  2.12s/it]                                                       {'loss': 1.3956, 'learning_rate': 0.0001103334307742428, 'epoch': 0.65}
+ 65%|██████▌   | 4437/6790 [2:33:41<1:23:12,  2.12s/it] 65%|██████▌   | 4438/6790 [2:33:44<1:23:15,  2.12s/it]                                                       {'loss': 1.3831, 'learning_rate': 0.0001102494895421035, 'epoch': 0.65}
+ 65%|██████▌   | 4438/6790 [2:33:44<1:23:15,  2.12s/it] 65%|██████▌   | 4439/6790 [2:33:46<1:22:22,  2.10s/it]                                                       {'loss': 1.4895, 'learning_rate': 0.0001101655681017248, 'epoch': 0.65}
+ 65%|██████▌   | 4439/6790 [2:33:46<1:22:22,  2.10s/it] 65%|██████▌   | 4440/6790 [2:33:48<1:20:47,  2.06s/it]                                                       {'loss': 1.4063, 'learning_rate': 0.00011008166647161306, 'epoch': 0.65}
+ 65%|██████▌   | 4440/6790 [2:33:48<1:20:47,  2.06s/it] 65%|██████▌   | 4441/6790 [2:33:50<1:24:23,  2.16s/it]                                                       {'loss': 1.3947, 'learning_rate': 0.00010999778467027027, 'epoch': 0.65}
+ 65%|██████▌   | 4441/6790 [2:33:50<1:24:23,  2.16s/it] 65%|██████▌   | 4442/6790 [2:33:52<1:21:50,  2.09s/it]                                                       {'loss': 1.2596, 'learning_rate': 0.00010991392271619391, 'epoch': 0.65}
+ 65%|██████▌   | 4442/6790 [2:33:52<1:21:50,  2.09s/it] 65%|██████▌   | 4443/6790 [2:33:55<1:30:39,  2.32s/it]                                                       {'loss': 1.2921, 'learning_rate': 0.0001098300806278773, 'epoch': 0.65}
+ 65%|██████▌   | 4443/6790 [2:33:55<1:30:39,  2.32s/it] 65%|██████▌   | 4444/6790 [2:33:57<1:30:54,  2.33s/it]                                                       {'loss': 1.4103, 'learning_rate': 0.00010974625842380921, 'epoch': 0.65}
+ 65%|██████▌   | 4444/6790 [2:33:57<1:30:54,  2.33s/it] 65%|██████▌   | 4445/6790 [2:33:59<1:26:47,  2.22s/it]                                                       {'loss': 1.3427, 'learning_rate': 0.00010966245612247422, 'epoch': 0.65}
+ 65%|██████▌   | 4445/6790 [2:33:59<1:26:47,  2.22s/it] 65%|██████▌   | 4446/6790 [2:34:01<1:24:42,  2.17s/it]                                                       {'loss': 1.5719, 'learning_rate': 0.00010957867374235222, 'epoch': 0.65}
+ 65%|██████▌   | 4446/6790 [2:34:01<1:24:42,  2.17s/it] 65%|██████▌   | 4447/6790 [2:34:03<1:24:40,  2.17s/it]                                                       {'loss': 1.4693, 'learning_rate': 0.00010949491130191893, 'epoch': 0.65}
+ 65%|██████▌   | 4447/6790 [2:34:03<1:24:40,  2.17s/it] 66%|██████▌   | 4448/6790 [2:34:05<1:20:09,  2.05s/it]                                                       {'loss': 1.5452, 'learning_rate': 0.00010941116881964571, 'epoch': 0.66}
+ 66%|██████▌   | 4448/6790 [2:34:05<1:20:09,  2.05s/it] 66%|██████▌   | 4449/6790 [2:34:07<1:22:59,  2.13s/it]                                                       {'loss': 1.5387, 'learning_rate': 0.00010932744631399931, 'epoch': 0.66}
+ 66%|██████▌   | 4449/6790 [2:34:07<1:22:59,  2.13s/it] 66%|██████▌   | 4450/6790 [2:34:10<1:24:02,  2.15s/it]                                                       {'loss': 1.3748, 'learning_rate': 0.00010924374380344231, 'epoch': 0.66}
+ 66%|██████▌   | 4450/6790 [2:34:10<1:24:02,  2.15s/it] 66%|██████▌   | 4451/6790 [2:34:12<1:25:33,  2.19s/it]                                                       {'loss': 1.5915, 'learning_rate': 0.0001091600613064327, 'epoch': 0.66}
+ 66%|██████▌   | 4451/6790 [2:34:12<1:25:33,  2.19s/it] 66%|██████▌   | 4452/6790 [2:34:14<1:24:26,  2.17s/it]                                                       {'loss': 1.5793, 'learning_rate': 0.00010907639884142423, 'epoch': 0.66}
+ 66%|██████▌   | 4452/6790 [2:34:14<1:24:26,  2.17s/it] 66%|██████▌   | 4453/6790 [2:34:16<1:23:37,  2.15s/it]                                                       {'loss': 1.5219, 'learning_rate': 0.00010899275642686593, 'epoch': 0.66}
+ 66%|██████▌   | 4453/6790 [2:34:16<1:23:37,  2.15s/it] 66%|██████▌   | 4454/6790 [2:34:18<1:20:28,  2.07s/it]                                                       {'loss': 1.4268, 'learning_rate': 0.00010890913408120273, 'epoch': 0.66}
+ 66%|██████▌   | 4454/6790 [2:34:18<1:20:28,  2.07s/it] 66%|██████▌   | 4455/6790 [2:34:20<1:21:59,  2.11s/it]                                                       {'loss': 1.4562, 'learning_rate': 0.00010882553182287498, 'epoch': 0.66}
+ 66%|██████▌   | 4455/6790 [2:34:20<1:21:59,  2.11s/it] 66%|██████▌   | 4456/6790 [2:34:22<1:21:47,  2.10s/it]                                                       {'loss': 1.4731, 'learning_rate': 0.00010874194967031874, 'epoch': 0.66}
+ 66%|██████▌   | 4456/6790 [2:34:22<1:21:47,  2.10s/it] 66%|██████▌   | 4457/6790 [2:34:25<1:24:18,  2.17s/it]                                                       {'loss': 1.3013, 'learning_rate': 0.00010865838764196534, 'epoch': 0.66}
+ 66%|██████▌   | 4457/6790 [2:34:25<1:24:18,  2.17s/it] 66%|██████▌   | 4458/6790 [2:34:27<1:23:19,  2.14s/it]                                                       {'loss': 1.3968, 'learning_rate': 0.00010857484575624194, 'epoch': 0.66}
+ 66%|██████▌   | 4458/6790 [2:34:27<1:23:19,  2.14s/it] 66%|██████▌   | 4459/6790 [2:34:29<1:21:04,  2.09s/it]                                                       {'loss': 1.5833, 'learning_rate': 0.0001084913240315712, 'epoch': 0.66}
+ 66%|██████▌   | 4459/6790 [2:34:29<1:21:04,  2.09s/it] 66%|██████▌   | 4460/6790 [2:34:31<1:20:56,  2.08s/it]                                                       {'loss': 1.3098, 'learning_rate': 0.00010840782248637136, 'epoch': 0.66}
+ 66%|██████▌   | 4460/6790 [2:34:31<1:20:56,  2.08s/it] 66%|██████▌   | 4461/6790 [2:34:33<1:18:32,  2.02s/it]                                                       {'loss': 1.395, 'learning_rate': 0.00010832434113905594, 'epoch': 0.66}
+ 66%|██████▌   | 4461/6790 [2:34:33<1:18:32,  2.02s/it] 66%|██████▌   | 4462/6790 [2:34:35<1:18:38,  2.03s/it]                                                       {'loss': 1.6093, 'learning_rate': 0.00010824088000803452, 'epoch': 0.66}
+ 66%|██████▌   | 4462/6790 [2:34:35<1:18:38,  2.03s/it] 66%|██████▌   | 4463/6790 [2:34:37<1:18:11,  2.02s/it]                                                       {'loss': 1.4906, 'learning_rate': 0.0001081574391117117, 'epoch': 0.66}
+ 66%|██████▌   | 4463/6790 [2:34:37<1:18:11,  2.02s/it] 66%|██████▌   | 4464/6790 [2:34:38<1:15:42,  1.95s/it]                                                       {'loss': 1.2107, 'learning_rate': 0.00010807401846848795, 'epoch': 0.66}
+ 66%|██████▌   | 4464/6790 [2:34:38<1:15:42,  1.95s/it] 66%|██████▌   | 4465/6790 [2:34:41<1:20:47,  2.08s/it]                                                       {'loss': 1.5187, 'learning_rate': 0.00010799061809675915, 'epoch': 0.66}
+ 66%|██████▌   | 4465/6790 [2:34:41<1:20:47,  2.08s/it] 66%|██████▌   | 4466/6790 [2:34:43<1:20:16,  2.07s/it]                                                       {'loss': 1.4462, 'learning_rate': 0.00010790723801491673, 'epoch': 0.66}
+ 66%|██████▌   | 4466/6790 [2:34:43<1:20:16,  2.07s/it] 66%|██████▌   | 4467/6790 [2:34:45<1:21:06,  2.09s/it]                                                       {'loss': 1.2378, 'learning_rate': 0.00010782387824134772, 'epoch': 0.66}
+ 66%|██████▌   | 4467/6790 [2:34:45<1:21:06,  2.09s/it] 66%|██████▌   | 4468/6790 [2:34:47<1:19:27,  2.05s/it]                                                       {'loss': 1.494, 'learning_rate': 0.00010774053879443437, 'epoch': 0.66}
+ 66%|██████▌   | 4468/6790 [2:34:47<1:19:27,  2.05s/it] 66%|██████▌   | 4469/6790 [2:34:49<1:17:47,  2.01s/it]                                                       {'loss': 1.5209, 'learning_rate': 0.00010765721969255498, 'epoch': 0.66}
+ 66%|██████▌   | 4469/6790 [2:34:49<1:17:47,  2.01s/it] 66%|██████▌   | 4470/6790 [2:34:51<1:19:36,  2.06s/it]                                                       {'loss': 1.4835, 'learning_rate': 0.00010757392095408283, 'epoch': 0.66}
+ 66%|██████▌   | 4470/6790 [2:34:51<1:19:36,  2.06s/it] 66%|██████▌   | 4471/6790 [2:34:53<1:17:31,  2.01s/it]                                                       {'loss': 1.2914, 'learning_rate': 0.00010749064259738713, 'epoch': 0.66}
+ 66%|██████▌   | 4471/6790 [2:34:53<1:17:31,  2.01s/it] 66%|██████▌   | 4472/6790 [2:34:55<1:15:35,  1.96s/it]                                                       {'loss': 1.5449, 'learning_rate': 0.00010740738464083207, 'epoch': 0.66}
+ 66%|██████▌   | 4472/6790 [2:34:55<1:15:35,  1.96s/it] 66%|██████▌   | 4473/6790 [2:34:57<1:20:42,  2.09s/it]                                                       {'loss': 1.3469, 'learning_rate': 0.00010732414710277807, 'epoch': 0.66}
+ 66%|██████▌   | 4473/6790 [2:34:57<1:20:42,  2.09s/it] 66%|██████▌   | 4474/6790 [2:35:00<1:24:48,  2.20s/it]                                                       {'loss': 1.5858, 'learning_rate': 0.00010724093000158042, 'epoch': 0.66}
+ 66%|██████▌   | 4474/6790 [2:35:00<1:24:48,  2.20s/it] 66%|██████▌   | 4475/6790 [2:35:02<1:21:47,  2.12s/it]                                                       {'loss': 1.5603, 'learning_rate': 0.00010715773335559017, 'epoch': 0.66}
+ 66%|██████▌   | 4475/6790 [2:35:02<1:21:47,  2.12s/it] 66%|██████▌   | 4476/6790 [2:35:03<1:19:26,  2.06s/it]                                                       {'loss': 1.5611, 'learning_rate': 0.00010707455718315382, 'epoch': 0.66}
+ 66%|██████▌   | 4476/6790 [2:35:03<1:19:26,  2.06s/it] 66%|██████▌   | 4477/6790 [2:35:05<1:18:30,  2.04s/it]                                                       {'loss': 1.3506, 'learning_rate': 0.00010699140150261347, 'epoch': 0.66}
+ 66%|██████▌   | 4477/6790 [2:35:05<1:18:30,  2.04s/it] 66%|██████▌   | 4478/6790 [2:35:07<1:17:42,  2.02s/it]                                                       {'loss': 1.2353, 'learning_rate': 0.00010690826633230644, 'epoch': 0.66}
+ 66%|██████▌   | 4478/6790 [2:35:07<1:17:42,  2.02s/it] 66%|██████▌   | 4479/6790 [2:35:09<1:16:25,  1.98s/it]                                                       {'loss': 1.5772, 'learning_rate': 0.0001068251516905657, 'epoch': 0.66}
+ 66%|██████▌   | 4479/6790 [2:35:09<1:16:25,  1.98s/it] 66%|██████▌   | 4480/6790 [2:35:12<1:22:40,  2.15s/it]                                                       {'loss': 1.4742, 'learning_rate': 0.00010674205759571974, 'epoch': 0.66}
+ 66%|██████▌   | 4480/6790 [2:35:12<1:22:40,  2.15s/it] 66%|██████▌   | 4481/6790 [2:35:14<1:18:27,  2.04s/it]                                                       {'loss': 1.3866, 'learning_rate': 0.0001066589840660925, 'epoch': 0.66}
+ 66%|██████▌   | 4481/6790 [2:35:14<1:18:27,  2.04s/it] 66%|██████▌   | 4482/6790 [2:35:16<1:18:20,  2.04s/it]                                                       {'loss': 1.6228, 'learning_rate': 0.00010657593112000306, 'epoch': 0.66}
+ 66%|██████▌   | 4482/6790 [2:35:16<1:18:20,  2.04s/it] 66%|██████▌   | 4483/6790 [2:35:18<1:20:49,  2.10s/it]                                                       {'loss': 1.4728, 'learning_rate': 0.00010649289877576654, 'epoch': 0.66}
+ 66%|██████▌   | 4483/6790 [2:35:18<1:20:49,  2.10s/it] 66%|██████▌   | 4484/6790 [2:35:20<1:19:14,  2.06s/it]                                                       {'loss': 1.3626, 'learning_rate': 0.00010640988705169317, 'epoch': 0.66}
+ 66%|██████▌   | 4484/6790 [2:35:20<1:19:14,  2.06s/it] 66%|██████▌   | 4485/6790 [2:35:22<1:25:08,  2.22s/it]                                                       {'loss': 1.5099, 'learning_rate': 0.00010632689596608854, 'epoch': 0.66}
+ 66%|██████▌   | 4485/6790 [2:35:22<1:25:08,  2.22s/it] 66%|██████▌   | 4486/6790 [2:35:24<1:19:40,  2.07s/it]                                                       {'loss': 1.321, 'learning_rate': 0.00010624392553725386, 'epoch': 0.66}
+ 66%|██████▌   | 4486/6790 [2:35:24<1:19:40,  2.07s/it] 66%|██████▌   | 4487/6790 [2:35:27<1:24:04,  2.19s/it]                                                       {'loss': 1.2419, 'learning_rate': 0.00010616097578348578, 'epoch': 0.66}
+ 66%|██████▌   | 4487/6790 [2:35:27<1:24:04,  2.19s/it] 66%|██████▌   | 4488/6790 [2:35:29<1:22:20,  2.15s/it]                                                       {'loss': 1.4169, 'learning_rate': 0.00010607804672307647, 'epoch': 0.66}
+ 66%|██████▌   | 4488/6790 [2:35:29<1:22:20,  2.15s/it] 66%|██████▌   | 4489/6790 [2:35:31<1:21:15,  2.12s/it]                                                       {'loss': 1.6238, 'learning_rate': 0.00010599513837431319, 'epoch': 0.66}
+ 66%|██████▌   | 4489/6790 [2:35:31<1:21:15,  2.12s/it] 66%|██████▌   | 4490/6790 [2:35:33<1:24:39,  2.21s/it]                                                       {'loss': 1.2601, 'learning_rate': 0.00010591225075547901, 'epoch': 0.66}
+ 66%|██████▌   | 4490/6790 [2:35:33<1:24:39,  2.21s/it] 66%|██████▌   | 4491/6790 [2:35:35<1:25:10,  2.22s/it]                                                       {'loss': 1.3912, 'learning_rate': 0.00010582938388485226, 'epoch': 0.66}
+ 66%|██████▌   | 4491/6790 [2:35:35<1:25:10,  2.22s/it] 66%|██████▌   | 4492/6790 [2:35:37<1:20:27,  2.10s/it]                                                       {'loss': 1.1897, 'learning_rate': 0.00010574653778070685, 'epoch': 0.66}
+ 66%|██████▌   | 4492/6790 [2:35:37<1:20:27,  2.10s/it] 66%|██████▌   | 4493/6790 [2:35:39<1:18:24,  2.05s/it]                                                       {'loss': 1.3734, 'learning_rate': 0.00010566371246131166, 'epoch': 0.66}
+ 66%|██████▌   | 4493/6790 [2:35:39<1:18:24,  2.05s/it] 66%|██████▌   | 4494/6790 [2:35:41<1:18:42,  2.06s/it]                                                       {'loss': 1.5745, 'learning_rate': 0.0001055809079449317, 'epoch': 0.66}
+ 66%|██████▌   | 4494/6790 [2:35:41<1:18:42,  2.06s/it] 66%|██████▌   | 4495/6790 [2:35:43<1:15:31,  1.97s/it]                                                       {'loss': 1.3075, 'learning_rate': 0.00010549812424982671, 'epoch': 0.66}
+ 66%|██████▌   | 4495/6790 [2:35:43<1:15:31,  1.97s/it] 66%|██████▌   | 4496/6790 [2:35:45<1:17:48,  2.04s/it]                                                       {'loss': 1.3719, 'learning_rate': 0.00010541536139425226, 'epoch': 0.66}
+ 66%|██████▌   | 4496/6790 [2:35:45<1:17:48,  2.04s/it] 66%|██████▌   | 4497/6790 [2:35:47<1:18:16,  2.05s/it]                                                       {'loss': 1.3891, 'learning_rate': 0.00010533261939645916, 'epoch': 0.66}
+ 66%|█��████▌   | 4497/6790 [2:35:47<1:18:16,  2.05s/it] 66%|██████▌   | 4498/6790 [2:35:49<1:15:47,  1.98s/it]                                                       {'loss': 1.3517, 'learning_rate': 0.00010524989827469373, 'epoch': 0.66}
+ 66%|██████▌   | 4498/6790 [2:35:49<1:15:47,  1.98s/it] 66%|██████▋   | 4499/6790 [2:35:51<1:16:10,  1.99s/it]                                                       {'loss': 1.5496, 'learning_rate': 0.00010516719804719747, 'epoch': 0.66}
+ 66%|██████▋   | 4499/6790 [2:35:51<1:16:10,  1.99s/it] 66%|██████▋   | 4500/6790 [2:35:53<1:16:11,  2.00s/it]                                                       {'loss': 1.3229, 'learning_rate': 0.00010508451873220751, 'epoch': 0.66}
+ 66%|██████▋   | 4500/6790 [2:35:53<1:16:11,  2.00s/it] 66%|██████▋   | 4501/6790 [2:35:55<1:19:27,  2.08s/it]                                                       {'loss': 1.5622, 'learning_rate': 0.00010500186034795625, 'epoch': 0.66}
+ 66%|██████▋   | 4501/6790 [2:35:55<1:19:27,  2.08s/it] 66%|██████▋   | 4502/6790 [2:35:57<1:15:26,  1.98s/it]                                                       {'loss': 1.4306, 'learning_rate': 0.00010491922291267149, 'epoch': 0.66}
+ 66%|██████▋   | 4502/6790 [2:35:57<1:15:26,  1.98s/it] 66%|██████▋   | 4503/6790 [2:35:59<1:14:53,  1.96s/it]                                                       {'loss': 1.0458, 'learning_rate': 0.00010483660644457649, 'epoch': 0.66}
+ 66%|██████▋   | 4503/6790 [2:35:59<1:14:53,  1.96s/it] 66%|██████▋   | 4504/6790 [2:36:01<1:15:09,  1.97s/it]                                                       {'loss': 1.4169, 'learning_rate': 0.00010475401096188962, 'epoch': 0.66}
+ 66%|██████▋   | 4504/6790 [2:36:01<1:15:09,  1.97s/it] 66%|██████▋   | 4505/6790 [2:36:03<1:14:26,  1.95s/it]                                                       {'loss': 1.2511, 'learning_rate': 0.00010467143648282509, 'epoch': 0.66}
+ 66%|██████▋   | 4505/6790 [2:36:03<1:14:26,  1.95s/it] 66%|██████▋   | 4506/6790 [2:36:05<1:12:03,  1.89s/it]                                                       {'loss': 1.4455, 'learning_rate': 0.00010458888302559197, 'epoch': 0.66}
+ 66%|██████▋   | 4506/6790 [2:36:05<1:12:03,  1.89s/it] 66%|██████▋   | 4507/6790 [2:36:07<1:12:53,  1.92s/it]                                                       {'loss': 1.4126, 'learning_rate': 0.00010450635060839502, 'epoch': 0.66}
+ 66%|██████▋   | 4507/6790 [2:36:07<1:12:53,  1.92s/it] 66%|██████▋   | 4508/6790 [2:36:09<1:14:05,  1.95s/it]                                                       {'loss': 1.4329, 'learning_rate': 0.00010442383924943428, 'epoch': 0.66}
+ 66%|██████▋   | 4508/6790 [2:36:09<1:14:05,  1.95s/it] 66%|██████▋   | 4509/6790 [2:36:11<1:16:17,  2.01s/it]                                                       {'loss': 1.3134, 'learning_rate': 0.0001043413489669052, 'epoch': 0.66}
+ 66%|██████▋   | 4509/6790 [2:36:11<1:16:17,  2.01s/it] 66%|██████▋   | 4510/6790 [2:36:13<1:15:21,  1.98s/it]                                                       {'loss': 1.4351, 'learning_rate': 0.00010425887977899833, 'epoch': 0.66}
+ 66%|██████▋   | 4510/6790 [2:36:13<1:15:21,  1.98s/it] 66%|██████▋   | 4511/6790 [2:36:15<1:20:49,  2.13s/it]                                                       {'loss': 1.7247, 'learning_rate': 0.00010417643170389988, 'epoch': 0.66}
+ 66%|██████▋   | 4511/6790 [2:36:15<1:20:49,  2.13s/it] 66%|██████▋   | 4512/6790 [2:36:17<1:21:38,  2.15s/it]                                                       {'loss': 1.3825, 'learning_rate': 0.00010409400475979127, 'epoch': 0.66}
+ 66%|██████▋   | 4512/6790 [2:36:17<1:21:38,  2.15s/it] 66%|██████▋   | 4513/6790 [2:36:20<1:24:03,  2.21s/it]                                                       {'loss': 1.4659, 'learning_rate': 0.00010401159896484935, 'epoch': 0.66}
+ 66%|██████▋   | 4513/6790 [2:36:20<1:24:03,  2.21s/it] 66%|██████▋   | 4514/6790 [2:36:22<1:27:32,  2.31s/it]                                                       {'loss': 1.368, 'learning_rate': 0.00010392921433724596, 'epoch': 0.66}
+ 66%|██████▋   | 4514/6790 [2:36:22<1:27:32,  2.31s/it] 66%|██████▋   | 4515/6790 [2:36:24<1:23:21,  2.20s/it]                                                       {'loss': 1.366, 'learning_rate': 0.00010384685089514888, 'epoch': 0.66}
+ 66%|██████▋   | 4515/6790 [2:36:24<1:23:21,  2.20s/it] 67%|██████▋   | 4516/6790 [2:36:26<1:20:26,  2.12s/it]                                                       {'loss': 1.3127, 'learning_rate': 0.00010376450865672063, 'epoch': 0.67}
+ 67%|██████▋   | 4516/6790 [2:36:26<1:20:26,  2.12s/it] 67%|██████▋   | 4517/6790 [2:36:29<1:31:35,  2.42s/it]                                                       {'loss': 1.6328, 'learning_rate': 0.00010368218764011937, 'epoch': 0.67}
+ 67%|██████▋   | 4517/6790 [2:36:29<1:31:35,  2.42s/it] 67%|██████▋   | 4518/6790 [2:36:31<1:27:32,  2.31s/it]                                                       {'loss': 1.3049, 'learning_rate': 0.00010359988786349852, 'epoch': 0.67}
+ 67%|██████▋   | 4518/6790 [2:36:31<1:27:32,  2.31s/it] 67%|██████▋   | 4519/6790 [2:36:34<1:28:12,  2.33s/it]                                                       {'loss': 1.629, 'learning_rate': 0.00010351760934500683, 'epoch': 0.67}
+ 67%|██████▋   | 4519/6790 [2:36:34<1:28:12,  2.33s/it] 67%|██████▋   | 4520/6790 [2:36:36<1:24:34,  2.24s/it]                                                       {'loss': 1.5206, 'learning_rate': 0.00010343535210278839, 'epoch': 0.67}
+ 67%|██████▋   | 4520/6790 [2:36:36<1:24:34,  2.24s/it] 67%|██████▋   | 4521/6790 [2:36:38<1:22:55,  2.19s/it]                                                       {'loss': 1.4297, 'learning_rate': 0.00010335311615498237, 'epoch': 0.67}
+ 67%|██████▋   | 4521/6790 [2:36:38<1:22:55,  2.19s/it] 67%|██████▋   | 4522/6790 [2:36:41<1:37:26,  2.58s/it]                                                       {'loss': 1.3456, 'learning_rate': 0.00010327090151972356, 'epoch': 0.67}
+ 67%|██████▋   | 4522/6790 [2:36:41<1:37:26,  2.58s/it] 67%|██████▋   | 4523/6790 [2:36:44<1:34:25,  2.50s/it]                                                       {'loss': 1.4205, 'learning_rate': 0.00010318870821514186, 'epoch': 0.67}
+ 67%|██████▋   | 4523/6790 [2:36:44<1:34:25,  2.50s/it] 67%|██████▋   | 4524/6790 [2:36:46<1:31:58,  2.44s/it]                                                       {'loss': 1.4095, 'learning_rate': 0.00010310653625936262, 'epoch': 0.67}
+ 67%|██████▋   | 4524/6790 [2:36:46<1:31:58,  2.44s/it] 67%|██████▋   | 4525/6790 [2:36:48<1:26:16,  2.29s/it]                                                       {'loss': 1.4072, 'learning_rate': 0.00010302438567050612, 'epoch': 0.67}
+ 67%|██████▋   | 4525/6790 [2:36:48<1:26:16,  2.29s/it] 67%|██████▋   | 4526/6790 [2:36:50<1:22:36,  2.19s/it]                                                       {'loss': 1.4491, 'learning_rate': 0.00010294225646668851, 'epoch': 0.67}
+ 67%|██████▋   | 4526/6790 [2:36:50<1:22:36,  2.19s/it] 67%|██████▋   | 4527/6790 [2:36:52<1:21:36,  2.16s/it]                                                       {'loss': 1.2713, 'learning_rate': 0.0001028601486660207, 'epoch': 0.67}
+ 67%|██████▋   | 4527/6790 [2:36:52<1:21:36,  2.16s/it] 67%|██████▋   | 4528/6790 [2:36:54<1:24:02,  2.23s/it]                                                       {'loss': 1.4811, 'learning_rate': 0.00010277806228660914, 'epoch': 0.67}
+ 67%|██████▋   | 4528/6790 [2:36:54<1:24:02,  2.23s/it] 67%|██████▋   | 4529/6790 [2:36:56<1:19:27,  2.11s/it]                                                       {'loss': 1.4966, 'learning_rate': 0.00010269599734655546, 'epoch': 0.67}
+ 67%|██████▋   | 4529/6790 [2:36:56<1:19:27,  2.11s/it] 67%|██████▋   | 4530/6790 [2:36:58<1:16:45,  2.04s/it]                                                       {'loss': 1.379, 'learning_rate': 0.00010261395386395674, 'epoch': 0.67}
+ 67%|██████▋   | 4530/6790 [2:36:58<1:16:45,  2.04s/it] 67%|██████▋   | 4531/6790 [2:37:00<1:17:50,  2.07s/it]                                                       {'loss': 1.6439, 'learning_rate': 0.00010253193185690499, 'epoch': 0.67}
+ 67%|██████▋   | 4531/6790 [2:37:00<1:17:50,  2.07s/it] 67%|██████▋   | 4532/6790 [2:37:02<1:17:17,  2.05s/it]                                                       {'loss': 1.298, 'learning_rate': 0.0001024499313434878, 'epoch': 0.67}
+ 67%|██████▋   | 4532/6790 [2:37:02<1:17:17,  2.05s/it] 67%|██████▋   | 4533/6790 [2:37:04<1:13:59,  1.97s/it]                                                       {'loss': 1.4191, 'learning_rate': 0.00010236795234178785, 'epoch': 0.67}
+ 67%|██████▋   | 4533/6790 [2:37:04<1:13:59,  1.97s/it] 67%|██████▋   | 4534/6790 [2:37:06<1:15:25,  2.01s/it]                                                       {'loss': 1.4204, 'learning_rate': 0.00010228599486988317, 'epoch': 0.67}
+ 67%|██████▋   | 4534/6790 [2:37:06<1:15:25,  2.01s/it] 67%|██████▋   | 4535/6790 [2:37:08<1:13:06,  1.95s/it]                                                       {'loss': 1.4786, 'learning_rate': 0.00010220405894584706, 'epoch': 0.67}
+ 67%|██████▋   | 4535/6790 [2:37:08<1:13:06,  1.95s/it] 67%|██████▋   | 4536/6790 [2:37:10<1:20:17,  2.14s/it]                                                       {'loss': 1.509, 'learning_rate': 0.0001021221445877478, 'epoch': 0.67}
+ 67%|██████▋   | 4536/6790 [2:37:10<1:20:17,  2.14s/it] 67%|██████▋   | 4537/6790 [2:37:12<1:18:23,  2.09s/it]                                                       {'loss': 1.45, 'learning_rate': 0.0001020402518136494, 'epoch': 0.67}
+ 67%|██████▋   | 4537/6790 [2:37:12<1:18:23,  2.09s/it] 67%|██████▋   | 4538/6790 [2:37:14<1:16:05,  2.03s/it]                                                       {'loss': 1.4684, 'learning_rate': 0.00010195838064161063, 'epoch': 0.67}
+ 67%|██████▋   | 4538/6790 [2:37:14<1:16:05,  2.03s/it] 67%|██████▋   | 4539/6790 [2:37:16<1:14:39,  1.99s/it]                                                       {'loss': 1.5232, 'learning_rate': 0.00010187653108968578, 'epoch': 0.67}
+ 67%|██████▋   | 4539/6790 [2:37:16<1:14:39,  1.99s/it] 67%|██████▋   | 4540/6790 [2:37:18<1:16:06,  2.03s/it]                                                       {'loss': 1.5321, 'learning_rate': 0.00010179470317592428, 'epoch': 0.67}
+ 67%|██████▋   | 4540/6790 [2:37:18<1:16:06,  2.03s/it] 67%|██████▋   | 4541/6790 [2:37:20<1:12:54,  1.95s/it]                                                       {'loss': 1.4285, 'learning_rate': 0.00010171289691837085, 'epoch': 0.67}
+ 67%|██████▋   | 4541/6790 [2:37:20<1:12:54,  1.95s/it] 67%|██████▋   | 4542/6790 [2:37:22<1:11:13,  1.90s/it]                                                       {'loss': 1.2188, 'learning_rate': 0.00010163111233506528, 'epoch': 0.67}
+ 67%|██████▋   | 4542/6790 [2:37:22<1:11:13,  1.90s/it] 67%|██████▋   | 4543/6790 [2:37:24<1:11:59,  1.92s/it]                                                       {'loss': 1.398, 'learning_rate': 0.00010154934944404275, 'epoch': 0.67}
+ 67%|██████▋   | 4543/6790 [2:37:24<1:11:59,  1.92s/it] 67%|██████▋   | 4544/6790 [2:37:26<1:12:53,  1.95s/it]                                                       {'loss': 1.3143, 'learning_rate': 0.00010146760826333359, 'epoch': 0.67}
+ 67%|██████▋   | 4544/6790 [2:37:26<1:12:53,  1.95s/it] 67%|██████▋   | 4545/6790 [2:37:28<1:11:33,  1.91s/it]                                                       {'loss': 1.3093, 'learning_rate': 0.00010138588881096342, 'epoch': 0.67}
+ 67%|██████▋   | 4545/6790 [2:37:28<1:11:33,  1.91s/it] 67%|██████▋   | 4546/6790 [2:37:30<1:15:38,  2.02s/it]                                                       {'loss': 1.5098, 'learning_rate': 0.00010130419110495286, 'epoch': 0.67}
+ 67%|██████▋   | 4546/6790 [2:37:30<1:15:38,  2.02s/it] 67%|██████▋   | 4547/6790 [2:37:32<1:14:36,  2.00s/it]                                                       {'loss': 1.3947, 'learning_rate': 0.00010122251516331792, 'epoch': 0.67}
+ 67%|██████▋   | 4547/6790 [2:37:32<1:14:36,  2.00s/it] 67%|██████▋   | 4548/6790 [2:37:34<1:15:46,  2.03s/it]                                                       {'loss': 1.5356, 'learning_rate': 0.00010114086100406974, 'epoch': 0.67}
+ 67%|██████▋   | 4548/6790 [2:37:34<1:15:46,  2.03s/it] 67%|██████▋   | 4549/6790 [2:37:36<1:17:02,  2.06s/it]                                                       {'loss': 1.5004, 'learning_rate': 0.00010105922864521478, 'epoch': 0.67}
+ 67%|██████▋   | 4549/6790 [2:37:36<1:17:02,  2.06s/it] 67%|██████▋   | 4550/6790 [2:37:38<1:16:58,  2.06s/it]                                                       {'loss': 1.3127, 'learning_rate': 0.00010097761810475437, 'epoch': 0.67}
+ 67%|██████▋   | 4550/6790 [2:37:38<1:16:58,  2.06s/it] 67%|██████▋   | 4551/6790 [2:37:40<1:14:53,  2.01s/it]                                                       {'loss': 1.5857, 'learning_rate': 0.00010089602940068545, 'epoch': 0.67}
+ 67%|██████▋   | 4551/6790 [2:37:40<1:14:53,  2.01s/it] 67%|██████▋   | 4552/6790 [2:37:42<1:14:41,  2.00s/it]                                                       {'loss': 1.6307, 'learning_rate': 0.00010081446255099996, 'epoch': 0.67}
+ 67%|██████▋   | 4552/6790 [2:37:42<1:14:41,  2.00s/it] 67%|██████▋   | 4553/6790 [2:37:44<1:14:31,  2.00s/it]                                                       {'loss': 1.362, 'learning_rate': 0.00010073291757368481, 'epoch': 0.67}
+ 67%|██████▋   | 4553/6790 [2:37:44<1:14:31,  2.00s/it] 67%|██████▋   | 4554/6790 [2:37:46<1:14:14,  1.99s/it]                                                       {'loss': 1.7285, 'learning_rate': 0.0001006513944867224, 'epoch': 0.67}
+ 67%|██████▋   | 4554/6790 [2:37:46<1:14:14,  1.99s/it] 67%|██████▋   | 4555/6790 [2:37:48<1:15:49,  2.04s/it]                                                       {'loss': 1.5675, 'learning_rate': 0.00010056989330809018, 'epoch': 0.67}
+ 67%|██████▋   | 4555/6790 [2:37:48<1:15:49,  2.04s/it] 67%|██████▋   | 4556/6790 [2:37:50<1:14:23,  2.00s/it]                                                       {'loss': 1.21, 'learning_rate': 0.00010048841405576083, 'epoch': 0.67}
+ 67%|██████▋   | 4556/6790 [2:37:50<1:14:23,  2.00s/it] 67%|██████▋   | 4557/6790 [2:37:53<1:19:24,  2.13s/it]                                                       {'loss': 1.333, 'learning_rate': 0.00010040695674770191, 'epoch': 0.67}
+ 67%|██████▋   | 4557/6790 [2:37:53<1:19:24,  2.13s/it] 67%|██████▋   | 4558/6790 [2:37:54<1:16:05,  2.05s/it]                                                       {'loss': 1.1945, 'learning_rate': 0.00010032552140187666, 'epoch': 0.67}
+ 67%|██████▋   | 4558/6790 [2:37:54<1:16:05,  2.05s/it] 67%|██████▋   | 4559/6790 [2:37:56<1:14:55,  2.01s/it]                                                       {'loss': 1.4449, 'learning_rate': 0.00010024410803624298, 'epoch': 0.67}
+ 67%|██████▋   | 4559/6790 [2:37:56<1:14:55,  2.01s/it] 67%|██████▋   | 4560/6790 [2:37:58<1:15:26,  2.03s/it]                                                       {'loss': 1.6169, 'learning_rate': 0.00010016271666875426, 'epoch': 0.67}
+ 67%|██████▋   | 4560/6790 [2:37:58<1:15:26,  2.03s/it] 67%|██████▋   | 4561/6790 [2:38:01<1:18:43,  2.12s/it]                                                       {'loss': 1.3114, 'learning_rate': 0.00010008134731735865, 'epoch': 0.67}
+ 67%|██████▋   | 4561/6790 [2:38:01<1:18:43,  2.12s/it] 67%|██████▋   | 4562/6790 [2:38:03<1:20:37,  2.17s/it]                                                       {'loss': 1.3881, 'learning_rate': 0.00010000000000000005, 'epoch': 0.67}
+ 67%|██████▋   | 4562/6790 [2:38:03<1:20:37,  2.17s/it] 67%|██████▋   | 4563/6790 [2:38:05<1:21:00,  2.18s/it]                                                       {'loss': 1.4153, 'learning_rate': 9.99186747346169e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4563/6790 [2:38:05<1:21:00,  2.18s/it] 67%|██████▋   | 4564/6790 [2:38:07<1:16:18,  2.06s/it]                                                       {'loss': 1.5848, 'learning_rate': 9.983737153914309e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4564/6790 [2:38:07<1:16:18,  2.06s/it] 67%|██████▋   | 4565/6790 [2:38:09<1:15:34,  2.04s/it]                                                       {'loss': 1.4073, 'learning_rate': 9.975609043150762e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4565/6790 [2:38:09<1:15:34,  2.04s/it] 67%|██████▋   | 4566/6790 [2:38:11<1:15:24,  2.03s/it]                                                       {'loss': 1.4268, 'learning_rate': 9.967483142963463e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4566/6790 [2:38:11<1:15:24,  2.03s/it] 67%|██████▋   | 4567/6790 [2:38:13<1:14:49,  2.02s/it]                                                       {'loss': 1.5223, 'learning_rate': 9.959359455144317e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4567/6790 [2:38:13<1:14:49,  2.02s/it] 67%|██████▋   | 4568/6790 [2:38:15<1:16:07,  2.06s/it]                                                       {'loss': 1.2617, 'learning_rate': 9.95123798148476e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4568/6790 [2:38:15<1:16:07,  2.06s/it] 67%|██████▋   | 4569/6790 [2:38:18<1:20:27,  2.17s/it]                                                       {'loss': 1.317, 'learning_rate': 9.943118723775761e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4569/6790 [2:38:18<1:20:27,  2.17s/it] 67%|██████▋   | 4570/6790 [2:38:19<1:15:49,  2.05s/it]                                                       {'loss': 1.3448, 'learning_rate': 9.935001683807752e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4570/6790 [2:38:19<1:15:49,  2.05s/it] 67%|██████▋   | 4571/6790 [2:38:21<1:15:47,  2.05s/it]                                                       {'loss': 1.4521, 'learning_rate': 9.926886863370708e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4571/6790 [2:38:21<1:15:47,  2.05s/it] 67%|██████▋   | 4572/6790 [2:38:24<1:17:52,  2.11s/it]                                                       {'loss': 1.5791, 'learning_rate': 9.918774264254107e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4572/6790 [2:38:24<1:17:52,  2.11s/it] 67%|██████▋   | 4573/6790 [2:38:26<1:19:31,  2.15s/it]                                                       {'loss': 1.3762, 'learning_rate': 9.910663888246947e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4573/6790 [2:38:26<1:19:31,  2.15s/it] 67%|██████▋   | 4574/6790 [2:38:28<1:17:03,  2.09s/it]                                                       {'loss': 1.2235, 'learning_rate': 9.902555737137709e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4574/6790 [2:38:28<1:17:03,  2.09s/it] 67%|██████▋   | 4575/6790 [2:38:30<1:15:51,  2.06s/it]                                                       {'loss': 1.363, 'learning_rate': 9.89444981271441e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4575/6790 [2:38:30<1:15:51,  2.06s/it] 67%|██████▋   | 4576/6790 [2:38:32<1:13:31,  1.99s/it]                                                       {'loss': 1.0464, 'learning_rate': 9.886346116764565e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4576/6790 [2:38:32<1:13:31,  1.99s/it] 67%|██████▋   | 4577/6790 [2:38:34<1:14:07,  2.01s/it]                                                       {'loss': 1.5581, 'learning_rate': 9.878244651075208e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4577/6790 [2:38:34<1:14:07,  2.01s/it] 67%|██████▋   | 4578/6790 [2:38:36<1:11:48,  1.95s/it]                                                       {'loss': 1.3916, 'learning_rate': 9.870145417432855e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4578/6790 [2:38:36<1:11:48,  1.95s/it] 67%|██████▋   | 4579/6790 [2:38:38<1:12:22,  1.96s/it]                                                       {'loss': 1.3682, 'learning_rate': 9.862048417623555e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4579/6790 [2:38:38<1:12:22,  1.96s/it] 67%|██████▋   | 4580/6790 [2:38:39<1:12:14,  1.96s/it]                                                       {'loss': 1.2406, 'learning_rate': 9.853953653432858e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4580/6790 [2:38:39<1:12:14,  1.96s/it] 67%|██████▋   | 4581/6790 [2:38:41<1:12:02,  1.96s/it]                                                       {'loss': 1.2536, 'learning_rate': 9.845861126645825e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4581/6790 [2:38:41<1:12:02,  1.96s/it] 67%|██████▋   | 4582/6790 [2:38:44<1:15:25,  2.05s/it]                                                       {'loss': 1.2856, 'learning_rate': 9.837770839046998e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4582/6790 [2:38:44<1:15:25,  2.05s/it] 67%|██████▋   | 4583/6790 [2:38:46<1:14:22,  2.02s/it]                                                       {'loss': 1.5128, 'learning_rate': 9.829682792420472e-05, 'epoch': 0.67}
+ 67%|██████▋   | 4583/6790 [2:38:46<1:14:22,  2.02s/it] 68%|██████▊   | 4584/6790 [2:38:48<1:12:49,  1.98s/it]                                                       {'loss': 1.3469, 'learning_rate': 9.821596988549801e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4584/6790 [2:38:48<1:12:49,  1.98s/it] 68%|██████▊   | 4585/6790 [2:38:50<1:13:25,  2.00s/it]                                                       {'loss': 1.5052, 'learning_rate': 9.813513429218074e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4585/6790 [2:38:50<1:13:25,  2.00s/it] 68%|██████▊   | 4586/6790 [2:38:52<1:16:08,  2.07s/it]                                                       {'loss': 1.3618, 'learning_rate': 9.805432116207868e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4586/6790 [2:38:52<1:16:08,  2.07s/it] 68%|██████▊   | 4587/6790 [2:38:54<1:15:03,  2.04s/it]                                                       {'loss': 1.4113, 'learning_rate': 9.797353051301278e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4587/6790 [2:38:54<1:15:03,  2.04s/it] 68%|██████▊   | 4588/6790 [2:38:56<1:18:13,  2.13s/it]                                                       {'loss': 1.5057, 'learning_rate': 9.789276236279907e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4588/6790 [2:38:56<1:18:13,  2.13s/it] 68%|██████▊   | 4589/6790 [2:38:58<1:20:10,  2.19s/it]                                                       {'loss': 1.5877, 'learning_rate': 9.781201672924834e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4589/6790 [2:38:58<1:20:10,  2.19s/it] 68%|██████▊   | 4590/6790 [2:39:00<1:16:41,  2.09s/it]                                                       {'loss': 1.4269, 'learning_rate': 9.773129363016664e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4590/6790 [2:39:00<1:16:41,  2.09s/it] 68%|██████▊   | 4591/6790 [2:39:02<1:17:19,  2.11s/it]                                                       {'loss': 1.3257, 'learning_rate': 9.765059308335507e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4591/6790 [2:39:02<1:17:19,  2.11s/it] 68%|██████▊   | 4592/6790 [2:39:04<1:15:19,  2.06s/it]                                                       {'loss': 1.3438, 'learning_rate': 9.756991510660975e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4592/6790 [2:39:04<1:15:19,  2.06s/it] 68%|██████▊   | 4593/6790 [2:39:06<1:14:21,  2.03s/it]                                                       {'loss': 1.3192, 'learning_rate': 9.748925971772152e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4593/6790 [2:39:06<1:14:21,  2.03s/it] 68%|██████▊   | 4594/6790 [2:39:08<1:13:36,  2.01s/it]                                                       {'loss': 1.5617, 'learning_rate': 9.740862693447679e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4594/6790 [2:39:08<1:13:36,  2.01s/it] 68%|██████▊   | 4595/6790 [2:39:10<1:10:26,  1.93s/it]                                                       {'loss': 1.5154, 'learning_rate': 9.732801677465648e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4595/6790 [2:39:10<1:10:26,  1.93s/it] 68%|██████▊   | 4596/6790 [2:39:12<1:10:16,  1.92s/it]                                                       {'loss': 1.4035, 'learning_rate': 9.72474292560368e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4596/6790 [2:39:12<1:10:16,  1.92s/it] 68%|██████▊   | 4597/6790 [2:39:14<1:12:25,  1.98s/it]                                                       {'loss': 1.5343, 'learning_rate': 9.716686439638884e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4597/6790 [2:39:14<1:12:25,  1.98s/it] 68%|██████▊   | 4598/6790 [2:39:16<1:11:57,  1.97s/it]                                                       {'loss': 1.4605, 'learning_rate': 9.708632221347889e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4598/6790 [2:39:16<1:11:57,  1.97s/it] 68%|██████▊   | 4599/6790 [2:39:18<1:13:05,  2.00s/it]                                                       {'loss': 1.4544, 'learning_rate': 9.700580272506789e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4599/6790 [2:39:18<1:13:05,  2.00s/it] 68%|██████▊   | 4600/6790 [2:39:20<1:13:04,  2.00s/it]                                                       {'loss': 1.3357, 'learning_rate': 9.692530594891208e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4600/6790 [2:39:20<1:13:04,  2.00s/it] 68%|██████▊   | 4601/6790 [2:39:22<1:12:43,  1.99s/it]                                                       {'loss': 1.5918, 'learning_rate': 9.684483190276256e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4601/6790 [2:39:22<1:12:43,  1.99s/it] 68%|██████▊   | 4602/6790 [2:39:24<1:13:28,  2.01s/it]                                                       {'loss': 1.5354, 'learning_rate': 9.676438060436549e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4602/6790 [2:39:24<1:13:28,  2.01s/it] 68%|██████▊   | 4603/6790 [2:39:26<1:13:32,  2.02s/it]                                                       {'loss': 1.4119, 'learning_rate': 9.668395207146192e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4603/6790 [2:39:26<1:13:32,  2.02s/it] 68%|██████▊   | 4604/6790 [2:39:28<1:16:20,  2.10s/it]                                                       {'loss': 1.2204, 'learning_rate': 9.660354632178799e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4604/6790 [2:39:28<1:16:20,  2.10s/it] 68%|██████▊   | 4605/6790 [2:39:31<1:21:21,  2.23s/it]                                                       {'loss': 1.6531, 'learning_rate': 9.652316337307476e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4605/6790 [2:39:31<1:21:21,  2.23s/it] 68%|██████▊   | 4606/6790 [2:39:33<1:20:52,  2.22s/it]                                                       {'loss': 1.6183, 'learning_rate': 9.644280324304818e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4606/6790 [2:39:33<1:20:52,  2.22s/it] 68%|██████▊   | 4607/6790 [2:39:36<1:23:08,  2.29s/it]                                                       {'loss': 1.4105, 'learning_rate': 9.636246594942926e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4607/6790 [2:39:36<1:23:08,  2.29s/it] 68%|██████▊   | 4608/6790 [2:39:38<1:20:28,  2.21s/it]                                                       {'loss': 1.3843, 'learning_rate': 9.6282151509934e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4608/6790 [2:39:38<1:20:28,  2.21s/it] 68%|██████▊   | 4609/6790 [2:39:40<1:22:29,  2.27s/it]                                                       {'loss': 1.5129, 'learning_rate': 9.620185994227338e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4609/6790 [2:39:40<1:22:29,  2.27s/it] 68%|██████▊   | 4610/6790 [2:39:42<1:19:46,  2.20s/it]                                                       {'loss': 1.5474, 'learning_rate': 9.612159126415314e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4610/6790 [2:39:42<1:19:46,  2.20s/it] 68%|██████▊   | 4611/6790 [2:39:44<1:18:31,  2.16s/it]                                                       {'loss': 1.6303, 'learning_rate': 9.604134549327415e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4611/6790 [2:39:44<1:18:31,  2.16s/it] 68%|██████▊   | 4612/6790 [2:39:47<1:21:24,  2.24s/it]                                                       {'loss': 1.3689, 'learning_rate': 9.596112264733223e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4612/6790 [2:39:47<1:21:24,  2.24s/it] 68%|██████▊   | 4613/6790 [2:39:49<1:24:41,  2.33s/it]                                                       {'loss': 1.298, 'learning_rate': 9.588092274401817e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4613/6790 [2:39:49<1:24:41,  2.33s/it] 68%|██████▊   | 4614/6790 [2:39:51<1:20:48,  2.23s/it]                                                       {'loss': 1.3543, 'learning_rate': 9.580074580101739e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4614/6790 [2:39:51<1:20:48,  2.23s/it] 68%|██████▊   | 4615/6790 [2:39:53<1:17:09,  2.13s/it]                                                       {'loss': 1.5351, 'learning_rate': 9.572059183601078e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4615/6790 [2:39:53<1:17:09,  2.13s/it] 68%|██████▊   | 4616/6790 [2:39:55<1:16:02,  2.10s/it]                                                       {'loss': 1.4277, 'learning_rate': 9.564046086667368e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4616/6790 [2:39:55<1:16:02,  2.10s/it] 68%|██████▊   | 4617/6790 [2:39:57<1:16:55,  2.12s/it]                                                       {'loss': 1.4559, 'learning_rate': 9.55603529106766e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4617/6790 [2:39:57<1:16:55,  2.12s/it] 68%|██████▊   | 4618/6790 [2:39:59<1:15:31,  2.09s/it]                                                       {'loss': 1.4988, 'learning_rate': 9.548026798568494e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4618/6790 [2:39:59<1:15:31,  2.09s/it] 68%|██████▊   | 4619/6790 [2:40:01<1:12:29,  2.00s/it]                                                       {'loss': 1.4448, 'learning_rate': 9.540020610935902e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4619/6790 [2:40:01<1:12:29,  2.00s/it] 68%|██████▊   | 4620/6790 [2:40:03<1:13:34,  2.03s/it]                                                       {'loss': 1.3787, 'learning_rate': 9.532016729935414e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4620/6790 [2:40:03<1:13:34,  2.03s/it] 68%|██████▊   | 4621/6790 [2:40:05<1:16:19,  2.11s/it]                                                       {'loss': 1.5542, 'learning_rate': 9.524015157332025e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4621/6790 [2:40:05<1:16:19,  2.11s/it] 68%|██████▊   | 4622/6790 [2:40:08<1:16:25,  2.12s/it]                                                       {'loss': 1.411, 'learning_rate': 9.51601589489025e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4622/6790 [2:40:08<1:16:25,  2.12s/it] 68%|██████▊   | 4623/6790 [2:40:10<1:18:12,  2.17s/it]                                                       {'loss': 1.5527, 'learning_rate': 9.508018944374086e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4623/6790 [2:40:10<1:18:12,  2.17s/it] 68%|██████▊   | 4624/6790 [2:40:12<1:16:09,  2.11s/it]                                                       {'loss': 1.345, 'learning_rate': 9.500024307547024e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4624/6790 [2:40:12<1:16:09,  2.11s/it] 68%|██████▊   | 4625/6790 [2:40:14<1:16:47,  2.13s/it]                                                       {'loss': 1.6383, 'learning_rate': 9.492031986172017e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4625/6790 [2:40:14<1:16:47,  2.13s/it] 68%|██████▊   | 4626/6790 [2:40:17<1:21:41,  2.26s/it]                                                       {'loss': 1.6149, 'learning_rate': 9.484041982011558e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4626/6790 [2:40:17<1:21:41,  2.26s/it] 68%|██████▊   | 4627/6790 [2:40:19<1:18:56,  2.19s/it]                                                       {'loss': 1.4425, 'learning_rate': 9.476054296827583e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4627/6790 [2:40:19<1:18:56,  2.19s/it] 68%|██████▊   | 4628/6790 [2:40:20<1:15:07,  2.08s/it]                                                       {'loss': 1.4708, 'learning_rate': 9.468068932381538e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4628/6790 [2:40:20<1:15:07,  2.08s/it] 68%|██████▊   | 4629/6790 [2:40:22<1:12:11,  2.00s/it]                                                       {'loss': 1.3772, 'learning_rate': 9.460085890434353e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4629/6790 [2:40:22<1:12:11,  2.00s/it] 68%|██████▊   | 4630/6790 [2:40:24<1:11:04,  1.97s/it]                                                       {'loss': 1.1166, 'learning_rate': 9.45210517274646e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4630/6790 [2:40:24<1:11:04,  1.97s/it] 68%|██████▊   | 4631/6790 [2:40:26<1:12:23,  2.01s/it]                                                       {'loss': 1.2327, 'learning_rate': 9.444126781077742e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4631/6790 [2:40:26<1:12:23,  2.01s/it] 68%|██████▊   | 4632/6790 [2:40:28<1:10:42,  1.97s/it]                                                       {'loss': 1.205, 'learning_rate': 9.436150717187604e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4632/6790 [2:40:28<1:10:42,  1.97s/it] 68%|██████▊   | 4633/6790 [2:40:30<1:14:30,  2.07s/it]                                                       {'loss': 1.5731, 'learning_rate': 9.428176982834926e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4633/6790 [2:40:30<1:14:30,  2.07s/it] 68%|██████▊   | 4634/6790 [2:40:32<1:12:50,  2.03s/it]                                                       {'loss': 1.3271, 'learning_rate': 9.420205579778079e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4634/6790 [2:40:32<1:12:50,  2.03s/it] 68%|██████▊   | 4635/6790 [2:40:34<1:12:27,  2.02s/it]                                                       {'loss': 1.3388, 'learning_rate': 9.412236509774901e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4635/6790 [2:40:34<1:12:27,  2.02s/it] 68%|██████▊   | 4636/6790 [2:40:36<1:11:04,  1.98s/it]                                                       {'loss': 1.2963, 'learning_rate': 9.404269774582731e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4636/6790 [2:40:36<1:11:04,  1.98s/it] 68%|██████▊   | 4637/6790 [2:40:38<1:11:33,  1.99s/it]                                                       {'loss': 1.4888, 'learning_rate': 9.39630537595841e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4637/6790 [2:40:38<1:11:33,  1.99s/it] 68%|██████▊   | 4638/6790 [2:40:40<1:10:42,  1.97s/it]                                                       {'loss': 1.4618, 'learning_rate': 9.388343315658225e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4638/6790 [2:40:40<1:10:42,  1.97s/it] 68%|██████▊   | 4639/6790 [2:40:42<1:10:21,  1.96s/it]                                                       {'loss': 1.6773, 'learning_rate': 9.380383595437978e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4639/6790 [2:40:42<1:10:21,  1.96s/it] 68%|██████▊   | 4640/6790 [2:40:44<1:08:36,  1.91s/it]                                                       {'loss': 1.447, 'learning_rate': 9.372426217052941e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4640/6790 [2:40:44<1:08:36,  1.91s/it] 68%|██████▊   | 4641/6790 [2:40:46<1:11:51,  2.01s/it]                                                       {'loss': 1.4646, 'learning_rate': 9.364471182257879e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4641/6790 [2:40:46<1:11:51,  2.01s/it] 68%|██████▊   | 4642/6790 [2:40:48<1:12:07,  2.01s/it]                                                       {'loss': 1.4545, 'learning_rate': 9.356518492807024e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4642/6790 [2:40:48<1:12:07,  2.01s/it] 68%|██████▊   | 4643/6790 [2:40:50<1:11:32,  2.00s/it]                                                       {'loss': 1.4589, 'learning_rate': 9.348568150454106e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4643/6790 [2:40:50<1:11:32,  2.00s/it] 68%|██████▊   | 4644/6790 [2:40:52<1:13:35,  2.06s/it]                                                       {'loss': 1.4339, 'learning_rate': 9.340620156952333e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4644/6790 [2:40:52<1:13:35,  2.06s/it] 68%|██████▊   | 4645/6790 [2:40:54<1:11:16,  1.99s/it]                                                       {'loss': 1.3747, 'learning_rate': 9.332674514054403e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4645/6790 [2:40:54<1:11:16,  1.99s/it] 68%|██████▊   | 4646/6790 [2:40:56<1:10:35,  1.98s/it]                                                       {'loss': 1.4208, 'learning_rate': 9.324731223512462e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4646/6790 [2:40:56<1:10:35,  1.98s/it] 68%|██████▊   | 4647/6790 [2:40:58<1:08:36,  1.92s/it]                                                       {'loss': 1.3849, 'learning_rate': 9.316790287078195e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4647/6790 [2:40:58<1:08:36,  1.92s/it] 68%|██████▊   | 4648/6790 [2:41:00<1:07:58,  1.90s/it]                                                       {'loss': 1.4925, 'learning_rate': 9.308851706502712e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4648/6790 [2:41:00<1:07:58,  1.90s/it] 68%|██████▊   | 4649/6790 [2:41:02<1:10:58,  1.99s/it]                                                       {'loss': 1.448, 'learning_rate': 9.300915483536635e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4649/6790 [2:41:02<1:10:58,  1.99s/it] 68%|██████▊   | 4650/6790 [2:41:04<1:10:53,  1.99s/it]                                                       {'loss': 1.7085, 'learning_rate': 9.292981619930057e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4650/6790 [2:41:04<1:10:53,  1.99s/it] 68%|██████▊   | 4651/6790 [2:41:06<1:11:34,  2.01s/it]                                                       {'loss': 1.3412, 'learning_rate': 9.285050117432559e-05, 'epoch': 0.68}
+ 68%|██████▊   | 4651/6790 [2:41:06<1:11:34,  2.01s/it] 69%|██████▊   | 4652/6790 [2:41:08<1:14:59,  2.10s/it]                                                       {'loss': 1.7296, 'learning_rate': 9.277120977793178e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4652/6790 [2:41:08<1:14:59,  2.10s/it] 69%|██████▊   | 4653/6790 [2:41:11<1:15:17,  2.11s/it]                                                       {'loss': 1.4695, 'learning_rate': 9.269194202760459e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4653/6790 [2:41:11<1:15:17,  2.11s/it] 69%|██████▊   | 4654/6790 [2:41:13<1:19:08,  2.22s/it]                                                       {'loss': 1.4827, 'learning_rate': 9.261269794082406e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4654/6790 [2:41:13<1:19:08,  2.22s/it] 69%|██████▊   | 4655/6790 [2:41:15<1:16:58,  2.16s/it]                                                       {'loss': 1.418, 'learning_rate': 9.253347753506511e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4655/6790 [2:41:15<1:16:58,  2.16s/it] 69%|██████▊   | 4656/6790 [2:41:17<1:14:44,  2.10s/it]                                                       {'loss': 1.3794, 'learning_rate': 9.245428082779745e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4656/6790 [2:41:17<1:14:44,  2.10s/it] 69%|██████▊   | 4657/6790 [2:41:19<1:14:01,  2.08s/it]                                                       {'loss': 1.4865, 'learning_rate': 9.237510783648536e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4657/6790 [2:41:19<1:14:01,  2.08s/it] 69%|██████▊   | 4658/6790 [2:41:21<1:13:38,  2.07s/it]                                                       {'loss': 1.3423, 'learning_rate': 9.229595857858826e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4658/6790 [2:41:21<1:13:38,  2.07s/it] 69%|██████▊   | 4659/6790 [2:41:23<1:14:01,  2.08s/it]                                                       {'loss': 1.3367, 'learning_rate': 9.221683307155995e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4659/6790 [2:41:23<1:14:01,  2.08s/it] 69%|██████▊   | 4660/6790 [2:41:25<1:11:16,  2.01s/it]                                                       {'loss': 1.3684, 'learning_rate': 9.213773133284924e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4660/6790 [2:41:25<1:11:16,  2.01s/it] 69%|██████▊   | 4661/6790 [2:41:27<1:10:58,  2.00s/it]                                                       {'loss': 1.3492, 'learning_rate': 9.205865337989963e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4661/6790 [2:41:27<1:10:58,  2.00s/it] 69%|██████▊   | 4662/6790 [2:41:29<1:10:12,  1.98s/it]                                                       {'loss': 1.4585, 'learning_rate': 9.197959923014942e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4662/6790 [2:41:29<1:10:12,  1.98s/it] 69%|██████▊   | 4663/6790 [2:41:31<1:11:20,  2.01s/it]                                                       {'loss': 1.6022, 'learning_rate': 9.190056890103149e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4663/6790 [2:41:31<1:11:20,  2.01s/it] 69%|██████▊   | 4664/6790 [2:41:33<1:10:14,  1.98s/it]                                                       {'loss': 1.5136, 'learning_rate': 9.182156240997365e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4664/6790 [2:41:33<1:10:14,  1.98s/it] 69%|██████▊   | 4665/6790 [2:41:35<1:08:27,  1.93s/it]                                                       {'loss': 1.3992, 'learning_rate': 9.174257977439842e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4665/6790 [2:41:35<1:08:27,  1.93s/it] 69%|██████▊   | 4666/6790 [2:41:37<1:08:21,  1.93s/it]                                                       {'loss': 1.5672, 'learning_rate': 9.166362101172305e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4666/6790 [2:41:37<1:08:21,  1.93s/it] 69%|██████▊   | 4667/6790 [2:41:39<1:08:49,  1.94s/it]                                                       {'loss': 1.3759, 'learning_rate': 9.15846861393594e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4667/6790 [2:41:39<1:08:49,  1.94s/it] 69%|██████▊   | 4668/6790 [2:41:41<1:16:49,  2.17s/it]                                                       {'loss': 1.5001, 'learning_rate': 9.150577517471424e-05, 'epoch': 0.69}
+ 69%|██████▊   | 4668/6790 [2:41:41<1:16:49,  2.17s/it] 69%|██████▉   | 4669/6790 [2:41:43<1:11:47,  2.03s/it]                                                       {'loss': 1.3267, 'learning_rate': 9.142688813518896e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4669/6790 [2:41:43<1:11:47,  2.03s/it] 69%|██████▉   | 4670/6790 [2:41:45<1:12:48,  2.06s/it]                                                       {'loss': 1.4039, 'learning_rate': 9.134802503817976e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4670/6790 [2:41:45<1:12:48,  2.06s/it] 69%|██████▉   | 4671/6790 [2:41:47<1:11:20,  2.02s/it]                                                       {'loss': 1.3663, 'learning_rate': 9.126918590107749e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4671/6790 [2:41:47<1:11:20,  2.02s/it] 69%|██████▉   | 4672/6790 [2:41:49<1:13:03,  2.07s/it]                                                       {'loss': 1.4265, 'learning_rate': 9.119037074126775e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4672/6790 [2:41:49<1:13:03,  2.07s/it] 69%|██████▉   | 4673/6790 [2:41:52<1:17:40,  2.20s/it]                                                       {'loss': 1.3884, 'learning_rate': 9.111157957613088e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4673/6790 [2:41:52<1:17:40,  2.20s/it] 69%|██████▉   | 4674/6790 [2:41:54<1:16:47,  2.18s/it]                                                       {'loss': 1.4896, 'learning_rate': 9.103281242304176e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4674/6790 [2:41:54<1:16:47,  2.18s/it] 69%|██████▉   | 4675/6790 [2:41:56<1:17:21,  2.19s/it]                                                       {'loss': 1.466, 'learning_rate': 9.095406929937021e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4675/6790 [2:41:56<1:17:21,  2.19s/it] 69%|██████▉   | 4676/6790 [2:41:58<1:16:05,  2.16s/it]                                                       {'loss': 1.5143, 'learning_rate': 9.087535022248057e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4676/6790 [2:41:58<1:16:05,  2.16s/it] 69%|██████▉   | 4677/6790 [2:42:01<1:17:25,  2.20s/it]                                                       {'loss': 1.1977, 'learning_rate': 9.079665520973211e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4677/6790 [2:42:01<1:17:25,  2.20s/it] 69%|██████▉   | 4678/6790 [2:42:03<1:17:54,  2.21s/it]                                                       {'loss': 1.5323, 'learning_rate': 9.071798427847835e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4678/6790 [2:42:03<1:17:54,  2.21s/it] 69%|██████▉   | 4679/6790 [2:42:05<1:16:45,  2.18s/it]                                                       {'loss': 1.6486, 'learning_rate': 9.06393374460681e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4679/6790 [2:42:05<1:16:45,  2.18s/it] 69%|██████▉   | 4680/6790 [2:42:07<1:15:01,  2.13s/it]                                                       {'loss': 1.5469, 'learning_rate': 9.056071472984433e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4680/6790 [2:42:07<1:15:01,  2.13s/it] 69%|██████▉   | 4681/6790 [2:42:09<1:12:22,  2.06s/it]                                                       {'loss': 1.5127, 'learning_rate': 9.048211614714503e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4681/6790 [2:42:09<1:12:22,  2.06s/it] 69%|██████▉   | 4682/6790 [2:42:11<1:12:55,  2.08s/it]                                                       {'loss': 1.3972, 'learning_rate': 9.040354171530255e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4682/6790 [2:42:11<1:12:55,  2.08s/it] 69%|██████▉   | 4683/6790 [2:42:13<1:10:09,  2.00s/it]                                                       {'loss': 1.2695, 'learning_rate': 9.032499145164435e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4683/6790 [2:42:13<1:10:09,  2.00s/it] 69%|██████▉   | 4684/6790 [2:42:15<1:09:38,  1.98s/it]                                                       {'loss': 1.4949, 'learning_rate': 9.024646537349213e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4684/6790 [2:42:15<1:09:38,  1.98s/it] 69%|██████▉   | 4685/6790 [2:42:17<1:12:25,  2.06s/it]                                                       {'loss': 1.2027, 'learning_rate': 9.016796349816253e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4685/6790 [2:42:17<1:12:25,  2.06s/it] 69%|██████▉   | 4686/6790 [2:42:19<1:11:27,  2.04s/it]                                                       {'loss': 1.4575, 'learning_rate': 9.008948584296673e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4686/6790 [2:42:19<1:11:27,  2.04s/it] 69%|██████▉   | 4687/6790 [2:42:21<1:10:50,  2.02s/it]                                                       {'loss': 1.4175, 'learning_rate': 9.00110324252106e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4687/6790 [2:42:21<1:10:50,  2.02s/it] 69%|██████▉   | 4688/6790 [2:42:23<1:11:10,  2.03s/it]                                                       {'loss': 1.4553, 'learning_rate': 8.993260326219477e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4688/6790 [2:42:23<1:11:10,  2.03s/it] 69%|██████▉   | 4689/6790 [2:42:25<1:08:19,  1.95s/it]                                                       {'loss': 1.3483, 'learning_rate': 8.98541983712142e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4689/6790 [2:42:25<1:08:19,  1.95s/it] 69%|██████▉   | 4690/6790 [2:42:27<1:17:14,  2.21s/it]                                                       {'loss': 1.4818, 'learning_rate': 8.977581776955899e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4690/6790 [2:42:28<1:17:14,  2.21s/it] 69%|██████▉   | 4691/6790 [2:42:30<1:18:10,  2.23s/it]                                                       {'loss': 1.4045, 'learning_rate': 8.969746147451339e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4691/6790 [2:42:30<1:18:10,  2.23s/it] 69%|██████▉   | 4692/6790 [2:42:32<1:14:36,  2.13s/it]                                                       {'loss': 1.2975, 'learning_rate': 8.96191295033566e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4692/6790 [2:42:32<1:14:36,  2.13s/it] 69%|██████▉   | 4693/6790 [2:42:34<1:15:14,  2.15s/it]                                                       {'loss': 1.483, 'learning_rate': 8.954082187336236e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4693/6790 [2:42:34<1:15:14,  2.15s/it] 69%|██████▉   | 4694/6790 [2:42:36<1:14:59,  2.15s/it]                                                       {'loss': 1.4083, 'learning_rate': 8.946253860179911e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4694/6790 [2:42:36<1:14:59,  2.15s/it] 69%|██████▉   | 4695/6790 [2:42:39<1:19:14,  2.27s/it]                                                       {'loss': 1.4331, 'learning_rate': 8.938427970592975e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4695/6790 [2:42:39<1:19:14,  2.27s/it] 69%|██████▉   | 4696/6790 [2:42:40<1:15:27,  2.16s/it]                                                       {'loss': 1.496, 'learning_rate': 8.930604520301196e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4696/6790 [2:42:40<1:15:27,  2.16s/it] 69%|██████▉   | 4697/6790 [2:42:43<1:16:26,  2.19s/it]                                                       {'loss': 1.4267, 'learning_rate': 8.922783511029798e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4697/6790 [2:42:43<1:16:26,  2.19s/it] 69%|██████▉   | 4698/6790 [2:42:45<1:18:53,  2.26s/it]                                                       {'loss': 1.397, 'learning_rate': 8.914964944503476e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4698/6790 [2:42:45<1:18:53,  2.26s/it] 69%|██████▉   | 4699/6790 [2:42:47<1:15:32,  2.17s/it]                                                       {'loss': 1.3054, 'learning_rate': 8.907148822446365e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4699/6790 [2:42:47<1:15:32,  2.17s/it] 69%|██████▉   | 4700/6790 [2:42:49<1:12:21,  2.08s/it]                                                       {'loss': 1.3976, 'learning_rate': 8.899335146582082e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4700/6790 [2:42:49<1:12:21,  2.08s/it] 69%|██████▉   | 4701/6790 [2:42:51<1:11:55,  2.07s/it]                                                       {'loss': 1.2665, 'learning_rate': 8.891523918633695e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4701/6790 [2:42:51<1:11:55,  2.07s/it] 69%|██████▉   | 4702/6790 [2:42:53<1:09:55,  2.01s/it]                                                       {'loss': 1.2853, 'learning_rate': 8.883715140323743e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4702/6790 [2:42:53<1:09:55,  2.01s/it] 69%|██████▉   | 4703/6790 [2:42:55<1:14:41,  2.15s/it]                                                       {'loss': 1.407, 'learning_rate': 8.875908813374194e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4703/6790 [2:42:55<1:14:41,  2.15s/it] 69%|██████▉   | 4704/6790 [2:42:57<1:11:32,  2.06s/it]                                                       {'loss': 1.3584, 'learning_rate': 8.868104939506519e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4704/6790 [2:42:57<1:11:32,  2.06s/it] 69%|██████▉   | 4705/6790 [2:42:59<1:08:46,  1.98s/it]                                                       {'loss': 1.5266, 'learning_rate': 8.860303520441624e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4705/6790 [2:42:59<1:08:46,  1.98s/it] 69%|██████▉   | 4706/6790 [2:43:01<1:09:35,  2.00s/it]                                                       {'loss': 1.3297, 'learning_rate': 8.852504557899866e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4706/6790 [2:43:01<1:09:35,  2.00s/it] 69%|██████▉   | 4707/6790 [2:43:03<1:10:25,  2.03s/it]                                                       {'loss': 1.4414, 'learning_rate': 8.844708053601072e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4707/6790 [2:43:03<1:10:25,  2.03s/it] 69%|██████▉   | 4708/6790 [2:43:05<1:08:48,  1.98s/it]                                                       {'loss': 1.4162, 'learning_rate': 8.83691400926453e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4708/6790 [2:43:05<1:08:48,  1.98s/it] 69%|██████▉   | 4709/6790 [2:43:07<1:13:07,  2.11s/it]                                                       {'loss': 1.4923, 'learning_rate': 8.829122426608984e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4709/6790 [2:43:07<1:13:07,  2.11s/it] 69%|██████▉   | 4710/6790 [2:43:10<1:22:49,  2.39s/it]                                                       {'loss': 1.2909, 'learning_rate': 8.821333307352622e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4710/6790 [2:43:10<1:22:49,  2.39s/it] 69%|██████▉   | 4711/6790 [2:43:12<1:17:06,  2.23s/it]                                                       {'loss': 1.5229, 'learning_rate': 8.813546653213102e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4711/6790 [2:43:12<1:17:06,  2.23s/it] 69%|██████▉   | 4712/6790 [2:43:14<1:15:18,  2.17s/it]                                                       {'loss': 1.6438, 'learning_rate': 8.805762465907539e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4712/6790 [2:43:14<1:15:18,  2.17s/it] 69%|██████▉   | 4713/6790 [2:43:16<1:14:32,  2.15s/it]                                                       {'loss': 1.3667, 'learning_rate': 8.797980747152503e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4713/6790 [2:43:17<1:14:32,  2.15s/it] 69%|██████▉   | 4714/6790 [2:43:18<1:11:07,  2.06s/it]                                                       {'loss': 1.2919, 'learning_rate': 8.790201498663997e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4714/6790 [2:43:18<1:11:07,  2.06s/it] 69%|██████▉   | 4715/6790 [2:43:20<1:11:41,  2.07s/it]                                                       {'loss': 1.3884, 'learning_rate': 8.78242472215753e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4715/6790 [2:43:20<1:11:41,  2.07s/it] 69%|██████▉   | 4716/6790 [2:43:23<1:12:52,  2.11s/it]                                                       {'loss': 1.3874, 'learning_rate': 8.774650419348007e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4716/6790 [2:43:23<1:12:52,  2.11s/it] 69%|██████▉   | 4717/6790 [2:43:25<1:10:57,  2.05s/it]                                                       {'loss': 1.5619, 'learning_rate': 8.766878591949829e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4717/6790 [2:43:25<1:10:57,  2.05s/it] 69%|██████▉   | 4718/6790 [2:43:27<1:11:14,  2.06s/it]                                                       {'loss': 1.4253, 'learning_rate': 8.759109241676835e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4718/6790 [2:43:27<1:11:14,  2.06s/it] 69%|██████▉   | 4719/6790 [2:43:29<1:10:35,  2.05s/it]                                                       {'loss': 1.3493, 'learning_rate': 8.751342370242329e-05, 'epoch': 0.69}
+ 69%|██████▉   | 4719/6790 [2:43:29<1:10:35,  2.05s/it] 70%|██████▉   | 4720/6790 [2:43:31<1:10:58,  2.06s/it]                                                       {'loss': 1.454, 'learning_rate': 8.743577979359041e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4720/6790 [2:43:31<1:10:58,  2.06s/it] 70%|██████▉   | 4721/6790 [2:43:33<1:08:39,  1.99s/it]                                                       {'loss': 1.264, 'learning_rate': 8.735816070739176e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4721/6790 [2:43:33<1:08:39,  1.99s/it] 70%|██████▉   | 4722/6790 [2:43:34<1:07:44,  1.97s/it]                                                       {'loss': 1.3253, 'learning_rate': 8.728056646094409e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4722/6790 [2:43:34<1:07:44,  1.97s/it] 70%|██████▉   | 4723/6790 [2:43:37<1:08:41,  1.99s/it]                                                       {'loss': 1.5584, 'learning_rate': 8.720299707135824e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4723/6790 [2:43:37<1:08:41,  1.99s/it] 70%|██████▉   | 4724/6790 [2:43:39<1:10:12,  2.04s/it]                                                       {'loss': 1.3596, 'learning_rate': 8.712545255573996e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4724/6790 [2:43:39<1:10:12,  2.04s/it] 70%|██████▉   | 4725/6790 [2:43:41<1:17:59,  2.27s/it]                                                       {'loss': 1.3688, 'learning_rate': 8.704793293118911e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4725/6790 [2:43:41<1:17:59,  2.27s/it] 70%|██████▉   | 4726/6790 [2:43:43<1:15:23,  2.19s/it]                                                       {'loss': 1.4926, 'learning_rate': 8.69704382148006e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4726/6790 [2:43:43<1:15:23,  2.19s/it] 70%|██████▉   | 4727/6790 [2:43:45<1:12:39,  2.11s/it]                                                       {'loss': 1.4962, 'learning_rate': 8.689296842366332e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4727/6790 [2:43:45<1:12:39,  2.11s/it] 70%|██████▉   | 4728/6790 [2:43:47<1:10:49,  2.06s/it]                                                       {'loss': 1.3822, 'learning_rate': 8.681552357486096e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4728/6790 [2:43:47<1:10:49,  2.06s/it] 70%|██████▉   | 4729/6790 [2:43:50<1:13:25,  2.14s/it]                                                       {'loss': 1.1469, 'learning_rate': 8.673810368547163e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4729/6790 [2:43:50<1:13:25,  2.14s/it] 70%|██████▉   | 4730/6790 [2:43:52<1:11:43,  2.09s/it]                                                       {'loss': 1.3749, 'learning_rate': 8.666070877256806e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4730/6790 [2:43:52<1:11:43,  2.09s/it] 70%|██████▉   | 4731/6790 [2:43:54<1:09:17,  2.02s/it]                                                       {'loss': 1.3266, 'learning_rate': 8.658333885321717e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4731/6790 [2:43:54<1:09:17,  2.02s/it] 70%|██████▉   | 4732/6790 [2:43:56<1:09:21,  2.02s/it]                                                       {'loss': 1.4069, 'learning_rate': 8.650599394448065e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4732/6790 [2:43:56<1:09:21,  2.02s/it] 70%|██████▉   | 4733/6790 [2:43:57<1:06:45,  1.95s/it]                                                       {'loss': 1.3197, 'learning_rate': 8.642867406341458e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4733/6790 [2:43:57<1:06:45,  1.95s/it] 70%|██████▉   | 4734/6790 [2:43:59<1:07:20,  1.97s/it]                                                       {'loss': 1.49, 'learning_rate': 8.635137922706955e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4734/6790 [2:43:59<1:07:20,  1.97s/it] 70%|██████▉   | 4735/6790 [2:44:02<1:17:38,  2.27s/it]                                                       {'loss': 1.3015, 'learning_rate': 8.627410945249044e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4735/6790 [2:44:02<1:17:38,  2.27s/it] 70%|██████▉   | 4736/6790 [2:44:04<1:15:08,  2.19s/it]                                                       {'loss': 1.4307, 'learning_rate': 8.619686475671703e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4736/6790 [2:44:04<1:15:08,  2.19s/it] 70%|██████▉   | 4737/6790 [2:44:06<1:10:01,  2.05s/it]                                                       {'loss': 1.3564, 'learning_rate': 8.611964515678308e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4737/6790 [2:44:06<1:10:01,  2.05s/it] 70%|██████▉   | 4738/6790 [2:44:08<1:11:28,  2.09s/it]                                                       {'loss': 1.3471, 'learning_rate': 8.604245066971712e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4738/6790 [2:44:08<1:11:28,  2.09s/it] 70%|██████▉   | 4739/6790 [2:44:11<1:13:52,  2.16s/it]                                                       {'loss': 1.2145, 'learning_rate': 8.596528131254205e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4739/6790 [2:44:11<1:13:52,  2.16s/it] 70%|██████▉   | 4740/6790 [2:44:12<1:11:42,  2.10s/it]                                                       {'loss': 1.2201, 'learning_rate': 8.588813710227521e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4740/6790 [2:44:12<1:11:42,  2.10s/it] 70%|██████▉   | 4741/6790 [2:44:15<1:17:15,  2.26s/it]                                                       {'loss': 1.4895, 'learning_rate': 8.581101805592855e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4741/6790 [2:44:15<1:17:15,  2.26s/it] 70%|██████▉   | 4742/6790 [2:44:17<1:15:58,  2.23s/it]                                                       {'loss': 1.5092, 'learning_rate': 8.573392419050818e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4742/6790 [2:44:17<1:15:58,  2.23s/it] 70%|██████▉   | 4743/6790 [2:44:19<1:13:28,  2.15s/it]                                                       {'loss': 1.5781, 'learning_rate': 8.565685552301488e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4743/6790 [2:44:19<1:13:28,  2.15s/it] 70%|██████▉   | 4744/6790 [2:44:22<1:17:26,  2.27s/it]                                                       {'loss': 1.5071, 'learning_rate': 8.557981207044381e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4744/6790 [2:44:22<1:17:26,  2.27s/it] 70%|██████▉   | 4745/6790 [2:44:24<1:18:32,  2.30s/it]                                                       {'loss': 1.5976, 'learning_rate': 8.550279384978465e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4745/6790 [2:44:24<1:18:32,  2.30s/it] 70%|██████▉   | 4746/6790 [2:44:26<1:15:32,  2.22s/it]                                                       {'loss': 1.4705, 'learning_rate': 8.542580087802125e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4746/6790 [2:44:26<1:15:32,  2.22s/it] 70%|██████▉   | 4747/6790 [2:44:28<1:13:11,  2.15s/it]                                                       {'loss': 1.3828, 'learning_rate': 8.534883317213233e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4747/6790 [2:44:28<1:13:11,  2.15s/it] 70%|██████▉   | 4748/6790 [2:44:30<1:13:57,  2.17s/it]                                                       {'loss': 1.3728, 'learning_rate': 8.52718907490906e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4748/6790 [2:44:30<1:13:57,  2.17s/it] 70%|██████▉   | 4749/6790 [2:44:32<1:11:37,  2.11s/it]                                                       {'loss': 1.4741, 'learning_rate': 8.519497362586344e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4749/6790 [2:44:32<1:11:37,  2.11s/it] 70%|██████▉   | 4750/6790 [2:44:35<1:12:28,  2.13s/it]                                                       {'loss': 1.5449, 'learning_rate': 8.511808181941261e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4750/6790 [2:44:35<1:12:28,  2.13s/it] 70%|██████▉   | 4751/6790 [2:44:38<1:25:04,  2.50s/it]                                                       {'loss': 1.325, 'learning_rate': 8.504121534669431e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4751/6790 [2:44:38<1:25:04,  2.50s/it] 70%|██████▉   | 4752/6790 [2:44:40<1:18:16,  2.30s/it]                                                       {'loss': 1.5082, 'learning_rate': 8.496437422465904e-05, 'epoch': 0.7}
+ 70%|██████▉   | 4752/6790 [2:44:40<1:18:16,  2.30s/it] 70%|███████   | 4753/6790 [2:44:42<1:15:51,  2.23s/it]                                                       {'loss': 1.3657, 'learning_rate': 8.488755847025178e-05, 'epoch': 0.7}
+ 70%|███████   | 4753/6790 [2:44:42<1:15:51,  2.23s/it] 70%|███████   | 4754/6790 [2:44:44<1:12:12,  2.13s/it]                                                       {'loss': 1.3965, 'learning_rate': 8.481076810041198e-05, 'epoch': 0.7}
+ 70%|███████   | 4754/6790 [2:44:44<1:12:12,  2.13s/it] 70%|███████   | 4755/6790 [2:44:46<1:09:41,  2.05s/it]                                                       {'loss': 1.1661, 'learning_rate': 8.473400313207338e-05, 'epoch': 0.7}
+ 70%|███████   | 4755/6790 [2:44:46<1:09:41,  2.05s/it] 70%|███████   | 4756/6790 [2:44:48<1:14:01,  2.18s/it]                                                       {'loss': 1.4627, 'learning_rate': 8.46572635821643e-05, 'epoch': 0.7}
+ 70%|███████   | 4756/6790 [2:44:48<1:14:01,  2.18s/it] 70%|███████   | 4757/6790 [2:44:50<1:14:21,  2.19s/it]                                                       {'loss': 1.4958, 'learning_rate': 8.45805494676071e-05, 'epoch': 0.7}
+ 70%|███████   | 4757/6790 [2:44:50<1:14:21,  2.19s/it] 70%|███████   | 4758/6790 [2:44:52<1:11:39,  2.12s/it]                                                       {'loss': 1.4834, 'learning_rate': 8.450386080531901e-05, 'epoch': 0.7}
+ 70%|███████   | 4758/6790 [2:44:52<1:11:39,  2.12s/it] 70%|███████   | 4759/6790 [2:44:54<1:09:41,  2.06s/it]                                                       {'loss': 1.3746, 'learning_rate': 8.442719761221118e-05, 'epoch': 0.7}
+ 70%|███████   | 4759/6790 [2:44:54<1:09:41,  2.06s/it] 70%|███████   | 4760/6790 [2:44:56<1:11:34,  2.12s/it]                                                       {'loss': 1.3961, 'learning_rate': 8.435055990518948e-05, 'epoch': 0.7}
+ 70%|███████   | 4760/6790 [2:44:56<1:11:34,  2.12s/it] 70%|███████   | 4761/6790 [2:44:58<1:09:49,  2.06s/it]                                                       {'loss': 1.2447, 'learning_rate': 8.4273947701154e-05, 'epoch': 0.7}
+ 70%|███████   | 4761/6790 [2:44:58<1:09:49,  2.06s/it] 70%|███████   | 4762/6790 [2:45:00<1:09:05,  2.04s/it]                                                       {'loss': 1.3042, 'learning_rate': 8.419736101699933e-05, 'epoch': 0.7}
+ 70%|███████   | 4762/6790 [2:45:00<1:09:05,  2.04s/it] 70%|███████   | 4763/6790 [2:45:03<1:16:07,  2.25s/it]                                                       {'loss': 1.5107, 'learning_rate': 8.41207998696142e-05, 'epoch': 0.7}
+ 70%|███████   | 4763/6790 [2:45:03<1:16:07,  2.25s/it] 70%|███████   | 4764/6790 [2:45:06<1:18:18,  2.32s/it]                                                       {'loss': 1.4441, 'learning_rate': 8.404426427588192e-05, 'epoch': 0.7}
+ 70%|███████   | 4764/6790 [2:45:06<1:18:18,  2.32s/it] 70%|███████   | 4765/6790 [2:45:08<1:16:03,  2.25s/it]                                                       {'loss': 1.7535, 'learning_rate': 8.39677542526801e-05, 'epoch': 0.7}
+ 70%|███████   | 4765/6790 [2:45:08<1:16:03,  2.25s/it] 70%|███████   | 4766/6790 [2:45:10<1:13:33,  2.18s/it]                                                       {'loss': 1.3072, 'learning_rate': 8.38912698168808e-05, 'epoch': 0.7}
+ 70%|███████   | 4766/6790 [2:45:10<1:13:33,  2.18s/it] 70%|███████   | 4767/6790 [2:45:12<1:15:59,  2.25s/it]                                                       {'loss': 1.3282, 'learning_rate': 8.381481098535013e-05, 'epoch': 0.7}
+ 70%|███████   | 4767/6790 [2:45:12<1:15:59,  2.25s/it] 70%|███████   | 4768/6790 [2:45:14<1:11:53,  2.13s/it]                                                       {'loss': 0.9761, 'learning_rate': 8.373837777494904e-05, 'epoch': 0.7}
+ 70%|███████   | 4768/6790 [2:45:14<1:11:53,  2.13s/it] 70%|███████   | 4769/6790 [2:45:16<1:08:49,  2.04s/it]                                                       {'loss': 1.3591, 'learning_rate': 8.366197020253237e-05, 'epoch': 0.7}
+ 70%|███████   | 4769/6790 [2:45:16<1:08:49,  2.04s/it] 70%|███████   | 4770/6790 [2:45:18<1:09:36,  2.07s/it]                                                       {'loss': 1.2575, 'learning_rate': 8.358558828494962e-05, 'epoch': 0.7}
+ 70%|███████   | 4770/6790 [2:45:18<1:09:36,  2.07s/it] 70%|███████   | 4771/6790 [2:45:20<1:10:42,  2.10s/it]                                                       {'loss': 1.4512, 'learning_rate': 8.350923203904433e-05, 'epoch': 0.7}
+ 70%|███████   | 4771/6790 [2:45:20<1:10:42,  2.10s/it] 70%|███████   | 4772/6790 [2:45:22<1:06:57,  1.99s/it]                                                       {'loss': 1.372, 'learning_rate': 8.343290148165474e-05, 'epoch': 0.7}
+ 70%|███████   | 4772/6790 [2:45:22<1:06:57,  1.99s/it] 70%|███████   | 4773/6790 [2:45:24<1:08:32,  2.04s/it]                                                       {'loss': 1.3759, 'learning_rate': 8.335659662961326e-05, 'epoch': 0.7}
+ 70%|███████   | 4773/6790 [2:45:24<1:08:32,  2.04s/it] 70%|███████   | 4774/6790 [2:45:26<1:07:33,  2.01s/it]                                                       {'loss': 1.4949, 'learning_rate': 8.32803174997465e-05, 'epoch': 0.7}
+ 70%|███████   | 4774/6790 [2:45:26<1:07:33,  2.01s/it] 70%|███████   | 4775/6790 [2:45:28<1:09:19,  2.06s/it]                                                       {'loss': 1.6036, 'learning_rate': 8.320406410887553e-05, 'epoch': 0.7}
+ 70%|███████   | 4775/6790 [2:45:28<1:09:19,  2.06s/it] 70%|███████   | 4776/6790 [2:45:30<1:08:20,  2.04s/it]                                                       {'loss': 1.4034, 'learning_rate': 8.31278364738158e-05, 'epoch': 0.7}
+ 70%|███████   | 4776/6790 [2:45:30<1:08:20,  2.04s/it] 70%|███████   | 4777/6790 [2:45:32<1:06:19,  1.98s/it]                                                       {'loss': 1.3056, 'learning_rate': 8.3051634611377e-05, 'epoch': 0.7}
+ 70%|███████   | 4777/6790 [2:45:32<1:06:19,  1.98s/it] 70%|███████   | 4778/6790 [2:45:34<1:05:05,  1.94s/it]                                                       {'loss': 1.339, 'learning_rate': 8.2975458538363e-05, 'epoch': 0.7}
+ 70%|███████   | 4778/6790 [2:45:34<1:05:05,  1.94s/it] 70%|███████   | 4779/6790 [2:45:36<1:04:38,  1.93s/it]                                                       {'loss': 1.35, 'learning_rate': 8.289930827157238e-05, 'epoch': 0.7}
+ 70%|███████   | 4779/6790 [2:45:36<1:04:38,  1.93s/it] 70%|███████   | 4780/6790 [2:45:38<1:04:23,  1.92s/it]                                                       {'loss': 1.5169, 'learning_rate': 8.282318382779756e-05, 'epoch': 0.7}
+ 70%|███████   | 4780/6790 [2:45:38<1:04:23,  1.92s/it] 70%|███████   | 4781/6790 [2:45:40<1:04:24,  1.92s/it]                                                       {'loss': 1.2921, 'learning_rate': 8.27470852238256e-05, 'epoch': 0.7}
+ 70%|███████   | 4781/6790 [2:45:40<1:04:24,  1.92s/it] 70%|███████   | 4782/6790 [2:45:42<1:06:35,  1.99s/it]                                                       {'loss': 1.368, 'learning_rate': 8.26710124764377e-05, 'epoch': 0.7}
+ 70%|███████   | 4782/6790 [2:45:42<1:06:35,  1.99s/it] 70%|███████   | 4783/6790 [2:45:44<1:06:50,  2.00s/it]                                                       {'loss': 1.6407, 'learning_rate': 8.259496560240948e-05, 'epoch': 0.7}
+ 70%|███████   | 4783/6790 [2:45:44<1:06:50,  2.00s/it] 70%|███████   | 4784/6790 [2:45:46<1:11:24,  2.14s/it]                                                       {'loss': 1.3528, 'learning_rate': 8.251894461851063e-05, 'epoch': 0.7}
+ 70%|███████   | 4784/6790 [2:45:46<1:11:24,  2.14s/it] 70%|███████   | 4785/6790 [2:45:49<1:14:04,  2.22s/it]                                                       {'loss': 1.5099, 'learning_rate': 8.24429495415054e-05, 'epoch': 0.7}
+ 70%|███████   | 4785/6790 [2:45:49<1:14:04,  2.22s/it] 70%|███████   | 4786/6790 [2:45:51<1:14:21,  2.23s/it]                                                       {'loss': 1.4574, 'learning_rate': 8.236698038815213e-05, 'epoch': 0.7}
+ 70%|███████   | 4786/6790 [2:45:51<1:14:21,  2.23s/it] 71%|███████   | 4787/6790 [2:45:53<1:13:25,  2.20s/it]                                                       {'loss': 1.4044, 'learning_rate': 8.229103717520366e-05, 'epoch': 0.71}
+ 71%|███████   | 4787/6790 [2:45:53<1:13:25,  2.20s/it] 71%|███████   | 4788/6790 [2:45:55<1:10:57,  2.13s/it]                                                       {'loss': 1.2496, 'learning_rate': 8.22151199194068e-05, 'epoch': 0.71}
+ 71%|███████   | 4788/6790 [2:45:55<1:10:57,  2.13s/it] 71%|███████   | 4789/6790 [2:45:57<1:11:20,  2.14s/it]                                                       {'loss': 1.5378, 'learning_rate': 8.213922863750279e-05, 'epoch': 0.71}
+ 71%|███████   | 4789/6790 [2:45:57<1:11:20,  2.14s/it] 71%|███████   | 4790/6790 [2:45:59<1:12:34,  2.18s/it]                                                       {'loss': 1.4656, 'learning_rate': 8.206336334622738e-05, 'epoch': 0.71}
+ 71%|███████   | 4790/6790 [2:45:59<1:12:34,  2.18s/it] 71%|███████   | 4791/6790 [2:46:01<1:11:43,  2.15s/it]                                                       {'loss': 1.5516, 'learning_rate': 8.198752406231014e-05, 'epoch': 0.71}
+ 71%|███████   | 4791/6790 [2:46:01<1:11:43,  2.15s/it] 71%|███████   | 4792/6790 [2:46:03<1:10:28,  2.12s/it]                                                       {'loss': 1.5614, 'learning_rate': 8.191171080247524e-05, 'epoch': 0.71}
+ 71%|███████   | 4792/6790 [2:46:03<1:10:28,  2.12s/it] 71%|███████   | 4793/6790 [2:46:06<1:10:24,  2.12s/it]                                                       {'loss': 1.5182, 'learning_rate': 8.183592358344096e-05, 'epoch': 0.71}
+ 71%|███████   | 4793/6790 [2:46:06<1:10:24,  2.12s/it] 71%|███████   | 4794/6790 [2:46:08<1:12:03,  2.17s/it]                                                       {'loss': 1.5513, 'learning_rate': 8.176016242191998e-05, 'epoch': 0.71}
+ 71%|███████   | 4794/6790 [2:46:08<1:12:03,  2.17s/it] 71%|███████   | 4795/6790 [2:46:10<1:12:14,  2.17s/it]                                                       {'loss': 1.3106, 'learning_rate': 8.168442733461896e-05, 'epoch': 0.71}
+ 71%|███████   | 4795/6790 [2:46:10<1:12:14,  2.17s/it] 71%|███████   | 4796/6790 [2:46:12<1:14:19,  2.24s/it]                                                       {'loss': 1.4495, 'learning_rate': 8.160871833823909e-05, 'epoch': 0.71}
+ 71%|███████   | 4796/6790 [2:46:12<1:14:19,  2.24s/it] 71%|███████   | 4797/6790 [2:46:15<1:14:06,  2.23s/it]                                                       {'loss': 1.4153, 'learning_rate': 8.153303544947566e-05, 'epoch': 0.71}
+ 71%|███████   | 4797/6790 [2:46:15<1:14:06,  2.23s/it] 71%|███████   | 4798/6790 [2:46:17<1:14:29,  2.24s/it]                                                       {'loss': 1.4624, 'learning_rate': 8.145737868501835e-05, 'epoch': 0.71}
+ 71%|███████   | 4798/6790 [2:46:17<1:14:29,  2.24s/it] 71%|███████   | 4799/6790 [2:46:19<1:12:12,  2.18s/it]                                                       {'loss': 1.4336, 'learning_rate': 8.138174806155081e-05, 'epoch': 0.71}
+ 71%|███████   | 4799/6790 [2:46:19<1:12:12,  2.18s/it] 71%|███████   | 4800/6790 [2:46:21<1:11:37,  2.16s/it]                                                       {'loss': 1.3756, 'learning_rate': 8.130614359575115e-05, 'epoch': 0.71}
+ 71%|███████   | 4800/6790 [2:46:21<1:11:37,  2.16s/it] 71%|███████   | 4801/6790 [2:46:23<1:09:48,  2.11s/it]                                                       {'loss': 1.3711, 'learning_rate': 8.123056530429168e-05, 'epoch': 0.71}
+ 71%|███████   | 4801/6790 [2:46:23<1:09:48,  2.11s/it] 71%|███████   | 4802/6790 [2:46:25<1:11:40,  2.16s/it]                                                       {'loss': 1.5583, 'learning_rate': 8.115501320383893e-05, 'epoch': 0.71}
+ 71%|███████   | 4802/6790 [2:46:25<1:11:40,  2.16s/it] 71%|███████   | 4803/6790 [2:46:27<1:07:40,  2.04s/it]                                                       {'loss': 1.0864, 'learning_rate': 8.107948731105346e-05, 'epoch': 0.71}
+ 71%|███████   | 4803/6790 [2:46:27<1:07:40,  2.04s/it] 71%|███████   | 4804/6790 [2:46:29<1:05:02,  1.96s/it]                                                       {'loss': 1.3567, 'learning_rate': 8.100398764259047e-05, 'epoch': 0.71}
+ 71%|███████   | 4804/6790 [2:46:29<1:05:02,  1.96s/it] 71%|███████   | 4805/6790 [2:46:31<1:04:11,  1.94s/it]                                                       {'loss': 1.3901, 'learning_rate': 8.092851421509895e-05, 'epoch': 0.71}
+ 71%|███████   | 4805/6790 [2:46:31<1:04:11,  1.94s/it] 71%|███████   | 4806/6790 [2:46:33<1:03:48,  1.93s/it]                                                       {'loss': 1.5322, 'learning_rate': 8.085306704522235e-05, 'epoch': 0.71}
+ 71%|███████   | 4806/6790 [2:46:33<1:03:48,  1.93s/it] 71%|███████   | 4807/6790 [2:46:35<1:05:22,  1.98s/it]                                                       {'loss': 1.535, 'learning_rate': 8.077764614959824e-05, 'epoch': 0.71}
+ 71%|███████   | 4807/6790 [2:46:35<1:05:22,  1.98s/it] 71%|███████   | 4808/6790 [2:46:37<1:08:54,  2.09s/it]                                                       {'loss': 1.5552, 'learning_rate': 8.070225154485842e-05, 'epoch': 0.71}
+ 71%|███████   | 4808/6790 [2:46:37<1:08:54,  2.09s/it] 71%|███████   | 4809/6790 [2:46:39<1:07:01,  2.03s/it]                                                       {'loss': 1.5405, 'learning_rate': 8.062688324762898e-05, 'epoch': 0.71}
+ 71%|███████   | 4809/6790 [2:46:39<1:07:01,  2.03s/it] 71%|███████   | 4810/6790 [2:46:41<1:05:23,  1.98s/it]                                                       {'loss': 1.3429, 'learning_rate': 8.055154127452986e-05, 'epoch': 0.71}
+ 71%|███████   | 4810/6790 [2:46:41<1:05:23,  1.98s/it] 71%|███████   | 4811/6790 [2:46:44<1:13:42,  2.23s/it]                                                       {'loss': 1.4801, 'learning_rate': 8.047622564217578e-05, 'epoch': 0.71}
+ 71%|███████   | 4811/6790 [2:46:44<1:13:42,  2.23s/it] 71%|███████   | 4812/6790 [2:46:46<1:11:12,  2.16s/it]                                                       {'loss': 1.4495, 'learning_rate': 8.040093636717511e-05, 'epoch': 0.71}
+ 71%|███████   | 4812/6790 [2:46:46<1:11:12,  2.16s/it] 71%|███████   | 4813/6790 [2:46:48<1:08:26,  2.08s/it]                                                       {'loss': 1.5616, 'learning_rate': 8.03256734661307e-05, 'epoch': 0.71}
+ 71%|███████   | 4813/6790 [2:46:48<1:08:26,  2.08s/it] 71%|███████   | 4814/6790 [2:46:49<1:05:44,  2.00s/it]                                                       {'loss': 1.5101, 'learning_rate': 8.025043695563948e-05, 'epoch': 0.71}
+ 71%|███████   | 4814/6790 [2:46:49<1:05:44,  2.00s/it] 71%|███████   | 4815/6790 [2:46:52<1:07:19,  2.05s/it]                                                       {'loss': 1.3003, 'learning_rate': 8.017522685229266e-05, 'epoch': 0.71}
+ 71%|███████   | 4815/6790 [2:46:52<1:07:19,  2.05s/it] 71%|███████   | 4816/6790 [2:46:54<1:06:51,  2.03s/it]                                                       {'loss': 1.5907, 'learning_rate': 8.010004317267543e-05, 'epoch': 0.71}
+ 71%|███████   | 4816/6790 [2:46:54<1:06:51,  2.03s/it] 71%|███████   | 4817/6790 [2:46:56<1:07:03,  2.04s/it]                                                       {'loss': 1.4855, 'learning_rate': 8.002488593336735e-05, 'epoch': 0.71}
+ 71%|███████   | 4817/6790 [2:46:56<1:07:03,  2.04s/it] 71%|███████   | 4818/6790 [2:46:57<1:04:35,  1.97s/it]                                                       {'loss': 1.2606, 'learning_rate': 7.994975515094205e-05, 'epoch': 0.71}
+ 71%|███████   | 4818/6790 [2:46:57<1:04:35,  1.97s/it] 71%|███████   | 4819/6790 [2:46:59<1:04:59,  1.98s/it]                                                       {'loss': 1.5447, 'learning_rate': 7.987465084196744e-05, 'epoch': 0.71}
+ 71%|███████   | 4819/6790 [2:46:59<1:04:59,  1.98s/it] 71%|███████   | 4820/6790 [2:47:01<1:05:03,  1.98s/it]                                                       {'loss': 1.3762, 'learning_rate': 7.979957302300536e-05, 'epoch': 0.71}
+ 71%|███████   | 4820/6790 [2:47:01<1:05:03,  1.98s/it] 71%|███████   | 4821/6790 [2:47:03<1:05:34,  2.00s/it]                                                       {'loss': 1.482, 'learning_rate': 7.972452171061202e-05, 'epoch': 0.71}
+ 71%|███████   | 4821/6790 [2:47:03<1:05:34,  2.00s/it] 71%|███████   | 4822/6790 [2:47:05<1:04:45,  1.97s/it]                                                       {'loss': 1.3202, 'learning_rate': 7.964949692133772e-05, 'epoch': 0.71}
+ 71%|███████   | 4822/6790 [2:47:05<1:04:45,  1.97s/it] 71%|███████   | 4823/6790 [2:47:07<1:02:00,  1.89s/it]                                                       {'loss': 1.3503, 'learning_rate': 7.957449867172693e-05, 'epoch': 0.71}
+ 71%|███████   | 4823/6790 [2:47:07<1:02:00,  1.89s/it] 71%|███████   | 4824/6790 [2:47:09<1:06:51,  2.04s/it]                                                       {'loss': 1.4354, 'learning_rate': 7.94995269783182e-05, 'epoch': 0.71}
+ 71%|███████   | 4824/6790 [2:47:09<1:06:51,  2.04s/it] 71%|███████   | 4825/6790 [2:47:11<1:04:50,  1.98s/it]                                                       {'loss': 1.1771, 'learning_rate': 7.942458185764429e-05, 'epoch': 0.71}
+ 71%|███████   | 4825/6790 [2:47:11<1:04:50,  1.98s/it] 71%|███████   | 4826/6790 [2:47:14<1:07:50,  2.07s/it]                                                       {'loss': 1.218, 'learning_rate': 7.934966332623217e-05, 'epoch': 0.71}
+ 71%|███████   | 4826/6790 [2:47:14<1:07:50,  2.07s/it] 71%|███████   | 4827/6790 [2:47:15<1:06:37,  2.04s/it]                                                       {'loss': 1.467, 'learning_rate': 7.927477140060268e-05, 'epoch': 0.71}
+ 71%|███████   | 4827/6790 [2:47:15<1:06:37,  2.04s/it] 71%|███████   | 4828/6790 [2:47:18<1:06:49,  2.04s/it]                                                       {'loss': 1.4878, 'learning_rate': 7.919990609727106e-05, 'epoch': 0.71}
+ 71%|███████   | 4828/6790 [2:47:18<1:06:49,  2.04s/it] 71%|███████   | 4829/6790 [2:47:20<1:06:10,  2.02s/it]                                                       {'loss': 1.5256, 'learning_rate': 7.912506743274659e-05, 'epoch': 0.71}
+ 71%|███████   | 4829/6790 [2:47:20<1:06:10,  2.02s/it] 71%|███████   | 4830/6790 [2:47:22<1:06:57,  2.05s/it]                                                       {'loss': 1.2958, 'learning_rate': 7.905025542353274e-05, 'epoch': 0.71}
+ 71%|███████   | 4830/6790 [2:47:22<1:06:57,  2.05s/it] 71%|███████   | 4831/6790 [2:47:23<1:03:50,  1.96s/it]                                                       {'loss': 1.1762, 'learning_rate': 7.897547008612691e-05, 'epoch': 0.71}
+ 71%|███████   | 4831/6790 [2:47:23<1:03:50,  1.96s/it] 71%|███████   | 4832/6790 [2:47:26<1:06:25,  2.04s/it]                                                       {'loss': 1.5237, 'learning_rate': 7.89007114370208e-05, 'epoch': 0.71}
+ 71%|███████   | 4832/6790 [2:47:26<1:06:25,  2.04s/it] 71%|███████   | 4833/6790 [2:47:27<1:04:48,  1.99s/it]                                                       {'loss': 1.2508, 'learning_rate': 7.882597949270017e-05, 'epoch': 0.71}
+ 71%|███████   | 4833/6790 [2:47:27<1:04:48,  1.99s/it] 71%|███████   | 4834/6790 [2:47:30<1:06:59,  2.06s/it]                                                       {'loss': 1.6476, 'learning_rate': 7.875127426964495e-05, 'epoch': 0.71}
+ 71%|███████   | 4834/6790 [2:47:30<1:06:59,  2.06s/it] 71%|███████   | 4835/6790 [2:47:32<1:06:04,  2.03s/it]                                                       {'loss': 1.2838, 'learning_rate': 7.867659578432891e-05, 'epoch': 0.71}
+ 71%|███████   | 4835/6790 [2:47:32<1:06:04,  2.03s/it] 71%|███████   | 4836/6790 [2:47:34<1:05:10,  2.00s/it]                                                       {'loss': 1.3945, 'learning_rate': 7.860194405322043e-05, 'epoch': 0.71}
+ 71%|███████   | 4836/6790 [2:47:34<1:05:10,  2.00s/it] 71%|███████   | 4837/6790 [2:47:35<1:03:57,  1.96s/it]                                                       {'loss': 1.3428, 'learning_rate': 7.852731909278146e-05, 'epoch': 0.71}
+ 71%|███████   | 4837/6790 [2:47:35<1:03:57,  1.96s/it] 71%|███████▏  | 4838/6790 [2:47:37<1:03:40,  1.96s/it]                                                       {'loss': 1.7628, 'learning_rate': 7.845272091946836e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4838/6790 [2:47:37<1:03:40,  1.96s/it] 71%|███████▏  | 4839/6790 [2:47:39<1:02:56,  1.94s/it]                                                       {'loss': 1.3397, 'learning_rate': 7.83781495497315e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4839/6790 [2:47:39<1:02:56,  1.94s/it] 71%|███████▏  | 4840/6790 [2:47:41<1:03:17,  1.95s/it]                                                       {'loss': 1.2342, 'learning_rate': 7.830360500001535e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4840/6790 [2:47:41<1:03:17,  1.95s/it] 71%|███████▏  | 4841/6790 [2:47:44<1:06:17,  2.04s/it]                                                       {'loss': 1.4522, 'learning_rate': 7.822908728675851e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4841/6790 [2:47:44<1:06:17,  2.04s/it] 71%|███████▏  | 4842/6790 [2:47:45<1:05:14,  2.01s/it]                                                       {'loss': 1.5593, 'learning_rate': 7.81545964263934e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4842/6790 [2:47:45<1:05:14,  2.01s/it] 71%|███████▏  | 4843/6790 [2:47:47<1:04:14,  1.98s/it]                                                       {'loss': 1.5156, 'learning_rate': 7.8080132435347e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4843/6790 [2:47:47<1:04:14,  1.98s/it] 71%|███████▏  | 4844/6790 [2:47:49<1:05:20,  2.01s/it]                                                       {'loss': 1.2345, 'learning_rate': 7.80056953300399e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4844/6790 [2:47:49<1:05:20,  2.01s/it] 71%|███████▏  | 4845/6790 [2:47:51<1:04:40,  1.99s/it]                                                       {'loss': 1.5705, 'learning_rate': 7.793128512688708e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4845/6790 [2:47:51<1:04:40,  1.99s/it] 71%|███████▏  | 4846/6790 [2:47:54<1:06:14,  2.04s/it]                                                       {'loss': 1.5304, 'learning_rate': 7.785690184229726e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4846/6790 [2:47:54<1:06:14,  2.04s/it] 71%|███████▏  | 4847/6790 [2:47:56<1:06:44,  2.06s/it]                                                       {'loss': 1.4002, 'learning_rate': 7.778254549267369e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4847/6790 [2:47:56<1:06:44,  2.06s/it] 71%|███████▏  | 4848/6790 [2:47:58<1:04:54,  2.01s/it]                                                       {'loss': 1.5076, 'learning_rate': 7.77082160944132e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4848/6790 [2:47:58<1:04:54,  2.01s/it] 71%|███████▏  | 4849/6790 [2:48:00<1:08:06,  2.11s/it]                                                       {'loss': 1.4164, 'learning_rate': 7.7633913663907e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4849/6790 [2:48:00<1:08:06,  2.11s/it] 71%|███████▏  | 4850/6790 [2:48:02<1:05:58,  2.04s/it]                                                       {'loss': 1.3455, 'learning_rate': 7.75596382175402e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4850/6790 [2:48:02<1:05:58,  2.04s/it] 71%|███████▏  | 4851/6790 [2:48:04<1:05:56,  2.04s/it]                                                       {'loss': 1.284, 'learning_rate': 7.748538977169209e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4851/6790 [2:48:04<1:05:56,  2.04s/it] 71%|███████▏  | 4852/6790 [2:48:05<1:02:22,  1.93s/it]                                                       {'loss': 1.344, 'learning_rate': 7.741116834273577e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4852/6790 [2:48:05<1:02:22,  1.93s/it] 71%|███████▏  | 4853/6790 [2:48:08<1:03:39,  1.97s/it]                                                       {'loss': 1.7534, 'learning_rate': 7.73369739470386e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4853/6790 [2:48:08<1:03:39,  1.97s/it] 71%|███████▏  | 4854/6790 [2:48:09<1:02:05,  1.92s/it]                                                       {'loss': 1.2735, 'learning_rate': 7.726280660096192e-05, 'epoch': 0.71}
+ 71%|███████▏  | 4854/6790 [2:48:09<1:02:05,  1.92s/it] 72%|███████▏  | 4855/6790 [2:48:11<1:03:58,  1.98s/it]                                                       {'loss': 1.328, 'learning_rate': 7.718866632086116e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4855/6790 [2:48:11<1:03:58,  1.98s/it] 72%|███████▏  | 4856/6790 [2:48:13<1:04:05,  1.99s/it]                                                       {'loss': 1.3594, 'learning_rate': 7.711455312308554e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4856/6790 [2:48:14<1:04:05,  1.99s/it] 72%|███████▏  | 4857/6790 [2:48:16<1:05:20,  2.03s/it]                                                       {'loss': 1.7196, 'learning_rate': 7.704046702397865e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4857/6790 [2:48:16<1:05:20,  2.03s/it] 72%|███████▏  | 4858/6790 [2:48:18<1:04:24,  2.00s/it]                                                       {'loss': 1.3558, 'learning_rate': 7.696640803987794e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4858/6790 [2:48:18<1:04:24,  2.00s/it] 72%|███████▏  | 4859/6790 [2:48:21<1:21:26,  2.53s/it]                                                       {'loss': 1.3221, 'learning_rate': 7.689237618711475e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4859/6790 [2:48:21<1:21:26,  2.53s/it] 72%|███████▏  | 4860/6790 [2:48:23<1:14:55,  2.33s/it]                                                       {'loss': 1.2908, 'learning_rate': 7.681837148201465e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4860/6790 [2:48:23<1:14:55,  2.33s/it] 72%|███████▏  | 4861/6790 [2:48:25<1:10:51,  2.20s/it]                                                       {'loss': 1.3251, 'learning_rate': 7.674439394089712e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4861/6790 [2:48:25<1:10:51,  2.20s/it] 72%|███████▏  | 4862/6790 [2:48:27<1:11:34,  2.23s/it]                                                       {'loss': 1.3685, 'learning_rate': 7.667044358007576e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4862/6790 [2:48:27<1:11:34,  2.23s/it] 72%|███████▏  | 4863/6790 [2:48:30<1:12:14,  2.25s/it]                                                       {'loss': 1.3143, 'learning_rate': 7.659652041585792e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4863/6790 [2:48:30<1:12:14,  2.25s/it] 72%|███████▏  | 4864/6790 [2:48:32<1:09:51,  2.18s/it]                                                       {'loss': 1.2003, 'learning_rate': 7.652262446454519e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4864/6790 [2:48:32<1:09:51,  2.18s/it] 72%|███████▏  | 4865/6790 [2:48:34<1:07:54,  2.12s/it]                                                       {'loss': 1.2862, 'learning_rate': 7.644875574243311e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4865/6790 [2:48:34<1:07:54,  2.12s/it] 72%|███████▏  | 4866/6790 [2:48:36<1:06:16,  2.07s/it]                                                       {'loss': 1.5387, 'learning_rate': 7.637491426581125e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4866/6790 [2:48:36<1:06:16,  2.07s/it] 72%|███████▏  | 4867/6790 [2:48:37<1:03:48,  1.99s/it]                                                       {'loss': 1.5809, 'learning_rate': 7.630110005096289e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4867/6790 [2:48:37<1:03:48,  1.99s/it] 72%|███████▏  | 4868/6790 [2:48:39<1:03:31,  1.98s/it]                                                       {'loss': 1.2867, 'learning_rate': 7.622731311416585e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4868/6790 [2:48:39<1:03:31,  1.98s/it] 72%|███████▏  | 4869/6790 [2:48:43<1:20:17,  2.51s/it]                                                       {'loss': 1.5561, 'learning_rate': 7.615355347169133e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4869/6790 [2:48:43<1:20:17,  2.51s/it] 72%|███████▏  | 4870/6790 [2:48:45<1:17:33,  2.42s/it]                                                       {'loss': 1.4985, 'learning_rate': 7.60798211398049e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4870/6790 [2:48:45<1:17:33,  2.42s/it] 72%|███████▏  | 4871/6790 [2:48:48<1:15:18,  2.35s/it]                                                       {'loss': 1.5261, 'learning_rate': 7.600611613476598e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4871/6790 [2:48:48<1:15:18,  2.35s/it] 72%|███████▏  | 4872/6790 [2:48:50<1:11:39,  2.24s/it]                                                       {'loss': 1.3887, 'learning_rate': 7.593243847282808e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4872/6790 [2:48:50<1:11:39,  2.24s/it] 72%|███████▏  | 4873/6790 [2:48:51<1:09:04,  2.16s/it]                                                       {'loss': 1.399, 'learning_rate': 7.585878817023839e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4873/6790 [2:48:51<1:09:04,  2.16s/it] 72%|███████▏  | 4874/6790 [2:48:53<1:06:49,  2.09s/it]                                                       {'loss': 1.4893, 'learning_rate': 7.578516524323837e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4874/6790 [2:48:53<1:06:49,  2.09s/it] 72%|███████▏  | 4875/6790 [2:48:56<1:07:53,  2.13s/it]                                                       {'loss': 1.4717, 'learning_rate': 7.571156970806333e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4875/6790 [2:48:56<1:07:53,  2.13s/it] 72%|███████▏  | 4876/6790 [2:48:58<1:08:14,  2.14s/it]                                                       {'loss': 1.4365, 'learning_rate': 7.56380015809425e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4876/6790 [2:48:58<1:08:14,  2.14s/it] 72%|███████▏  | 4877/6790 [2:49:00<1:04:35,  2.03s/it]                                                       {'loss': 1.2204, 'learning_rate': 7.55644608780992e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4877/6790 [2:49:00<1:04:35,  2.03s/it] 72%|███████▏  | 4878/6790 [2:49:01<1:02:10,  1.95s/it]                                                       {'loss': 1.4682, 'learning_rate': 7.549094761575042e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4878/6790 [2:49:01<1:02:10,  1.95s/it] 72%|███████▏  | 4879/6790 [2:49:04<1:05:09,  2.05s/it]                                                       {'loss': 1.3436, 'learning_rate': 7.541746181010752e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4879/6790 [2:49:04<1:05:09,  2.05s/it] 72%|███████▏  | 4880/6790 [2:49:05<1:03:37,  2.00s/it]                                                       {'loss': 1.4406, 'learning_rate': 7.534400347737539e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4880/6790 [2:49:05<1:03:37,  2.00s/it] 72%|███████▏  | 4881/6790 [2:49:07<1:03:00,  1.98s/it]                                                       {'loss': 1.5899, 'learning_rate': 7.52705726337531e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4881/6790 [2:49:07<1:03:00,  1.98s/it] 72%|███████▏  | 4882/6790 [2:49:09<1:02:28,  1.96s/it]                                                       {'loss': 1.4307, 'learning_rate': 7.519716929543361e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4882/6790 [2:49:09<1:02:28,  1.96s/it] 72%|███████▏  | 4883/6790 [2:49:11<1:01:33,  1.94s/it]                                                       {'loss': 1.3262, 'learning_rate': 7.51237934786039e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4883/6790 [2:49:11<1:01:33,  1.94s/it] 72%|███████▏  | 4884/6790 [2:49:13<59:27,  1.87s/it]                                                       {'loss': 1.5212, 'learning_rate': 7.505044519944459e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4884/6790 [2:49:13<59:27,  1.87s/it] 72%|███████▏  | 4885/6790 [2:49:15<1:00:45,  1.91s/it]                                                       {'loss': 1.4373, 'learning_rate': 7.497712447413057e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4885/6790 [2:49:15<1:00:45,  1.91s/it] 72%|███████▏  | 4886/6790 [2:49:17<1:04:38,  2.04s/it]                                                       {'loss': 1.5448, 'learning_rate': 7.490383131883044e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4886/6790 [2:49:17<1:04:38,  2.04s/it] 72%|███████▏  | 4887/6790 [2:49:19<1:03:09,  1.99s/it]                                                       {'loss': 1.2963, 'learning_rate': 7.483056574970689e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4887/6790 [2:49:19<1:03:09,  1.99s/it] 72%|███████▏  | 4888/6790 [2:49:21<1:01:08,  1.93s/it]                                                       {'loss': 1.3218, 'learning_rate': 7.475732778291626e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4888/6790 [2:49:21<1:01:08,  1.93s/it] 72%|███████▏  | 4889/6790 [2:49:23<1:01:15,  1.93s/it]                                                       {'loss': 1.3312, 'learning_rate': 7.468411743460908e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4889/6790 [2:49:23<1:01:15,  1.93s/it] 72%|███████▏  | 4890/6790 [2:49:25<1:02:55,  1.99s/it]                                                       {'loss': 1.6142, 'learning_rate': 7.461093472092966e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4890/6790 [2:49:25<1:02:55,  1.99s/it] 72%|███████▏  | 4891/6790 [2:49:27<1:02:10,  1.96s/it]                                                       {'loss': 1.4425, 'learning_rate': 7.453777965801623e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4891/6790 [2:49:27<1:02:10,  1.96s/it] 72%|███████▏  | 4892/6790 [2:49:29<1:01:01,  1.93s/it]                                                       {'loss': 1.2737, 'learning_rate': 7.446465226200092e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4892/6790 [2:49:29<1:01:01,  1.93s/it] 72%|███████▏  | 4893/6790 [2:49:31<1:03:59,  2.02s/it]                                                       {'loss': 1.3883, 'learning_rate': 7.439155254900977e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4893/6790 [2:49:31<1:03:59,  2.02s/it] 72%|███████▏  | 4894/6790 [2:49:33<1:04:28,  2.04s/it]                                                       {'loss': 1.6356, 'learning_rate': 7.43184805351628e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4894/6790 [2:49:33<1:04:28,  2.04s/it] 72%|███████▏  | 4895/6790 [2:49:35<1:04:19,  2.04s/it]                                                       {'loss': 1.204, 'learning_rate': 7.424543623657367e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4895/6790 [2:49:35<1:04:19,  2.04s/it] 72%|███████▏  | 4896/6790 [2:49:38<1:08:00,  2.15s/it]                                                       {'loss': 1.4583, 'learning_rate': 7.417241966935018e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4896/6790 [2:49:38<1:08:00,  2.15s/it] 72%|███████▏  | 4897/6790 [2:49:40<1:08:48,  2.18s/it]                                                       {'loss': 1.6071, 'learning_rate': 7.40994308495939e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4897/6790 [2:49:40<1:08:48,  2.18s/it] 72%|███████▏  | 4898/6790 [2:49:42<1:07:36,  2.14s/it]                                                       {'loss': 1.5721, 'learning_rate': 7.402646979340037e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4898/6790 [2:49:42<1:07:36,  2.14s/it] 72%|███████▏  | 4899/6790 [2:49:44<1:08:53,  2.19s/it]                                                       {'loss': 1.6619, 'learning_rate': 7.395353651685879e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4899/6790 [2:49:44<1:08:53,  2.19s/it] 72%|███████▏  | 4900/6790 [2:49:46<1:07:51,  2.15s/it]                                                       {'loss': 1.378, 'learning_rate': 7.38806310360526e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4900/6790 [2:49:46<1:07:51,  2.15s/it] 72%|███████▏  | 4901/6790 [2:49:48<1:08:54,  2.19s/it]                                                       {'loss': 1.4804, 'learning_rate': 7.380775336705874e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4901/6790 [2:49:48<1:08:54,  2.19s/it] 72%|███████▏  | 4902/6790 [2:49:51<1:08:37,  2.18s/it]                                                       {'loss': 1.3764, 'learning_rate': 7.373490352594823e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4902/6790 [2:49:51<1:08:37,  2.18s/it] 72%|███████▏  | 4903/6790 [2:49:53<1:08:00,  2.16s/it]                                                       {'loss': 1.187, 'learning_rate': 7.366208152878589e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4903/6790 [2:49:53<1:08:00,  2.16s/it] 72%|███████▏  | 4904/6790 [2:49:55<1:06:53,  2.13s/it]                                                       {'loss': 1.4742, 'learning_rate': 7.358928739163049e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4904/6790 [2:49:55<1:06:53,  2.13s/it] 72%|███████▏  | 4905/6790 [2:49:57<1:07:37,  2.15s/it]                                                       {'loss': 1.8533, 'learning_rate': 7.351652113053442e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4905/6790 [2:49:57<1:07:37,  2.15s/it] 72%|███████▏  | 4906/6790 [2:49:59<1:03:07,  2.01s/it]                                                       {'loss': 1.1955, 'learning_rate': 7.344378276154418e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4906/6790 [2:49:59<1:03:07,  2.01s/it] 72%|███████▏  | 4907/6790 [2:50:01<1:04:43,  2.06s/it]                                                       {'loss': 1.2599, 'learning_rate': 7.337107230069997e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4907/6790 [2:50:01<1:04:43,  2.06s/it] 72%|███████▏  | 4908/6790 [2:50:03<1:03:20,  2.02s/it]                                                       {'loss': 1.4044, 'learning_rate': 7.329838976403591e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4908/6790 [2:50:03<1:03:20,  2.02s/it] 72%|███████▏  | 4909/6790 [2:50:05<1:06:28,  2.12s/it]                                                       {'loss': 1.4643, 'learning_rate': 7.322573516758003e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4909/6790 [2:50:05<1:06:28,  2.12s/it] 72%|███████▏  | 4910/6790 [2:50:07<1:05:51,  2.10s/it]                                                       {'loss': 1.6774, 'learning_rate': 7.315310852735385e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4910/6790 [2:50:07<1:05:51,  2.10s/it] 72%|███████▏  | 4911/6790 [2:50:09<1:02:45,  2.00s/it]                                                       {'loss': 1.4649, 'learning_rate': 7.308050985937327e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4911/6790 [2:50:09<1:02:45,  2.00s/it] 72%|███████▏  | 4912/6790 [2:50:11<1:03:20,  2.02s/it]                                                       {'loss': 1.4776, 'learning_rate': 7.300793917964755e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4912/6790 [2:50:11<1:03:20,  2.02s/it] 72%|███████▏  | 4913/6790 [2:50:13<1:04:13,  2.05s/it]                                                       {'loss': 1.3826, 'learning_rate': 7.293539650417997e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4913/6790 [2:50:13<1:04:13,  2.05s/it] 72%|███████▏  | 4914/6790 [2:50:15<1:05:41,  2.10s/it]                                                       {'loss': 1.6168, 'learning_rate': 7.286288184896768e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4914/6790 [2:50:15<1:05:41,  2.10s/it] 72%|███████▏  | 4915/6790 [2:50:18<1:07:15,  2.15s/it]                                                       {'loss': 1.4385, 'learning_rate': 7.279039523000164e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4915/6790 [2:50:18<1:07:15,  2.15s/it] 72%|███████▏  | 4916/6790 [2:50:20<1:06:35,  2.13s/it]                                                       {'loss': 1.4153, 'learning_rate': 7.271793666326645e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4916/6790 [2:50:20<1:06:35,  2.13s/it] 72%|███████▏  | 4917/6790 [2:50:22<1:07:03,  2.15s/it]                                                       {'loss': 1.651, 'learning_rate': 7.264550616474073e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4917/6790 [2:50:22<1:07:03,  2.15s/it] 72%|███████▏  | 4918/6790 [2:50:24<1:02:58,  2.02s/it]                                                       {'loss': 1.1879, 'learning_rate': 7.257310375039681e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4918/6790 [2:50:24<1:02:58,  2.02s/it] 72%|███████▏  | 4919/6790 [2:50:26<1:02:32,  2.01s/it]                                                       {'loss': 1.4644, 'learning_rate': 7.250072943620095e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4919/6790 [2:50:26<1:02:32,  2.01s/it] 72%|███████▏  | 4920/6790 [2:50:28<1:06:01,  2.12s/it]                                                       {'loss': 1.1835, 'learning_rate': 7.242838323811293e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4920/6790 [2:50:28<1:06:01,  2.12s/it] 72%|███████▏  | 4921/6790 [2:50:30<1:05:45,  2.11s/it]                                                       {'loss': 1.4936, 'learning_rate': 7.235606517208666e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4921/6790 [2:50:30<1:05:45,  2.11s/it] 72%|███████▏  | 4922/6790 [2:50:32<1:03:14,  2.03s/it]                                                       {'loss': 1.6768, 'learning_rate': 7.228377525406964e-05, 'epoch': 0.72}
+ 72%|███████▏  | 4922/6790 [2:50:32<1:03:14,  2.03s/it] 73%|███████▎  | 4923/6790 [2:50:34<1:02:37,  2.01s/it]                                                       {'loss': 1.4912, 'learning_rate': 7.221151350000332e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4923/6790 [2:50:34<1:02:37,  2.01s/it] 73%|███████▎  | 4924/6790 [2:50:36<1:00:59,  1.96s/it]                                                       {'loss': 1.4008, 'learning_rate': 7.213927992582266e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4924/6790 [2:50:36<1:00:59,  1.96s/it] 73%|███████▎  | 4925/6790 [2:50:38<1:02:51,  2.02s/it]                                                       {'loss': 1.354, 'learning_rate': 7.206707454745674e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4925/6790 [2:50:38<1:02:51,  2.02s/it] 73%|███████▎  | 4926/6790 [2:50:40<1:02:10,  2.00s/it]                                                       {'loss': 1.4804, 'learning_rate': 7.19948973808283e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4926/6790 [2:50:40<1:02:10,  2.00s/it] 73%|███████▎  | 4927/6790 [2:50:42<1:03:43,  2.05s/it]                                                       {'loss': 1.3528, 'learning_rate': 7.192274844185372e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4927/6790 [2:50:42<1:03:43,  2.05s/it] 73%|███████▎  | 4928/6790 [2:50:44<1:02:13,  2.01s/it]                                                       {'loss': 1.4573, 'learning_rate': 7.185062774644329e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4928/6790 [2:50:44<1:02:13,  2.01s/it] 73%|███████▎  | 4929/6790 [2:50:46<1:05:02,  2.10s/it]                                                       {'loss': 1.5004, 'learning_rate': 7.177853531050109e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4929/6790 [2:50:46<1:05:02,  2.10s/it] 73%|███████▎  | 4930/6790 [2:50:48<1:03:05,  2.04s/it]                                                       {'loss': 1.2537, 'learning_rate': 7.170647114992496e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4930/6790 [2:50:48<1:03:05,  2.04s/it] 73%|███████▎  | 4931/6790 [2:50:50<1:05:54,  2.13s/it]                                                       {'loss': 1.4979, 'learning_rate': 7.163443528060629e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4931/6790 [2:50:50<1:05:54,  2.13s/it] 73%|███████▎  | 4932/6790 [2:50:52<1:04:41,  2.09s/it]                                                       {'loss': 1.3858, 'learning_rate': 7.156242771843066e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4932/6790 [2:50:52<1:04:41,  2.09s/it] 73%|███████▎  | 4933/6790 [2:50:56<1:14:31,  2.41s/it]                                                       {'loss': 1.3739, 'learning_rate': 7.1490448479277e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4933/6790 [2:50:56<1:14:31,  2.41s/it] 73%|███████▎  | 4934/6790 [2:50:58<1:09:41,  2.25s/it]                                                       {'loss': 1.5, 'learning_rate': 7.141849757901824e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4934/6790 [2:50:58<1:09:41,  2.25s/it] 73%|███████▎  | 4935/6790 [2:51:00<1:09:29,  2.25s/it]                                                       {'loss': 1.3461, 'learning_rate': 7.13465750335208e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4935/6790 [2:51:00<1:09:29,  2.25s/it] 73%|███████▎  | 4936/6790 [2:51:02<1:08:50,  2.23s/it]                                                       {'loss': 1.7089, 'learning_rate': 7.127468085864528e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4936/6790 [2:51:02<1:08:50,  2.23s/it] 73%|███████▎  | 4937/6790 [2:51:04<1:06:55,  2.17s/it]                                                       {'loss': 1.3835, 'learning_rate': 7.120281507024558e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4937/6790 [2:51:04<1:06:55,  2.17s/it] 73%|███████▎  | 4938/6790 [2:51:06<1:06:47,  2.16s/it]                                                       {'loss': 1.5495, 'learning_rate': 7.113097768416956e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4938/6790 [2:51:06<1:06:47,  2.16s/it] 73%|███████▎  | 4939/6790 [2:51:08<1:03:13,  2.05s/it]                                                       {'loss': 1.4551, 'learning_rate': 7.105916871625884e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4939/6790 [2:51:08<1:03:13,  2.05s/it] 73%|███████▎  | 4940/6790 [2:51:10<1:03:22,  2.06s/it]                                                       {'loss': 1.3892, 'learning_rate': 7.098738818234871e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4940/6790 [2:51:10<1:03:22,  2.06s/it] 73%|███████▎  | 4941/6790 [2:51:12<1:02:04,  2.01s/it]                                                       {'loss': 1.4094, 'learning_rate': 7.091563609826813e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4941/6790 [2:51:12<1:02:04,  2.01s/it] 73%|███████▎  | 4942/6790 [2:51:14<1:00:36,  1.97s/it]                                                       {'loss': 1.358, 'learning_rate': 7.084391247983981e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4942/6790 [2:51:14<1:00:36,  1.97s/it] 73%|███████▎  | 4943/6790 [2:51:16<1:06:00,  2.14s/it]                                                       {'loss': 1.3633, 'learning_rate': 7.077221734288045e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4943/6790 [2:51:16<1:06:00,  2.14s/it] 73%|███████▎  | 4944/6790 [2:51:18<1:05:09,  2.12s/it]                                                       {'loss': 1.4541, 'learning_rate': 7.070055070320001e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4944/6790 [2:51:18<1:05:09,  2.12s/it] 73%|███████▎  | 4945/6790 [2:51:20<1:04:03,  2.08s/it]                                                       {'loss': 1.4483, 'learning_rate': 7.062891257660252e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4945/6790 [2:51:20<1:04:03,  2.08s/it] 73%|███████▎  | 4946/6790 [2:51:23<1:04:32,  2.10s/it]                                                       {'loss': 1.6267, 'learning_rate': 7.055730297888555e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4946/6790 [2:51:23<1:04:32,  2.10s/it] 73%|███████▎  | 4947/6790 [2:51:24<1:03:11,  2.06s/it]                                                       {'loss': 1.3908, 'learning_rate': 7.04857219258405e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4947/6790 [2:51:24<1:03:11,  2.06s/it] 73%|███████▎  | 4948/6790 [2:51:27<1:03:50,  2.08s/it]                                                       {'loss': 1.4205, 'learning_rate': 7.041416943325232e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4948/6790 [2:51:27<1:03:50,  2.08s/it] 73%|███████▎  | 4949/6790 [2:51:28<1:02:04,  2.02s/it]                                                       {'loss': 1.4743, 'learning_rate': 7.034264551689978e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4949/6790 [2:51:28<1:02:04,  2.02s/it] 73%|███████▎  | 4950/6790 [2:51:30<1:00:17,  1.97s/it]                                                       {'loss': 1.6647, 'learning_rate': 7.02711501925553e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4950/6790 [2:51:30<1:00:17,  1.97s/it] 73%|███████▎  | 4951/6790 [2:51:32<1:01:59,  2.02s/it]                                                       {'loss': 1.4804, 'learning_rate': 7.019968347598513e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4951/6790 [2:51:32<1:01:59,  2.02s/it] 73%|███████▎  | 4952/6790 [2:51:34<1:01:32,  2.01s/it]                                                       {'loss': 1.3246, 'learning_rate': 7.012824538294891e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4952/6790 [2:51:34<1:01:32,  2.01s/it] 73%|███████▎  | 4953/6790 [2:51:37<1:03:58,  2.09s/it]                                                       {'loss': 1.2661, 'learning_rate': 7.005683592920024e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4953/6790 [2:51:37<1:03:58,  2.09s/it] 73%|███████▎  | 4954/6790 [2:51:39<1:02:32,  2.04s/it]                                                       {'loss': 1.2556, 'learning_rate': 6.99854551304863e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4954/6790 [2:51:39<1:02:32,  2.04s/it] 73%|███████▎  | 4955/6790 [2:51:41<1:00:43,  1.99s/it]                                                       {'loss': 1.2603, 'learning_rate': 6.991410300254808e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4955/6790 [2:51:41<1:00:43,  1.99s/it] 73%|███████▎  | 4956/6790 [2:51:43<1:02:11,  2.03s/it]                                                       {'loss': 1.5709, 'learning_rate': 6.984277956111988e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4956/6790 [2:51:43<1:02:11,  2.03s/it] 73%|███████▎  | 4957/6790 [2:51:45<1:02:31,  2.05s/it]                                                       {'loss': 1.2987, 'learning_rate': 6.977148482193021e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4957/6790 [2:51:45<1:02:31,  2.05s/it] 73%|███████▎  | 4958/6790 [2:51:47<1:00:40,  1.99s/it]                                                       {'loss': 1.4515, 'learning_rate': 6.970021880070078e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4958/6790 [2:51:47<1:00:40,  1.99s/it] 73%|███████▎  | 4959/6790 [2:51:49<1:07:21,  2.21s/it]                                                       {'loss': 1.4883, 'learning_rate': 6.962898151314721e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4959/6790 [2:51:49<1:07:21,  2.21s/it] 73%|███████▎  | 4960/6790 [2:51:52<1:07:06,  2.20s/it]                                                       {'loss': 1.3107, 'learning_rate': 6.955777297497874e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4960/6790 [2:51:52<1:07:06,  2.20s/it] 73%|███████▎  | 4961/6790 [2:51:54<1:07:53,  2.23s/it]                                                       {'loss': 1.4521, 'learning_rate': 6.948659320189825e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4961/6790 [2:51:54<1:07:53,  2.23s/it] 73%|███████▎  | 4962/6790 [2:51:56<1:06:52,  2.20s/it]                                                       {'loss': 1.4475, 'learning_rate': 6.941544220960235e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4962/6790 [2:51:56<1:06:52,  2.20s/it] 73%|███████▎  | 4963/6790 [2:51:58<1:03:05,  2.07s/it]                                                       {'loss': 1.441, 'learning_rate': 6.93443200137811e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4963/6790 [2:51:58<1:03:05,  2.07s/it] 73%|███████▎  | 4964/6790 [2:52:00<1:04:27,  2.12s/it]                                                       {'loss': 1.3915, 'learning_rate': 6.927322663011847e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4964/6790 [2:52:00<1:04:27,  2.12s/it] 73%|███████▎  | 4965/6790 [2:52:02<1:03:24,  2.08s/it]                                                       {'loss': 1.458, 'learning_rate': 6.920216207429186e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4965/6790 [2:52:02<1:03:24,  2.08s/it] 73%|███████▎  | 4966/6790 [2:52:04<1:01:29,  2.02s/it]                                                       {'loss': 1.4132, 'learning_rate': 6.913112636197256e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4966/6790 [2:52:04<1:01:29,  2.02s/it] 73%|███████▎  | 4967/6790 [2:52:06<1:00:20,  1.99s/it]                                                       {'loss': 1.5305, 'learning_rate': 6.906011950882511e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4967/6790 [2:52:06<1:00:20,  1.99s/it] 73%|███████▎  | 4968/6790 [2:52:08<1:02:30,  2.06s/it]                                                       {'loss': 1.4423, 'learning_rate': 6.898914153050819e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4968/6790 [2:52:08<1:02:30,  2.06s/it] 73%|███████▎  | 4969/6790 [2:52:11<1:08:02,  2.24s/it]                                                       {'loss': 1.1961, 'learning_rate': 6.891819244267367e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4969/6790 [2:52:11<1:08:02,  2.24s/it] 73%|███████▎  | 4970/6790 [2:52:13<1:05:38,  2.16s/it]                                                       {'loss': 1.3611, 'learning_rate': 6.884727226096727e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4970/6790 [2:52:13<1:05:38,  2.16s/it] 73%|███████▎  | 4971/6790 [2:52:15<1:04:15,  2.12s/it]                                                       {'loss': 1.3377, 'learning_rate': 6.87763810010283e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4971/6790 [2:52:15<1:04:15,  2.12s/it] 73%|███████▎  | 4972/6790 [2:52:17<1:05:00,  2.15s/it]                                                       {'loss': 1.5908, 'learning_rate': 6.870551867848974e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4972/6790 [2:52:17<1:05:00,  2.15s/it] 73%|███████▎  | 4973/6790 [2:52:19<1:09:42,  2.30s/it]                                                       {'loss': 1.3912, 'learning_rate': 6.8634685308978e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4973/6790 [2:52:19<1:09:42,  2.30s/it] 73%|███████▎  | 4974/6790 [2:52:22<1:08:13,  2.25s/it]                                                       {'loss': 1.2894, 'learning_rate': 6.856388090811331e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4974/6790 [2:52:22<1:08:13,  2.25s/it] 73%|███████▎  | 4975/6790 [2:52:24<1:05:29,  2.16s/it]                                                       {'loss': 1.465, 'learning_rate': 6.849310549150944e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4975/6790 [2:52:24<1:05:29,  2.16s/it] 73%|███████▎  | 4976/6790 [2:52:25<1:02:44,  2.08s/it]                                                       {'loss': 1.24, 'learning_rate': 6.842235907477377e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4976/6790 [2:52:25<1:02:44,  2.08s/it] 73%|███████▎  | 4977/6790 [2:52:27<1:02:31,  2.07s/it]                                                       {'loss': 1.3449, 'learning_rate': 6.83516416735073e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4977/6790 [2:52:27<1:02:31,  2.07s/it] 73%|███████▎  | 4978/6790 [2:52:30<1:04:00,  2.12s/it]                                                       {'loss': 1.584, 'learning_rate': 6.828095330330455e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4978/6790 [2:52:30<1:04:00,  2.12s/it] 73%|███████▎  | 4979/6790 [2:52:32<1:03:05,  2.09s/it]                                                       {'loss': 1.3499, 'learning_rate': 6.821029397975383e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4979/6790 [2:52:32<1:03:05,  2.09s/it] 73%|███████▎  | 4980/6790 [2:52:34<1:02:51,  2.08s/it]                                                       {'loss': 1.4349, 'learning_rate': 6.813966371843676e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4980/6790 [2:52:34<1:02:51,  2.08s/it] 73%|███████▎  | 4981/6790 [2:52:37<1:08:47,  2.28s/it]                                                       {'loss': 1.4491, 'learning_rate': 6.80690625349288e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4981/6790 [2:52:37<1:08:47,  2.28s/it] 73%|███████▎  | 4982/6790 [2:52:39<1:10:19,  2.33s/it]                                                       {'loss': 1.4666, 'learning_rate': 6.799849044479886e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4982/6790 [2:52:39<1:10:19,  2.33s/it] 73%|███████▎  | 4983/6790 [2:52:42<1:13:35,  2.44s/it]                                                       {'loss': 1.4351, 'learning_rate': 6.792794746360958e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4983/6790 [2:52:42<1:13:35,  2.44s/it] 73%|███████▎  | 4984/6790 [2:52:44<1:10:51,  2.35s/it]                                                       {'loss': 1.4535, 'learning_rate': 6.785743360691694e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4984/6790 [2:52:44<1:10:51,  2.35s/it] 73%|███████▎  | 4985/6790 [2:52:46<1:08:00,  2.26s/it]                                                       {'loss': 1.34, 'learning_rate': 6.778694889027071e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4985/6790 [2:52:46<1:08:00,  2.26s/it] 73%|███████▎  | 4986/6790 [2:52:48<1:04:42,  2.15s/it]                                                       {'loss': 1.5698, 'learning_rate': 6.771649332921415e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4986/6790 [2:52:48<1:04:42,  2.15s/it] 73%|███████▎  | 4987/6790 [2:52:50<1:02:24,  2.08s/it]                                                       {'loss': 1.336, 'learning_rate': 6.764606693928418e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4987/6790 [2:52:50<1:02:24,  2.08s/it] 73%|███████▎  | 4988/6790 [2:52:52<1:02:02,  2.07s/it]                                                       {'loss': 1.2909, 'learning_rate': 6.7575669736011e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4988/6790 [2:52:52<1:02:02,  2.07s/it] 73%|███████▎  | 4989/6790 [2:52:54<1:00:13,  2.01s/it]                                                       {'loss': 1.1949, 'learning_rate': 6.750530173491887e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4989/6790 [2:52:54<1:00:13,  2.01s/it] 73%|███████▎  | 4990/6790 [2:52:55<59:02,  1.97s/it]                                                       {'loss': 1.4885, 'learning_rate': 6.74349629515251e-05, 'epoch': 0.73}
+ 73%|███████▎  | 4990/6790 [2:52:56<59:02,  1.97s/it] 74%|███████▎  | 4991/6790 [2:52:58<1:00:58,  2.03s/it]                                                       {'loss': 1.2903, 'learning_rate': 6.736465340134086e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4991/6790 [2:52:58<1:00:58,  2.03s/it] 74%|███████▎  | 4992/6790 [2:53:00<1:03:49,  2.13s/it]                                                       {'loss': 1.447, 'learning_rate': 6.72943730998708e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4992/6790 [2:53:00<1:03:49,  2.13s/it] 74%|███████▎  | 4993/6790 [2:53:02<1:02:56,  2.10s/it]                                                       {'loss': 1.2741, 'learning_rate': 6.72241220626131e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4993/6790 [2:53:02<1:02:56,  2.10s/it] 74%|███████▎  | 4994/6790 [2:53:04<1:03:51,  2.13s/it]                                                       {'loss': 1.4104, 'learning_rate': 6.715390030505959e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4994/6790 [2:53:04<1:03:51,  2.13s/it] 74%|███████▎  | 4995/6790 [2:53:06<1:01:30,  2.06s/it]                                                       {'loss': 1.3718, 'learning_rate': 6.708370784269542e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4995/6790 [2:53:06<1:01:30,  2.06s/it] 74%|███████▎  | 4996/6790 [2:53:08<1:02:16,  2.08s/it]                                                       {'loss': 1.3087, 'learning_rate': 6.701354469099945e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4996/6790 [2:53:08<1:02:16,  2.08s/it] 74%|███████▎  | 4997/6790 [2:53:10<1:00:44,  2.03s/it]                                                       {'loss': 1.4037, 'learning_rate': 6.694341086544407e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4997/6790 [2:53:10<1:00:44,  2.03s/it] 74%|███████▎  | 4998/6790 [2:53:12<1:01:59,  2.08s/it]                                                       {'loss': 1.503, 'learning_rate': 6.687330638149523e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4998/6790 [2:53:12<1:01:59,  2.08s/it] 74%|███████▎  | 4999/6790 [2:53:15<1:02:16,  2.09s/it]                                                       {'loss': 1.5119, 'learning_rate': 6.680323125461214e-05, 'epoch': 0.74}
+ 74%|███████▎  | 4999/6790 [2:53:15<1:02:16,  2.09s/it] 74%|███████▎  | 5000/6790 [2:53:16<59:58,  2.01s/it]                                                       {'loss': 1.0325, 'learning_rate': 6.673318550024806e-05, 'epoch': 0.74}
+ 74%|███████▎  | 5000/6790 [2:53:16<59:58,  2.01s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 74%|███████▎  | 5001/6790 [2:53:19<1:06:14,  2.22s/it]                                                       {'loss': 1.3127, 'learning_rate': 6.666316913384923e-05, 'epoch': 0.74}
+ 74%|███████▎  | 5001/6790 [2:53:19<1:06:14,  2.22s/it] 74%|███████▎  | 5002/6790 [2:53:21<1:03:53,  2.14s/it]                                                       {'loss': 1.0905, 'learning_rate': 6.65931821708557e-05, 'epoch': 0.74}
+ 74%|███████▎  | 5002/6790 [2:53:21<1:03:53,  2.14s/it] 74%|███████▎  | 5003/6790 [2:53:23<1:00:47,  2.04s/it]                                                       {'loss': 1.0697, 'learning_rate': 6.6523224626701e-05, 'epoch': 0.74}
+ 74%|███████▎  | 5003/6790 [2:53:23<1:00:47,  2.04s/it] 74%|███████▎  | 5004/6790 [2:53:25<1:00:19,  2.03s/it]                                                       {'loss': 1.4711, 'learning_rate': 6.64532965168122e-05, 'epoch': 0.74}
+ 74%|███████▎  | 5004/6790 [2:53:25<1:00:19,  2.03s/it] 74%|███████▎  | 5005/6790 [2:53:27<1:01:11,  2.06s/it]                                                       {'loss': 1.4947, 'learning_rate': 6.638339785660972e-05, 'epoch': 0.74}
+ 74%|███████▎  | 5005/6790 [2:53:27<1:01:11,  2.06s/it] 74%|███████▎  | 5006/6790 [2:53:29<1:01:41,  2.07s/it]                                                       {'loss': 1.2798, 'learning_rate': 6.631352866150764e-05, 'epoch': 0.74}
+ 74%|███████▎  | 5006/6790 [2:53:29<1:01:41,  2.07s/it] 74%|███████▎  | 5007/6790 [2:53:31<1:03:57,  2.15s/it]                                                       {'loss': 1.4244, 'learning_rate': 6.624368894691351e-05, 'epoch': 0.74}
+ 74%|███████▎  | 5007/6790 [2:53:31<1:03:57,  2.15s/it] 74%|███████▍  | 5008/6790 [2:53:33<1:02:27,  2.10s/it]                                                       {'loss': 1.2675, 'learning_rate': 6.617387872822842e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5008/6790 [2:53:33<1:02:27,  2.10s/it] 74%|███████▍  | 5009/6790 [2:53:35<1:00:49,  2.05s/it]                                                       {'loss': 1.4157, 'learning_rate': 6.610409802084679e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5009/6790 [2:53:35<1:00:49,  2.05s/it] 74%|███████▍  | 5010/6790 [2:53:37<59:05,  1.99s/it]                                                       {'loss': 1.3126, 'learning_rate': 6.603434684015661e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5010/6790 [2:53:37<59:05,  1.99s/it] 74%|███████▍  | 5011/6790 [2:53:39<57:54,  1.95s/it]                                                     {'loss': 1.3973, 'learning_rate': 6.596462520153964e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5011/6790 [2:53:39<57:54,  1.95s/it] 74%|███████▍  | 5012/6790 [2:53:41<58:33,  1.98s/it]                                                     {'loss': 1.4431, 'learning_rate': 6.589493312037063e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5012/6790 [2:53:41<58:33,  1.98s/it] 74%|███████▍  | 5013/6790 [2:53:43<58:26,  1.97s/it]                                                     {'loss': 1.4702, 'learning_rate': 6.582527061201817e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5013/6790 [2:53:43<58:26,  1.97s/it] 74%|███████▍  | 5014/6790 [2:53:45<1:01:26,  2.08s/it]                                                       {'loss': 1.3967, 'learning_rate': 6.575563769184419e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5014/6790 [2:53:45<1:01:26,  2.08s/it] 74%|███████▍  | 5015/6790 [2:53:47<1:01:08,  2.07s/it]                                                       {'loss': 1.4169, 'learning_rate': 6.568603437520422e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5015/6790 [2:53:47<1:01:08,  2.07s/it] 74%|███████▍  | 5016/6790 [2:53:49<59:13,  2.00s/it]                                                       {'loss': 1.5053, 'learning_rate': 6.5616460677447e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5016/6790 [2:53:49<59:13,  2.00s/it] 74%|███████▍  | 5017/6790 [2:53:52<1:02:09,  2.10s/it]                                                       {'loss': 1.2544, 'learning_rate': 6.554691661391499e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5017/6790 [2:53:52<1:02:09,  2.10s/it] 74%|███████▍  | 5018/6790 [2:53:54<1:01:49,  2.09s/it]                                                       {'loss': 1.5576, 'learning_rate': 6.5477402199944e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5018/6790 [2:53:54<1:01:49,  2.09s/it] 74%|███████▍  | 5019/6790 [2:53:55<59:42,  2.02s/it]                                                       {'loss': 1.1581, 'learning_rate': 6.540791745086345e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5019/6790 [2:53:55<59:42,  2.02s/it] 74%|███████▍  | 5020/6790 [2:53:58<1:00:55,  2.07s/it]                                                       {'loss': 1.4789, 'learning_rate': 6.533846238199588e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5020/6790 [2:53:58<1:00:55,  2.07s/it] 74%|███████▍  | 5021/6790 [2:54:00<1:06:14,  2.25s/it]                                                       {'loss': 1.496, 'learning_rate': 6.526903700865776e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5021/6790 [2:54:00<1:06:14,  2.25s/it] 74%|███████▍  | 5022/6790 [2:54:02<1:02:12,  2.11s/it]                                                       {'loss': 1.3958, 'learning_rate': 6.519964134615856e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5022/6790 [2:54:02<1:02:12,  2.11s/it] 74%|███████▍  | 5023/6790 [2:54:04<1:00:16,  2.05s/it]                                                       {'loss': 1.398, 'learning_rate': 6.513027540980154e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5023/6790 [2:54:04<1:00:16,  2.05s/it] 74%|███████▍  | 5024/6790 [2:54:06<57:52,  1.97s/it]                                                       {'loss': 1.2809, 'learning_rate': 6.506093921488304e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5024/6790 [2:54:06<57:52,  1.97s/it] 74%|███████▍  | 5025/6790 [2:54:08<58:35,  1.99s/it]                                                     {'loss': 1.3464, 'learning_rate': 6.499163277669334e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5025/6790 [2:54:08<58:35,  1.99s/it] 74%|███████▍  | 5026/6790 [2:54:10<58:06,  1.98s/it]                                                     {'loss': 1.6676, 'learning_rate': 6.492235611051567e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5026/6790 [2:54:10<58:06,  1.98s/it] 74%|███████▍  | 5027/6790 [2:54:12<58:37,  2.00s/it]                                                     {'loss': 1.4681, 'learning_rate': 6.485310923162697e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5027/6790 [2:54:12<58:37,  2.00s/it] 74%|███████▍  | 5028/6790 [2:54:14<1:00:32,  2.06s/it]                                                       {'loss': 1.5825, 'learning_rate': 6.478389215529756e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5028/6790 [2:54:14<1:00:32,  2.06s/it] 74%|███████▍  | 5029/6790 [2:54:16<58:47,  2.00s/it]                                                       {'loss': 1.5408, 'learning_rate': 6.471470489679117e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5029/6790 [2:54:16<58:47,  2.00s/it] 74%|███████▍  | 5030/6790 [2:54:18<58:22,  1.99s/it]                                                     {'loss': 1.537, 'learning_rate': 6.4645547471365e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5030/6790 [2:54:18<58:22,  1.99s/it] 74%|███████▍  | 5031/6790 [2:54:20<1:02:16,  2.12s/it]                                                       {'loss': 1.4603, 'learning_rate': 6.457641989426946e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5031/6790 [2:54:20<1:02:16,  2.12s/it] 74%|███████▍  | 5032/6790 [2:54:22<1:01:22,  2.09s/it]                                                       {'loss': 1.4904, 'learning_rate': 6.450732218074879e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5032/6790 [2:54:22<1:01:22,  2.09s/it] 74%|███████▍  | 5033/6790 [2:54:24<1:00:50,  2.08s/it]                                                       {'loss': 1.2668, 'learning_rate': 6.443825434604021e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5033/6790 [2:54:24<1:00:50,  2.08s/it] 74%|███████▍  | 5034/6790 [2:54:26<59:20,  2.03s/it]                                                       {'loss': 1.3426, 'learning_rate': 6.436921640537461e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5034/6790 [2:54:26<59:20,  2.03s/it] 74%|███████▍  | 5035/6790 [2:54:28<1:00:20,  2.06s/it]                                                       {'loss': 1.501, 'learning_rate': 6.430020837397621e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5035/6790 [2:54:28<1:00:20,  2.06s/it] 74%|███████▍  | 5036/6790 [2:54:31<1:02:19,  2.13s/it]                                                       {'loss': 1.3895, 'learning_rate': 6.423123026706273e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5036/6790 [2:54:31<1:02:19,  2.13s/it] 74%|███████▍  | 5037/6790 [2:54:33<1:02:55,  2.15s/it]                                                       {'loss': 1.6046, 'learning_rate': 6.416228209984507e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5037/6790 [2:54:33<1:02:55,  2.15s/it] 74%|███████▍  | 5038/6790 [2:54:35<1:05:09,  2.23s/it]                                                       {'loss': 1.4894, 'learning_rate': 6.409336388752772e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5038/6790 [2:54:35<1:05:09,  2.23s/it] 74%|███████▍  | 5039/6790 [2:54:37<1:03:46,  2.19s/it]                                                       {'loss': 1.501, 'learning_rate': 6.40244756453085e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5039/6790 [2:54:37<1:03:46,  2.19s/it] 74%|███████▍  | 5040/6790 [2:54:39<1:02:00,  2.13s/it]                                                       {'loss': 1.418, 'learning_rate': 6.395561738837867e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5040/6790 [2:54:39<1:02:00,  2.13s/it] 74%|███████▍  | 5041/6790 [2:54:41<1:01:19,  2.10s/it]                                                       {'loss': 1.3173, 'learning_rate': 6.388678913192276e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5041/6790 [2:54:41<1:01:19,  2.10s/it] 74%|███████▍  | 5042/6790 [2:54:43<58:15,  2.00s/it]                                                       {'loss': 1.1386, 'learning_rate': 6.381799089111882e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5042/6790 [2:54:43<58:15,  2.00s/it] 74%|███████▍  | 5043/6790 [2:54:45<59:57,  2.06s/it]                                                     {'loss': 1.4629, 'learning_rate': 6.37492226811382e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5043/6790 [2:54:45<59:57,  2.06s/it] 74%|███████▍  | 5044/6790 [2:54:48<1:01:17,  2.11s/it]                                                       {'loss': 1.2279, 'learning_rate': 6.368048451714563e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5044/6790 [2:54:48<1:01:17,  2.11s/it] 74%|███████▍  | 5045/6790 [2:54:49<59:00,  2.03s/it]                                                       {'loss': 1.3965, 'learning_rate': 6.361177641429928e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5045/6790 [2:54:49<59:00,  2.03s/it] 74%|███████▍  | 5046/6790 [2:54:51<57:26,  1.98s/it]                                                     {'loss': 1.4288, 'learning_rate': 6.354309838775061e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5046/6790 [2:54:51<57:26,  1.98s/it] 74%|███████▍  | 5047/6790 [2:54:54<1:00:34,  2.09s/it]                                                       {'loss': 1.3723, 'learning_rate': 6.347445045264455e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5047/6790 [2:54:54<1:00:34,  2.09s/it] 74%|███████▍  | 5048/6790 [2:54:56<59:40,  2.06s/it]                                                       {'loss': 1.4848, 'learning_rate': 6.340583262411921e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5048/6790 [2:54:56<59:40,  2.06s/it] 74%|███████▍  | 5049/6790 [2:54:57<57:30,  1.98s/it]                                                     {'loss': 1.2222, 'learning_rate': 6.333724491730621e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5049/6790 [2:54:57<57:30,  1.98s/it] 74%|███████▍  | 5050/6790 [2:54:59<57:30,  1.98s/it]                                                     {'loss': 1.7153, 'learning_rate': 6.326868734733056e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5050/6790 [2:54:59<57:30,  1.98s/it] 74%|███████▍  | 5051/6790 [2:55:02<1:03:14,  2.18s/it]                                                       {'loss': 1.3073, 'learning_rate': 6.320015992931055e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5051/6790 [2:55:02<1:03:14,  2.18s/it] 74%|███████▍  | 5052/6790 [2:55:04<1:01:37,  2.13s/it]                                                       {'loss': 1.3779, 'learning_rate': 6.313166267835768e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5052/6790 [2:55:04<1:01:37,  2.13s/it] 74%|███████▍  | 5053/6790 [2:55:06<1:00:07,  2.08s/it]                                                       {'loss': 1.4207, 'learning_rate': 6.306319560957719e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5053/6790 [2:55:06<1:00:07,  2.08s/it] 74%|███████▍  | 5054/6790 [2:55:08<57:58,  2.00s/it]                                                       {'loss': 1.3065, 'learning_rate': 6.299475873806722e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5054/6790 [2:55:08<57:58,  2.00s/it] 74%|███████▍  | 5055/6790 [2:55:10<56:29,  1.95s/it]                                                     {'loss': 1.285, 'learning_rate': 6.29263520789196e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5055/6790 [2:55:10<56:29,  1.95s/it] 74%|███████▍  | 5056/6790 [2:55:12<55:52,  1.93s/it]                                                     {'loss': 1.267, 'learning_rate': 6.285797564721915e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5056/6790 [2:55:12<55:52,  1.93s/it] 74%|███████▍  | 5057/6790 [2:55:14<56:42,  1.96s/it]                                                     {'loss': 1.5704, 'learning_rate': 6.278962945804447e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5057/6790 [2:55:14<56:42,  1.96s/it] 74%|███████▍  | 5058/6790 [2:55:15<55:16,  1.91s/it]                                                     {'loss': 1.4607, 'learning_rate': 6.272131352646706e-05, 'epoch': 0.74}
+ 74%|███████▍  | 5058/6790 [2:55:15<55:16,  1.91s/it] 75%|███████▍  | 5059/6790 [2:55:17<56:27,  1.96s/it]                                                     {'loss': 1.4169, 'learning_rate': 6.2653027867552e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5059/6790 [2:55:18<56:27,  1.96s/it] 75%|███████▍  | 5060/6790 [2:55:19<56:45,  1.97s/it]                                                     {'loss': 1.6787, 'learning_rate': 6.258477249635764e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5060/6790 [2:55:20<56:45,  1.97s/it] 75%|███████▍  | 5061/6790 [2:55:22<1:02:51,  2.18s/it]                                                       {'loss': 1.5715, 'learning_rate': 6.251654742793562e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5061/6790 [2:55:22<1:02:51,  2.18s/it] 75%|███████▍  | 5062/6790 [2:55:25<1:04:40,  2.25s/it]                                                       {'loss': 1.6077, 'learning_rate': 6.244835267733095e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5062/6790 [2:55:25<1:04:40,  2.25s/it] 75%|███████▍  | 5063/6790 [2:55:26<1:01:37,  2.14s/it]                                                       {'loss': 1.6022, 'learning_rate': 6.23801882595818e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5063/6790 [2:55:26<1:01:37,  2.14s/it] 75%|███████▍  | 5064/6790 [2:55:28<1:00:20,  2.10s/it]                                                       {'loss': 1.3677, 'learning_rate': 6.231205418971997e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5064/6790 [2:55:28<1:00:20,  2.10s/it] 75%|███████▍  | 5065/6790 [2:55:30<58:37,  2.04s/it]                                                       {'loss': 1.3963, 'learning_rate': 6.224395048277019e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5065/6790 [2:55:30<58:37,  2.04s/it] 75%|███████▍  | 5066/6790 [2:55:32<55:57,  1.95s/it]                                                     {'loss': 1.2977, 'learning_rate': 6.217587715375072e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5066/6790 [2:55:32<55:57,  1.95s/it] 75%|███████▍  | 5067/6790 [2:55:34<55:23,  1.93s/it]                                                     {'loss': 1.3674, 'learning_rate': 6.210783421767312e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5067/6790 [2:55:34<55:23,  1.93s/it] 75%|███████▍  | 5068/6790 [2:55:36<56:28,  1.97s/it]                                                     {'loss': 1.3697, 'learning_rate': 6.203982168954223e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5068/6790 [2:55:36<56:28,  1.97s/it] 75%|███████▍  | 5069/6790 [2:55:38<58:26,  2.04s/it]                                                     {'loss': 1.741, 'learning_rate': 6.197183958435604e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5069/6790 [2:55:38<58:26,  2.04s/it] 75%|███████▍  | 5070/6790 [2:55:40<59:11,  2.06s/it]                                                     {'loss': 1.469, 'learning_rate': 6.190388791710602e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5070/6790 [2:55:40<59:11,  2.06s/it] 75%|███████▍  | 5071/6790 [2:55:43<1:03:36,  2.22s/it]                                                       {'loss': 1.4727, 'learning_rate': 6.183596670277682e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5071/6790 [2:55:43<1:03:36,  2.22s/it] 75%|███████▍  | 5072/6790 [2:55:45<1:00:21,  2.11s/it]                                                       {'loss': 1.3404, 'learning_rate': 6.17680759563465e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5072/6790 [2:55:45<1:00:21,  2.11s/it] 75%|███████▍  | 5073/6790 [2:55:47<58:31,  2.05s/it]                                                       {'loss': 1.4368, 'learning_rate': 6.170021569278619e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5073/6790 [2:55:47<58:31,  2.05s/it] 75%|███████▍  | 5074/6790 [2:55:49<57:01,  1.99s/it]                                                     {'loss': 1.3877, 'learning_rate': 6.163238592706046e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5074/6790 [2:55:49<57:01,  1.99s/it] 75%|███████▍  | 5075/6790 [2:55:51<57:12,  2.00s/it]                                                     {'loss': 1.5912, 'learning_rate': 6.156458667412715e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5075/6790 [2:55:51<57:12,  2.00s/it] 75%|███████▍  | 5076/6790 [2:55:53<1:00:56,  2.13s/it]                                                       {'loss': 1.3066, 'learning_rate': 6.149681794893734e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5076/6790 [2:55:53<1:00:56,  2.13s/it] 75%|███████▍  | 5077/6790 [2:55:56<1:07:02,  2.35s/it]                                                       {'loss': 1.4528, 'learning_rate': 6.142907976643524e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5077/6790 [2:55:56<1:07:02,  2.35s/it] 75%|███████▍  | 5078/6790 [2:55:58<1:04:23,  2.26s/it]                                                       {'loss': 1.4854, 'learning_rate': 6.136137214155861e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5078/6790 [2:55:58<1:04:23,  2.26s/it] 75%|███████▍  | 5079/6790 [2:56:00<1:02:21,  2.19s/it]                                                       {'loss': 1.2665, 'learning_rate': 6.129369508923835e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5079/6790 [2:56:00<1:02:21,  2.19s/it] 75%|███████▍  | 5080/6790 [2:56:03<1:07:45,  2.38s/it]                                                       {'loss': 1.4005, 'learning_rate': 6.122604862439843e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5080/6790 [2:56:03<1:07:45,  2.38s/it] 75%|███████▍  | 5081/6790 [2:56:05<1:05:20,  2.29s/it]                                                       {'loss': 1.4135, 'learning_rate': 6.11584327619563e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5081/6790 [2:56:05<1:05:20,  2.29s/it] 75%|███████▍  | 5082/6790 [2:56:07<1:03:57,  2.25s/it]                                                       {'loss': 1.1091, 'learning_rate': 6.109084751682259e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5082/6790 [2:56:07<1:03:57,  2.25s/it] 75%|███████▍  | 5083/6790 [2:56:09<1:00:37,  2.13s/it]                                                       {'loss': 1.5585, 'learning_rate': 6.1023292903901296e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5083/6790 [2:56:09<1:00:37,  2.13s/it] 75%|███████▍  | 5084/6790 [2:56:11<58:54,  2.07s/it]                                                       {'loss': 1.5017, 'learning_rate': 6.0955768938089344e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5084/6790 [2:56:11<58:54,  2.07s/it] 75%|███████▍  | 5085/6790 [2:56:13<58:14,  2.05s/it]                                                     {'loss': 1.51, 'learning_rate': 6.088827563427721e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5085/6790 [2:56:13<58:14,  2.05s/it] 75%|███████▍  | 5086/6790 [2:56:16<1:05:24,  2.30s/it]                                                       {'loss': 1.2932, 'learning_rate': 6.08208130073485e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5086/6790 [2:56:16<1:05:24,  2.30s/it] 75%|███████▍  | 5087/6790 [2:56:18<1:03:49,  2.25s/it]                                                       {'loss': 1.4158, 'learning_rate': 6.075338107218012e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5087/6790 [2:56:18<1:03:49,  2.25s/it] 75%|███████▍  | 5088/6790 [2:56:20<59:58,  2.11s/it]                                                       {'loss': 1.2396, 'learning_rate': 6.0685979843641926e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5088/6790 [2:56:20<59:58,  2.11s/it] 75%|███████▍  | 5089/6790 [2:56:21<57:37,  2.03s/it]                                                     {'loss': 1.4128, 'learning_rate': 6.061860933659749e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5089/6790 [2:56:21<57:37,  2.03s/it] 75%|███████▍  | 5090/6790 [2:56:24<58:42,  2.07s/it]                                                     {'loss': 1.5426, 'learning_rate': 6.055126956590316e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5090/6790 [2:56:24<58:42,  2.07s/it] 75%|███████▍  | 5091/6790 [2:56:25<56:57,  2.01s/it]                                                     {'loss': 1.4249, 'learning_rate': 6.0483960546408746e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5091/6790 [2:56:25<56:57,  2.01s/it] 75%|███████▍  | 5092/6790 [2:56:27<55:00,  1.94s/it]                                                     {'loss': 1.2967, 'learning_rate': 6.0416682292957205e-05, 'epoch': 0.75}
+ 75%|███████▍  | 5092/6790 [2:56:27<55:00,  1.94s/it] 75%|███████▌  | 5093/6790 [2:56:30<58:00,  2.05s/it]                                                     {'loss': 1.491, 'learning_rate': 6.034943482038478e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5093/6790 [2:56:30<58:00,  2.05s/it] 75%|███████▌  | 5094/6790 [2:56:32<59:09,  2.09s/it]                                                     {'loss': 1.4177, 'learning_rate': 6.0282218143520754e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5094/6790 [2:56:32<59:09,  2.09s/it] 75%|███████▌  | 5095/6790 [2:56:34<59:25,  2.10s/it]                                                     {'loss': 1.5244, 'learning_rate': 6.0215032277187744e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5095/6790 [2:56:34<59:25,  2.10s/it] 75%|███████▌  | 5096/6790 [2:56:36<57:34,  2.04s/it]                                                     {'loss': 1.2266, 'learning_rate': 6.014787723620172e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5096/6790 [2:56:36<57:34,  2.04s/it] 75%|███████▌  | 5097/6790 [2:56:38<57:32,  2.04s/it]                                                     {'loss': 1.062, 'learning_rate': 6.008075303537153e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5097/6790 [2:56:38<57:32,  2.04s/it] 75%|███████▌  | 5098/6790 [2:56:40<58:10,  2.06s/it]                                                     {'loss': 1.5372, 'learning_rate': 6.00136596894995e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5098/6790 [2:56:40<58:10,  2.06s/it] 75%|███████▌  | 5099/6790 [2:56:42<57:11,  2.03s/it]                                                     {'loss': 1.3232, 'learning_rate': 5.994659721338087e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5099/6790 [2:56:42<57:11,  2.03s/it] 75%|███████▌  | 5100/6790 [2:56:44<55:28,  1.97s/it]                                                     {'loss': 1.3923, 'learning_rate': 5.987956562180445e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5100/6790 [2:56:44<55:28,  1.97s/it] 75%|███████▌  | 5101/6790 [2:56:46<54:40,  1.94s/it]                                                     {'loss': 1.4182, 'learning_rate': 5.98125649295519e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5101/6790 [2:56:46<54:40,  1.94s/it] 75%|███████▌  | 5102/6790 [2:56:48<54:29,  1.94s/it]                                                     {'loss': 1.5496, 'learning_rate': 5.9745595151398194e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5102/6790 [2:56:48<54:29,  1.94s/it] 75%|███████▌  | 5103/6790 [2:56:50<56:26,  2.01s/it]                                                     {'loss': 1.4849, 'learning_rate': 5.9678656302111534e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5103/6790 [2:56:50<56:26,  2.01s/it] 75%|███████▌  | 5104/6790 [2:56:52<54:59,  1.96s/it]                                                     {'loss': 1.2247, 'learning_rate': 5.961174839645331e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5104/6790 [2:56:52<54:59,  1.96s/it] 75%|███████▌  | 5105/6790 [2:56:54<58:07,  2.07s/it]                                                     {'loss': 1.1836, 'learning_rate': 5.9544871449177906e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5105/6790 [2:56:54<58:07,  2.07s/it] 75%|███████▌  | 5106/6790 [2:56:56<1:01:02,  2.17s/it]                                                       {'loss': 1.4477, 'learning_rate': 5.9478025475033096e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5106/6790 [2:56:56<1:01:02,  2.17s/it] 75%|███████▌  | 5107/6790 [2:56:58<57:58,  2.07s/it]                                                       {'loss': 1.2778, 'learning_rate': 5.941121048875971e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5107/6790 [2:56:58<57:58,  2.07s/it] 75%|███████▌  | 5108/6790 [2:57:00<56:03,  2.00s/it]                                                     {'loss': 1.4727, 'learning_rate': 5.934442650509184e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5108/6790 [2:57:00<56:03,  2.00s/it] 75%|███████▌  | 5109/6790 [2:57:02<56:24,  2.01s/it]                                                     {'loss': 1.4074, 'learning_rate': 5.927767353875651e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5109/6790 [2:57:02<56:24,  2.01s/it] 75%|███████▌  | 5110/6790 [2:57:04<57:23,  2.05s/it]                                                     {'loss': 1.3928, 'learning_rate': 5.9210951604474294e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5110/6790 [2:57:04<57:23,  2.05s/it] 75%|███████▌  | 5111/6790 [2:57:06<59:59,  2.14s/it]                                                     {'loss': 1.518, 'learning_rate': 5.914426071695851e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5111/6790 [2:57:06<59:59,  2.14s/it] 75%|███████▌  | 5112/6790 [2:57:10<1:12:39,  2.60s/it]                                                       {'loss': 1.3832, 'learning_rate': 5.907760089091589e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5112/6790 [2:57:10<1:12:39,  2.60s/it] 75%|███████▌  | 5113/6790 [2:57:12<1:09:06,  2.47s/it]                                                       {'loss': 1.4399, 'learning_rate': 5.901097214104623e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5113/6790 [2:57:12<1:09:06,  2.47s/it] 75%|███████▌  | 5114/6790 [2:57:14<1:03:55,  2.29s/it]                                                       {'loss': 1.4885, 'learning_rate': 5.8944374482042486e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5114/6790 [2:57:14<1:03:55,  2.29s/it] 75%|███████▌  | 5115/6790 [2:57:16<1:00:54,  2.18s/it]                                                       {'loss': 1.2353, 'learning_rate': 5.8877807928590836e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5115/6790 [2:57:16<1:00:54,  2.18s/it] 75%|███████▌  | 5116/6790 [2:57:18<59:48,  2.14s/it]                                                       {'loss': 1.3999, 'learning_rate': 5.8811272495370394e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5116/6790 [2:57:18<59:48,  2.14s/it] 75%|███████▌  | 5117/6790 [2:57:20<1:01:13,  2.20s/it]                                                       {'loss': 1.4157, 'learning_rate': 5.874476819705357e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5117/6790 [2:57:20<1:01:13,  2.20s/it] 75%|███████▌  | 5118/6790 [2:57:23<1:02:10,  2.23s/it]                                                       {'loss': 1.4303, 'learning_rate': 5.8678295048305906e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5118/6790 [2:57:23<1:02:10,  2.23s/it] 75%|███████▌  | 5119/6790 [2:57:25<1:03:43,  2.29s/it]                                                       {'loss': 1.5316, 'learning_rate': 5.861185306378611e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5119/6790 [2:57:25<1:03:43,  2.29s/it] 75%|███████▌  | 5120/6790 [2:57:27<1:02:17,  2.24s/it]                                                       {'loss': 1.4214, 'learning_rate': 5.854544225814573e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5120/6790 [2:57:27<1:02:17,  2.24s/it] 75%|███████▌  | 5121/6790 [2:57:29<1:00:41,  2.18s/it]                                                       {'loss': 1.3981, 'learning_rate': 5.847906264602996e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5121/6790 [2:57:29<1:00:41,  2.18s/it] 75%|███████▌  | 5122/6790 [2:57:31<57:40,  2.07s/it]                                                       {'loss': 1.5083, 'learning_rate': 5.841271424207657e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5122/6790 [2:57:31<57:40,  2.07s/it] 75%|███████▌  | 5123/6790 [2:57:33<56:17,  2.03s/it]                                                     {'loss': 1.3749, 'learning_rate': 5.83463970609168e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5123/6790 [2:57:33<56:17,  2.03s/it] 75%|███████▌  | 5124/6790 [2:57:35<55:33,  2.00s/it]                                                     {'loss': 1.2686, 'learning_rate': 5.828011111717491e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5124/6790 [2:57:35<55:33,  2.00s/it] 75%|███████▌  | 5125/6790 [2:57:37<53:45,  1.94s/it]                                                     {'loss': 1.4212, 'learning_rate': 5.821385642546826e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5125/6790 [2:57:37<53:45,  1.94s/it] 75%|███████▌  | 5126/6790 [2:57:39<54:58,  1.98s/it]                                                     {'loss': 1.1717, 'learning_rate': 5.814763300040726e-05, 'epoch': 0.75}
+ 75%|███████▌  | 5126/6790 [2:57:39<54:58,  1.98s/it] 76%|███████▌  | 5127/6790 [2:57:41<53:31,  1.93s/it]                                                     {'loss': 1.0821, 'learning_rate': 5.80814408565955e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5127/6790 [2:57:41<53:31,  1.93s/it] 76%|███████▌  | 5128/6790 [2:57:43<52:29,  1.90s/it]                                                     {'loss': 1.5381, 'learning_rate': 5.801528000862968e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5128/6790 [2:57:43<52:29,  1.90s/it] 76%|███████▌  | 5129/6790 [2:57:45<57:04,  2.06s/it]                                                     {'loss': 1.4526, 'learning_rate': 5.7949150471099567e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5129/6790 [2:57:45<57:04,  2.06s/it] 76%|███████▌  | 5130/6790 [2:57:47<55:37,  2.01s/it]                                                     {'loss': 1.314, 'learning_rate': 5.78830522585881e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5130/6790 [2:57:47<55:37,  2.01s/it] 76%|███████▌  | 5131/6790 [2:57:49<57:26,  2.08s/it]                                                     {'loss': 1.4032, 'learning_rate': 5.781698538567104e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5131/6790 [2:57:49<57:26,  2.08s/it] 76%|███████▌  | 5132/6790 [2:57:51<57:19,  2.07s/it]                                                     {'loss': 1.4772, 'learning_rate': 5.775094986691769e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5132/6790 [2:57:51<57:19,  2.07s/it] 76%|███████▌  | 5133/6790 [2:57:53<57:52,  2.10s/it]                                                     {'loss': 1.4516, 'learning_rate': 5.7684945716890005e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5133/6790 [2:57:53<57:52,  2.10s/it] 76%|███████▌  | 5134/6790 [2:57:55<57:41,  2.09s/it]                                                     {'loss': 1.3124, 'learning_rate': 5.7618972950143266e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5134/6790 [2:57:55<57:41,  2.09s/it] 76%|███████▌  | 5135/6790 [2:57:57<56:47,  2.06s/it]                                                     {'loss': 1.043, 'learning_rate': 5.755303158122578e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5135/6790 [2:57:57<56:47,  2.06s/it] 76%|███████▌  | 5136/6790 [2:57:59<56:27,  2.05s/it]                                                     {'loss': 1.392, 'learning_rate': 5.748712162467895e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5136/6790 [2:57:59<56:27,  2.05s/it] 76%|███████▌  | 5137/6790 [2:58:01<56:08,  2.04s/it]                                                     {'loss': 1.3918, 'learning_rate': 5.742124309503716e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5137/6790 [2:58:01<56:08,  2.04s/it] 76%|███████▌  | 5138/6790 [2:58:03<54:08,  1.97s/it]                                                     {'loss': 1.3218, 'learning_rate': 5.735539600682791e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5138/6790 [2:58:03<54:08,  1.97s/it] 76%|███████▌  | 5139/6790 [2:58:05<54:25,  1.98s/it]                                                     {'loss': 1.5036, 'learning_rate': 5.728958037457186e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5139/6790 [2:58:05<54:25,  1.98s/it] 76%|███████▌  | 5140/6790 [2:58:07<55:58,  2.04s/it]                                                     {'loss': 1.1828, 'learning_rate': 5.722379621278267e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5140/6790 [2:58:07<55:58,  2.04s/it] 76%|███████▌  | 5141/6790 [2:58:10<58:54,  2.14s/it]                                                     {'loss': 1.2537, 'learning_rate': 5.7158043535966875e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5141/6790 [2:58:10<58:54,  2.14s/it] 76%|███████▌  | 5142/6790 [2:58:12<57:45,  2.10s/it]                                                     {'loss': 1.4033, 'learning_rate': 5.7092322358624496e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5142/6790 [2:58:12<57:45,  2.10s/it] 76%|███████▌  | 5143/6790 [2:58:14<55:54,  2.04s/it]                                                     {'loss': 1.4688, 'learning_rate': 5.702663269524815e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5143/6790 [2:58:14<55:54,  2.04s/it] 76%|███████▌  | 5144/6790 [2:58:16<53:48,  1.96s/it]                                                     {'loss': 1.2979, 'learning_rate': 5.696097456032383e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5144/6790 [2:58:16<53:48,  1.96s/it] 76%|███████▌  | 5145/6790 [2:58:18<55:17,  2.02s/it]                                                     {'loss': 1.5385, 'learning_rate': 5.6895347968330294e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5145/6790 [2:58:18<55:17,  2.02s/it] 76%|███████▌  | 5146/6790 [2:58:20<56:08,  2.05s/it]                                                     {'loss': 1.3649, 'learning_rate': 5.682975293373964e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5146/6790 [2:58:20<56:08,  2.05s/it] 76%|███████▌  | 5147/6790 [2:58:22<57:38,  2.11s/it]                                                     {'loss': 1.5109, 'learning_rate': 5.6764189471016913e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5147/6790 [2:58:22<57:38,  2.11s/it] 76%|███████▌  | 5148/6790 [2:58:24<56:10,  2.05s/it]                                                     {'loss': 1.2095, 'learning_rate': 5.669865759462001e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5148/6790 [2:58:24<56:10,  2.05s/it] 76%|███████▌  | 5149/6790 [2:58:26<56:47,  2.08s/it]                                                     {'loss': 1.5682, 'learning_rate': 5.6633157319000076e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5149/6790 [2:58:26<56:47,  2.08s/it] 76%|███████▌  | 5150/6790 [2:58:28<56:06,  2.05s/it]                                                     {'loss': 1.5981, 'learning_rate': 5.656768865860118e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5150/6790 [2:58:28<56:06,  2.05s/it] 76%|███████▌  | 5151/6790 [2:58:30<54:49,  2.01s/it]                                                     {'loss': 1.5968, 'learning_rate': 5.650225162786056e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5151/6790 [2:58:30<54:49,  2.01s/it] 76%|███████▌  | 5152/6790 [2:58:33<1:02:52,  2.30s/it]                                                       {'loss': 1.3672, 'learning_rate': 5.643684624120818e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5152/6790 [2:58:33<1:02:52,  2.30s/it] 76%|███████▌  | 5153/6790 [2:58:35<59:01,  2.16s/it]                                                       {'loss': 1.3979, 'learning_rate': 5.637147251306745e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5153/6790 [2:58:35<59:01,  2.16s/it] 76%|███████▌  | 5154/6790 [2:58:37<58:13,  2.14s/it]                                                     {'loss': 1.563, 'learning_rate': 5.63061304578544e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5154/6790 [2:58:37<58:13,  2.14s/it] 76%|███████▌  | 5155/6790 [2:58:39<57:37,  2.11s/it]                                                     {'loss': 1.4884, 'learning_rate': 5.6240820089978284e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5155/6790 [2:58:39<57:37,  2.11s/it] 76%|███████▌  | 5156/6790 [2:58:41<55:37,  2.04s/it]                                                     {'loss': 1.4243, 'learning_rate': 5.617554142384134e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5156/6790 [2:58:41<55:37,  2.04s/it] 76%|███████▌  | 5157/6790 [2:58:43<53:33,  1.97s/it]                                                     {'loss': 1.4475, 'learning_rate': 5.6110294473838885e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5157/6790 [2:58:43<53:33,  1.97s/it] 76%|███████▌  | 5158/6790 [2:58:45<56:12,  2.07s/it]                                                     {'loss': 1.584, 'learning_rate': 5.6045079254359e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5158/6790 [2:58:45<56:12,  2.07s/it] 76%|███████▌  | 5159/6790 [2:58:47<54:51,  2.02s/it]                                                     {'loss': 1.3581, 'learning_rate': 5.597989577978302e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5159/6790 [2:58:47<54:51,  2.02s/it] 76%|███████▌  | 5160/6790 [2:58:49<54:14,  2.00s/it]                                                     {'loss': 1.3454, 'learning_rate': 5.591474406448518e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5160/6790 [2:58:49<54:14,  2.00s/it] 76%|███████▌  | 5161/6790 [2:58:51<56:44,  2.09s/it]                                                     {'loss': 1.4256, 'learning_rate': 5.584962412283279e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5161/6790 [2:58:51<56:44,  2.09s/it] 76%|███████▌  | 5162/6790 [2:58:53<54:14,  2.00s/it]                                                     {'loss': 1.3238, 'learning_rate': 5.578453596918596e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5162/6790 [2:58:53<54:14,  2.00s/it] 76%|███████▌  | 5163/6790 [2:58:55<53:48,  1.98s/it]                                                     {'loss': 1.4224, 'learning_rate': 5.5719479617897874e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5163/6790 [2:58:55<53:48,  1.98s/it] 76%|███████▌  | 5164/6790 [2:58:57<52:28,  1.94s/it]                                                     {'loss': 1.2938, 'learning_rate': 5.565445508331497e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5164/6790 [2:58:57<52:28,  1.94s/it] 76%|███████▌  | 5165/6790 [2:58:59<54:24,  2.01s/it]                                                     {'loss': 1.4556, 'learning_rate': 5.558946237977627e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5165/6790 [2:58:59<54:24,  2.01s/it] 76%|███████▌  | 5166/6790 [2:59:01<55:16,  2.04s/it]                                                     {'loss': 1.4519, 'learning_rate': 5.552450152161397e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5166/6790 [2:59:01<55:16,  2.04s/it] 76%|███████▌  | 5167/6790 [2:59:03<54:49,  2.03s/it]                                                     {'loss': 1.4293, 'learning_rate': 5.5459572523153234e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5167/6790 [2:59:03<54:49,  2.03s/it] 76%|███████▌  | 5168/6790 [2:59:05<56:54,  2.11s/it]                                                     {'loss': 1.5144, 'learning_rate': 5.539467539871226e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5168/6790 [2:59:05<56:54,  2.11s/it] 76%|███████▌  | 5169/6790 [2:59:08<59:03,  2.19s/it]                                                     {'loss': 1.4444, 'learning_rate': 5.5329810162602015e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5169/6790 [2:59:08<59:03,  2.19s/it] 76%|███████▌  | 5170/6790 [2:59:10<57:42,  2.14s/it]                                                     {'loss': 1.2167, 'learning_rate': 5.526497682912664e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5170/6790 [2:59:10<57:42,  2.14s/it] 76%|███████▌  | 5171/6790 [2:59:11<55:08,  2.04s/it]                                                     {'loss': 1.4196, 'learning_rate': 5.5200175412583154e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5171/6790 [2:59:11<55:08,  2.04s/it] 76%|███████▌  | 5172/6790 [2:59:13<54:32,  2.02s/it]                                                     {'loss': 1.2008, 'learning_rate': 5.5135405927261605e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5172/6790 [2:59:13<54:32,  2.02s/it] 76%|███████▌  | 5173/6790 [2:59:15<54:45,  2.03s/it]                                                     {'loss': 1.7165, 'learning_rate': 5.507066838744484e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5173/6790 [2:59:15<54:45,  2.03s/it] 76%|███████▌  | 5174/6790 [2:59:17<53:39,  1.99s/it]                                                     {'loss': 1.2497, 'learning_rate': 5.500596280740882e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5174/6790 [2:59:17<53:39,  1.99s/it] 76%|███████▌  | 5175/6790 [2:59:19<52:30,  1.95s/it]                                                     {'loss': 1.422, 'learning_rate': 5.494128920142239e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5175/6790 [2:59:19<52:30,  1.95s/it] 76%|███████▌  | 5176/6790 [2:59:21<54:22,  2.02s/it]                                                     {'loss': 1.4528, 'learning_rate': 5.487664758374742e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5176/6790 [2:59:21<54:22,  2.02s/it] 76%|███████▌  | 5177/6790 [2:59:24<58:49,  2.19s/it]                                                     {'loss': 1.4672, 'learning_rate': 5.48120379686385e-05, 'epoch': 0.76}
+ 76%|███████▌  | 5177/6790 [2:59:24<58:49,  2.19s/it] 76%|███████▋  | 5178/6790 [2:59:26<58:04,  2.16s/it]                                                     {'loss': 1.5102, 'learning_rate': 5.4747460370343575e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5178/6790 [2:59:26<58:04,  2.16s/it] 76%|███████▋  | 5179/6790 [2:59:28<56:46,  2.11s/it]                                                     {'loss': 1.5058, 'learning_rate': 5.468291480310306e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5179/6790 [2:59:28<56:46,  2.11s/it] 76%|███████▋  | 5180/6790 [2:59:30<55:18,  2.06s/it]                                                     {'loss': 1.4761, 'learning_rate': 5.461840128115061e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5180/6790 [2:59:30<55:18,  2.06s/it] 76%|███████▋  | 5181/6790 [2:59:32<54:35,  2.04s/it]                                                     {'loss': 1.3422, 'learning_rate': 5.4553919818712765e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5181/6790 [2:59:32<54:35,  2.04s/it] 76%|███████▋  | 5182/6790 [2:59:34<52:48,  1.97s/it]                                                     {'loss': 1.4114, 'learning_rate': 5.448947043000889e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5182/6790 [2:59:34<52:48,  1.97s/it] 76%|███████▋  | 5183/6790 [2:59:36<54:30,  2.04s/it]                                                     {'loss': 1.5931, 'learning_rate': 5.442505312925148e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5183/6790 [2:59:36<54:30,  2.04s/it] 76%|███████▋  | 5184/6790 [2:59:38<54:33,  2.04s/it]                                                     {'loss': 1.4786, 'learning_rate': 5.43606679306456e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5184/6790 [2:59:38<54:33,  2.04s/it] 76%|███████▋  | 5185/6790 [2:59:40<53:55,  2.02s/it]                                                     {'loss': 1.5127, 'learning_rate': 5.4296314848389707e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5185/6790 [2:59:40<53:55,  2.02s/it] 76%|███████▋  | 5186/6790 [2:59:43<1:01:33,  2.30s/it]                                                       {'loss': 1.442, 'learning_rate': 5.423199389667475e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5186/6790 [2:59:43<1:01:33,  2.30s/it] 76%|███████▋  | 5187/6790 [2:59:46<1:03:16,  2.37s/it]                                                       {'loss': 1.4093, 'learning_rate': 5.416770508968487e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5187/6790 [2:59:46<1:03:16,  2.37s/it] 76%|███████▋  | 5188/6790 [2:59:48<1:00:45,  2.28s/it]                                                       {'loss': 1.429, 'learning_rate': 5.410344844159687e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5188/6790 [2:59:48<1:00:45,  2.28s/it] 76%|███████▋  | 5189/6790 [2:59:50<59:01,  2.21s/it]                                                       {'loss': 1.308, 'learning_rate': 5.403922396658085e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5189/6790 [2:59:50<59:01,  2.21s/it] 76%|███████▋  | 5190/6790 [2:59:52<56:59,  2.14s/it]                                                     {'loss': 1.4917, 'learning_rate': 5.397503167879938e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5190/6790 [2:59:52<56:59,  2.14s/it] 76%|███████▋  | 5191/6790 [2:59:54<55:31,  2.08s/it]                                                     {'loss': 1.4579, 'learning_rate': 5.3910871592408175e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5191/6790 [2:59:54<55:31,  2.08s/it] 76%|███████▋  | 5192/6790 [2:59:56<55:58,  2.10s/it]                                                     {'loss': 1.4531, 'learning_rate': 5.384674372155582e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5192/6790 [2:59:56<55:58,  2.10s/it] 76%|███████▋  | 5193/6790 [2:59:58<54:54,  2.06s/it]                                                     {'loss': 1.5151, 'learning_rate': 5.378264808038385e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5193/6790 [2:59:58<54:54,  2.06s/it] 76%|███████▋  | 5194/6790 [3:00:00<55:47,  2.10s/it]                                                     {'loss': 1.486, 'learning_rate': 5.3718584683026464e-05, 'epoch': 0.76}
+ 76%|███████▋  | 5194/6790 [3:00:00<55:47,  2.10s/it] 77%|███████▋  | 5195/6790 [3:00:02<53:55,  2.03s/it]                                                     {'loss': 1.5091, 'learning_rate': 5.3654553543611e-05, 'epoch': 0.77}
+ 77%|���██████▋  | 5195/6790 [3:00:02<53:55,  2.03s/it] 77%|███████▋  | 5196/6790 [3:00:04<53:25,  2.01s/it]                                                     {'loss': 1.5584, 'learning_rate': 5.3590554676257575e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5196/6790 [3:00:04<53:25,  2.01s/it] 77%|███████▋  | 5197/6790 [3:00:06<52:42,  1.99s/it]                                                     {'loss': 1.2393, 'learning_rate': 5.35265880950792e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5197/6790 [3:00:06<52:42,  1.99s/it] 77%|███████▋  | 5198/6790 [3:00:08<52:24,  1.97s/it]                                                     {'loss': 1.2966, 'learning_rate': 5.346265381418179e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5198/6790 [3:00:08<52:24,  1.97s/it] 77%|███████▋  | 5199/6790 [3:00:10<53:22,  2.01s/it]                                                     {'loss': 1.5701, 'learning_rate': 5.3398751847664075e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5199/6790 [3:00:10<53:22,  2.01s/it] 77%|███████▋  | 5200/6790 [3:00:12<53:24,  2.02s/it]                                                     {'loss': 1.5817, 'learning_rate': 5.33348822096178e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5200/6790 [3:00:12<53:24,  2.02s/it] 77%|███████▋  | 5201/6790 [3:00:14<54:10,  2.05s/it]                                                     {'loss': 1.4643, 'learning_rate': 5.3271044914127354e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5201/6790 [3:00:14<54:10,  2.05s/it] 77%|███████▋  | 5202/6790 [3:00:16<52:16,  1.98s/it]                                                     {'loss': 1.2481, 'learning_rate': 5.320723997527017e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5202/6790 [3:00:16<52:16,  1.98s/it] 77%|███████▋  | 5203/6790 [3:00:18<52:10,  1.97s/it]                                                     {'loss': 1.6713, 'learning_rate': 5.3143467407116506e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5203/6790 [3:00:18<52:10,  1.97s/it] 77%|███████▋  | 5204/6790 [3:00:20<55:46,  2.11s/it]                                                     {'loss': 1.447, 'learning_rate': 5.3079727223729536e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5204/6790 [3:00:20<55:46,  2.11s/it] 77%|███████▋  | 5205/6790 [3:00:22<57:59,  2.20s/it]                                                     {'loss': 1.3193, 'learning_rate': 5.301601943916512e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5205/6790 [3:00:22<57:59,  2.20s/it] 77%|███████▋  | 5206/6790 [3:00:24<56:45,  2.15s/it]                                                     {'loss': 1.5178, 'learning_rate': 5.2952344067472115e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5206/6790 [3:00:24<56:45,  2.15s/it] 77%|███████▋  | 5207/6790 [3:00:26<54:04,  2.05s/it]                                                     {'loss': 1.5444, 'learning_rate': 5.28887011226922e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5207/6790 [3:00:26<54:04,  2.05s/it] 77%|███████▋  | 5208/6790 [3:00:28<54:13,  2.06s/it]                                                     {'loss': 1.3043, 'learning_rate': 5.282509061885999e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5208/6790 [3:00:28<54:13,  2.06s/it] 77%|███████▋  | 5209/6790 [3:00:30<53:44,  2.04s/it]                                                     {'loss': 1.2788, 'learning_rate': 5.2761512570002656e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5209/6790 [3:00:30<53:44,  2.04s/it] 77%|███████▋  | 5210/6790 [3:00:32<54:38,  2.08s/it]                                                     {'loss': 1.4896, 'learning_rate': 5.269796699014067e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5210/6790 [3:00:32<54:38,  2.08s/it] 77%|███████▋  | 5211/6790 [3:00:35<55:20,  2.10s/it]                                                     {'loss': 1.3868, 'learning_rate': 5.263445389328687e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5211/6790 [3:00:35<55:20,  2.10s/it] 77%|███████▋  | 5212/6790 [3:00:37<56:55,  2.16s/it]                                                     {'loss': 1.2431, 'learning_rate': 5.257097329344727e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5212/6790 [3:00:37<56:55,  2.16s/it] 77%|███████▋  | 5213/6790 [3:00:39<55:42,  2.12s/it]                                                     {'loss': 1.4965, 'learning_rate': 5.250752520462055e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5213/6790 [3:00:39<55:42,  2.12s/it] 77%|███████▋  | 5214/6790 [3:00:41<56:28,  2.15s/it]                                                     {'loss': 1.444, 'learning_rate': 5.2444109640798266e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5214/6790 [3:00:41<56:28,  2.15s/it] 77%|███████▋  | 5215/6790 [3:00:43<56:08,  2.14s/it]                                                     {'loss': 1.474, 'learning_rate': 5.238072661596487e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5215/6790 [3:00:43<56:08,  2.14s/it] 77%|███████▋  | 5216/6790 [3:00:46<56:58,  2.17s/it]                                                     {'loss': 1.3439, 'learning_rate': 5.231737614409742e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5216/6790 [3:00:46<56:58,  2.17s/it] 77%|███████▋  | 5217/6790 [3:00:48<55:56,  2.13s/it]                                                     {'loss': 1.7172, 'learning_rate': 5.225405823916616e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5217/6790 [3:00:48<55:56,  2.13s/it] 77%|███████▋  | 5218/6790 [3:00:50<55:05,  2.10s/it]                                                     {'loss': 1.5796, 'learning_rate': 5.2190772915133744e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5218/6790 [3:00:50<55:05,  2.10s/it] 77%|███████▋  | 5219/6790 [3:00:52<54:03,  2.06s/it]                                                     {'loss': 1.6014, 'learning_rate': 5.2127520185955994e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5219/6790 [3:00:52<54:03,  2.06s/it] 77%|███████▋  | 5220/6790 [3:00:54<53:04,  2.03s/it]                                                     {'loss': 1.3602, 'learning_rate': 5.206430006558116e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5220/6790 [3:00:54<53:04,  2.03s/it] 77%|███████▋  | 5221/6790 [3:00:56<53:13,  2.04s/it]                                                     {'loss': 1.4751, 'learning_rate': 5.2001112567950816e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5221/6790 [3:00:56<53:13,  2.04s/it] 77%|███████▋  | 5222/6790 [3:00:58<54:53,  2.10s/it]                                                     {'loss': 1.2675, 'learning_rate': 5.193795770699885e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5222/6790 [3:00:58<54:53,  2.10s/it] 77%|███████▋  | 5223/6790 [3:01:00<54:37,  2.09s/it]                                                     {'loss': 1.4587, 'learning_rate': 5.187483549665222e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5223/6790 [3:01:00<54:37,  2.09s/it] 77%|███████▋  | 5224/6790 [3:01:02<53:27,  2.05s/it]                                                     {'loss': 1.2608, 'learning_rate': 5.181174595083063e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5224/6790 [3:01:02<53:27,  2.05s/it] 77%|███████▋  | 5225/6790 [3:01:04<53:49,  2.06s/it]                                                     {'loss': 1.4702, 'learning_rate': 5.174868908344659e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5225/6790 [3:01:04<53:49,  2.06s/it] 77%|███████▋  | 5226/6790 [3:01:06<53:53,  2.07s/it]                                                     {'loss': 1.3673, 'learning_rate': 5.1685664908405316e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5226/6790 [3:01:06<53:53,  2.07s/it] 77%|███████▋  | 5227/6790 [3:01:08<54:20,  2.09s/it]                                                     {'loss': 1.5586, 'learning_rate': 5.162267343960492e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5227/6790 [3:01:08<54:20,  2.09s/it] 77%|███████▋  | 5228/6790 [3:01:10<54:33,  2.10s/it]                                                     {'loss': 1.4984, 'learning_rate': 5.155971469093625e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5228/6790 [3:01:10<54:33,  2.10s/it] 77%|███████▋  | 5229/6790 [3:01:12<54:11,  2.08s/it]                                                     {'loss': 1.2751, 'learning_rate': 5.149678867628305e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5229/6790 [3:01:12<54:11,  2.08s/it] 77%|███████▋  | 5230/6790 [3:01:15<55:26,  2.13s/it]                                                     {'loss': 1.4079, 'learning_rate': 5.1433895409521547e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5230/6790 [3:01:15<55:26,  2.13s/it] 77%|███████▋  | 5231/6790 [3:01:16<52:35,  2.02s/it]                                                     {'loss': 1.548, 'learning_rate': 5.1371034904521134e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5231/6790 [3:01:16<52:35,  2.02s/it] 77%|███████▋  | 5232/6790 [3:01:18<51:32,  1.98s/it]                                                     {'loss': 1.4239, 'learning_rate': 5.130820717514378e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5232/6790 [3:01:18<51:32,  1.98s/it] 77%|███████▋  | 5233/6790 [3:01:20<51:33,  1.99s/it]                                                     {'loss': 1.3678, 'learning_rate': 5.124541223524415e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5233/6790 [3:01:20<51:33,  1.99s/it] 77%|███████▋  | 5234/6790 [3:01:22<51:45,  2.00s/it]                                                     {'loss': 1.3013, 'learning_rate': 5.11826500986698e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5234/6790 [3:01:22<51:45,  2.00s/it] 77%|███████▋  | 5235/6790 [3:01:24<50:23,  1.94s/it]                                                     {'loss': 1.3259, 'learning_rate': 5.111992077926104e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5235/6790 [3:01:24<50:23,  1.94s/it] 77%|███████▋  | 5236/6790 [3:01:26<51:48,  2.00s/it]                                                     {'loss': 1.3637, 'learning_rate': 5.105722429085098e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5236/6790 [3:01:26<51:48,  2.00s/it] 77%|███████▋  | 5237/6790 [3:01:28<52:56,  2.05s/it]                                                     {'loss': 1.4211, 'learning_rate': 5.099456064726531e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5237/6790 [3:01:28<52:56,  2.05s/it] 77%|███████▋  | 5238/6790 [3:01:31<53:30,  2.07s/it]                                                     {'loss': 1.4019, 'learning_rate': 5.093192986232265e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5238/6790 [3:01:31<53:30,  2.07s/it] 77%|███████▋  | 5239/6790 [3:01:33<53:39,  2.08s/it]                                                     {'loss': 1.4286, 'learning_rate': 5.0869331949834343e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5239/6790 [3:01:33<53:39,  2.08s/it] 77%|███████▋  | 5240/6790 [3:01:35<53:17,  2.06s/it]                                                     {'loss': 1.4123, 'learning_rate': 5.080676692360453e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5240/6790 [3:01:35<53:17,  2.06s/it] 77%|███████▋  | 5241/6790 [3:01:37<52:04,  2.02s/it]                                                     {'loss': 1.5135, 'learning_rate': 5.0744234797429845e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5241/6790 [3:01:37<52:04,  2.02s/it] 77%|███████▋  | 5242/6790 [3:01:38<50:48,  1.97s/it]                                                     {'loss': 1.3375, 'learning_rate': 5.06817355851001e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5242/6790 [3:01:38<50:48,  1.97s/it] 77%|███████▋  | 5243/6790 [3:01:41<56:05,  2.18s/it]                                                     {'loss': 1.4716, 'learning_rate': 5.061926930039742e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5243/6790 [3:01:41<56:05,  2.18s/it] 77%|███████▋  | 5244/6790 [3:01:43<54:45,  2.13s/it]                                                     {'loss': 1.0529, 'learning_rate': 5.05568359570969e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5244/6790 [3:01:43<54:45,  2.13s/it] 77%|███████▋  | 5245/6790 [3:01:45<55:45,  2.17s/it]                                                     {'loss': 1.3717, 'learning_rate': 5.049443556896638e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5245/6790 [3:01:45<55:45,  2.17s/it] 77%|███████▋  | 5246/6790 [3:01:47<55:11,  2.15s/it]                                                     {'loss': 1.4276, 'learning_rate': 5.0432068149766376e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5246/6790 [3:01:47<55:11,  2.15s/it] 77%|███████▋  | 5247/6790 [3:01:49<52:15,  2.03s/it]                                                     {'loss': 1.3372, 'learning_rate': 5.0369733713250046e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5247/6790 [3:01:49<52:15,  2.03s/it] 77%|███████▋  | 5248/6790 [3:01:51<54:11,  2.11s/it]                                                     {'loss': 1.2934, 'learning_rate': 5.0307432273163436e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5248/6790 [3:01:51<54:11,  2.11s/it] 77%|███████▋  | 5249/6790 [3:01:53<53:19,  2.08s/it]                                                     {'loss': 1.2798, 'learning_rate': 5.024516384324522e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5249/6790 [3:01:53<53:19,  2.08s/it] 77%|███████▋  | 5250/6790 [3:01:56<55:08,  2.15s/it]                                                     {'loss': 1.2741, 'learning_rate': 5.018292843722683e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5250/6790 [3:01:56<55:08,  2.15s/it] 77%|███████▋  | 5251/6790 [3:01:58<54:52,  2.14s/it]                                                     {'loss': 1.5044, 'learning_rate': 5.0120726068832446e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5251/6790 [3:01:58<54:52,  2.14s/it] 77%|███████▋  | 5252/6790 [3:02:00<52:42,  2.06s/it]                                                     {'loss': 1.5647, 'learning_rate': 5.0058556751778775e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5252/6790 [3:02:00<52:42,  2.06s/it] 77%|█���█████▋  | 5253/6790 [3:02:02<52:01,  2.03s/it]                                                     {'loss': 1.4648, 'learning_rate': 4.999642049977558e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5253/6790 [3:02:02<52:01,  2.03s/it] 77%|███████▋  | 5254/6790 [3:02:04<50:41,  1.98s/it]                                                     {'loss': 1.3594, 'learning_rate': 4.993431732652498e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5254/6790 [3:02:04<50:41,  1.98s/it] 77%|███████▋  | 5255/6790 [3:02:06<52:40,  2.06s/it]                                                     {'loss': 1.632, 'learning_rate': 4.987224724572199e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5255/6790 [3:02:06<52:40,  2.06s/it] 77%|███████▋  | 5256/6790 [3:02:08<50:36,  1.98s/it]                                                     {'loss': 1.2482, 'learning_rate': 4.9810210271054304e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5256/6790 [3:02:08<50:36,  1.98s/it] 77%|███████▋  | 5257/6790 [3:02:10<50:02,  1.96s/it]                                                     {'loss': 1.3066, 'learning_rate': 4.974820641620237e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5257/6790 [3:02:10<50:02,  1.96s/it] 77%|███████▋  | 5258/6790 [3:02:12<50:17,  1.97s/it]                                                     {'loss': 1.2467, 'learning_rate': 4.96862356948391e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5258/6790 [3:02:12<50:17,  1.97s/it] 77%|███████▋  | 5259/6790 [3:02:14<53:50,  2.11s/it]                                                     {'loss': 1.3865, 'learning_rate': 4.9624298120630366e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5259/6790 [3:02:14<53:50,  2.11s/it] 77%|███████▋  | 5260/6790 [3:02:16<52:14,  2.05s/it]                                                     {'loss': 1.4421, 'learning_rate': 4.956239370723461e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5260/6790 [3:02:16<52:14,  2.05s/it] 77%|███████▋  | 5261/6790 [3:02:18<55:45,  2.19s/it]                                                     {'loss': 1.5849, 'learning_rate': 4.9500522468303054e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5261/6790 [3:02:18<55:45,  2.19s/it] 77%|███████▋  | 5262/6790 [3:02:21<55:07,  2.16s/it]                                                     {'loss': 1.405, 'learning_rate': 4.9438684417479386e-05, 'epoch': 0.77}
+ 77%|███████▋  | 5262/6790 [3:02:21<55:07,  2.16s/it] 78%|███████▊  | 5263/6790 [3:02:23<55:22,  2.18s/it]                                                     {'loss': 1.4171, 'learning_rate': 4.937687956840018e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5263/6790 [3:02:23<55:22,  2.18s/it] 78%|███████▊  | 5264/6790 [3:02:25<53:44,  2.11s/it]                                                     {'loss': 1.2795, 'learning_rate': 4.931510793469463e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5264/6790 [3:02:25<53:44,  2.11s/it] 78%|███████▊  | 5265/6790 [3:02:27<58:51,  2.32s/it]                                                     {'loss': 1.1118, 'learning_rate': 4.9253369529984605e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5265/6790 [3:02:27<58:51,  2.32s/it] 78%|███████▊  | 5266/6790 [3:02:30<59:11,  2.33s/it]                                                     {'loss': 1.5906, 'learning_rate': 4.919166436788465e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5266/6790 [3:02:30<59:11,  2.33s/it] 78%|███████▊  | 5267/6790 [3:02:32<1:01:03,  2.41s/it]                                                       {'loss': 1.4629, 'learning_rate': 4.912999246200196e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5267/6790 [3:02:32<1:01:03,  2.41s/it] 78%|███████▊  | 5268/6790 [3:02:35<58:59,  2.33s/it]                                                       {'loss': 1.4013, 'learning_rate': 4.9068353825936485e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5268/6790 [3:02:35<58:59,  2.33s/it] 78%|███████▊  | 5269/6790 [3:02:37<56:31,  2.23s/it]                                                     {'loss': 1.3301, 'learning_rate': 4.900674847328062e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5269/6790 [3:02:37<56:31,  2.23s/it] 78%|███████▊  | 5270/6790 [3:02:38<54:06,  2.14s/it]                                                     {'loss': 1.2827, 'learning_rate': 4.894517641761962e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5270/6790 [3:02:38<54:06,  2.14s/it] 78%|███████▊  | 5271/6790 [3:02:40<52:52,  2.09s/it]                                                     {'loss': 1.5374, 'learning_rate': 4.888363767253137e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5271/6790 [3:02:40<52:52,  2.09s/it] 78%|███████▊  | 5272/6790 [3:02:43<52:49,  2.09s/it]                                                     {'loss': 1.5383, 'learning_rate': 4.8822132251586406e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5272/6790 [3:02:43<52:49,  2.09s/it] 78%|███████▊  | 5273/6790 [3:02:45<52:25,  2.07s/it]                                                     {'loss': 1.5564, 'learning_rate': 4.876066016834773e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5273/6790 [3:02:45<52:25,  2.07s/it] 78%|███████▊  | 5274/6790 [3:02:47<51:49,  2.05s/it]                                                     {'loss': 1.4251, 'learning_rate': 4.869922143637138e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5274/6790 [3:02:47<51:49,  2.05s/it] 78%|███████▊  | 5275/6790 [3:02:48<50:38,  2.01s/it]                                                     {'loss': 1.1734, 'learning_rate': 4.8637816069205656e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5275/6790 [3:02:48<50:38,  2.01s/it] 78%|███████▊  | 5276/6790 [3:02:50<49:29,  1.96s/it]                                                     {'loss': 1.4651, 'learning_rate': 4.857644408039166e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5276/6790 [3:02:50<49:29,  1.96s/it] 78%|███████▊  | 5277/6790 [3:02:52<49:33,  1.97s/it]                                                     {'loss': 1.3311, 'learning_rate': 4.8515105483463183e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5277/6790 [3:02:52<49:33,  1.97s/it] 78%|███████▊  | 5278/6790 [3:02:54<47:39,  1.89s/it]                                                     {'loss': 1.3255, 'learning_rate': 4.8453800291946616e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5278/6790 [3:02:54<47:39,  1.89s/it] 78%|███████▊  | 5279/6790 [3:02:57<55:34,  2.21s/it]                                                     {'loss': 1.3311, 'learning_rate': 4.839252851936089e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5279/6790 [3:02:57<55:34,  2.21s/it] 78%|███████▊  | 5280/6790 [3:02:59<54:23,  2.16s/it]                                                     {'loss': 1.3861, 'learning_rate': 4.8331290179217645e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5280/6790 [3:02:59<54:23,  2.16s/it] 78%|███████▊  | 5281/6790 [3:03:01<52:44,  2.10s/it]                                                     {'loss': 1.6508, 'learning_rate': 4.8270085285021196e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5281/6790 [3:03:01<52:44,  2.10s/it] 78%|███████▊  | 5282/6790 [3:03:03<51:54,  2.07s/it]                                                     {'loss': 1.2333, 'learning_rate': 4.82089138502684e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5282/6790 [3:03:03<51:54,  2.07s/it] 78%|███████▊  | 5283/6790 [3:03:06<56:13,  2.24s/it]                                                     {'loss': 1.4091, 'learning_rate': 4.814777588844885e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5283/6790 [3:03:06<56:13,  2.24s/it] 78%|███████▊  | 5284/6790 [3:03:08<53:36,  2.14s/it]                                                     {'loss': 1.407, 'learning_rate': 4.808667141304446e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5284/6790 [3:03:08<53:36,  2.14s/it] 78%|███████▊  | 5285/6790 [3:03:10<55:56,  2.23s/it]                                                     {'loss': 1.1673, 'learning_rate': 4.802560043753026e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5285/6790 [3:03:10<55:56,  2.23s/it] 78%|███████▊  | 5286/6790 [3:03:12<54:28,  2.17s/it]                                                     {'loss': 1.4376, 'learning_rate': 4.7964562975373375e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5286/6790 [3:03:12<54:28,  2.17s/it] 78%|███████▊  | 5287/6790 [3:03:14<54:48,  2.19s/it]                                                     {'loss': 1.0462, 'learning_rate': 4.7903559040033875e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5287/6790 [3:03:14<54:48,  2.19s/it] 78%|███████▊  | 5288/6790 [3:03:16<52:19,  2.09s/it]                                                     {'loss': 1.3786, 'learning_rate': 4.7842588644964316e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5288/6790 [3:03:16<52:19,  2.09s/it] 78%|███████▊  | 5289/6790 [3:03:18<51:43,  2.07s/it]                                                     {'loss': 1.4362, 'learning_rate': 4.778165180360994e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5289/6790 [3:03:18<51:43,  2.07s/it] 78%|███████▊  | 5290/6790 [3:03:20<50:35,  2.02s/it]                                                     {'loss': 1.3287, 'learning_rate': 4.7720748529408375e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5290/6790 [3:03:20<50:35,  2.02s/it] 78%|███████▊  | 5291/6790 [3:03:22<50:43,  2.03s/it]                                                     {'loss': 1.2799, 'learning_rate': 4.7659878835790103e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5291/6790 [3:03:22<50:43,  2.03s/it] 78%|███████▊  | 5292/6790 [3:03:24<48:47,  1.95s/it]                                                     {'loss': 1.3648, 'learning_rate': 4.759904273617806e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5292/6790 [3:03:24<48:47,  1.95s/it] 78%|███████▊  | 5293/6790 [3:03:26<50:50,  2.04s/it]                                                     {'loss': 1.3623, 'learning_rate': 4.7538240243987875e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5293/6790 [3:03:26<50:50,  2.04s/it] 78%|███████▊  | 5294/6790 [3:03:28<49:37,  1.99s/it]                                                     {'loss': 1.4981, 'learning_rate': 4.747747137262759e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5294/6790 [3:03:28<49:37,  1.99s/it] 78%|███████▊  | 5295/6790 [3:03:30<48:00,  1.93s/it]                                                     {'loss': 1.3311, 'learning_rate': 4.7416736135498e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5295/6790 [3:03:30<48:00,  1.93s/it] 78%|███████▊  | 5296/6790 [3:03:32<51:00,  2.05s/it]                                                     {'loss': 1.4946, 'learning_rate': 4.735603454599242e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5296/6790 [3:03:32<51:00,  2.05s/it] 78%|███████▊  | 5297/6790 [3:03:34<49:16,  1.98s/it]                                                     {'loss': 1.1491, 'learning_rate': 4.7295366617496785e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5297/6790 [3:03:34<49:16,  1.98s/it] 78%|███████▊  | 5298/6790 [3:03:36<47:33,  1.91s/it]                                                     {'loss': 1.3677, 'learning_rate': 4.7234732363389445e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5298/6790 [3:03:36<47:33,  1.91s/it] 78%|███████▊  | 5299/6790 [3:03:38<51:39,  2.08s/it]                                                     {'loss': 1.3657, 'learning_rate': 4.7174131797041575e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5299/6790 [3:03:38<51:39,  2.08s/it] 78%|███████▊  | 5300/6790 [3:03:41<54:35,  2.20s/it]                                                     {'loss': 1.2068, 'learning_rate': 4.711356493181684e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5300/6790 [3:03:41<54:35,  2.20s/it] 78%|███████▊  | 5301/6790 [3:03:43<56:23,  2.27s/it]                                                     {'loss': 1.453, 'learning_rate': 4.7053031781071276e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5301/6790 [3:03:43<56:23,  2.27s/it] 78%|███████▊  | 5302/6790 [3:03:45<55:06,  2.22s/it]                                                     {'loss': 1.5207, 'learning_rate': 4.699253235815373e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5302/6790 [3:03:45<55:06,  2.22s/it] 78%|███████▊  | 5303/6790 [3:03:47<55:21,  2.23s/it]                                                     {'loss': 1.3068, 'learning_rate': 4.69320666764055e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5303/6790 [3:03:47<55:21,  2.23s/it] 78%|███████▊  | 5304/6790 [3:03:49<52:29,  2.12s/it]                                                     {'loss': 1.4984, 'learning_rate': 4.687163474916054e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5304/6790 [3:03:49<52:29,  2.12s/it] 78%|███████▊  | 5305/6790 [3:03:51<52:47,  2.13s/it]                                                     {'loss': 1.4585, 'learning_rate': 4.681123658974509e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5305/6790 [3:03:51<52:47,  2.13s/it] 78%|███████▊  | 5306/6790 [3:03:53<51:19,  2.08s/it]                                                     {'loss': 1.4134, 'learning_rate': 4.675087221147838e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5306/6790 [3:03:53<51:19,  2.08s/it] 78%|███████▊  | 5307/6790 [3:03:55<50:00,  2.02s/it]                                                     {'loss': 1.459, 'learning_rate': 4.669054162767177e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5307/6790 [3:03:55<50:00,  2.02s/it] 78%|███████▊  | 5308/6790 [3:03:57<48:58,  1.98s/it]                                                     {'loss': 1.1079, 'learning_rate': 4.6630244851629456e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5308/6790 [3:03:57<48:58,  1.98s/it] 78%|███████▊  | 5309/6790 [3:03:59<49:35,  2.01s/it]                                                     {'loss': 1.3176, 'learning_rate': 4.656998189664789e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5309/6790 [3:03:59<49:35,  2.01s/it] 78%|███████▊  | 5310/6790 [3:04:01<49:48,  2.02s/it]                                                     {'loss': 1.3285, 'learning_rate': 4.65097527760165e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5310/6790 [3:04:01<49:48,  2.02s/it] 78%|███████▊  | 5311/6790 [3:04:03<50:17,  2.04s/it]                                                     {'loss': 1.6574, 'learning_rate': 4.64495575030168e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5311/6790 [3:04:03<50:17,  2.04s/it] 78%|███████▊  | 5312/6790 [3:04:06<51:15,  2.08s/it]                                                     {'loss': 1.5516, 'learning_rate': 4.638939609092312e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5312/6790 [3:04:06<51:15,  2.08s/it] 78%|███████▊  | 5313/6790 [3:04:07<50:03,  2.03s/it]                                                     {'loss': 1.4291, 'learning_rate': 4.6329268553002213e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5313/6790 [3:04:07<50:03,  2.03s/it] 78%|███████▊  | 5314/6790 [3:04:09<49:07,  2.00s/it]                                                     {'loss': 1.228, 'learning_rate': 4.626917490251346e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5314/6790 [3:04:09<49:07,  2.00s/it] 78%|███████▊  | 5315/6790 [3:04:11<48:35,  1.98s/it]                                                     {'loss': 1.3658, 'learning_rate': 4.620911515270858e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5315/6790 [3:04:11<48:35,  1.98s/it] 78%|███████▊  | 5316/6790 [3:04:13<48:55,  1.99s/it]                                                     {'loss': 1.6437, 'learning_rate': 4.614908931683193e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5316/6790 [3:04:13<48:55,  1.99s/it] 78%|███████▊  | 5317/6790 [3:04:16<51:07,  2.08s/it]                                                     {'loss': 1.4756, 'learning_rate': 4.6089097408120576e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5317/6790 [3:04:16<51:07,  2.08s/it] 78%|███████▊  | 5318/6790 [3:04:18<51:05,  2.08s/it]                                                     {'loss': 1.3887, 'learning_rate': 4.6029139439803734e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5318/6790 [3:04:18<51:05,  2.08s/it] 78%|███████▊  | 5319/6790 [3:04:20<50:32,  2.06s/it]                                                     {'loss': 1.4509, 'learning_rate': 4.5969215425103395e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5319/6790 [3:04:20<50:32,  2.06s/it] 78%|███████▊  | 5320/6790 [3:04:22<53:38,  2.19s/it]                                                     {'loss': 1.5504, 'learning_rate': 4.5909325377233956e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5320/6790 [3:04:22<53:38,  2.19s/it] 78%|███████▊  | 5321/6790 [3:04:24<54:03,  2.21s/it]                                                     {'loss': 1.4033, 'learning_rate': 4.584946930940246e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5321/6790 [3:04:24<54:03,  2.21s/it] 78%|███████▊  | 5322/6790 [3:04:26<51:38,  2.11s/it]                                                     {'loss': 1.4849, 'learning_rate': 4.578964723480821e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5322/6790 [3:04:26<51:38,  2.11s/it] 78%|███████▊  | 5323/6790 [3:04:28<51:30,  2.11s/it]                                                     {'loss': 1.4039, 'learning_rate': 4.572985916664321e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5323/6790 [3:04:28<51:30,  2.11s/it] 78%|███████▊  | 5324/6790 [3:04:30<49:37,  2.03s/it]                                                     {'loss': 1.3723, 'learning_rate': 4.567010511809191e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5324/6790 [3:04:30<49:37,  2.03s/it] 78%|███████▊  | 5325/6790 [3:04:32<49:27,  2.03s/it]                                                     {'loss': 1.359, 'learning_rate': 4.561038510233131e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5325/6790 [3:04:32<49:27,  2.03s/it] 78%|███████▊  | 5326/6790 [3:04:34<49:29,  2.03s/it]                                                     {'loss': 1.3657, 'learning_rate': 4.555069913253076e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5326/6790 [3:04:34<49:29,  2.03s/it] 78%|███████▊  | 5327/6790 [3:04:36<48:56,  2.01s/it]                                                     {'loss': 1.5494, 'learning_rate': 4.5491047221852244e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5327/6790 [3:04:36<48:56,  2.01s/it] 78%|███████▊  | 5328/6790 [3:04:38<49:49,  2.04s/it]                                                     {'loss': 1.441, 'learning_rate': 4.5431429383450195e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5328/6790 [3:04:38<49:49,  2.04s/it] 78%|███████▊  | 5329/6790 [3:04:40<49:59,  2.05s/it]                                                     {'loss': 1.5706, 'learning_rate': 4.537184563047157e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5329/6790 [3:04:41<49:59,  2.05s/it] 78%|███████▊  | 5330/6790 [3:04:42<47:37,  1.96s/it]                                                     {'loss': 1.3239, 'learning_rate': 4.531229597605558e-05, 'epoch': 0.78}
+ 78%|███████▊  | 5330/6790 [3:04:42<47:37,  1.96s/it] 79%|███████▊  | 5331/6790 [3:04:44<46:04,  1.89s/it]                                                     {'loss': 1.1059, 'learning_rate': 4.525278043333434e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5331/6790 [3:04:44<46:04,  1.89s/it] 79%|███████▊  | 5332/6790 [3:04:46<46:06,  1.90s/it]                                                     {'loss': 1.3917, 'learning_rate': 4.5193299015432036e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5332/6790 [3:04:46<46:06,  1.90s/it] 79%|███████▊  | 5333/6790 [3:04:48<48:14,  1.99s/it]                                                     {'loss': 1.3176, 'learning_rate': 4.513385173546556e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5333/6790 [3:04:48<48:14,  1.99s/it] 79%|███████▊  | 5334/6790 [3:04:50<48:34,  2.00s/it]                                                     {'loss': 1.4296, 'learning_rate': 4.507443860654419e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5334/6790 [3:04:50<48:34,  2.00s/it] 79%|███████▊  | 5335/6790 [3:04:52<50:08,  2.07s/it]                                                     {'loss': 1.4248, 'learning_rate': 4.501505964176971e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5335/6790 [3:04:52<50:08,  2.07s/it] 79%|███████▊  | 5336/6790 [3:04:54<50:46,  2.10s/it]                                                     {'loss': 1.4099, 'learning_rate': 4.495571485423642e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5336/6790 [3:04:54<50:46,  2.10s/it] 79%|███████▊  | 5337/6790 [3:04:57<55:00,  2.27s/it]                                                     {'loss': 1.4315, 'learning_rate': 4.489640425703088e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5337/6790 [3:04:57<55:00,  2.27s/it] 79%|███████▊  | 5338/6790 [3:04:59<53:24,  2.21s/it]                                                     {'loss': 1.4053, 'learning_rate': 4.483712786323231e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5338/6790 [3:04:59<53:24,  2.21s/it] 79%|███████▊  | 5339/6790 [3:05:01<52:43,  2.18s/it]                                                     {'loss': 1.5405, 'learning_rate': 4.477788568591235e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5339/6790 [3:05:01<52:43,  2.18s/it] 79%|███████▊  | 5340/6790 [3:05:03<51:54,  2.15s/it]                                                     {'loss': 1.4313, 'learning_rate': 4.47186777381351e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5340/6790 [3:05:03<51:54,  2.15s/it] 79%|███████▊  | 5341/6790 [3:05:05<51:05,  2.12s/it]                                                     {'loss': 1.6608, 'learning_rate': 4.465950403295693e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5341/6790 [3:05:05<51:05,  2.12s/it] 79%|███████▊  | 5342/6790 [3:05:07<50:10,  2.08s/it]                                                     {'loss': 1.4481, 'learning_rate': 4.4600364583427026e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5342/6790 [3:05:07<50:10,  2.08s/it] 79%|███████▊  | 5343/6790 [3:05:10<54:36,  2.26s/it]                                                     {'loss': 1.32, 'learning_rate': 4.454125940258664e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5343/6790 [3:05:10<54:36,  2.26s/it] 79%|███████▊  | 5344/6790 [3:05:12<52:15,  2.17s/it]                                                     {'loss': 1.587, 'learning_rate': 4.44821885034697e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5344/6790 [3:05:12<52:15,  2.17s/it] 79%|███████▊  | 5345/6790 [3:05:14<50:14,  2.09s/it]                                                     {'loss': 1.2123, 'learning_rate': 4.4423151899102486e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5345/6790 [3:05:14<50:14,  2.09s/it] 79%|███████▊  | 5346/6790 [3:05:16<50:19,  2.09s/it]                                                     {'loss': 1.359, 'learning_rate': 4.436414960250379e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5346/6790 [3:05:16<50:19,  2.09s/it] 79%|███████▊  | 5347/6790 [3:05:18<47:22,  1.97s/it]                                                     {'loss': 1.4412, 'learning_rate': 4.430518162668469e-05, 'epoch': 0.79}
+ 79%|███████▊  | 5347/6790 [3:05:18<47:22,  1.97s/it] 79%|███████▉  | 5348/6790 [3:05:20<46:34,  1.94s/it]                                                     {'loss': 1.2453, 'learning_rate': 4.424624798464885e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5348/6790 [3:05:20<46:34,  1.94s/it] 79%|███████▉  | 5349/6790 [3:05:22<49:02,  2.04s/it]                                                     {'loss': 1.3339, 'learning_rate': 4.418734868939227e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5349/6790 [3:05:22<49:02,  2.04s/it] 79%|███████▉  | 5350/6790 [3:05:24<48:40,  2.03s/it]                                                     {'loss': 1.4867, 'learning_rate': 4.412848375390344e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5350/6790 [3:05:24<48:40,  2.03s/it] 79%|███████▉  | 5351/6790 [3:05:26<49:47,  2.08s/it]                                                     {'loss': 1.5014, 'learning_rate': 4.406965319116323e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5351/6790 [3:05:26<49:47,  2.08s/it] 79%|███████▉  | 5352/6790 [3:05:28<48:18,  2.02s/it]                                                     {'loss': 1.3315, 'learning_rate': 4.401085701414493e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5352/6790 [3:05:28<48:18,  2.02s/it] 79%|███████▉  | 5353/6790 [3:05:30<48:41,  2.03s/it]                                                     {'loss': 1.3099, 'learning_rate': 4.395209523581434e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5353/6790 [3:05:30<48:41,  2.03s/it] 79%|███████▉  | 5354/6790 [3:05:32<50:58,  2.13s/it]                                                     {'loss': 1.4843, 'learning_rate': 4.3893367869129454e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5354/6790 [3:05:32<50:58,  2.13s/it] 79%|███████▉  | 5355/6790 [3:05:35<53:09,  2.22s/it]                                                     {'loss': 1.3047, 'learning_rate': 4.383467492704087e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5355/6790 [3:05:35<53:09,  2.22s/it] 79%|███████▉  | 5356/6790 [3:05:37<51:10,  2.14s/it]                                                     {'loss': 1.4388, 'learning_rate': 4.3776016422491583e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5356/6790 [3:05:37<51:10,  2.14s/it] 79%|███████▉  | 5357/6790 [3:05:39<51:24,  2.15s/it]                                                     {'loss': 1.5858, 'learning_rate': 4.371739236841697e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5357/6790 [3:05:39<51:24,  2.15s/it] 79%|███████▉  | 5358/6790 [3:05:41<51:15,  2.15s/it]                                                     {'loss': 1.3207, 'learning_rate': 4.36588027777447e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5358/6790 [3:05:41<51:15,  2.15s/it] 79%|███████▉  | 5359/6790 [3:05:43<49:37,  2.08s/it]                                                     {'loss': 1.5107, 'learning_rate': 4.360024766339497e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5359/6790 [3:05:43<49:37,  2.08s/it] 79%|███████▉  | 5360/6790 [3:05:45<48:42,  2.04s/it]                                                     {'loss': 1.6765, 'learning_rate': 4.3541727038280364e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5360/6790 [3:05:45<48:42,  2.04s/it] 79%|███████▉  | 5361/6790 [3:05:47<51:05,  2.14s/it]                                                     {'loss': 1.3783, 'learning_rate': 4.348324091530587e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5361/6790 [3:05:47<51:05,  2.14s/it] 79%|███████▉  | 5362/6790 [3:05:50<52:41,  2.21s/it]                                                     {'loss': 1.3268, 'learning_rate': 4.342478930736869e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5362/6790 [3:05:50<52:41,  2.21s/it] 79%|███████▉  | 5363/6790 [3:05:52<51:58,  2.19s/it]                                                     {'loss': 1.4138, 'learning_rate': 4.3366372227358756e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5363/6790 [3:05:52<51:58,  2.19s/it] 79%|███████▉  | 5364/6790 [3:05:54<51:19,  2.16s/it]                                                     {'loss': 1.595, 'learning_rate': 4.3307989688158036e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5364/6790 [3:05:54<51:19,  2.16s/it] 79%|███████▉  | 5365/6790 [3:05:56<51:05,  2.15s/it]                                                     {'loss': 1.4219, 'learning_rate': 4.3249641702641076e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5365/6790 [3:05:56<51:05,  2.15s/it] 79%|███████▉  | 5366/6790 [3:05:58<49:48,  2.10s/it]                                                     {'loss': 1.6525, 'learning_rate': 4.319132828367478e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5366/6790 [3:05:58<49:48,  2.10s/it] 79%|███████▉  | 5367/6790 [3:06:00<51:28,  2.17s/it]                                                     {'loss': 1.525, 'learning_rate': 4.31330494441184e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5367/6790 [3:06:00<51:28,  2.17s/it] 79%|███████▉  | 5368/6790 [3:06:02<50:37,  2.14s/it]                                                     {'loss': 1.3423, 'learning_rate': 4.307480519682363e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5368/6790 [3:06:02<50:37,  2.14s/it] 79%|███████▉  | 5369/6790 [3:06:04<48:36,  2.05s/it]                                                     {'loss': 1.244, 'learning_rate': 4.301659555463435e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5369/6790 [3:06:04<48:36,  2.05s/it] 79%|███████▉  | 5370/6790 [3:06:06<46:49,  1.98s/it]                                                     {'loss': 1.3093, 'learning_rate': 4.2958420530387014e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5370/6790 [3:06:06<46:49,  1.98s/it] 79%|███████▉  | 5371/6790 [3:06:08<47:14,  2.00s/it]                                                     {'loss': 1.5122, 'learning_rate': 4.2900280136910345e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5371/6790 [3:06:08<47:14,  2.00s/it] 79%|███████▉  | 5372/6790 [3:06:10<47:06,  1.99s/it]                                                     {'loss': 1.2069, 'learning_rate': 4.284217438702551e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5372/6790 [3:06:10<47:06,  1.99s/it] 79%|███████▉  | 5373/6790 [3:06:12<47:27,  2.01s/it]                                                     {'loss': 1.4458, 'learning_rate': 4.2784103293545804e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5373/6790 [3:06:12<47:27,  2.01s/it] 79%|███████▉  | 5374/6790 [3:06:14<48:01,  2.03s/it]                                                     {'loss': 1.418, 'learning_rate': 4.272606686927729e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5374/6790 [3:06:14<48:01,  2.03s/it] 79%|███████▉  | 5375/6790 [3:06:16<46:36,  1.98s/it]                                                     {'loss': 1.2929, 'learning_rate': 4.2668065127017974e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5375/6790 [3:06:16<46:36,  1.98s/it] 79%|███████▉  | 5376/6790 [3:06:18<45:39,  1.94s/it]                                                     {'loss': 1.2742, 'learning_rate': 4.2610098079558425e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5376/6790 [3:06:18<45:39,  1.94s/it] 79%|███████▉  | 5377/6790 [3:06:20<46:35,  1.98s/it]                                                     {'loss': 1.5063, 'learning_rate': 4.255216573968153e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5377/6790 [3:06:20<46:35,  1.98s/it] 79%|███████▉  | 5378/6790 [3:06:23<50:26,  2.14s/it]                                                     {'loss': 1.3464, 'learning_rate': 4.249426812016257e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5378/6790 [3:06:23<50:26,  2.14s/it] 79%|███████▉  | 5379/6790 [3:06:25<49:53,  2.12s/it]                                                     {'loss': 1.6538, 'learning_rate': 4.243640523376902e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5379/6790 [3:06:25<49:53,  2.12s/it] 79%|███████▉  | 5380/6790 [3:06:26<47:19,  2.01s/it]                                                     {'loss': 1.412, 'learning_rate': 4.2378577093260826e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5380/6790 [3:06:26<47:19,  2.01s/it] 79%|███████▉  | 5381/6790 [3:06:28<46:58,  2.00s/it]                                                     {'loss': 1.2987, 'learning_rate': 4.232078371139023e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5381/6790 [3:06:28<46:58,  2.00s/it] 79%|███████▉  | 5382/6790 [3:06:30<46:17,  1.97s/it]                                                     {'loss': 1.2524, 'learning_rate': 4.22630251009019e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5382/6790 [3:06:30<46:17,  1.97s/it] 79%|███████▉  | 5383/6790 [3:06:32<46:42,  1.99s/it]                                                     {'loss': 1.3716, 'learning_rate': 4.220530127453259e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5383/6790 [3:06:32<46:42,  1.99s/it] 79%|███████▉  | 5384/6790 [3:06:34<46:29,  1.98s/it]                                                     {'loss': 1.4637, 'learning_rate': 4.21476122450116e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5384/6790 [3:06:34<46:29,  1.98s/it] 79%|███████▉  | 5385/6790 [3:06:36<46:32,  1.99s/it]                                                     {'loss': 1.3666, 'learning_rate': 4.208995802506062e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5385/6790 [3:06:36<46:32,  1.99s/it] 79%|███████▉  | 5386/6790 [3:06:39<51:32,  2.20s/it]                                                     {'loss': 1.3502, 'learning_rate': 4.203233862739342e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5386/6790 [3:06:39<51:32,  2.20s/it] 79%|███████▉  | 5387/6790 [3:06:41<52:49,  2.26s/it]                                                     {'loss': 1.3926, 'learning_rate': 4.197475406471623e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5387/6790 [3:06:41<52:49,  2.26s/it] 79%|███████▉  | 5388/6790 [3:06:43<50:05,  2.14s/it]                                                     {'loss': 1.2254, 'learning_rate': 4.1917204349727615e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5388/6790 [3:06:43<50:05,  2.14s/it] 79%|███████▉  | 5389/6790 [3:06:46<50:53,  2.18s/it]                                                     {'loss': 1.6447, 'learning_rate': 4.185968949511847e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5389/6790 [3:06:46<50:53,  2.18s/it] 79%|███████▉  | 5390/6790 [3:06:48<49:26,  2.12s/it]                                                     {'loss': 1.3903, 'learning_rate': 4.180220951357183e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5390/6790 [3:06:48<49:26,  2.12s/it] 79%|███████▉  | 5391/6790 [3:06:50<49:37,  2.13s/it]                                                     {'loss': 1.2818, 'learning_rate': 4.174476441776325e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5391/6790 [3:06:50<49:37,  2.13s/it] 79%|███████▉  | 5392/6790 [3:06:52<49:50,  2.14s/it]                                                     {'loss': 1.2817, 'learning_rate': 4.168735422036048e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5392/6790 [3:06:52<49:50,  2.14s/it] 79%|███████▉  | 5393/6790 [3:06:54<48:16,  2.07s/it]                                                     {'loss': 1.1082, 'learning_rate': 4.162997893402367e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5393/6790 [3:06:54<48:16,  2.07s/it] 79%|███████▉  | 5394/6790 [3:06:56<48:24,  2.08s/it]                                                     {'loss': 1.3688, 'learning_rate': 4.157263857140505e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5394/6790 [3:06:56<48:24,  2.08s/it] 79%|███████▉  | 5395/6790 [3:06:58<46:33,  2.00s/it]                                                     {'loss': 1.3193, 'learning_rate': 4.1515333145149506e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5395/6790 [3:06:58<46:33,  2.00s/it] 79%|███████▉  | 5396/6790 [3:07:00<50:24,  2.17s/it]                                                     {'loss': 1.5548, 'learning_rate': 4.145806266789387e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5396/6790 [3:07:00<50:24,  2.17s/it] 79%|███████▉  | 5397/6790 [3:07:02<49:20,  2.13s/it]                                                     {'loss': 1.4573, 'learning_rate': 4.140082715226752e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5397/6790 [3:07:02<49:20,  2.13s/it] 79%|███████▉  | 5398/6790 [3:07:04<48:41,  2.10s/it]                                                     {'loss': 1.7014, 'learning_rate': 4.1343626610891816e-05, 'epoch': 0.79}
+ 79%|███████▉  | 5398/6790 [3:07:04<48:41,  2.10s/it] 80%|███████▉  | 5399/6790 [3:07:06<46:24,  2.00s/it]                                                     {'loss': 1.3426, 'learning_rate': 4.1286461056380876e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5399/6790 [3:07:06<46:24,  2.00s/it] 80%|███████▉  | 5400/6790 [3:07:08<48:11,  2.08s/it]                                                     {'loss': 1.4993, 'learning_rate': 4.122933050134066e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5400/6790 [3:07:08<48:11,  2.08s/it] 80%|███████▉  | 5401/6790 [3:07:10<46:26,  2.01s/it]                                                     {'loss': 1.3187, 'learning_rate': 4.117223495836961e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5401/6790 [3:07:10<46:26,  2.01s/it] 80%|███████▉  | 5402/6790 [3:07:12<45:01,  1.95s/it]                                                     {'loss': 1.3281, 'learning_rate': 4.1115174440058456e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5402/6790 [3:07:12<45:01,  1.95s/it] 80%|███████▉  | 5403/6790 [3:07:14<47:43,  2.06s/it]                                                     {'loss': 1.6185, 'learning_rate': 4.105814895899014e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5403/6790 [3:07:14<47:43,  2.06s/it] 80%|███████▉  | 5404/6790 [3:07:16<46:56,  2.03s/it]                                                     {'loss': 1.2658, 'learning_rate': 4.100115852773998e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5404/6790 [3:07:16<46:56,  2.03s/it] 80%|███████▉  | 5405/6790 [3:07:18<46:17,  2.01s/it]                                                     {'loss': 1.2801, 'learning_rate': 4.094420315887533e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5405/6790 [3:07:18<46:17,  2.01s/it] 80%|███████▉  | 5406/6790 [3:07:20<45:31,  1.97s/it]                                                     {'loss': 1.2733, 'learning_rate': 4.088728286495618e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5406/6790 [3:07:20<45:31,  1.97s/it] 80%|███████▉  | 5407/6790 [3:07:22<45:04,  1.96s/it]                                                     {'loss': 1.4699, 'learning_rate': 4.0830397658534425e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5407/6790 [3:07:22<45:04,  1.96s/it] 80%|███████▉  | 5408/6790 [3:07:24<45:17,  1.97s/it]                                                     {'loss': 1.4133, 'learning_rate': 4.077354755215441e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5408/6790 [3:07:24<45:17,  1.97s/it] 80%|███████▉  | 5409/6790 [3:07:26<46:56,  2.04s/it]                                                     {'loss': 1.2106, 'learning_rate': 4.071673255835275e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5409/6790 [3:07:26<46:56,  2.04s/it] 80%|███████▉  | 5410/6790 [3:07:28<45:29,  1.98s/it]                                                     {'loss': 1.4726, 'learning_rate': 4.06599526896583e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5410/6790 [3:07:28<45:29,  1.98s/it] 80%|███████▉  | 5411/6790 [3:07:30<45:12,  1.97s/it]                                                     {'loss': 1.3932, 'learning_rate': 4.0603207958592e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5411/6790 [3:07:30<45:12,  1.97s/it] 80%|███████▉  | 5412/6790 [3:07:32<44:41,  1.95s/it]                                                     {'loss': 1.1435, 'learning_rate': 4.054649837766731e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5412/6790 [3:07:32<44:41,  1.95s/it] 80%|███████▉  | 5413/6790 [3:07:34<45:48,  2.00s/it]                                                     {'loss': 1.2825, 'learning_rate': 4.0489823959389783e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5413/6790 [3:07:34<45:48,  2.00s/it] 80%|███████▉  | 5414/6790 [3:07:36<44:53,  1.96s/it]                                                     {'loss': 1.4939, 'learning_rate': 4.0433184716257275e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5414/6790 [3:07:36<44:53,  1.96s/it] 80%|███████▉  | 5415/6790 [3:07:38<45:35,  1.99s/it]                                                     {'loss': 1.4354, 'learning_rate': 4.037658066075978e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5415/6790 [3:07:38<45:35,  1.99s/it] 80%|███████▉  | 5416/6790 [3:07:40<45:47,  2.00s/it]                                                     {'loss': 1.3777, 'learning_rate': 4.032001180537965e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5416/6790 [3:07:40<45:47,  2.00s/it] 80%|███████▉  | 5417/6790 [3:07:42<46:27,  2.03s/it]                                                     {'loss': 1.4166, 'learning_rate': 4.026347816259146e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5417/6790 [3:07:42<46:27,  2.03s/it] 80%|███████▉  | 5418/6790 [3:07:44<47:30,  2.08s/it]                                                     {'loss': 1.403, 'learning_rate': 4.020697974486196e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5418/6790 [3:07:44<47:30,  2.08s/it] 80%|███████▉  | 5419/6790 [3:07:47<49:22,  2.16s/it]                                                     {'loss': 1.5645, 'learning_rate': 4.0150516564650186e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5419/6790 [3:07:47<49:22,  2.16s/it] 80%|███████▉  | 5420/6790 [3:07:48<47:08,  2.06s/it]                                                     {'loss': 1.4992, 'learning_rate': 4.00940886344074e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5420/6790 [3:07:48<47:08,  2.06s/it] 80%|███████▉  | 5421/6790 [3:07:50<46:48,  2.05s/it]                                                     {'loss': 1.3622, 'learning_rate': 4.00376959665771e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5421/6790 [3:07:50<46:48,  2.05s/it] 80%|███████▉  | 5422/6790 [3:07:53<47:30,  2.08s/it]                                                     {'loss': 1.2789, 'learning_rate': 3.9981338573594876e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5422/6790 [3:07:53<47:30,  2.08s/it] 80%|███████▉  | 5423/6790 [3:07:55<46:29,  2.04s/it]                                                     {'loss': 1.4904, 'learning_rate': 3.9925016467888706e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5423/6790 [3:07:55<46:29,  2.04s/it] 80%|███████▉  | 5424/6790 [3:07:56<45:16,  1.99s/it]                                                     {'loss': 1.5074, 'learning_rate': 3.9868729661878754e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5424/6790 [3:07:56<45:16,  1.99s/it] 80%|███████▉  | 5425/6790 [3:07:59<46:31,  2.05s/it]                                                     {'loss': 1.4103, 'learning_rate': 3.98124781679774e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5425/6790 [3:07:59<46:31,  2.05s/it] 80%|███████▉  | 5426/6790 [3:08:01<46:38,  2.05s/it]                                                     {'loss': 1.4181, 'learning_rate': 3.975626199858911e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5426/6790 [3:08:01<46:38,  2.05s/it] 80%|███████▉  | 5427/6790 [3:08:03<46:11,  2.03s/it]                                                     {'loss': 1.3087, 'learning_rate': 3.97000811661107e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5427/6790 [3:08:03<46:11,  2.03s/it] 80%|███████▉  | 5428/6790 [3:08:05<46:00,  2.03s/it]                                                     {'loss': 1.3996, 'learning_rate': 3.964393568293117e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5428/6790 [3:08:05<46:00,  2.03s/it] 80%|███████▉  | 5429/6790 [3:08:06<44:04,  1.94s/it]                                                     {'loss': 1.14, 'learning_rate': 3.958782556143175e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5429/6790 [3:08:06<44:04,  1.94s/it] 80%|███████▉  | 5430/6790 [3:08:09<45:21,  2.00s/it]                                                     {'loss': 1.3396, 'learning_rate': 3.953175081398568e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5430/6790 [3:08:09<45:21,  2.00s/it] 80%|███████▉  | 5431/6790 [3:08:11<44:59,  1.99s/it]                                                     {'loss': 1.5284, 'learning_rate': 3.9475711452958765e-05, 'epoch': 0.8}
+ 80%|███████▉  | 5431/6790 [3:08:11<44:59,  1.99s/it] 80%|████████  | 5432/6790 [3:08:13<47:49,  2.11s/it]                                                     {'loss': 1.4733, 'learning_rate': 3.9419707490708626e-05, 'epoch': 0.8}
+ 80%|████████  | 5432/6790 [3:08:13<47:49,  2.11s/it] 80%|████████  | 5433/6790 [3:08:15<45:16,  2.00s/it]                                                     {'loss': 1.2852, 'learning_rate': 3.936373893958527e-05, 'epoch': 0.8}
+ 80%|████████  | 5433/6790 [3:08:15<45:16,  2.00s/it] 80%|████████  | 5434/6790 [3:08:16<43:52,  1.94s/it]                                                     {'loss': 1.4066, 'learning_rate': 3.930780581193092e-05, 'epoch': 0.8}
+ 80%|████████  | 5434/6790 [3:08:16<43:52,  1.94s/it] 80%|████████  | 5435/6790 [3:08:19<45:19,  2.01s/it]                                                     {'loss': 1.5386, 'learning_rate': 3.925190812007991e-05, 'epoch': 0.8}
+ 80%|████████  | 5435/6790 [3:08:19<45:19,  2.01s/it] 80%|████████  | 5436/6790 [3:08:21<48:18,  2.14s/it]                                                     {'loss': 1.5034, 'learning_rate': 3.919604587635883e-05, 'epoch': 0.8}
+ 80%|████████  | 5436/6790 [3:08:21<48:18,  2.14s/it] 80%|████████  | 5437/6790 [3:08:23<49:22,  2.19s/it]                                                     {'loss': 1.4842, 'learning_rate': 3.914021909308625e-05, 'epoch': 0.8}
+ 80%|████████  | 5437/6790 [3:08:23<49:22,  2.19s/it] 80%|████████  | 5438/6790 [3:08:25<46:26,  2.06s/it]                                                     {'loss': 1.3435, 'learning_rate': 3.908442778257331e-05, 'epoch': 0.8}
+ 80%|████████  | 5438/6790 [3:08:25<46:26,  2.06s/it] 80%|████████  | 5439/6790 [3:08:27<44:56,  2.00s/it]                                                     {'loss': 1.5665, 'learning_rate': 3.902867195712292e-05, 'epoch': 0.8}
+ 80%|████████  | 5439/6790 [3:08:27<44:56,  2.00s/it] 80%|████████  | 5440/6790 [3:08:31<58:13,  2.59s/it]                                                     {'loss': 1.4112, 'learning_rate': 3.8972951629030384e-05, 'epoch': 0.8}
+ 80%|████████  | 5440/6790 [3:08:31<58:13,  2.59s/it] 80%|████████  | 5441/6790 [3:08:33<54:15,  2.41s/it]                                                     {'loss': 1.4449, 'learning_rate': 3.891726681058316e-05, 'epoch': 0.8}
+ 80%|████████  | 5441/6790 [3:08:33<54:15,  2.41s/it] 80%|████████  | 5442/6790 [3:08:35<50:20,  2.24s/it]                                                     {'loss': 1.2618, 'learning_rate': 3.88616175140609e-05, 'epoch': 0.8}
+ 80%|████████  | 5442/6790 [3:08:35<50:20,  2.24s/it] 80%|████████  | 5443/6790 [3:08:37<47:47,  2.13s/it]                                                     {'loss': 1.2105, 'learning_rate': 3.8806003751735265e-05, 'epoch': 0.8}
+ 80%|████████  | 5443/6790 [3:08:37<47:47,  2.13s/it] 80%|████████  | 5444/6790 [3:08:39<48:11,  2.15s/it]                                                     {'loss': 1.5608, 'learning_rate': 3.8750425535870226e-05, 'epoch': 0.8}
+ 80%|████████  | 5444/6790 [3:08:39<48:11,  2.15s/it] 80%|████████  | 5445/6790 [3:08:41<47:26,  2.12s/it]                                                     {'loss': 1.3411, 'learning_rate': 3.869488287872189e-05, 'epoch': 0.8}
+ 80%|████████  | 5445/6790 [3:08:41<47:26,  2.12s/it] 80%|████████  | 5446/6790 [3:08:43<46:38,  2.08s/it]                                                     {'loss': 1.1692, 'learning_rate': 3.863937579253858e-05, 'epoch': 0.8}
+ 80%|████████  | 5446/6790 [3:08:43<46:38,  2.08s/it] 80%|████████  | 5447/6790 [3:08:45<45:35,  2.04s/it]                                                     {'loss': 1.3905, 'learning_rate': 3.858390428956056e-05, 'epoch': 0.8}
+ 80%|████████  | 5447/6790 [3:08:45<45:35,  2.04s/it] 80%|████████  | 5448/6790 [3:08:47<45:44,  2.05s/it]                                                     {'loss': 1.4086, 'learning_rate': 3.8528468382020466e-05, 'epoch': 0.8}
+ 80%|████████  | 5448/6790 [3:08:47<45:44,  2.05s/it] 80%|████████  | 5449/6790 [3:08:49<45:48,  2.05s/it]                                                     {'loss': 1.2676, 'learning_rate': 3.8473068082143014e-05, 'epoch': 0.8}
+ 80%|████████  | 5449/6790 [3:08:49<45:48,  2.05s/it] 80%|████████  | 5450/6790 [3:08:51<46:32,  2.08s/it]                                                     {'loss': 1.6083, 'learning_rate': 3.841770340214512e-05, 'epoch': 0.8}
+ 80%|████████  | 5450/6790 [3:08:51<46:32,  2.08s/it] 80%|████████  | 5451/6790 [3:08:53<44:29,  1.99s/it]                                                     {'loss': 1.4299, 'learning_rate': 3.836237435423562e-05, 'epoch': 0.8}
+ 80%|████████  | 5451/6790 [3:08:53<44:29,  1.99s/it] 80%|████████  | 5452/6790 [3:08:55<44:14,  1.98s/it]                                                     {'loss': 1.6556, 'learning_rate': 3.830708095061582e-05, 'epoch': 0.8}
+ 80%|████████  | 5452/6790 [3:08:55<44:14,  1.98s/it] 80%|████████  | 5453/6790 [3:08:57<43:09,  1.94s/it]                                                     {'loss': 1.3534, 'learning_rate': 3.825182320347902e-05, 'epoch': 0.8}
+ 80%|████████  | 5453/6790 [3:08:57<43:09,  1.94s/it] 80%|████████  | 5454/6790 [3:08:59<43:05,  1.94s/it]                                                     {'loss': 1.3361, 'learning_rate': 3.819660112501053e-05, 'epoch': 0.8}
+ 80%|████████  | 5454/6790 [3:08:59<43:05,  1.94s/it] 80%|████████  | 5455/6790 [3:09:01<44:18,  1.99s/it]                                                     {'loss': 1.6271, 'learning_rate': 3.814141472738797e-05, 'epoch': 0.8}
+ 80%|████████  | 5455/6790 [3:09:01<44:18,  1.99s/it] 80%|████████  | 5456/6790 [3:09:03<44:28,  2.00s/it]                                                     {'loss': 1.3883, 'learning_rate': 3.8086264022781015e-05, 'epoch': 0.8}
+ 80%|████████  | 5456/6790 [3:09:03<44:28,  2.00s/it] 80%|████████  | 5457/6790 [3:09:05<43:57,  1.98s/it]                                                     {'loss': 1.4374, 'learning_rate': 3.803114902335156e-05, 'epoch': 0.8}
+ 80%|████████  | 5457/6790 [3:09:05<43:57,  1.98s/it] 80%|████████  | 5458/6790 [3:09:06<42:41,  1.92s/it]                                                     {'loss': 1.3873, 'learning_rate': 3.7976069741253425e-05, 'epoch': 0.8}
+ 80%|████████  | 5458/6790 [3:09:06<42:41,  1.92s/it] 80%|████████  | 5459/6790 [3:09:08<42:04,  1.90s/it]                                                     {'loss': 1.4819, 'learning_rate': 3.7921026188632756e-05, 'epoch': 0.8}
+ 80%|████████  | 5459/6790 [3:09:08<42:04,  1.90s/it] 80%|████████  | 5460/6790 [3:09:10<43:54,  1.98s/it]                                                     {'loss': 1.6438, 'learning_rate': 3.786601837762771e-05, 'epoch': 0.8}
+ 80%|████████  | 5460/6790 [3:09:11<43:54,  1.98s/it] 80%|████████  | 5461/6790 [3:09:13<46:58,  2.12s/it]                                                     {'loss': 1.4796, 'learning_rate': 3.781104632036869e-05, 'epoch': 0.8}
+ 80%|████████  | 5461/6790 [3:09:13<46:58,  2.12s/it] 80%|████████  | 5462/6790 [3:09:15<46:29,  2.10s/it]                                                     {'loss': 1.5717, 'learning_rate': 3.775611002897792e-05, 'epoch': 0.8}
+ 80%|████████  | 5462/6790 [3:09:15<46:29,  2.10s/it] 80%|████████  | 5463/6790 [3:09:17<45:54,  2.08s/it]                                                     {'loss': 1.5448, 'learning_rate': 3.7701209515570194e-05, 'epoch': 0.8}
+ 80%|████████  | 5463/6790 [3:09:17<45:54,  2.08s/it] 80%|████████  | 5464/6790 [3:09:19<45:11,  2.05s/it]                                                     {'loss': 1.4254, 'learning_rate': 3.764634479225195e-05, 'epoch': 0.8}
+ 80%|████████  | 5464/6790 [3:09:19<45:11,  2.05s/it] 80%|████████  | 5465/6790 [3:09:21<46:11,  2.09s/it]                                                     {'loss': 1.373, 'learning_rate': 3.759151587112204e-05, 'epoch': 0.8}
+ 80%|████████  | 5465/6790 [3:09:21<46:11,  2.09s/it] 81%|████████  | 5466/6790 [3:09:23<47:20,  2.15s/it]                                                     {'loss': 1.6291, 'learning_rate': 3.753672276427129e-05, 'epoch': 0.81}
+ 81%|████████  | 5466/6790 [3:09:23<47:20,  2.15s/it] 81%|████████  | 5467/6790 [3:09:26<46:55,  2.13s/it]                                                     {'loss': 1.4768, 'learning_rate': 3.7481965483782755e-05, 'epoch': 0.81}
+ 81%|████████  | 5467/6790 [3:09:26<46:55,  2.13s/it] 81%|████████  | 5468/6790 [3:09:28<46:02,  2.09s/it]                                                     {'loss': 1.3676, 'learning_rate': 3.742724404173135e-05, 'epoch': 0.81}
+ 81%|████████  | 5468/6790 [3:09:28<46:02,  2.09s/it] 81%|████████  | 5469/6790 [3:09:30<48:08,  2.19s/it]                                                     {'loss': 1.3877, 'learning_rate': 3.7372558450184256e-05, 'epoch': 0.81}
+ 81%|████████  | 5469/6790 [3:09:30<48:08,  2.19s/it] 81%|████████  | 5470/6790 [3:09:32<45:41,  2.08s/it]                                                     {'loss': 1.1739, 'learning_rate': 3.731790872120089e-05, 'epoch': 0.81}
+ 81%|████████  | 5470/6790 [3:09:32<45:41,  2.08s/it] 81%|████████  | 5471/6790 [3:09:34<43:47,  1.99s/it]                                                     {'loss': 1.3639, 'learning_rate': 3.726329486683242e-05, 'epoch': 0.81}
+ 81%|████████  | 5471/6790 [3:09:34<43:47,  1.99s/it] 81%|████████  | 5472/6790 [3:09:36<45:29,  2.07s/it]                                                     {'loss': 1.3027, 'learning_rate': 3.720871689912242e-05, 'epoch': 0.81}
+ 81%|████████  | 5472/6790 [3:09:36<45:29,  2.07s/it] 81%|████████  | 5473/6790 [3:09:38<45:01,  2.05s/it]                                                     {'loss': 1.5576, 'learning_rate': 3.715417483010619e-05, 'epoch': 0.81}
+ 81%|████████  | 5473/6790 [3:09:38<45:01,  2.05s/it] 81%|████████  | 5474/6790 [3:09:40<43:24,  1.98s/it]                                                     {'loss': 1.4069, 'learning_rate': 3.7099668671811604e-05, 'epoch': 0.81}
+ 81%|████████  | 5474/6790 [3:09:40<43:24,  1.98s/it] 81%|████████  | 5475/6790 [3:09:42<44:22,  2.02s/it]                                                     {'loss': 1.5033, 'learning_rate': 3.704519843625818e-05, 'epoch': 0.81}
+ 81%|████████  | 5475/6790 [3:09:42<44:22,  2.02s/it] 81%|████████  | 5476/6790 [3:09:44<43:24,  1.98s/it]                                                     {'loss': 1.4811, 'learning_rate': 3.69907641354577e-05, 'epoch': 0.81}
+ 81%|████████  | 5476/6790 [3:09:44<43:24,  1.98s/it] 81%|████████  | 5477/6790 [3:09:46<43:13,  1.98s/it]                                                     {'loss': 1.2377, 'learning_rate': 3.6936365781414015e-05, 'epoch': 0.81}
+ 81%|████████  | 5477/6790 [3:09:46<43:13,  1.98s/it] 81%|████████  | 5478/6790 [3:09:48<44:03,  2.01s/it]                                                     {'loss': 1.4544, 'learning_rate': 3.688200338612311e-05, 'epoch': 0.81}
+ 81%|████████  | 5478/6790 [3:09:48<44:03,  2.01s/it] 81%|████████  | 5479/6790 [3:09:50<44:58,  2.06s/it]                                                     {'loss': 1.3379, 'learning_rate': 3.6827676961572856e-05, 'epoch': 0.81}
+ 81%|████████  | 5479/6790 [3:09:50<44:58,  2.06s/it] 81%|████████  | 5480/6790 [3:09:52<43:42,  2.00s/it]                                                     {'loss': 1.2493, 'learning_rate': 3.677338651974334e-05, 'epoch': 0.81}
+ 81%|████████  | 5480/6790 [3:09:52<43:42,  2.00s/it] 81%|████████  | 5481/6790 [3:09:54<43:09,  1.98s/it]                                                     {'loss': 1.393, 'learning_rate': 3.671913207260667e-05, 'epoch': 0.81}
+ 81%|████████  | 5481/6790 [3:09:54<43:09,  1.98s/it] 81%|████████  | 5482/6790 [3:09:56<43:39,  2.00s/it]                                                     {'loss': 1.4065, 'learning_rate': 3.666491363212712e-05, 'epoch': 0.81}
+ 81%|████████  | 5482/6790 [3:09:56<43:39,  2.00s/it] 81%|████████  | 5483/6790 [3:09:58<44:38,  2.05s/it]                                                     {'loss': 1.469, 'learning_rate': 3.6610731210260706e-05, 'epoch': 0.81}
+ 81%|████████  | 5483/6790 [3:09:58<44:38,  2.05s/it] 81%|████████  | 5484/6790 [3:10:00<44:27,  2.04s/it]                                                     {'loss': 1.3008, 'learning_rate': 3.6556584818956005e-05, 'epoch': 0.81}
+ 81%|████████  | 5484/6790 [3:10:00<44:27,  2.04s/it] 81%|████████  | 5485/6790 [3:10:02<43:41,  2.01s/it]                                                     {'loss': 1.2502, 'learning_rate': 3.650247447015316e-05, 'epoch': 0.81}
+ 81%|████████  | 5485/6790 [3:10:02<43:41,  2.01s/it] 81%|████████  | 5486/6790 [3:10:04<46:32,  2.14s/it]                                                     {'loss': 1.2989, 'learning_rate': 3.6448400175784614e-05, 'epoch': 0.81}
+ 81%|████████  | 5486/6790 [3:10:04<46:32,  2.14s/it] 81%|████████  | 5487/6790 [3:10:06<45:51,  2.11s/it]                                                     {'loss': 1.3109, 'learning_rate': 3.6394361947774857e-05, 'epoch': 0.81}
+ 81%|████████  | 5487/6790 [3:10:06<45:51,  2.11s/it] 81%|████████  | 5488/6790 [3:10:08<44:50,  2.07s/it]                                                     {'loss': 1.5836, 'learning_rate': 3.6340359798040355e-05, 'epoch': 0.81}
+ 81%|████████  | 5488/6790 [3:10:08<44:50,  2.07s/it] 81%|████████  | 5489/6790 [3:10:10<45:32,  2.10s/it]                                                     {'loss': 1.394, 'learning_rate': 3.628639373848974e-05, 'epoch': 0.81}
+ 81%|████████  | 5489/6790 [3:10:10<45:32,  2.10s/it] 81%|████████  | 5490/6790 [3:10:12<43:57,  2.03s/it]                                                     {'loss': 1.2395, 'learning_rate': 3.623246378102343e-05, 'epoch': 0.81}
+ 81%|████████  | 5490/6790 [3:10:12<43:57,  2.03s/it] 81%|████████  | 5491/6790 [3:10:15<46:53,  2.17s/it]                                                     {'loss': 1.7199, 'learning_rate': 3.617856993753417e-05, 'epoch': 0.81}
+ 81%|████████  | 5491/6790 [3:10:15<46:53,  2.17s/it] 81%|████████  | 5492/6790 [3:10:17<47:15,  2.18s/it]                                                     {'loss': 1.5018, 'learning_rate': 3.612471221990654e-05, 'epoch': 0.81}
+ 81%|████████  | 5492/6790 [3:10:17<47:15,  2.18s/it] 81%|████████  | 5493/6790 [3:10:19<46:05,  2.13s/it]                                                     {'loss': 1.1023, 'learning_rate': 3.607089064001734e-05, 'epoch': 0.81}
+ 81%|████████  | 5493/6790 [3:10:19<46:05,  2.13s/it] 81%|████████  | 5494/6790 [3:10:21<45:46,  2.12s/it]                                                     {'loss': 1.4821, 'learning_rate': 3.6017105209735114e-05, 'epoch': 0.81}
+ 81%|████████  | 5494/6790 [3:10:21<45:46,  2.12s/it] 81%|████████  | 5495/6790 [3:10:24<48:20,  2.24s/it]                                                     {'loss': 1.279, 'learning_rate': 3.5963355940920816e-05, 'epoch': 0.81}
+ 81%|████████  | 5495/6790 [3:10:24<48:20,  2.24s/it] 81%|████████  | 5496/6790 [3:10:26<47:07,  2.19s/it]                                                     {'loss': 1.4727, 'learning_rate': 3.590964284542708e-05, 'epoch': 0.81}
+ 81%|████████  | 5496/6790 [3:10:26<47:07,  2.19s/it] 81%|████████  | 5497/6790 [3:10:28<45:24,  2.11s/it]                                                     {'loss': 1.4236, 'learning_rate': 3.585596593509877e-05, 'epoch': 0.81}
+ 81%|████████  | 5497/6790 [3:10:28<45:24,  2.11s/it] 81%|████████  | 5498/6790 [3:10:30<45:30,  2.11s/it]                                                     {'loss': 1.476, 'learning_rate': 3.580232522177265e-05, 'epoch': 0.81}
+ 81%|████████  | 5498/6790 [3:10:30<45:30,  2.11s/it] 81%|████████  | 5499/6790 [3:10:32<46:09,  2.14s/it]                                                     {'loss': 1.4205, 'learning_rate': 3.580232522177265e-05, 'epoch': 0.81}
+ 81%|████████  | 5499/6790 [3:10:32<46:09,  2.14s/it] 81%|████████  | 5500/6790 [3:10:34<46:17,  2.15s/it]                                                     {'loss': 1.4192, 'learning_rate': 3.5748720717277664e-05, 'epoch': 0.81}
+ 81%|████████  | 5500/6790 [3:10:34<46:17,  2.15s/it] 81%|████████  | 5501/6790 [3:10:36<44:49,  2.09s/it]                                                     {'loss': 1.3757, 'learning_rate': 3.569515243343453e-05, 'epoch': 0.81}
+ 81%|████████  | 5501/6790 [3:10:36<44:49,  2.09s/it] 81%|████████  | 5502/6790 [3:10:38<43:25,  2.02s/it]                                                     {'loss': 1.3022, 'learning_rate': 3.5641620382056165e-05, 'epoch': 0.81}
+ 81%|████████  | 5502/6790 [3:10:38<43:25,  2.02s/it] 81%|████████  | 5503/6790 [3:10:40<43:23,  2.02s/it]                                                     {'loss': 1.4771, 'learning_rate': 3.558812457494747e-05, 'epoch': 0.81}
+ 81%|████████  | 5503/6790 [3:10:40<43:23,  2.02s/it] 81%|████████  | 5504/6790 [3:10:42<42:58,  2.00s/it]                                                     {'loss': 1.1859, 'learning_rate': 3.55346650239053e-05, 'epoch': 0.81}
+ 81%|████████  | 5504/6790 [3:10:42<42:58,  2.00s/it] 81%|████████  | 5505/6790 [3:10:44<44:05,  2.06s/it]                                                     {'loss': 1.4009, 'learning_rate': 3.548124174071861e-05, 'epoch': 0.81}
+ 81%|████████  | 5505/6790 [3:10:44<44:05,  2.06s/it] 81%|████████  | 5506/6790 [3:10:46<44:02,  2.06s/it]                                                     {'loss': 1.3007, 'learning_rate': 3.542785473716812e-05, 'epoch': 0.81}
+ 81%|████████  | 5506/6790 [3:10:46<44:02,  2.06s/it] 81%|████████  | 5507/6790 [3:10:48<42:51,  2.00s/it]                                                     {'loss': 1.4874, 'learning_rate': 3.537450402502695e-05, 'epoch': 0.81}
+ 81%|████████  | 5507/6790 [3:10:48<42:51,  2.00s/it] 81%|████████  | 5508/6790 [3:10:50<42:55,  2.01s/it]                                                     {'loss': 1.6036, 'learning_rate': 3.5321189616059815e-05, 'epoch': 0.81}
+ 81%|████████  | 5508/6790 [3:10:50<42:55,  2.01s/it] 81%|████████  | 5509/6790 [3:10:52<43:08,  2.02s/it]                                                     {'loss': 1.3516, 'learning_rate': 3.5267911522023625e-05, 'epoch': 0.81}
+ 81%|████████  | 5509/6790 [3:10:52<43:08,  2.02s/it] 81%|████████  | 5510/6790 [3:10:54<42:57,  2.01s/it]                                                     {'loss': 1.5061, 'learning_rate': 3.521466975466729e-05, 'epoch': 0.81}
+ 81%|████████  | 5510/6790 [3:10:54<42:57,  2.01s/it] 81%|████████  | 5511/6790 [3:10:56<43:46,  2.05s/it]                                                     {'loss': 1.2611, 'learning_rate': 3.516146432573171e-05, 'epoch': 0.81}
+ 81%|████████  | 5511/6790 [3:10:56<43:46,  2.05s/it] 81%|████████  | 5512/6790 [3:10:58<42:42,  2.01s/it]                                                     {'loss': 1.3996, 'learning_rate': 3.510829524694963e-05, 'epoch': 0.81}
+ 81%|████████  | 5512/6790 [3:10:58<42:42,  2.01s/it] 81%|████████  | 5513/6790 [3:11:01<45:41,  2.15s/it]                                                     {'loss': 1.5436, 'learning_rate': 3.505516253004593e-05, 'epoch': 0.81}
+ 81%|████████  | 5513/6790 [3:11:01<45:41,  2.15s/it] 81%|████████  | 5514/6790 [3:11:02<43:30,  2.05s/it]                                                     {'loss': 1.4408, 'learning_rate': 3.50020661867374e-05, 'epoch': 0.81}
+ 81%|████████  | 5514/6790 [3:11:02<43:30,  2.05s/it] 81%|████████  | 5515/6790 [3:11:05<43:51,  2.06s/it]                                                     {'loss': 1.5978, 'learning_rate': 3.4949006228732936e-05, 'epoch': 0.81}
+ 81%|████████  | 5515/6790 [3:11:05<43:51,  2.06s/it] 81%|████████  | 5516/6790 [3:11:07<44:56,  2.12s/it]                                                     {'loss': 1.3537, 'learning_rate': 3.489598266773313e-05, 'epoch': 0.81}
+ 81%|████████  | 5516/6790 [3:11:07<44:56,  2.12s/it] 81%|████████▏ | 5517/6790 [3:11:09<45:00,  2.12s/it]                                                     {'loss': 1.4177, 'learning_rate': 3.484299551543091e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5517/6790 [3:11:09<45:00,  2.12s/it] 81%|████████▏ | 5518/6790 [3:11:12<49:39,  2.34s/it]                                                     {'loss': 1.2167, 'learning_rate': 3.479004478351087e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5518/6790 [3:11:12<49:39,  2.34s/it] 81%|████████▏ | 5519/6790 [3:11:14<49:24,  2.33s/it]                                                     {'loss': 1.3855, 'learning_rate': 3.473713048364975e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5519/6790 [3:11:14<49:24,  2.33s/it] 81%|████████▏ | 5520/6790 [3:11:16<48:30,  2.29s/it]                                                     {'loss': 1.3592, 'learning_rate': 3.468425262751609e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5520/6790 [3:11:16<48:30,  2.29s/it] 81%|████████▏ | 5521/6790 [3:11:18<46:58,  2.22s/it]                                                     {'loss': 1.4483, 'learning_rate': 3.463141122677063e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5521/6790 [3:11:18<46:58,  2.22s/it] 81%|████████▏ | 5522/6790 [3:11:22<54:42,  2.59s/it]                                                     {'loss': 1.1791, 'learning_rate': 3.457860629306595e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5522/6790 [3:11:22<54:42,  2.59s/it] 81%|████████▏ | 5523/6790 [3:11:24<51:06,  2.42s/it]                                                     {'loss': 1.2406, 'learning_rate': 3.4525837838046485e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5523/6790 [3:11:24<51:06,  2.42s/it] 81%|████████▏ | 5524/6790 [3:11:26<50:44,  2.41s/it]                                                     {'loss': 1.4013, 'learning_rate': 3.447310587334878e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5524/6790 [3:11:26<50:44,  2.41s/it] 81%|████████▏ | 5525/6790 [3:11:28<48:09,  2.28s/it]                                                     {'loss': 1.4011, 'learning_rate': 3.442041041060122e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5525/6790 [3:11:28<48:09,  2.28s/it] 81%|████████▏ | 5526/6790 [3:11:30<47:27,  2.25s/it]                                                     {'loss': 1.3905, 'learning_rate': 3.436775146142433e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5526/6790 [3:11:30<47:27,  2.25s/it] 81%|████████▏ | 5527/6790 [3:11:32<44:28,  2.11s/it]                                                     {'loss': 1.5478, 'learning_rate': 3.4315129037430236e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5527/6790 [3:11:32<44:28,  2.11s/it] 81%|████████▏ | 5528/6790 [3:11:34<45:30,  2.16s/it]                                                     {'loss': 1.4231, 'learning_rate': 3.426254315022344e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5528/6790 [3:11:34<45:30,  2.16s/it] 81%|████████▏ | 5529/6790 [3:11:36<42:57,  2.04s/it]                                                     {'loss': 1.4064, 'learning_rate': 3.420999381140002e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5529/6790 [3:11:36<42:57,  2.04s/it] 81%|████████▏ | 5530/6790 [3:11:38<40:52,  1.95s/it]                                                     {'loss': 1.155, 'learning_rate': 3.415748103254821e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5530/6790 [3:11:38<40:52,  1.95s/it] 81%|████████▏ | 5531/6790 [3:11:40<42:38,  2.03s/it]                                                     {'loss': 1.3722, 'learning_rate': 3.41050048252481e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5531/6790 [3:11:40<42:38,  2.03s/it] 81%|████████▏ | 5532/6790 [3:11:42<43:59,  2.10s/it]                                                     {'loss': 1.6292, 'learning_rate': 3.405256520107176e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5532/6790 [3:11:42<43:59,  2.10s/it] 81%|████████▏ | 5533/6790 [3:11:44<43:06,  2.06s/it]                                                     {'loss': 1.429, 'learning_rate': 3.400016217158308e-05, 'epoch': 0.81}
+ 81%|████████▏ | 5533/6790 [3:11:44<43:06,  2.06s/it] 82%|████████▏ | 5534/6790 [3:11:47<43:56,  2.10s/it]                                                     {'loss': 1.6849, 'learning_rate': 3.394779574833804e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5534/6790 [3:11:47<43:56,  2.10s/it] 82%|████████▏ | 5535/6790 [3:11:48<42:22,  2.03s/it]                                                     {'loss': 1.3938, 'learning_rate': 3.389546594288444e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5535/6790 [3:11:48<42:22,  2.03s/it] 82%|████████▏ | 5536/6790 [3:11:51<43:00,  2.06s/it]                                                     {'loss': 1.5461, 'learning_rate': 3.384317276676208e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5536/6790 [3:11:51<43:00,  2.06s/it] 82%|████████▏ | 5537/6790 [3:11:53<43:40,  2.09s/it]                                                     {'loss': 1.4347, 'learning_rate': 3.379091623150257e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5537/6790 [3:11:53<43:40,  2.09s/it] 82%|████████▏ | 5538/6790 [3:11:55<44:15,  2.12s/it]                                                     {'loss': 1.4733, 'learning_rate': 3.3738696348629476e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5538/6790 [3:11:55<44:15,  2.12s/it] 82%|████████▏ | 5539/6790 [3:11:57<42:27,  2.04s/it]                                                     {'loss': 1.5371, 'learning_rate': 3.368651312965847e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5539/6790 [3:11:57<42:27,  2.04s/it] 82%|████████▏ | 5540/6790 [3:11:59<42:16,  2.03s/it]                                                     {'loss': 1.5441, 'learning_rate': 3.363436658609684e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5540/6790 [3:11:59<42:16,  2.03s/it] 82%|████████▏ | 5541/6790 [3:12:01<41:11,  1.98s/it]                                                     {'loss': 1.3827, 'learning_rate': 3.3582256729443996e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5541/6790 [3:12:01<41:11,  1.98s/it] 82%|████████▏ | 5542/6790 [3:12:03<41:13,  1.98s/it]                                                     {'loss': 1.2546, 'learning_rate': 3.353018357119118e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5542/6790 [3:12:03<41:13,  1.98s/it] 82%|████████▏ | 5543/6790 [3:12:05<41:22,  1.99s/it]                                                     {'loss': 1.521, 'learning_rate': 3.347814712282158e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5543/6790 [3:12:05<41:22,  1.99s/it] 82%|████████▏ | 5544/6790 [3:12:07<40:46,  1.96s/it]                                                     {'loss': 1.5451, 'learning_rate': 3.342614739581018e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5544/6790 [3:12:07<40:46,  1.96s/it] 82%|████████▏ | 5545/6790 [3:12:09<40:45,  1.96s/it]                                                     {'loss': 1.4052, 'learning_rate': 3.3374184401623985e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5545/6790 [3:12:09<40:45,  1.96s/it] 82%|████████▏ | 5546/6790 [3:12:11<40:52,  1.97s/it]                                                     {'loss': 1.2439, 'learning_rate': 3.332225815172187e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5546/6790 [3:12:11<40:52,  1.97s/it] 82%|████████▏ | 5547/6790 [3:12:12<39:46,  1.92s/it]                                                     {'loss': 1.2423, 'learning_rate': 3.3270368657554664e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5547/6790 [3:12:12<39:46,  1.92s/it] 82%|████████▏ | 5548/6790 [3:12:15<41:35,  2.01s/it]                                                     {'loss': 1.4271, 'learning_rate': 3.3218515930564905e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5548/6790 [3:12:15<41:35,  2.01s/it] 82%|████████▏ | 5549/6790 [3:12:17<41:54,  2.03s/it]                                                     {'loss': 1.5257, 'learning_rate': 3.31666999821872e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5549/6790 [3:12:17<41:54,  2.03s/it] 82%|████████▏ | 5550/6790 [3:12:18<40:42,  1.97s/it]                                                     {'loss': 1.4751, 'learning_rate': 3.3114920823847994e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5550/6790 [3:12:18<40:42,  1.97s/it] 82%|████████▏ | 5551/6790 [3:12:21<42:57,  2.08s/it]                                                     {'loss': 1.4103, 'learning_rate': 3.306317846696565e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5551/6790 [3:12:21<42:57,  2.08s/it] 82%|████████▏ | 5552/6790 [3:12:23<42:25,  2.06s/it]                                                     {'loss': 1.5196, 'learning_rate': 3.301147292295026e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5552/6790 [3:12:23<42:25,  2.06s/it] 82%|████████▏ | 5553/6790 [3:12:25<41:00,  1.99s/it]                                                     {'loss': 1.3678, 'learning_rate': 3.295980420320408e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5553/6790 [3:12:25<41:00,  1.99s/it] 82%|████████▏ | 5554/6790 [3:12:27<41:16,  2.00s/it]                                                     {'loss': 1.5096, 'learning_rate': 3.290817231912096e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5554/6790 [3:12:27<41:16,  2.00s/it] 82%|████████▏ | 5555/6790 [3:12:29<40:22,  1.96s/it]                                                     {'loss': 1.3245, 'learning_rate': 3.2856577282086776e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5555/6790 [3:12:29<40:22,  1.96s/it] 82%|████████▏ | 5556/6790 [3:12:30<39:57,  1.94s/it]                                                     {'loss': 1.5063, 'learning_rate': 3.2805019103479264e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5556/6790 [3:12:30<39:57,  1.94s/it] 82%|████████▏ | 5557/6790 [3:12:32<39:41,  1.93s/it]                                                     {'loss': 1.3588, 'learning_rate': 3.275349779466805e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5557/6790 [3:12:32<39:41,  1.93s/it] 82%|████████▏ | 5558/6790 [3:12:34<40:16,  1.96s/it]                                                     {'loss': 1.4109, 'learning_rate': 3.2702013367014594e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5558/6790 [3:12:34<40:16,  1.96s/it] 82%|████████▏ | 5559/6790 [3:12:36<41:13,  2.01s/it]                                                     {'loss': 1.3435, 'learning_rate': 3.2650565831872135e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5559/6790 [3:12:36<41:13,  2.01s/it] 82%|████████▏ | 5560/6790 [3:12:38<40:08,  1.96s/it]                                                     {'loss': 1.5226, 'learning_rate': 3.259915520058605e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5560/6790 [3:12:38<40:08,  1.96s/it] 82%|████████▏ | 5561/6790 [3:12:40<41:19,  2.02s/it]                                                     {'loss': 1.3636, 'learning_rate': 3.2547781484493225e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5561/6790 [3:12:40<41:19,  2.02s/it] 82%|████████▏ | 5562/6790 [3:12:42<39:49,  1.95s/it]                                                     {'loss': 1.3331, 'learning_rate': 3.2496444694922726e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5562/6790 [3:12:42<39:49,  1.95s/it] 82%|████████▏ | 5563/6790 [3:12:45<44:32,  2.18s/it]                                                     {'loss': 1.5301, 'learning_rate': 3.244514484319512e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5563/6790 [3:12:45<44:32,  2.18s/it] 82%|████████▏ | 5564/6790 [3:12:47<46:17,  2.27s/it]                                                     {'loss': 1.2854, 'learning_rate': 3.2393881940623294e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5564/6790 [3:12:47<46:17,  2.27s/it] 82%|████████▏ | 5565/6790 [3:12:50<45:54,  2.25s/it]                                                     {'loss': 1.4876, 'learning_rate': 3.2342655998511564e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5565/6790 [3:12:50<45:54,  2.25s/it] 82%|████████▏ | 5566/6790 [3:12:52<44:46,  2.20s/it]                                                     {'loss': 1.4413, 'learning_rate': 3.229146702815629e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5566/6790 [3:12:52<44:46,  2.20s/it] 82%|████████▏ | 5567/6790 [3:12:54<43:57,  2.16s/it]                                                     {'loss': 1.3174, 'learning_rate': 3.224031504084566e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5567/6790 [3:12:54<43:57,  2.16s/it] 82%|████████▏ | 5568/6790 [3:12:56<43:14,  2.12s/it]                                                     {'loss': 1.2449, 'learning_rate': 3.218920004785977e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5568/6790 [3:12:56<43:14,  2.12s/it] 82%|████████▏ | 5569/6790 [3:12:58<43:05,  2.12s/it]                                                     {'loss': 1.3858, 'learning_rate': 3.2138122060470356e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5569/6790 [3:12:58<43:05,  2.12s/it] 82%|████████▏ | 5570/6790 [3:13:00<42:37,  2.10s/it]                                                     {'loss': 1.5181, 'learning_rate': 3.2087081089941205e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5570/6790 [3:13:00<42:37,  2.10s/it] 82%|████████▏ | 5571/6790 [3:13:02<40:54,  2.01s/it]                                                     {'loss': 1.3734, 'learning_rate': 3.203607714752783e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5571/6790 [3:13:02<40:54,  2.01s/it] 82%|████████▏ | 5572/6790 [3:13:04<40:00,  1.97s/it]                                                     {'loss': 1.477, 'learning_rate': 3.1985110244477636e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5572/6790 [3:13:04<40:00,  1.97s/it] 82%|████████▏ | 5573/6790 [3:13:06<42:49,  2.11s/it]                                                     {'loss': 1.4538, 'learning_rate': 3.19341803920298e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5573/6790 [3:13:06<42:49,  2.11s/it] 82%|████████▏ | 5574/6790 [3:13:08<43:05,  2.13s/it]                                                     {'loss': 1.4095, 'learning_rate': 3.1883287601415366e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5574/6790 [3:13:08<43:05,  2.13s/it] 82%|████████▏ | 5575/6790 [3:13:10<43:26,  2.15s/it]                                                     {'loss': 1.553, 'learning_rate': 3.183243188385729e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5575/6790 [3:13:10<43:26,  2.15s/it] 82%|████████▏ | 5576/6790 [3:13:12<42:36,  2.11s/it]                                                     {'loss': 1.4122, 'learning_rate': 3.1781613250570116e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5576/6790 [3:13:12<42:36,  2.11s/it] 82%|████████▏ | 5577/6790 [3:13:17<55:23,  2.74s/it]                                                     {'loss': 1.0933, 'learning_rate': 3.173083171276041e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5577/6790 [3:13:17<55:23,  2.74s/it] 82%|████████▏ | 5578/6790 [3:13:19<50:10,  2.48s/it]                                                     {'loss': 1.5779, 'learning_rate': 3.168008728162655e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5578/6790 [3:13:19<50:10,  2.48s/it] 82%|████████▏ | 5579/6790 [3:13:21<51:00,  2.53s/it]                                                     {'loss': 1.3753, 'learning_rate': 3.162937996835869e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5579/6790 [3:13:21<51:00,  2.53s/it] 82%|████████▏ | 5580/6790 [3:13:23<47:50,  2.37s/it]                                                     {'loss': 1.5041, 'learning_rate': 3.1578709784138685e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5580/6790 [3:13:23<47:50,  2.37s/it] 82%|████████▏ | 5581/6790 [3:13:25<46:56,  2.33s/it]                                                     {'loss': 1.3093, 'learning_rate': 3.15280767401404e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5581/6790 [3:13:25<46:56,  2.33s/it] 82%|████████▏ | 5582/6790 [3:13:27<44:03,  2.19s/it]                                                     {'loss': 1.4258, 'learning_rate': 3.1477480847529414e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5582/6790 [3:13:27<44:03,  2.19s/it] 82%|████████▏ | 5583/6790 [3:13:29<42:13,  2.10s/it]                                                     {'loss': 1.1847, 'learning_rate': 3.1426922117463143e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5583/6790 [3:13:29<42:13,  2.10s/it] 82%|████████▏ | 5584/6790 [3:13:32<47:59,  2.39s/it]                                                     {'loss': 1.3069, 'learning_rate': 3.137640056109068e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5584/6790 [3:13:32<47:59,  2.39s/it] 82%|████████▏ | 5585/6790 [3:13:34<46:28,  2.31s/it]                                                     {'loss': 1.4275, 'learning_rate': 3.132591618955318e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5585/6790 [3:13:34<46:28,  2.31s/it] 82%|████████▏ | 5586/6790 [3:13:36<44:08,  2.20s/it]                                                     {'loss': 1.3718, 'learning_rate': 3.1275469013983326e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5586/6790 [3:13:36<44:08,  2.20s/it] 82%|████████▏ | 5587/6790 [3:13:38<42:59,  2.14s/it]                                                     {'loss': 1.3596, 'learning_rate': 3.122505904550577e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5587/6790 [3:13:38<42:59,  2.14s/it] 82%|████████▏ | 5588/6790 [3:13:41<44:45,  2.23s/it]                                                     {'loss': 1.2283, 'learning_rate': 3.117468629523688e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5588/6790 [3:13:41<44:45,  2.23s/it] 82%|████████▏ | 5589/6790 [3:13:43<43:33,  2.18s/it]                                                     {'loss': 1.2672, 'learning_rate': 3.112435077428484e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5589/6790 [3:13:43<43:33,  2.18s/it] 82%|████████▏ | 5590/6790 [3:13:46<48:27,  2.42s/it]                                                     {'loss': 1.3182, 'learning_rate': 3.1074052493749704e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5590/6790 [3:13:46<48:27,  2.42s/it] 82%|████████▏ | 5591/6790 [3:13:48<47:28,  2.38s/it]                                                     {'loss': 1.4585, 'learning_rate': 3.102379146472312e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5591/6790 [3:13:48<47:28,  2.38s/it] 82%|████████▏ | 5592/6790 [3:13:50<45:01,  2.26s/it]                                                     {'loss': 1.4808, 'learning_rate': 3.09735676982887e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5592/6790 [3:13:50<45:01,  2.26s/it] 82%|████████▏ | 5593/6790 [3:13:52<42:58,  2.15s/it]                                                     {'loss': 1.2839, 'learning_rate': 3.092338120552176e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5593/6790 [3:13:52<42:58,  2.15s/it] 82%|████████▏ | 5594/6790 [3:13:54<41:55,  2.10s/it]                                                     {'loss': 1.5489, 'learning_rate': 3.0873231997489484e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5594/6790 [3:13:54<41:55,  2.10s/it] 82%|████████▏ | 5595/6790 [3:13:56<42:01,  2.11s/it]                                                     {'loss': 1.2879, 'learning_rate': 3.082312008525059e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5595/6790 [3:13:56<42:01,  2.11s/it] 82%|████████▏ | 5596/6790 [3:13:58<41:24,  2.08s/it]                                                     {'loss': 1.3761, 'learning_rate': 3.077304547985596e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5596/6790 [3:13:58<41:24,  2.08s/it] 82%|████████▏ | 5597/6790 [3:14:01<43:28,  2.19s/it]                                                     {'loss': 1.3642, 'learning_rate': 3.072300819234788e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5597/6790 [3:14:01<43:28,  2.19s/it] 82%|████████▏ | 5598/6790 [3:14:03<42:54,  2.16s/it]                                                     {'loss': 1.4671, 'learning_rate': 3.06730082337606e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5598/6790 [3:14:03<42:54,  2.16s/it] 82%|████████▏ | 5599/6790 [3:14:05<43:04,  2.17s/it]                                                     {'loss': 1.5943, 'learning_rate': 3.062304561512011e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5599/6790 [3:14:05<43:04,  2.17s/it] 82%|████████▏ | 5600/6790 [3:14:07<42:04,  2.12s/it]                                                     {'loss': 1.4888, 'learning_rate': 3.0573120347444216e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5600/6790 [3:14:07<42:04,  2.12s/it] 82%|████████▏ | 5601/6790 [3:14:09<41:50,  2.11s/it]                                                     {'loss': 1.4863, 'learning_rate': 3.052323244174229e-05, 'epoch': 0.82}
+ 82%|████████▏ | 5601/6790 [3:14:09<41:50,  2.11s/it] 83%|████████▎ | 5602/6790 [3:14:11<40:12,  2.03s/it]                                                     {'loss': 1.2278, 'learning_rate': 3.0473381909015698e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5602/6790 [3:14:11<40:12,  2.03s/it] 83%|████████▎ | 5603/6790 [3:14:13<38:54,  1.97s/it]                                                     {'loss': 1.2932, 'learning_rate': 3.0423568760257427e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5603/6790 [3:14:13<38:54,  1.97s/it] 83%|████████▎ | 5604/6790 [3:14:15<44:07,  2.23s/it]                                                     {'loss': 1.4778, 'learning_rate': 3.0373793006452332e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5604/6790 [3:14:15<44:07,  2.23s/it] 83%|████████▎ | 5605/6790 [3:14:18<46:01,  2.33s/it]                                                     {'loss': 1.3033, 'learning_rate': 3.0324054658576794e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5605/6790 [3:14:18<46:01,  2.33s/it] 83%|████████▎ | 5606/6790 [3:14:20<46:22,  2.35s/it]                                                     {'loss': 1.4266, 'learning_rate': 3.027435372759926e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5606/6790 [3:14:20<46:22,  2.35s/it] 83%|████████▎ | 5607/6790 [3:14:22<43:50,  2.22s/it]                                                     {'loss': 1.4435, 'learning_rate': 3.0224690224479735e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5607/6790 [3:14:22<43:50,  2.22s/it] 83%|████████▎ | 5608/6790 [3:14:24<42:11,  2.14s/it]                                                     {'loss': 1.5296, 'learning_rate': 3.0175064160169953e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5608/6790 [3:14:24<42:11,  2.14s/it] 83%|████████▎ | 5609/6790 [3:14:26<41:49,  2.12s/it]                                                     {'loss': 1.4119, 'learning_rate': 3.0125475545613447e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5609/6790 [3:14:26<41:49,  2.12s/it] 83%|████████▎ | 5610/6790 [3:14:28<41:20,  2.10s/it]                                                     {'loss': 1.4414, 'learning_rate': 3.007592439174549e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5610/6790 [3:14:28<41:20,  2.10s/it] 83%|████████▎ | 5611/6790 [3:14:31<41:46,  2.13s/it]                                                     {'loss': 1.344, 'learning_rate': 3.0026410709493193e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5611/6790 [3:14:31<41:46,  2.13s/it] 83%|████████▎ | 5612/6790 [3:14:33<40:29,  2.06s/it]                                                     {'loss': 1.4368, 'learning_rate': 2.9976934509775125e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5612/6790 [3:14:33<40:29,  2.06s/it] 83%|████████▎ | 5613/6790 [3:14:34<39:26,  2.01s/it]                                                     {'loss': 1.4594, 'learning_rate': 2.992749580350187e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5613/6790 [3:14:34<39:26,  2.01s/it] 83%|████████▎ | 5614/6790 [3:14:37<40:08,  2.05s/it]                                                     {'loss': 1.3589, 'learning_rate': 2.9878094601575625e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5614/6790 [3:14:37<40:08,  2.05s/it] 83%|████████▎ | 5615/6790 [3:14:38<38:49,  1.98s/it]                                                     {'loss': 1.4032, 'learning_rate': 2.982873091489038e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5615/6790 [3:14:38<38:49,  1.98s/it] 83%|████████▎ | 5616/6790 [3:14:41<40:05,  2.05s/it]                                                     {'loss': 1.222, 'learning_rate': 2.977940475433163e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5616/6790 [3:14:41<40:05,  2.05s/it] 83%|████████▎ | 5617/6790 [3:14:43<41:46,  2.14s/it]                                                     {'loss': 1.4179, 'learning_rate': 2.9730116130777007e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5617/6790 [3:14:43<41:46,  2.14s/it] 83%|████████▎ | 5618/6790 [3:14:45<41:04,  2.10s/it]                                                     {'loss': 1.3589, 'learning_rate': 2.9680865055095465e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5618/6790 [3:14:45<41:04,  2.10s/it] 83%|████████▎ | 5619/6790 [3:14:47<40:18,  2.07s/it]                                                     {'loss': 1.3933, 'learning_rate': 2.9631651538147864e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5619/6790 [3:14:47<40:18,  2.07s/it] 83%|████████▎ | 5620/6790 [3:14:49<40:34,  2.08s/it]                                                     {'loss': 1.5989, 'learning_rate': 2.9582475590786773e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5620/6790 [3:14:49<40:34,  2.08s/it] 83%|████████▎ | 5621/6790 [3:14:51<41:44,  2.14s/it]                                                     {'loss': 1.63, 'learning_rate': 2.9533337223856515e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5621/6790 [3:14:51<41:44,  2.14s/it] 83%|████████▎ | 5622/6790 [3:14:53<40:49,  2.10s/it]                                                     {'loss': 1.2496, 'learning_rate': 2.9484236448192983e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5622/6790 [3:14:53<40:49,  2.10s/it] 83%|████████▎ | 5623/6790 [3:14:55<40:12,  2.07s/it]                                                     {'loss': 1.2991, 'learning_rate': 2.9435173274623886e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5623/6790 [3:14:55<40:12,  2.07s/it] 83%|████████▎ | 5624/6790 [3:14:57<40:16,  2.07s/it]                                                     {'loss': 1.4532, 'learning_rate': 2.938614771396866e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5624/6790 [3:14:57<40:16,  2.07s/it] 83%|████████▎ | 5625/6790 [3:15:01<50:12,  2.59s/it]                                                     {'loss': 1.4734, 'learning_rate': 2.9337159777038368e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5625/6790 [3:15:01<50:12,  2.59s/it] 83%|████████▎ | 5626/6790 [3:15:03<46:46,  2.41s/it]                                                     {'loss': 1.4451, 'learning_rate': 2.9288209474635888e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5626/6790 [3:15:03<46:46,  2.41s/it] 83%|████████▎ | 5627/6790 [3:15:05<44:02,  2.27s/it]                                                     {'loss': 1.2753, 'learning_rate': 2.9239296817555596e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5627/6790 [3:15:05<44:02,  2.27s/it] 83%|████████▎ | 5628/6790 [3:15:07<42:45,  2.21s/it]                                                     {'loss': 1.4777, 'learning_rate': 2.919042181658387e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5628/6790 [3:15:07<42:45,  2.21s/it] 83%|████████▎ | 5629/6790 [3:15:09<42:31,  2.20s/it]                                                     {'loss': 1.4128, 'learning_rate': 2.9141584482498487e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5629/6790 [3:15:09<42:31,  2.20s/it] 83%|████████▎ | 5630/6790 [3:15:11<39:53,  2.06s/it]                                                     {'loss': 1.2176, 'learning_rate': 2.9092784826069075e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5630/6790 [3:15:11<39:53,  2.06s/it] 83%|████████▎ | 5631/6790 [3:15:13<39:45,  2.06s/it]                                                     {'loss': 1.6544, 'learning_rate': 2.904402285805694e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5631/6790 [3:15:13<39:45,  2.06s/it] 83%|████████▎ | 5632/6790 [3:15:15<37:50,  1.96s/it]                                                     {'loss': 1.3355, 'learning_rate': 2.899529858921508e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5632/6790 [3:15:15<37:50,  1.96s/it] 83%|████████▎ | 5633/6790 [3:15:17<38:57,  2.02s/it]                                                     {'loss': 1.5183, 'learning_rate': 2.89466120302881e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5633/6790 [3:15:17<38:57,  2.02s/it] 83%|████████▎ | 5634/6790 [3:15:19<38:18,  1.99s/it]                                                     {'loss': 1.4567, 'learning_rate': 2.8897963192012366e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5634/6790 [3:15:19<38:18,  1.99s/it] 83%|████████▎ | 5635/6790 [3:15:21<38:22,  1.99s/it]                                                     {'loss': 1.2068, 'learning_rate': 2.8849352085115922e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5635/6790 [3:15:21<38:22,  1.99s/it] 83%|████████▎ | 5636/6790 [3:15:23<37:54,  1.97s/it]                                                     {'loss': 1.3477, 'learning_rate': 2.88007787203185e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5636/6790 [3:15:23<37:54,  1.97s/it] 83%|████████▎ | 5637/6790 [3:15:26<44:21,  2.31s/it]                                                     {'loss': 1.2755, 'learning_rate': 2.8752243108331445e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5637/6790 [3:15:26<44:21,  2.31s/it] 83%|████████▎ | 5638/6790 [3:15:28<43:43,  2.28s/it]                                                     {'loss': 1.5816, 'learning_rate': 2.8703745259857817e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5638/6790 [3:15:28<43:43,  2.28s/it] 83%|████████▎ | 5639/6790 [3:15:30<43:31,  2.27s/it]                                                     {'loss': 1.1035, 'learning_rate': 2.8655285185592375e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5639/6790 [3:15:30<43:31,  2.27s/it] 83%|████████▎ | 5640/6790 [3:15:33<44:45,  2.33s/it]                                                     {'loss': 1.5514, 'learning_rate': 2.8606862896221497e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5640/6790 [3:15:33<44:45,  2.33s/it] 83%|████████▎ | 5641/6790 [3:15:35<45:24,  2.37s/it]                                                     {'loss': 1.4164, 'learning_rate': 2.8558478402423294e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5641/6790 [3:15:35<45:24,  2.37s/it] 83%|████████▎ | 5642/6790 [3:15:37<43:31,  2.28s/it]                                                     {'loss': 1.3477, 'learning_rate': 2.851013171486747e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5642/6790 [3:15:37<43:31,  2.28s/it] 83%|████████▎ | 5643/6790 [3:15:40<42:38,  2.23s/it]                                                     {'loss': 1.6802, 'learning_rate': 2.846182284421548e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5643/6790 [3:15:40<42:38,  2.23s/it] 83%|████████▎ | 5644/6790 [3:15:41<40:26,  2.12s/it]                                                     {'loss': 1.5233, 'learning_rate': 2.8413551801120286e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5644/6790 [3:15:41<40:26,  2.12s/it] 83%|████████▎ | 5645/6790 [3:15:45<49:47,  2.61s/it]                                                     {'loss': 1.4039, 'learning_rate': 2.8365318596226685e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5645/6790 [3:15:45<49:47,  2.61s/it] 83%|████████▎ | 5646/6790 [3:15:47<46:52,  2.46s/it]                                                     {'loss': 1.3734, 'learning_rate': 2.8317123240170995e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5646/6790 [3:15:47<46:52,  2.46s/it] 83%|████████▎ | 5647/6790 [3:15:49<45:03,  2.37s/it]                                                     {'loss': 1.3079, 'learning_rate': 2.826896574358133e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5647/6790 [3:15:49<45:03,  2.37s/it] 83%|████████▎ | 5648/6790 [3:15:52<43:27,  2.28s/it]                                                     {'loss': 1.3617, 'learning_rate': 2.8220846117077248e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5648/6790 [3:15:52<43:27,  2.28s/it] 83%|████████▎ | 5649/6790 [3:15:54<42:51,  2.25s/it]                                                     {'loss': 1.2281, 'learning_rate': 2.817276437127021e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5649/6790 [3:15:54<42:51,  2.25s/it] 83%|████████▎ | 5650/6790 [3:15:55<40:07,  2.11s/it]                                                     {'loss': 1.4767, 'learning_rate': 2.8124720516763092e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5650/6790 [3:15:55<40:07,  2.11s/it] 83%|████████▎ | 5651/6790 [3:15:57<38:43,  2.04s/it]                                                     {'loss': 1.4368, 'learning_rate': 2.807671456415053e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5651/6790 [3:15:57<38:43,  2.04s/it] 83%|████████▎ | 5652/6790 [3:15:59<38:55,  2.05s/it]                                                     {'loss': 1.5231, 'learning_rate': 2.802874652401881e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5652/6790 [3:15:59<38:55,  2.05s/it] 83%|████████▎ | 5653/6790 [3:16:01<38:25,  2.03s/it]                                                     {'loss': 1.4303, 'learning_rate': 2.7980816406945875e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5653/6790 [3:16:01<38:25,  2.03s/it] 83%|████████▎ | 5654/6790 [3:16:03<38:14,  2.02s/it]                                                     {'loss': 1.5416, 'learning_rate': 2.7932924223501157e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5654/6790 [3:16:03<38:14,  2.02s/it] 83%|████████▎ | 5655/6790 [3:16:06<39:32,  2.09s/it]                                                     {'loss': 1.4784, 'learning_rate': 2.788506998424589e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5655/6790 [3:16:06<39:32,  2.09s/it] 83%|████████▎ | 5656/6790 [3:16:08<38:56,  2.06s/it]                                                     {'loss': 1.3019, 'learning_rate': 2.7837253699732867e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5656/6790 [3:16:08<38:56,  2.06s/it] 83%|████████▎ | 5657/6790 [3:16:10<38:41,  2.05s/it]                                                     {'loss': 1.5988, 'learning_rate': 2.7789475380506536e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5657/6790 [3:16:10<38:41,  2.05s/it] 83%|████████▎ | 5658/6790 [3:16:11<37:23,  1.98s/it]                                                     {'loss': 1.5256, 'learning_rate': 2.774173503710298e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5658/6790 [3:16:11<37:23,  1.98s/it] 83%|████████▎ | 5659/6790 [3:16:14<38:24,  2.04s/it]                                                     {'loss': 1.3046, 'learning_rate': 2.7694032680049774e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5659/6790 [3:16:14<38:24,  2.04s/it] 83%|████████▎ | 5660/6790 [3:16:16<38:18,  2.03s/it]                                                     {'loss': 1.3386, 'learning_rate': 2.7646368319866423e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5660/6790 [3:16:16<38:18,  2.03s/it] 83%|████████▎ | 5661/6790 [3:16:18<37:40,  2.00s/it]                                                     {'loss': 1.4228, 'learning_rate': 2.7598741967063692e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5661/6790 [3:16:18<37:40,  2.00s/it] 83%|████████▎ | 5662/6790 [3:16:20<38:46,  2.06s/it]                                                     {'loss': 1.3942, 'learning_rate': 2.75511536321442e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5662/6790 [3:16:20<38:46,  2.06s/it] 83%|████████▎ | 5663/6790 [3:16:22<39:50,  2.12s/it]                                                     {'loss': 1.4614, 'learning_rate': 2.750360332560211e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5663/6790 [3:16:22<39:50,  2.12s/it] 83%|████████▎ | 5664/6790 [3:16:24<39:35,  2.11s/it]                                                     {'loss': 1.7335, 'learning_rate': 2.7456091057923262e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5664/6790 [3:16:24<39:35,  2.11s/it] 83%|████████▎ | 5665/6790 [3:16:26<39:03,  2.08s/it]                                                     {'loss': 1.3091, 'learning_rate': 2.740861683958491e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5665/6790 [3:16:26<39:03,  2.08s/it] 83%|████████▎ | 5666/6790 [3:16:28<38:00,  2.03s/it]                                                     {'loss': 1.2964, 'learning_rate': 2.7361180681056174e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5666/6790 [3:16:28<38:00,  2.03s/it] 83%|████████▎ | 5667/6790 [3:16:30<37:06,  1.98s/it]                                                     {'loss': 1.5973, 'learning_rate': 2.7313782592797597e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5667/6790 [3:16:30<37:06,  1.98s/it] 83%|████████▎ | 5668/6790 [3:16:32<36:14,  1.94s/it]                                                     {'loss': 1.2554, 'learning_rate': 2.7266422585261485e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5668/6790 [3:16:32<36:14,  1.94s/it] 83%|████████▎ | 5669/6790 [3:16:34<36:12,  1.94s/it]                                                     {'loss': 1.1746, 'learning_rate': 2.721910066889155e-05, 'epoch': 0.83}
+ 83%|████████▎ | 5669/6790 [3:16:34<36:12,  1.94s/it] 84%|████████▎ | 5670/6790 [3:16:36<37:49,  2.03s/it]                                                     {'loss': 1.4222, 'learning_rate': 2.7171816854123267e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5670/6790 [3:16:36<37:49,  2.03s/it] 84%|████████▎ | 5671/6790 [3:16:38<39:13,  2.10s/it]                                                     {'loss': 1.2485, 'learning_rate': 2.7124571151383628e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5671/6790 [3:16:38<39:13,  2.10s/it] 84%|████████▎ | 5672/6790 [3:16:40<38:36,  2.07s/it]                                                     {'loss': 1.2763, 'learning_rate': 2.7077363571091295e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5672/6790 [3:16:40<38:36,  2.07s/it] 84%|████████▎ | 5673/6790 [3:16:42<36:58,  1.99s/it]                                                     {'loss': 1.2597, 'learning_rate': 2.703019412365633e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5673/6790 [3:16:42<36:58,  1.99s/it] 84%|████████▎ | 5674/6790 [3:16:44<37:38,  2.02s/it]                                                     {'loss': 1.3214, 'learning_rate': 2.6983062819480685e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5674/6790 [3:16:44<37:38,  2.02s/it] 84%|████████▎ | 5675/6790 [3:16:46<37:43,  2.03s/it]                                                     {'loss': 1.3359, 'learning_rate': 2.693596966895775e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5675/6790 [3:16:46<37:43,  2.03s/it] 84%|████████▎ | 5676/6790 [3:16:48<39:08,  2.11s/it]                                                     {'loss': 1.2984, 'learning_rate': 2.6888914682472366e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5676/6790 [3:16:48<39:08,  2.11s/it] 84%|████████▎ | 5677/6790 [3:16:52<44:35,  2.40s/it]                                                     {'loss': 1.3314, 'learning_rate': 2.6841897870401166e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5677/6790 [3:16:52<44:35,  2.40s/it] 84%|████████▎ | 5678/6790 [3:16:54<45:14,  2.44s/it]                                                     {'loss': 1.3865, 'learning_rate': 2.679491924311226e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5678/6790 [3:16:54<45:14,  2.44s/it] 84%|████████▎ | 5679/6790 [3:16:56<43:23,  2.34s/it]                                                     {'loss': 1.3369, 'learning_rate': 2.6747978810965446e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5679/6790 [3:16:56<43:23,  2.34s/it] 84%|████████▎ | 5680/6790 [3:16:58<41:03,  2.22s/it]                                                     {'loss': 1.2286, 'learning_rate': 2.6701076584311847e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5680/6790 [3:16:58<41:03,  2.22s/it] 84%|████████▎ | 5681/6790 [3:17:00<39:30,  2.14s/it]                                                     {'loss': 1.4352, 'learning_rate': 2.665421257349452e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5681/6790 [3:17:00<39:30,  2.14s/it] 84%|████████▎ | 5682/6790 [3:17:02<40:02,  2.17s/it]                                                     {'loss': 1.4738, 'learning_rate': 2.6607386788847754e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5682/6790 [3:17:02<40:02,  2.17s/it] 84%|████████▎ | 5683/6790 [3:17:05<42:41,  2.31s/it]                                                     {'loss': 1.4879, 'learning_rate': 2.6560599240697692e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5683/6790 [3:17:05<42:41,  2.31s/it] 84%|████████▎ | 5684/6790 [3:17:07<40:15,  2.18s/it]                                                     {'loss': 1.4231, 'learning_rate': 2.6513849939361745e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5684/6790 [3:17:07<40:15,  2.18s/it] 84%|████████▎ | 5685/6790 [3:17:09<40:48,  2.22s/it]                                                     {'loss': 1.2884, 'learning_rate': 2.6467138895149247e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5685/6790 [3:17:09<40:48,  2.22s/it] 84%|████████▎ | 5686/6790 [3:17:12<42:57,  2.33s/it]                                                     {'loss': 1.2765, 'learning_rate': 2.6420466118360755e-05, 'epoch': 0.84}
+ 84%|████████▎ | 5686/6790 [3:17:12<42:57,  2.33s/it] 84%|████████▍ | 5687/6790 [3:17:14<41:17,  2.25s/it]                                                     {'loss': 1.5129, 'learning_rate': 2.6373831619288613e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5687/6790 [3:17:14<41:17,  2.25s/it] 84%|████████▍ | 5688/6790 [3:17:16<40:58,  2.23s/it]                                                     {'loss': 1.3225, 'learning_rate': 2.6327235408216643e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5688/6790 [3:17:16<40:58,  2.23s/it] 84%|████████▍ | 5689/6790 [3:17:18<41:07,  2.24s/it]                                                     {'loss': 1.3392, 'learning_rate': 2.6280677495420248e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5689/6790 [3:17:18<41:07,  2.24s/it] 84%|████████▍ | 5690/6790 [3:17:21<42:26,  2.31s/it]                                                     {'loss': 1.3996, 'learning_rate': 2.62341578911663e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5690/6790 [3:17:21<42:26,  2.31s/it] 84%|████████▍ | 5691/6790 [3:17:22<38:57,  2.13s/it]                                                     {'loss': 1.3114, 'learning_rate': 2.6187676605713285e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5691/6790 [3:17:22<38:57,  2.13s/it] 84%|████████▍ | 5692/6790 [3:17:24<37:56,  2.07s/it]                                                     {'loss': 1.3109, 'learning_rate': 2.61412336493114e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5692/6790 [3:17:24<37:56,  2.07s/it] 84%|████████▍ | 5693/6790 [3:17:26<36:38,  2.00s/it]                                                     {'loss': 1.3778, 'learning_rate': 2.609482903220206e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5693/6790 [3:17:26<36:38,  2.00s/it] 84%|████████▍ | 5694/6790 [3:17:28<36:46,  2.01s/it]                                                     {'loss': 1.3621, 'learning_rate': 2.6048462764618477e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5694/6790 [3:17:28<36:46,  2.01s/it] 84%|████████▍ | 5695/6790 [3:17:30<36:25,  2.00s/it]                                                     {'loss': 1.2901, 'learning_rate': 2.600213485678531e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5695/6790 [3:17:30<36:25,  2.00s/it] 84%|████████▍ | 5696/6790 [3:17:32<37:03,  2.03s/it]                                                     {'loss': 1.3234, 'learning_rate': 2.5955845318918838e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5696/6790 [3:17:32<37:03,  2.03s/it] 84%|████████▍ | 5697/6790 [3:17:34<36:19,  1.99s/it]                                                     {'loss': 1.5922, 'learning_rate': 2.5909594161226715e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5697/6790 [3:17:34<36:19,  1.99s/it] 84%|████████▍ | 5698/6790 [3:17:37<37:49,  2.08s/it]                                                     {'loss': 1.3163, 'learning_rate': 2.586338139390827e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5698/6790 [3:17:37<37:49,  2.08s/it] 84%|████████▍ | 5699/6790 [3:17:39<37:48,  2.08s/it]                                                     {'loss': 1.2307, 'learning_rate': 2.581720702715438e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5699/6790 [3:17:39<37:48,  2.08s/it] 84%|████████▍ | 5700/6790 [3:17:41<37:28,  2.06s/it]                                                     {'loss': 1.2797, 'learning_rate': 2.5771071071147402e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5700/6790 [3:17:41<37:28,  2.06s/it] 84%|████████▍ | 5701/6790 [3:17:43<40:19,  2.22s/it]                                                     {'loss': 1.4036, 'learning_rate': 2.5724973536061136e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5701/6790 [3:17:43<40:19,  2.22s/it] 84%|████████▍ | 5702/6790 [3:17:45<38:54,  2.15s/it]                                                     {'loss': 1.3041, 'learning_rate': 2.5678914432061075e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5702/6790 [3:17:45<38:54,  2.15s/it] 84%|████████▍ | 5703/6790 [3:17:47<36:18,  2.00s/it]                                                     {'loss': 1.257, 'learning_rate': 2.5632893769304133e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5703/6790 [3:17:47<36:18,  2.00s/it] 84%|████████▍ | 5704/6790 [3:17:49<35:25,  1.96s/it]                                                     {'loss': 1.3189, 'learning_rate': 2.558691155793884e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5704/6790 [3:17:49<35:25,  1.96s/it] 84%|████████▍ | 5705/6790 [3:17:51<35:28,  1.96s/it]                                                     {'loss': 1.3799, 'learning_rate': 2.5540967808105042e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5705/6790 [3:17:51<35:28,  1.96s/it] 84%|████████▍ | 5706/6790 [3:17:53<37:04,  2.05s/it]                                                     {'loss': 1.4018, 'learning_rate': 2.5495062529934432e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5706/6790 [3:17:53<37:04,  2.05s/it] 84%|████████▍ | 5707/6790 [3:17:55<36:38,  2.03s/it]                                                     {'loss': 1.4688, 'learning_rate': 2.5449195733549868e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5707/6790 [3:17:55<36:38,  2.03s/it] 84%|████████▍ | 5708/6790 [3:17:57<35:15,  1.96s/it]                                                     {'loss': 1.4057, 'learning_rate': 2.540336742906595e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5708/6790 [3:17:57<35:15,  1.96s/it] 84%|████████▍ | 5709/6790 [3:17:59<36:25,  2.02s/it]                                                     {'loss': 1.4562, 'learning_rate': 2.5357577626588726e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5709/6790 [3:17:59<36:25,  2.02s/it] 84%|████████▍ | 5710/6790 [3:18:01<37:30,  2.08s/it]                                                     {'loss': 1.602, 'learning_rate': 2.5311826336215737e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5710/6790 [3:18:01<37:30,  2.08s/it] 84%|████████▍ | 5711/6790 [3:18:04<40:46,  2.27s/it]                                                     {'loss': 1.2746, 'learning_rate': 2.526611356803612e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5711/6790 [3:18:04<40:46,  2.27s/it] 84%|████████▍ | 5712/6790 [3:18:06<41:34,  2.31s/it]                                                     {'loss': 1.4424, 'learning_rate': 2.522043933213032e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5712/6790 [3:18:06<41:34,  2.31s/it] 84%|████████▍ | 5713/6790 [3:18:08<40:29,  2.26s/it]                                                     {'loss': 1.4371, 'learning_rate': 2.5174803638570478e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5713/6790 [3:18:08<40:29,  2.26s/it] 84%|████████▍ | 5714/6790 [3:18:10<39:19,  2.19s/it]                                                     {'loss': 1.4948, 'learning_rate': 2.5129206497420142e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5714/6790 [3:18:10<39:19,  2.19s/it] 84%|████████▍ | 5715/6790 [3:18:12<37:29,  2.09s/it]                                                     {'loss': 1.621, 'learning_rate': 2.5083647918734456e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5715/6790 [3:18:12<37:29,  2.09s/it] 84%|████████▍ | 5716/6790 [3:18:15<38:41,  2.16s/it]                                                     {'loss': 1.3329, 'learning_rate': 2.5038127912559816e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5716/6790 [3:18:15<38:41,  2.16s/it] 84%|████████▍ | 5717/6790 [3:18:17<40:45,  2.28s/it]                                                     {'loss': 1.4879, 'learning_rate': 2.499264648893449e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5717/6790 [3:18:17<40:45,  2.28s/it] 84%|████████▍ | 5718/6790 [3:18:19<40:35,  2.27s/it]                                                     {'loss': 1.4777, 'learning_rate': 2.4947203657887897e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5718/6790 [3:18:19<40:35,  2.27s/it] 84%|████████▍ | 5719/6790 [3:18:22<40:37,  2.28s/it]                                                     {'loss': 1.4584, 'learning_rate': 2.490179942944113e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5719/6790 [3:18:22<40:37,  2.28s/it] 84%|████████▍ | 5720/6790 [3:18:24<41:00,  2.30s/it]                                                     {'loss': 1.3167, 'learning_rate': 2.4856433813606694e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5720/6790 [3:18:24<41:00,  2.30s/it] 84%|████████▍ | 5721/6790 [3:18:26<38:40,  2.17s/it]                                                     {'loss': 1.367, 'learning_rate': 2.4811106820388652e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5721/6790 [3:18:26<38:40,  2.17s/it] 84%|████████▍ | 5722/6790 [3:18:28<39:20,  2.21s/it]                                                     {'loss': 1.5315, 'learning_rate': 2.4765818459782408e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5722/6790 [3:18:28<39:20,  2.21s/it] 84%|████████▍ | 5723/6790 [3:18:30<38:14,  2.15s/it]                                                     {'loss': 1.1017, 'learning_rate': 2.472056874177502e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5723/6790 [3:18:30<38:14,  2.15s/it] 84%|████████▍ | 5724/6790 [3:18:32<37:34,  2.11s/it]                                                     {'loss': 1.4866, 'learning_rate': 2.4675357676344902e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5724/6790 [3:18:32<37:34,  2.11s/it] 84%|████████▍ | 5725/6790 [3:18:34<36:51,  2.08s/it]                                                     {'loss': 1.4014, 'learning_rate': 2.4630185273462014e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5725/6790 [3:18:34<36:51,  2.08s/it] 84%|████████▍ | 5726/6790 [3:18:36<35:28,  2.00s/it]                                                     {'loss': 1.2086, 'learning_rate': 2.458505154308779e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5726/6790 [3:18:36<35:28,  2.00s/it] 84%|████████▍ | 5727/6790 [3:18:38<36:21,  2.05s/it]                                                     {'loss': 1.331, 'learning_rate': 2.4539956495175e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5727/6790 [3:18:38<36:21,  2.05s/it] 84%|████████▍ | 5728/6790 [3:18:41<38:08,  2.16s/it]                                                     {'loss': 1.295, 'learning_rate': 2.4494900139668152e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5728/6790 [3:18:41<38:08,  2.16s/it] 84%|████████▍ | 5729/6790 [3:18:43<38:53,  2.20s/it]                                                     {'loss': 1.3493, 'learning_rate': 2.444988248650293e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5729/6790 [3:18:43<38:53,  2.20s/it] 84%|████████▍ | 5730/6790 [3:18:45<37:14,  2.11s/it]                                                     {'loss': 1.2728, 'learning_rate': 2.440490354560665e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5730/6790 [3:18:45<37:14,  2.11s/it] 84%|████████▍ | 5731/6790 [3:18:47<36:30,  2.07s/it]                                                     {'loss': 1.5224, 'learning_rate': 2.4359963326898094e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5731/6790 [3:18:47<36:30,  2.07s/it] 84%|████████▍ | 5732/6790 [3:18:49<35:47,  2.03s/it]                                                     {'loss': 1.432, 'learning_rate': 2.431506184028747e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5732/6790 [3:18:49<35:47,  2.03s/it] 84%|████████▍ | 5733/6790 [3:18:51<34:51,  1.98s/it]                                                     {'loss': 1.4744, 'learning_rate': 2.4270199095676384e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5733/6790 [3:18:51<34:51,  1.98s/it] 84%|████████▍ | 5734/6790 [3:18:52<33:48,  1.92s/it]                                                     {'loss': 1.3768, 'learning_rate': 2.422537510295799e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5734/6790 [3:18:52<33:48,  1.92s/it] 84%|████████▍ | 5735/6790 [3:18:54<34:22,  1.95s/it]                                                     {'loss': 1.4671, 'learning_rate': 2.4180589872016855e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5735/6790 [3:18:54<34:22,  1.95s/it] 84%|████████▍ | 5736/6790 [3:18:56<33:30,  1.91s/it]                                                     {'loss': 1.2906, 'learning_rate': 2.4135843412729077e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5736/6790 [3:18:56<33:30,  1.91s/it] 84%|████████▍ | 5737/6790 [3:18:58<33:04,  1.88s/it]                                                     {'loss': 1.2128, 'learning_rate': 2.4091135734961977e-05, 'epoch': 0.84}
+ 84%|████████▍ | 5737/6790 [3:18:58<33:04,  1.88s/it] 85%|████████▍ | 5738/6790 [3:19:00<33:39,  1.92s/it]                                                     {'loss': 1.4377, 'learning_rate': 2.4046466848574657e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5738/6790 [3:19:00<33:39,  1.92s/it] 85%|████████▍ | 5739/6790 [3:19:02<35:52,  2.05s/it]                                                     {'loss': 1.2902, 'learning_rate': 2.4001836763417385e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5739/6790 [3:19:02<35:52,  2.05s/it] 85%|████████▍ | 5740/6790 [3:19:04<35:52,  2.05s/it]                                                     {'loss': 1.479, 'learning_rate': 2.3957245489331982e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5740/6790 [3:19:04<35:52,  2.05s/it] 85%|████████▍ | 5741/6790 [3:19:06<35:51,  2.05s/it]                                                     {'loss': 1.57, 'learning_rate': 2.3912693036151735e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5741/6790 [3:19:07<35:51,  2.05s/it] 85%|████████▍ | 5742/6790 [3:19:09<37:11,  2.13s/it]                                                     {'loss': 1.4542, 'learning_rate': 2.386817941370132e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5742/6790 [3:19:09<37:11,  2.13s/it] 85%|████████▍ | 5743/6790 [3:19:11<36:29,  2.09s/it]                                                     {'loss': 1.6197, 'learning_rate': 2.3823704631796927e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5743/6790 [3:19:11<36:29,  2.09s/it] 85%|████████▍ | 5744/6790 [3:19:13<35:12,  2.02s/it]                                                     {'loss': 1.3269, 'learning_rate': 2.3779268700246048e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5744/6790 [3:19:13<35:12,  2.02s/it] 85%|████████▍ | 5745/6790 [3:19:15<35:29,  2.04s/it]                                                     {'loss': 1.4762, 'learning_rate': 2.3734871628847688e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5745/6790 [3:19:15<35:29,  2.04s/it] 85%|████████▍ | 5746/6790 [3:19:17<36:11,  2.08s/it]                                                     {'loss': 1.4862, 'learning_rate': 2.3690513427392325e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5746/6790 [3:19:17<36:11,  2.08s/it] 85%|████████▍ | 5747/6790 [3:19:19<34:30,  1.99s/it]                                                     {'loss': 1.3103, 'learning_rate': 2.364619410566182e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5747/6790 [3:19:19<34:30,  1.99s/it] 85%|████████▍ | 5748/6790 [3:19:21<34:11,  1.97s/it]                                                     {'loss': 1.4912, 'learning_rate': 2.3601913673429364e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5748/6790 [3:19:21<34:11,  1.97s/it] 85%|████████▍ | 5749/6790 [3:19:23<35:37,  2.05s/it]                                                     {'loss': 1.5579, 'learning_rate': 2.3557672140459808e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5749/6790 [3:19:23<35:37,  2.05s/it] 85%|████████▍ | 5750/6790 [3:19:25<33:55,  1.96s/it]                                                     {'loss': 1.2179, 'learning_rate': 2.351346951650919e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5750/6790 [3:19:25<33:55,  1.96s/it] 85%|████████▍ | 5751/6790 [3:19:27<34:51,  2.01s/it]                                                     {'loss': 1.6732, 'learning_rate': 2.346930581132507e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5751/6790 [3:19:27<34:51,  2.01s/it] 85%|████████▍ | 5752/6790 [3:19:29<34:36,  2.00s/it]                                                     {'loss': 1.5588, 'learning_rate': 2.3425181034646438e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5752/6790 [3:19:29<34:36,  2.00s/it] 85%|████████▍ | 5753/6790 [3:19:31<34:54,  2.02s/it]                                                     {'loss': 1.4159, 'learning_rate': 2.338109519620373e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5753/6790 [3:19:31<34:54,  2.02s/it] 85%|████████▍ | 5754/6790 [3:19:33<35:53,  2.08s/it]                                                     {'loss': 1.334, 'learning_rate': 2.3337048305718634e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5754/6790 [3:19:33<35:53,  2.08s/it] 85%|████████▍ | 5755/6790 [3:19:35<35:24,  2.05s/it]                                                     {'loss': 1.1805, 'learning_rate': 2.3293040372904407e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5755/6790 [3:19:35<35:24,  2.05s/it] 85%|████████▍ | 5756/6790 [3:19:37<34:14,  1.99s/it]                                                     {'loss': 1.4347, 'learning_rate': 2.3249071407465682e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5756/6790 [3:19:37<34:14,  1.99s/it] 85%|████████▍ | 5757/6790 [3:19:40<38:56,  2.26s/it]                                                     {'loss': 1.2724, 'learning_rate': 2.320514141909853e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5757/6790 [3:19:40<38:56,  2.26s/it] 85%|████████▍ | 5758/6790 [3:19:42<39:39,  2.31s/it]                                                     {'loss': 1.4889, 'learning_rate': 2.316125041749029e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5758/6790 [3:19:42<39:39,  2.31s/it] 85%|████████▍ | 5759/6790 [3:19:44<38:18,  2.23s/it]                                                     {'loss': 1.2955, 'learning_rate': 2.311739841231977e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5759/6790 [3:19:44<38:18,  2.23s/it] 85%|████████▍ | 5760/6790 [3:19:46<35:33,  2.07s/it]                                                     {'loss': 1.4477, 'learning_rate': 2.307358541325737e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5760/6790 [3:19:46<35:33,  2.07s/it] 85%|████████▍ | 5761/6790 [3:19:48<34:42,  2.02s/it]                                                     {'loss': 1.2804, 'learning_rate': 2.3029811429964564e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5761/6790 [3:19:48<34:42,  2.02s/it] 85%|████████▍ | 5762/6790 [3:19:50<35:23,  2.07s/it]                                                     {'loss': 1.6093, 'learning_rate': 2.298607647209443e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5762/6790 [3:19:50<35:23,  2.07s/it] 85%|████████▍ | 5763/6790 [3:19:52<33:35,  1.96s/it]                                                     {'loss': 1.1698, 'learning_rate': 2.2942380549291408e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5763/6790 [3:19:52<33:35,  1.96s/it] 85%|████████▍ | 5764/6790 [3:19:53<32:24,  1.89s/it]                                                     {'loss': 1.3219, 'learning_rate': 2.2898723671191348e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5764/6790 [3:19:53<32:24,  1.89s/it] 85%|████████▍ | 5765/6790 [3:19:55<32:52,  1.92s/it]                                                     {'loss': 1.314, 'learning_rate': 2.2855105847421343e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5765/6790 [3:19:55<32:52,  1.92s/it] 85%|████████▍ | 5766/6790 [3:19:58<34:10,  2.00s/it]                                                     {'loss': 1.4982, 'learning_rate': 2.281152708760006e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5766/6790 [3:19:58<34:10,  2.00s/it] 85%|████████▍ | 5767/6790 [3:19:59<32:46,  1.92s/it]                                                     {'loss': 1.1462, 'learning_rate': 2.2767987401337455e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5767/6790 [3:19:59<32:46,  1.92s/it] 85%|████████▍ | 5768/6790 [3:20:01<32:42,  1.92s/it]                                                     {'loss': 1.3682, 'learning_rate': 2.2724486798234956e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5768/6790 [3:20:01<32:42,  1.92s/it] 85%|████████▍ | 5769/6790 [3:20:03<33:00,  1.94s/it]                                                     {'loss': 1.3894, 'learning_rate': 2.268102528788516e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5769/6790 [3:20:03<33:00,  1.94s/it] 85%|████████▍ | 5770/6790 [3:20:05<31:55,  1.88s/it]                                                     {'loss': 1.3269, 'learning_rate': 2.2637602879872354e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5770/6790 [3:20:05<31:55,  1.88s/it] 85%|████████▍ | 5771/6790 [3:20:07<33:24,  1.97s/it]                                                     {'loss': 1.5558, 'learning_rate': 2.2594219583771902e-05, 'epoch': 0.85}
+ 85%|████████▍ | 5771/6790 [3:20:07<33:24,  1.97s/it] 85%|████████▌ | 5772/6790 [3:20:09<34:04,  2.01s/it]                                                     {'loss': 1.5287, 'learning_rate': 2.2550875409150794e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5772/6790 [3:20:09<34:04,  2.01s/it] 85%|████████▌ | 5773/6790 [3:20:12<35:37,  2.10s/it]                                                     {'loss': 1.493, 'learning_rate': 2.2507570365567144e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5773/6790 [3:20:12<35:37,  2.10s/it] 85%|████████▌ | 5774/6790 [3:20:14<37:48,  2.23s/it]                                                     {'loss': 1.4676, 'learning_rate': 2.2464304462570705e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5774/6790 [3:20:14<37:48,  2.23s/it] 85%|████████▌ | 5775/6790 [3:20:16<37:26,  2.21s/it]                                                     {'loss': 1.3787, 'learning_rate': 2.2421077709702366e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5775/6790 [3:20:16<37:26,  2.21s/it] 85%|████████▌ | 5776/6790 [3:20:18<37:24,  2.21s/it]                                                     {'loss': 1.4344, 'learning_rate': 2.2377890116494515e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5776/6790 [3:20:18<37:24,  2.21s/it] 85%|████████▌ | 5777/6790 [3:20:20<35:16,  2.09s/it]                                                     {'loss': 1.5035, 'learning_rate': 2.233474169247087e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5777/6790 [3:20:20<35:16,  2.09s/it] 85%|████████▌ | 5778/6790 [3:20:22<34:22,  2.04s/it]                                                     {'loss': 1.1926, 'learning_rate': 2.2291632447146517e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5778/6790 [3:20:22<34:22,  2.04s/it] 85%|████████▌ | 5779/6790 [3:20:24<32:35,  1.93s/it]                                                     {'loss': 1.157, 'learning_rate': 2.2248562390027906e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5779/6790 [3:20:24<32:35,  1.93s/it] 85%|████████▌ | 5780/6790 [3:20:26<33:03,  1.96s/it]                                                     {'loss': 1.3813, 'learning_rate': 2.2205531530612756e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5780/6790 [3:20:26<33:03,  1.96s/it] 85%|████████▌ | 5781/6790 [3:20:28<33:48,  2.01s/it]                                                     {'loss': 1.3655, 'learning_rate': 2.2162539878390364e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5781/6790 [3:20:28<33:48,  2.01s/it] 85%|████████▌ | 5782/6790 [3:20:30<34:01,  2.02s/it]                                                     {'loss': 1.4617, 'learning_rate': 2.211958744284113e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5782/6790 [3:20:30<34:01,  2.02s/it] 85%|████████▌ | 5783/6790 [3:20:32<33:43,  2.01s/it]                                                     {'loss': 1.5107, 'learning_rate': 2.2076674233436934e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5783/6790 [3:20:32<33:43,  2.01s/it] 85%|████████▌ | 5784/6790 [3:20:34<33:54,  2.02s/it]                                                     {'loss': 1.6129, 'learning_rate': 2.203380025964099e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5784/6790 [3:20:34<33:54,  2.02s/it] 85%|████████▌ | 5785/6790 [3:20:36<32:59,  1.97s/it]                                                     {'loss': 1.2733, 'learning_rate': 2.1990965530907913e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5785/6790 [3:20:36<32:59,  1.97s/it] 85%|████████▌ | 5786/6790 [3:20:38<31:51,  1.90s/it]                                                     {'loss': 1.2772, 'learning_rate': 2.1948170056683525e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5786/6790 [3:20:38<31:51,  1.90s/it] 85%|████████▌ | 5787/6790 [3:20:39<31:02,  1.86s/it]                                                     {'loss': 1.4288, 'learning_rate': 2.1905413846405077e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5787/6790 [3:20:39<31:02,  1.86s/it] 85%|████████▌ | 5788/6790 [3:20:42<31:58,  1.91s/it]                                                     {'loss': 1.5518, 'learning_rate': 2.1862696909501203e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5788/6790 [3:20:42<31:58,  1.91s/it] 85%|████████▌ | 5789/6790 [3:20:44<33:38,  2.02s/it]                                                     {'loss': 1.4533, 'learning_rate': 2.1820019255391855e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5789/6790 [3:20:44<33:38,  2.02s/it] 85%|████████▌ | 5790/6790 [3:20:46<33:00,  1.98s/it]                                                     {'loss': 1.4815, 'learning_rate': 2.177738089348822e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5790/6790 [3:20:46<33:00,  1.98s/it] 85%|████████▌ | 5791/6790 [3:20:48<32:18,  1.94s/it]                                                     {'loss': 1.4901, 'learning_rate': 2.173478183319293e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5791/6790 [3:20:48<32:18,  1.94s/it] 85%|████████▌ | 5792/6790 [3:20:49<31:18,  1.88s/it]                                                     {'loss': 1.4061, 'learning_rate': 2.1692222083899937e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5792/6790 [3:20:49<31:18,  1.88s/it] 85%|████████▌ | 5793/6790 [3:20:51<31:41,  1.91s/it]                                                     {'loss': 1.6294, 'learning_rate': 2.164970165499449e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5793/6790 [3:20:51<31:41,  1.91s/it] 85%|████████▌ | 5794/6790 [3:20:53<32:49,  1.98s/it]                                                     {'loss': 1.3223, 'learning_rate': 2.16072205558532e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5794/6790 [3:20:53<32:49,  1.98s/it] 85%|████████▌ | 5795/6790 [3:20:55<31:38,  1.91s/it]                                                     {'loss': 1.2952, 'learning_rate': 2.1564778795843955e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5795/6790 [3:20:55<31:38,  1.91s/it] 85%|████████▌ | 5796/6790 [3:20:57<32:02,  1.93s/it]                                                     {'loss': 1.4372, 'learning_rate': 2.1522376384326082e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5796/6790 [3:20:57<32:02,  1.93s/it] 85%|████████▌ | 5797/6790 [3:20:59<33:41,  2.04s/it]                                                     {'loss': 1.4794, 'learning_rate': 2.148001333065006e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5797/6790 [3:20:59<33:41,  2.04s/it] 85%|████████▌ | 5798/6790 [3:21:01<32:08,  1.94s/it]                                                     {'loss': 1.3639, 'learning_rate': 2.14376896441578e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5798/6790 [3:21:01<32:08,  1.94s/it] 85%|████████▌ | 5799/6790 [3:21:03<33:36,  2.03s/it]                                                     {'loss': 1.3271, 'learning_rate': 2.1395405334182516e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5799/6790 [3:21:03<33:36,  2.03s/it] 85%|████████▌ | 5800/6790 [3:21:06<36:19,  2.20s/it]                                                     {'loss': 1.3759, 'learning_rate': 2.13531604100488e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5800/6790 [3:21:06<36:19,  2.20s/it] 85%|████████▌ | 5801/6790 [3:21:08<36:58,  2.24s/it]                                                     {'loss': 1.5447, 'learning_rate': 2.1310954881072376e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5801/6790 [3:21:08<36:58,  2.24s/it] 85%|████████▌ | 5802/6790 [3:21:10<36:13,  2.20s/it]                                                     {'loss': 1.4888, 'learning_rate': 2.1268788756560466e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5802/6790 [3:21:10<36:13,  2.20s/it] 85%|████████▌ | 5803/6790 [3:21:12<35:15,  2.14s/it]                                                     {'loss': 1.3658, 'learning_rate': 2.122666204581152e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5803/6790 [3:21:12<35:15,  2.14s/it] 85%|████████▌ | 5804/6790 [3:21:14<34:27,  2.10s/it]                                                     {'loss': 1.571, 'learning_rate': 2.118457475811535e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5804/6790 [3:21:14<34:27,  2.10s/it] 85%|████████▌ | 5805/6790 [3:21:17<35:39,  2.17s/it]                                                     {'loss': 1.3688, 'learning_rate': 2.1142526902752933e-05, 'epoch': 0.85}
+ 85%|████████▌ | 5805/6790 [3:21:17<35:39,  2.17s/it] 86%|████████▌ | 5806/6790 [3:21:19<34:59,  2.13s/it]                                                     {'loss': 1.4804, 'learning_rate': 2.1100518488996767e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5806/6790 [3:21:19<34:59,  2.13s/it] 86%|████████▌ | 5807/6790 [3:21:21<34:28,  2.10s/it]                                                     {'loss': 1.4462, 'learning_rate': 2.1058549526110462e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5807/6790 [3:21:21<34:28,  2.10s/it] 86%|████████▌ | 5808/6790 [3:21:23<34:06,  2.08s/it]                                                     {'loss': 1.4171, 'learning_rate': 2.1016620023349032e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5808/6790 [3:21:23<34:06,  2.08s/it] 86%|████████▌ | 5809/6790 [3:21:25<33:21,  2.04s/it]                                                     {'loss': 1.4541, 'learning_rate': 2.097472998995873e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5809/6790 [3:21:25<33:21,  2.04s/it] 86%|████████▌ | 5810/6790 [3:21:27<32:59,  2.02s/it]                                                     {'loss': 1.4924, 'learning_rate': 2.093287943517719e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5810/6790 [3:21:27<32:59,  2.02s/it] 86%|████████▌ | 5811/6790 [3:21:29<35:13,  2.16s/it]                                                     {'loss': 1.1834, 'learning_rate': 2.089106836823329e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5811/6790 [3:21:29<35:13,  2.16s/it] 86%|████████▌ | 5812/6790 [3:21:31<34:25,  2.11s/it]                                                     {'loss': 1.5365, 'learning_rate': 2.084929679834706e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5812/6790 [3:21:31<34:25,  2.11s/it] 86%|████████▌ | 5813/6790 [3:21:33<33:22,  2.05s/it]                                                     {'loss': 1.3627, 'learning_rate': 2.0807564734730177e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5813/6790 [3:21:33<33:22,  2.05s/it] 86%|████████▌ | 5814/6790 [3:21:36<34:56,  2.15s/it]                                                     {'loss': 1.2397, 'learning_rate': 2.076587218658521e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5814/6790 [3:21:36<34:56,  2.15s/it] 86%|████████▌ | 5815/6790 [3:21:38<34:24,  2.12s/it]                                                     {'loss': 1.4001, 'learning_rate': 2.0724219163106253e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5815/6790 [3:21:38<34:24,  2.12s/it] 86%|████████▌ | 5816/6790 [3:21:39<33:21,  2.05s/it]                                                     {'loss': 1.3519, 'learning_rate': 2.0682605673478594e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5816/6790 [3:21:39<33:21,  2.05s/it] 86%|████████▌ | 5817/6790 [3:21:42<33:19,  2.05s/it]                                                     {'loss': 1.3713, 'learning_rate': 2.0641031726878924e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5817/6790 [3:21:42<33:19,  2.05s/it] 86%|████████▌ | 5818/6790 [3:21:44<33:49,  2.09s/it]                                                     {'loss': 1.4798, 'learning_rate': 2.059949733247497e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5818/6790 [3:21:44<33:49,  2.09s/it] 86%|████████▌ | 5819/6790 [3:21:46<32:45,  2.02s/it]                                                     {'loss': 1.287, 'learning_rate': 2.055800249942599e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5819/6790 [3:21:46<32:45,  2.02s/it] 86%|████████▌ | 5820/6790 [3:21:47<31:41,  1.96s/it]                                                     {'loss': 1.302, 'learning_rate': 2.0516547236882387e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5820/6790 [3:21:47<31:41,  1.96s/it] 86%|████████▌ | 5821/6790 [3:21:50<33:16,  2.06s/it]                                                     {'loss': 1.3592, 'learning_rate': 2.0475131553985905e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5821/6790 [3:21:50<33:16,  2.06s/it] 86%|████████▌ | 5822/6790 [3:21:52<33:51,  2.10s/it]                                                     {'loss': 1.2779, 'learning_rate': 2.043375545986943e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5822/6790 [3:21:52<33:51,  2.10s/it] 86%|████████▌ | 5823/6790 [3:21:54<32:17,  2.00s/it]                                                     {'loss': 1.4448, 'learning_rate': 2.0392418963657265e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5823/6790 [3:21:54<32:17,  2.00s/it] 86%|████████▌ | 5824/6790 [3:21:56<33:07,  2.06s/it]                                                     {'loss': 1.2602, 'learning_rate': 2.0351122074464922e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5824/6790 [3:21:56<33:07,  2.06s/it] 86%|████████▌ | 5825/6790 [3:21:58<32:05,  2.00s/it]                                                     {'loss': 1.2557, 'learning_rate': 2.0309864801399205e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5825/6790 [3:21:58<32:05,  2.00s/it] 86%|████████▌ | 5826/6790 [3:22:00<32:33,  2.03s/it]                                                     {'loss': 1.5478, 'learning_rate': 2.0268647153558074e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5826/6790 [3:22:00<32:33,  2.03s/it] 86%|████████▌ | 5827/6790 [3:22:02<32:17,  2.01s/it]                                                     {'loss': 1.4129, 'learning_rate': 2.022746914003091e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5827/6790 [3:22:02<32:17,  2.01s/it] 86%|████████▌ | 5828/6790 [3:22:04<32:56,  2.05s/it]                                                     {'loss': 1.5611, 'learning_rate': 2.018633076989831e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5828/6790 [3:22:04<32:56,  2.05s/it] 86%|████████▌ | 5829/6790 [3:22:06<33:00,  2.06s/it]                                                     {'loss': 1.5384, 'learning_rate': 2.0145232052231998e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5829/6790 [3:22:06<33:00,  2.06s/it] 86%|████████▌ | 5830/6790 [3:22:08<33:05,  2.07s/it]                                                     {'loss': 1.5918, 'learning_rate': 2.0104172996095106e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5830/6790 [3:22:08<33:05,  2.07s/it] 86%|████████▌ | 5831/6790 [3:22:11<35:24,  2.22s/it]                                                     {'loss': 1.1963, 'learning_rate': 2.006315361054196e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5831/6790 [3:22:11<35:24,  2.22s/it] 86%|████████▌ | 5832/6790 [3:22:13<35:39,  2.23s/it]                                                     {'loss': 1.5069, 'learning_rate': 2.002217390461818e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5832/6790 [3:22:13<35:39,  2.23s/it] 86%|████████▌ | 5833/6790 [3:22:15<36:14,  2.27s/it]                                                     {'loss': 1.3144, 'learning_rate': 1.998123388736053e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5833/6790 [3:22:15<36:14,  2.27s/it] 86%|████████▌ | 5834/6790 [3:22:17<35:27,  2.23s/it]                                                     {'loss': 1.1599, 'learning_rate': 1.994033356779714e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5834/6790 [3:22:17<35:27,  2.23s/it] 86%|████████▌ | 5835/6790 [3:22:19<34:06,  2.14s/it]                                                     {'loss': 1.3776, 'learning_rate': 1.9899472954947342e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5835/6790 [3:22:19<34:06,  2.14s/it] 86%|████████▌ | 5836/6790 [3:22:21<33:19,  2.10s/it]                                                     {'loss': 1.5684, 'learning_rate': 1.9858652057821714e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5836/6790 [3:22:21<33:19,  2.10s/it] 86%|████████▌ | 5837/6790 [3:22:24<33:40,  2.12s/it]                                                     {'loss': 1.6551, 'learning_rate': 1.9817870885421975e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5837/6790 [3:22:24<33:40,  2.12s/it] 86%|████████▌ | 5838/6790 [3:22:25<32:50,  2.07s/it]                                                     {'loss': 1.4947, 'learning_rate': 1.9777129446741328e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5838/6790 [3:22:25<32:50,  2.07s/it] 86%|████████▌ | 5839/6790 [3:22:27<32:26,  2.05s/it]                                                     {'loss': 1.3453, 'learning_rate': 1.9736427750763963e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5839/6790 [3:22:27<32:26,  2.05s/it] 86%|████████▌ | 5840/6790 [3:22:29<31:53,  2.01s/it]                                                     {'loss': 1.1923, 'learning_rate': 1.969576580646544e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5840/6790 [3:22:29<31:53,  2.01s/it] 86%|████████▌ | 5841/6790 [3:22:32<32:16,  2.04s/it]                                                     {'loss': 1.3905, 'learning_rate': 1.9655143622812533e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5841/6790 [3:22:32<32:16,  2.04s/it] 86%|████████▌ | 5842/6790 [3:22:33<31:45,  2.01s/it]                                                     {'loss': 1.4116, 'learning_rate': 1.9614561208763237e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5842/6790 [3:22:33<31:45,  2.01s/it] 86%|████████▌ | 5843/6790 [3:22:35<31:37,  2.00s/it]                                                     {'loss': 1.1953, 'learning_rate': 1.9574018573266727e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5843/6790 [3:22:35<31:37,  2.00s/it] 86%|████████▌ | 5844/6790 [3:22:38<35:04,  2.23s/it]                                                     {'loss': 1.3414, 'learning_rate': 1.9533515725263453e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5844/6790 [3:22:38<35:04,  2.23s/it] 86%|████████▌ | 5845/6790 [3:22:40<35:17,  2.24s/it]                                                     {'loss': 1.4846, 'learning_rate': 1.949305267368522e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5845/6790 [3:22:40<35:17,  2.24s/it] 86%|████████▌ | 5846/6790 [3:22:43<36:24,  2.31s/it]                                                     {'loss': 1.4958, 'learning_rate': 1.9452629427454784e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5846/6790 [3:22:43<36:24,  2.31s/it] 86%|████████▌ | 5847/6790 [3:22:45<33:48,  2.15s/it]                                                     {'loss': 1.3126, 'learning_rate': 1.9412245995486368e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5847/6790 [3:22:45<33:48,  2.15s/it] 86%|████████▌ | 5848/6790 [3:22:47<33:02,  2.10s/it]                                                     {'loss': 1.4982, 'learning_rate': 1.9371902386685203e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5848/6790 [3:22:47<33:02,  2.10s/it] 86%|████████▌ | 5849/6790 [3:22:49<32:43,  2.09s/it]                                                     {'loss': 1.6045, 'learning_rate': 1.9331598609947976e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5849/6790 [3:22:49<32:43,  2.09s/it] 86%|████████▌ | 5850/6790 [3:22:51<34:14,  2.19s/it]                                                     {'loss': 1.3899, 'learning_rate': 1.92913346741624e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5850/6790 [3:22:51<34:14,  2.19s/it] 86%|████████▌ | 5851/6790 [3:22:53<32:05,  2.05s/it]                                                     {'loss': 1.1182, 'learning_rate': 1.9251110588207478e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5851/6790 [3:22:53<32:05,  2.05s/it] 86%|████████▌ | 5852/6790 [3:22:55<30:47,  1.97s/it]                                                     {'loss': 1.3297, 'learning_rate': 1.9210926360953408e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5852/6790 [3:22:55<30:47,  1.97s/it] 86%|████████▌ | 5853/6790 [3:22:57<31:00,  1.99s/it]                                                     {'loss': 1.4556, 'learning_rate': 1.9170782001261656e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5853/6790 [3:22:57<31:00,  1.99s/it] 86%|████████▌ | 5854/6790 [3:22:59<32:55,  2.11s/it]                                                     {'loss': 1.4955, 'learning_rate': 1.9130677517984764e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5854/6790 [3:22:59<32:55,  2.11s/it] 86%|████████▌ | 5855/6790 [3:23:02<34:32,  2.22s/it]                                                     {'loss': 1.5893, 'learning_rate': 1.909061291996661e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5855/6790 [3:23:02<34:32,  2.22s/it] 86%|████████▌ | 5856/6790 [3:23:03<32:39,  2.10s/it]                                                     {'loss': 1.472, 'learning_rate': 1.905058821604222e-05, 'epoch': 0.86}
+ 86%|████████▌ | 5856/6790 [3:23:03<32:39,  2.10s/it] 86%|████████▋ | 5857/6790 [3:23:05<32:14,  2.07s/it]                                                     {'loss': 1.3449, 'learning_rate': 1.9010603415037886e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5857/6790 [3:23:05<32:14,  2.07s/it] 86%|████████▋ | 5858/6790 [3:23:07<31:07,  2.00s/it]                                                     {'loss': 1.1833, 'learning_rate': 1.8970658525770914e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5858/6790 [3:23:07<31:07,  2.00s/it] 86%|████████▋ | 5859/6790 [3:23:09<30:58,  2.00s/it]                                                     {'loss': 1.6214, 'learning_rate': 1.8930753557050096e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5859/6790 [3:23:09<30:58,  2.00s/it] 86%|████████▋ | 5860/6790 [3:23:11<30:35,  1.97s/it]                                                     {'loss': 1.403, 'learning_rate': 1.8890888517675153e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5860/6790 [3:23:11<30:35,  1.97s/it] 86%|████████▋ | 5861/6790 [3:23:14<32:39,  2.11s/it]                                                     {'loss': 1.3798, 'learning_rate': 1.8851063416437164e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5861/6790 [3:23:14<32:39,  2.11s/it] 86%|████████▋ | 5862/6790 [3:23:16<33:12,  2.15s/it]                                                     {'loss': 1.3978, 'learning_rate': 1.8811278262118347e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5862/6790 [3:23:16<33:12,  2.15s/it] 86%|████████▋ | 5863/6790 [3:23:18<33:20,  2.16s/it]                                                     {'loss': 1.257, 'learning_rate': 1.8771533063492107e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5863/6790 [3:23:18<33:20,  2.16s/it] 86%|████████▋ | 5864/6790 [3:23:20<33:37,  2.18s/it]                                                     {'loss': 1.4393, 'learning_rate': 1.8731827829323077e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5864/6790 [3:23:20<33:37,  2.18s/it] 86%|████████▋ | 5865/6790 [3:23:22<33:24,  2.17s/it]                                                     {'loss': 1.5147, 'learning_rate': 1.8692162568366968e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5865/6790 [3:23:22<33:24,  2.17s/it] 86%|████████▋ | 5866/6790 [3:23:25<33:42,  2.19s/it]                                                     {'loss': 1.3774, 'learning_rate': 1.8652537289370818e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5866/6790 [3:23:25<33:42,  2.19s/it] 86%|████████▋ | 5867/6790 [3:23:27<33:23,  2.17s/it]                                                     {'loss': 1.4369, 'learning_rate': 1.861295200107276e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5867/6790 [3:23:27<33:23,  2.17s/it] 86%|████████▋ | 5868/6790 [3:23:29<32:16,  2.10s/it]                                                     {'loss': 1.4581, 'learning_rate': 1.857340671220218e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5868/6790 [3:23:29<32:16,  2.10s/it] 86%|████████▋ | 5869/6790 [3:23:31<32:09,  2.10s/it]                                                     {'loss': 1.473, 'learning_rate': 1.8533901431479483e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5869/6790 [3:23:31<32:09,  2.10s/it] 86%|████████▋ | 5870/6790 [3:23:33<32:04,  2.09s/it]                                                     {'loss': 1.3003, 'learning_rate': 1.8494436167616503e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5870/6790 [3:23:33<32:04,  2.09s/it] 86%|████████▋ | 5871/6790 [3:23:35<31:43,  2.07s/it]                                                     {'loss': 1.4353, 'learning_rate': 1.8455010929316007e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5871/6790 [3:23:35<31:43,  2.07s/it] 86%|████████▋ | 5872/6790 [3:23:37<33:53,  2.22s/it]                                                     {'loss': 1.4846, 'learning_rate': 1.841562572527209e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5872/6790 [3:23:37<33:53,  2.22s/it] 86%|████████▋ | 5873/6790 [3:23:39<31:55,  2.09s/it]                                                     {'loss': 1.2563, 'learning_rate': 1.8376280564169934e-05, 'epoch': 0.86}
+ 86%|████████▋ | 5873/6790 [3:23:39<31:55,  2.09s/it] 87%|████████▋ | 5874/6790 [3:23:41<32:15,  2.11s/it]                                                     {'loss': 1.371, 'learning_rate': 1.8336975454686e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5874/6790 [3:23:41<32:15,  2.11s/it] 87%|████████▋ | 5875/6790 [3:23:43<31:46,  2.08s/it]                                                     {'loss': 1.597, 'learning_rate': 1.8297710405487733e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5875/6790 [3:23:43<31:46,  2.08s/it] 87%|████████▋ | 5876/6790 [3:23:46<32:11,  2.11s/it]                                                     {'loss': 1.5732, 'learning_rate': 1.8258485425233894e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5876/6790 [3:23:46<32:11,  2.11s/it] 87%|████████▋ | 5877/6790 [3:23:47<30:42,  2.02s/it]                                                     {'loss': 1.2593, 'learning_rate': 1.821930052257439e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5877/6790 [3:23:47<30:42,  2.02s/it] 87%|████████▋ | 5878/6790 [3:23:49<29:48,  1.96s/it]                                                     {'loss': 1.3768, 'learning_rate': 1.8180155706150236e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5878/6790 [3:23:49<29:48,  1.96s/it] 87%|████████▋ | 5879/6790 [3:23:51<28:54,  1.90s/it]                                                     {'loss': 1.4153, 'learning_rate': 1.814105098459371e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5879/6790 [3:23:51<28:54,  1.90s/it] 87%|████████▋ | 5880/6790 [3:23:53<28:44,  1.89s/it]                                                     {'loss': 1.5059, 'learning_rate': 1.8101986366528025e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5880/6790 [3:23:53<28:44,  1.89s/it] 87%|████████▋ | 5881/6790 [3:23:55<29:27,  1.94s/it]                                                     {'loss': 1.5483, 'learning_rate': 1.8062961860567883e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5881/6790 [3:23:55<29:27,  1.94s/it] 87%|████████▋ | 5882/6790 [3:23:57<29:51,  1.97s/it]                                                     {'loss': 1.4757, 'learning_rate': 1.8023977475318833e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5882/6790 [3:23:57<29:51,  1.97s/it] 87%|████████▋ | 5883/6790 [3:23:59<30:55,  2.05s/it]                                                     {'loss': 1.4506, 'learning_rate': 1.7985033219377723e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5883/6790 [3:23:59<30:55,  2.05s/it] 87%|████████▋ | 5884/6790 [3:24:01<30:20,  2.01s/it]                                                     {'loss': 1.504, 'learning_rate': 1.7946129101332554e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5884/6790 [3:24:01<30:20,  2.01s/it] 87%|████████▋ | 5885/6790 [3:24:03<30:00,  1.99s/it]                                                     {'loss': 1.3314, 'learning_rate': 1.7907265129762484e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5885/6790 [3:24:03<30:00,  1.99s/it] 87%|████████▋ | 5886/6790 [3:24:05<30:59,  2.06s/it]                                                     {'loss': 1.2945, 'learning_rate': 1.7868441313237706e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5886/6790 [3:24:05<30:59,  2.06s/it] 87%|████████▋ | 5887/6790 [3:24:08<34:01,  2.26s/it]                                                     {'loss': 1.2983, 'learning_rate': 1.7829657660319698e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5887/6790 [3:24:08<34:01,  2.26s/it] 87%|████████▋ | 5888/6790 [3:24:10<32:40,  2.17s/it]                                                     {'loss': 1.3965, 'learning_rate': 1.779091417956098e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5888/6790 [3:24:10<32:40,  2.17s/it] 87%|████████▋ | 5889/6790 [3:24:12<31:03,  2.07s/it]                                                     {'loss': 1.379, 'learning_rate': 1.7752210879505314e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5889/6790 [3:24:12<31:03,  2.07s/it] 87%|████████▋ | 5890/6790 [3:24:14<31:54,  2.13s/it]                                                     {'loss': 1.3216, 'learning_rate': 1.77135477686875e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5890/6790 [3:24:14<31:54,  2.13s/it] 87%|████████▋ | 5891/6790 [3:24:16<30:41,  2.05s/it]                                                     {'loss': 1.2726, 'learning_rate': 1.767492485563349e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5891/6790 [3:24:16<30:41,  2.05s/it] 87%|████████▋ | 5892/6790 [3:24:18<29:29,  1.97s/it]                                                     {'loss': 1.4149, 'learning_rate': 1.763634214886045e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5892/6790 [3:24:18<29:29,  1.97s/it] 87%|████████▋ | 5893/6790 [3:24:20<29:31,  1.97s/it]                                                     {'loss': 1.4651, 'learning_rate': 1.7597799656876666e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5893/6790 [3:24:20<29:31,  1.97s/it] 87%|████████▋ | 5894/6790 [3:24:22<30:13,  2.02s/it]                                                     {'loss': 1.3915, 'learning_rate': 1.755929738818136e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5894/6790 [3:24:22<30:13,  2.02s/it] 87%|████████▋ | 5895/6790 [3:24:24<29:48,  2.00s/it]                                                     {'loss': 1.4676, 'learning_rate': 1.752083535126521e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5895/6790 [3:24:24<29:48,  2.00s/it] 87%|████████▋ | 5896/6790 [3:24:26<28:52,  1.94s/it]                                                     {'loss': 1.3886, 'learning_rate': 1.748241355460982e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5896/6790 [3:24:26<28:52,  1.94s/it] 87%|████████▋ | 5897/6790 [3:24:28<29:18,  1.97s/it]                                                     {'loss': 1.4454, 'learning_rate': 1.7444032006687893e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5897/6790 [3:24:28<29:18,  1.97s/it] 87%|████████▋ | 5898/6790 [3:24:29<28:52,  1.94s/it]                                                     {'loss': 1.4109, 'learning_rate': 1.740569071596336e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5898/6790 [3:24:29<28:52,  1.94s/it] 87%|████████▋ | 5899/6790 [3:24:31<29:16,  1.97s/it]                                                     {'loss': 1.2293, 'learning_rate': 1.736738969089122e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5899/6790 [3:24:31<29:16,  1.97s/it] 87%|████████▋ | 5900/6790 [3:24:33<28:55,  1.95s/it]                                                     {'loss': 1.4001, 'learning_rate': 1.7329128939917648e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5900/6790 [3:24:33<28:55,  1.95s/it] 87%|████████▋ | 5901/6790 [3:24:36<30:37,  2.07s/it]                                                     {'loss': 1.4678, 'learning_rate': 1.7290908471479805e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5901/6790 [3:24:36<30:37,  2.07s/it] 87%|████████▋ | 5902/6790 [3:24:38<29:57,  2.02s/it]                                                     {'loss': 1.3676, 'learning_rate': 1.725272829400617e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5902/6790 [3:24:38<29:57,  2.02s/it] 87%|████████▋ | 5903/6790 [3:24:40<31:09,  2.11s/it]                                                     {'loss': 1.2687, 'learning_rate': 1.7214588415916145e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5903/6790 [3:24:40<31:09,  2.11s/it] 87%|████████▋ | 5904/6790 [3:24:42<29:38,  2.01s/it]                                                     {'loss': 1.3937, 'learning_rate': 1.717648884562035e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5904/6790 [3:24:42<29:38,  2.01s/it] 87%|████████▋ | 5905/6790 [3:24:44<29:48,  2.02s/it]                                                     {'loss': 1.1829, 'learning_rate': 1.71384295915205e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5905/6790 [3:24:44<29:48,  2.02s/it] 87%|████████▋ | 5906/6790 [3:24:46<29:34,  2.01s/it]                                                     {'loss': 1.3879, 'learning_rate': 1.7100410662009446e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5906/6790 [3:24:46<29:34,  2.01s/it] 87%|████████▋ | 5907/6790 [3:24:48<30:49,  2.09s/it]                                                     {'loss': 1.6636, 'learning_rate': 1.7062432065471024e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5907/6790 [3:24:48<30:49,  2.09s/it] 87%|████████▋ | 5908/6790 [3:24:50<30:08,  2.05s/it]                                                     {'loss': 1.3425, 'learning_rate': 1.702449381028033e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5908/6790 [3:24:50<30:08,  2.05s/it] 87%|████████▋ | 5909/6790 [3:24:52<30:41,  2.09s/it]                                                     {'loss': 1.4045, 'learning_rate': 1.698659590480347e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5909/6790 [3:24:52<30:41,  2.09s/it] 87%|████████▋ | 5910/6790 [3:24:54<29:33,  2.02s/it]                                                     {'loss': 1.3939, 'learning_rate': 1.6948738357397742e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5910/6790 [3:24:54<29:33,  2.02s/it] 87%|████████▋ | 5911/6790 [3:24:56<29:43,  2.03s/it]                                                     {'loss': 1.5215, 'learning_rate': 1.691092117641142e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5911/6790 [3:24:56<29:43,  2.03s/it] 87%|████████▋ | 5912/6790 [3:24:58<28:27,  1.94s/it]                                                     {'loss': 1.5312, 'learning_rate': 1.68731443701839e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5912/6790 [3:24:58<28:27,  1.94s/it] 87%|████████▋ | 5913/6790 [3:25:00<29:11,  2.00s/it]                                                     {'loss': 1.4814, 'learning_rate': 1.6835407947045835e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5913/6790 [3:25:00<29:11,  2.00s/it] 87%|████████▋ | 5914/6790 [3:25:02<28:15,  1.94s/it]                                                     {'loss': 1.6534, 'learning_rate': 1.6797711915318758e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5914/6790 [3:25:02<28:15,  1.94s/it] 87%|████████▋ | 5915/6790 [3:25:04<28:18,  1.94s/it]                                                     {'loss': 1.3479, 'learning_rate': 1.676005628331543e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5915/6790 [3:25:04<28:18,  1.94s/it] 87%|████████▋ | 5916/6790 [3:25:06<29:48,  2.05s/it]                                                     {'loss': 1.6795, 'learning_rate': 1.6722441059339645e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5916/6790 [3:25:06<29:48,  2.05s/it] 87%|████████▋ | 5917/6790 [3:25:08<30:43,  2.11s/it]                                                     {'loss': 1.2779, 'learning_rate': 1.6684866251686327e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5917/6790 [3:25:08<30:43,  2.11s/it] 87%|████████▋ | 5918/6790 [3:25:10<30:31,  2.10s/it]                                                     {'loss': 1.4723, 'learning_rate': 1.6647331868641426e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5918/6790 [3:25:10<30:31,  2.10s/it] 87%|████████▋ | 5919/6790 [3:25:12<29:48,  2.05s/it]                                                     {'loss': 1.3327, 'learning_rate': 1.660983791848203e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5919/6790 [3:25:12<29:48,  2.05s/it] 87%|████████▋ | 5920/6790 [3:25:14<29:27,  2.03s/it]                                                     {'loss': 1.4798, 'learning_rate': 1.6572384409476283e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5920/6790 [3:25:14<29:27,  2.03s/it] 87%|████████▋ | 5921/6790 [3:25:16<28:43,  1.98s/it]                                                     {'loss': 1.4876, 'learning_rate': 1.6534971349883487e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5921/6790 [3:25:16<28:43,  1.98s/it] 87%|████████▋ | 5922/6790 [3:25:18<29:48,  2.06s/it]                                                     {'loss': 1.4908, 'learning_rate': 1.649759874795389e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5922/6790 [3:25:18<29:48,  2.06s/it] 87%|████████▋ | 5923/6790 [3:25:20<29:38,  2.05s/it]                                                     {'loss': 1.3237, 'learning_rate': 1.64602666119289e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5923/6790 [3:25:20<29:38,  2.05s/it] 87%|████████▋ | 5924/6790 [3:25:22<28:56,  2.01s/it]                                                     {'loss': 1.4854, 'learning_rate': 1.6422974950040994e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5924/6790 [3:25:22<28:56,  2.01s/it] 87%|████████▋ | 5925/6790 [3:25:24<29:24,  2.04s/it]                                                     {'loss': 1.5217, 'learning_rate': 1.6385723770513774e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5925/6790 [3:25:24<29:24,  2.04s/it] 87%|████████▋ | 5926/6790 [3:25:27<33:17,  2.31s/it]                                                     {'loss': 1.3901, 'learning_rate': 1.6348513081561734e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5926/6790 [3:25:27<33:17,  2.31s/it] 87%|████████▋ | 5927/6790 [3:25:30<32:54,  2.29s/it]                                                     {'loss': 1.3492, 'learning_rate': 1.6311342891390734e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5927/6790 [3:25:30<32:54,  2.29s/it] 87%|████████▋ | 5928/6790 [3:25:32<31:47,  2.21s/it]                                                     {'loss': 1.4374, 'learning_rate': 1.627421320819742e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5928/6790 [3:25:32<31:47,  2.21s/it] 87%|████████▋ | 5929/6790 [3:25:34<32:10,  2.24s/it]                                                     {'loss': 1.4313, 'learning_rate': 1.623712404016964e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5929/6790 [3:25:34<32:10,  2.24s/it] 87%|████████▋ | 5930/6790 [3:25:36<33:02,  2.31s/it]                                                     {'loss': 1.4363, 'learning_rate': 1.6200075395486293e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5930/6790 [3:25:36<33:02,  2.31s/it] 87%|████████▋ | 5931/6790 [3:25:39<32:09,  2.25s/it]                                                     {'loss': 1.3864, 'learning_rate': 1.6163067282317336e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5931/6790 [3:25:39<32:09,  2.25s/it] 87%|████████▋ | 5932/6790 [3:25:41<31:27,  2.20s/it]                                                     {'loss': 1.4192, 'learning_rate': 1.612609970882384e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5932/6790 [3:25:41<31:27,  2.20s/it] 87%|████████▋ | 5933/6790 [3:25:43<31:31,  2.21s/it]                                                     {'loss': 1.4048, 'learning_rate': 1.6089172683157773e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5933/6790 [3:25:43<31:31,  2.21s/it] 87%|████████▋ | 5934/6790 [3:25:45<30:44,  2.16s/it]                                                     {'loss': 1.4325, 'learning_rate': 1.605228621346242e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5934/6790 [3:25:45<30:44,  2.16s/it] 87%|████████▋ | 5935/6790 [3:25:47<29:54,  2.10s/it]                                                     {'loss': 1.5093, 'learning_rate': 1.6015440307871833e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5935/6790 [3:25:47<29:54,  2.10s/it] 87%|████████▋ | 5936/6790 [3:25:49<29:15,  2.06s/it]                                                     {'loss': 1.4523, 'learning_rate': 1.5978634974511375e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5936/6790 [3:25:49<29:15,  2.06s/it] 87%|████████▋ | 5937/6790 [3:25:51<28:21,  1.99s/it]                                                     {'loss': 1.4478, 'learning_rate': 1.5941870221497247e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5937/6790 [3:25:51<28:21,  1.99s/it] 87%|████████▋ | 5938/6790 [3:25:53<28:25,  2.00s/it]                                                     {'loss': 1.5958, 'learning_rate': 1.5905146056936915e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5938/6790 [3:25:53<28:25,  2.00s/it] 87%|████████▋ | 5939/6790 [3:25:55<28:45,  2.03s/it]                                                     {'loss': 1.4258, 'learning_rate': 1.5868462488928683e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5939/6790 [3:25:55<28:45,  2.03s/it] 87%|████████▋ | 5940/6790 [3:25:57<28:14,  1.99s/it]                                                     {'loss': 1.4432, 'learning_rate': 1.583181952556205e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5940/6790 [3:25:57<28:14,  1.99s/it] 87%|████████▋ | 5941/6790 [3:25:59<28:11,  1.99s/it]                                                     {'loss': 1.3328, 'learning_rate': 1.5795217174917498e-05, 'epoch': 0.87}
+ 87%|████████▋ | 5941/6790 [3:25:59<28:11,  1.99s/it] 88%|████████▊ | 5942/6790 [3:26:00<27:23,  1.94s/it]                                                     {'loss': 1.4439, 'learning_rate': 1.5758655445066627e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5942/6790 [3:26:00<27:23,  1.94s/it] 88%|████████▊ | 5943/6790 [3:26:02<26:50,  1.90s/it]                                                     {'loss': 1.2801, 'learning_rate': 1.5722134344071925e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5943/6790 [3:26:02<26:50,  1.90s/it] 88%|████████▊ | 5944/6790 [3:26:05<28:12,  2.00s/it]                                                     {'loss': 1.5429, 'learning_rate': 1.5685653879987082e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5944/6790 [3:26:05<28:12,  2.00s/it] 88%|████████▊ | 5945/6790 [3:26:07<28:23,  2.02s/it]                                                     {'loss': 1.6657, 'learning_rate': 1.5649214060856733e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5945/6790 [3:26:07<28:23,  2.02s/it] 88%|████████▊ | 5946/6790 [3:26:09<28:41,  2.04s/it]                                                     {'loss': 1.4585, 'learning_rate': 1.5612814894716578e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5946/6790 [3:26:09<28:41,  2.04s/it] 88%|████████▊ | 5947/6790 [3:26:11<28:21,  2.02s/it]                                                     {'loss': 1.4307, 'learning_rate': 1.557645638959335e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5947/6790 [3:26:11<28:21,  2.02s/it] 88%|████████▊ | 5948/6790 [3:26:13<29:24,  2.10s/it]                                                     {'loss': 1.2484, 'learning_rate': 1.5540138553504844e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5948/6790 [3:26:13<29:24,  2.10s/it] 88%|████████▊ | 5949/6790 [3:26:15<28:54,  2.06s/it]                                                     {'loss': 1.3572, 'learning_rate': 1.5503861394459895e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5949/6790 [3:26:15<28:54,  2.06s/it] 88%|████████▊ | 5950/6790 [3:26:17<30:01,  2.14s/it]                                                     {'loss': 1.2259, 'learning_rate': 1.5467624920458235e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5950/6790 [3:26:17<30:01,  2.14s/it] 88%|████████▊ | 5951/6790 [3:26:19<28:14,  2.02s/it]                                                     {'loss': 1.4477, 'learning_rate': 1.543142913949076e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5951/6790 [3:26:19<28:14,  2.02s/it] 88%|████████▊ | 5952/6790 [3:26:21<27:00,  1.93s/it]                                                     {'loss': 1.4909, 'learning_rate': 1.5395274059539376e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5952/6790 [3:26:21<27:00,  1.93s/it] 88%|████████▊ | 5953/6790 [3:26:23<27:43,  1.99s/it]                                                     {'loss': 1.4971, 'learning_rate': 1.5359159688577018e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5953/6790 [3:26:23<27:43,  1.99s/it] 88%|████████▊ | 5954/6790 [3:26:25<27:39,  1.98s/it]                                                     {'loss': 1.2357, 'learning_rate': 1.5323086034567534e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5954/6790 [3:26:25<27:39,  1.98s/it] 88%|████████▊ | 5955/6790 [3:26:27<27:40,  1.99s/it]                                                     {'loss': 1.2506, 'learning_rate': 1.5287053105465942e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5955/6790 [3:26:27<27:40,  1.99s/it] 88%|████████▊ | 5956/6790 [3:26:29<27:19,  1.97s/it]                                                     {'loss': 1.3387, 'learning_rate': 1.5251060909218196e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5956/6790 [3:26:29<27:19,  1.97s/it] 88%|████████▊ | 5957/6790 [3:26:31<27:13,  1.96s/it]                                                     {'loss': 1.4986, 'learning_rate': 1.5215109453761322e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5957/6790 [3:26:31<27:13,  1.96s/it] 88%|████████▊ | 5958/6790 [3:26:33<27:35,  1.99s/it]                                                     {'loss': 1.2513, 'learning_rate': 1.5179198747023205e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5958/6790 [3:26:33<27:35,  1.99s/it] 88%|████████▊ | 5959/6790 [3:26:35<28:07,  2.03s/it]                                                     {'loss': 1.3861, 'learning_rate': 1.514332879692304e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5959/6790 [3:26:35<28:07,  2.03s/it] 88%|████████▊ | 5960/6790 [3:26:37<27:44,  2.01s/it]                                                     {'loss': 1.3542, 'learning_rate': 1.5107499611370746e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5960/6790 [3:26:37<27:44,  2.01s/it] 88%|████████▊ | 5961/6790 [3:26:39<27:51,  2.02s/it]                                                     {'loss': 1.372, 'learning_rate': 1.507171119826738e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5961/6790 [3:26:39<27:51,  2.02s/it] 88%|████████▊ | 5962/6790 [3:26:41<28:02,  2.03s/it]                                                     {'loss': 1.3055, 'learning_rate': 1.5035963565505007e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5962/6790 [3:26:41<28:02,  2.03s/it] 88%|████████▊ | 5963/6790 [3:26:43<26:46,  1.94s/it]                                                     {'loss': 1.2843, 'learning_rate': 1.5000256720966676e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5963/6790 [3:26:43<26:46,  1.94s/it] 88%|████████▊ | 5964/6790 [3:26:44<26:17,  1.91s/it]                                                     {'loss': 1.3492, 'learning_rate': 1.4964590672526513e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5964/6790 [3:26:44<26:17,  1.91s/it] 88%|████████▊ | 5965/6790 [3:26:47<26:56,  1.96s/it]                                                     {'loss': 1.2736, 'learning_rate': 1.492896542804949e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5965/6790 [3:26:47<26:56,  1.96s/it] 88%|████████▊ | 5966/6790 [3:26:49<27:20,  1.99s/it]                                                     {'loss': 1.4671, 'learning_rate': 1.4893380995391726e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5966/6790 [3:26:49<27:20,  1.99s/it] 88%|████████▊ | 5967/6790 [3:26:50<26:58,  1.97s/it]                                                     {'loss': 1.4363, 'learning_rate': 1.4857837382400274e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5967/6790 [3:26:50<26:58,  1.97s/it] 88%|████████▊ | 5968/6790 [3:26:52<27:04,  1.98s/it]                                                     {'loss': 1.4722, 'learning_rate': 1.4822334596913268e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5968/6790 [3:26:52<27:04,  1.98s/it] 88%|████████▊ | 5969/6790 [3:26:54<26:21,  1.93s/it]                                                     {'loss': 1.4143, 'learning_rate': 1.4786872646759665e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5969/6790 [3:26:54<26:21,  1.93s/it] 88%|████████▊ | 5970/6790 [3:26:57<28:42,  2.10s/it]                                                     {'loss': 1.4867, 'learning_rate': 1.4751451539759632e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5970/6790 [3:26:57<28:42,  2.10s/it] 88%|████████▊ | 5971/6790 [3:26:59<27:39,  2.03s/it]                                                     {'loss': 1.4658, 'learning_rate': 1.4716071283724142e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5971/6790 [3:26:59<27:39,  2.03s/it] 88%|████████▊ | 5972/6790 [3:27:01<28:41,  2.10s/it]                                                     {'loss': 1.6191, 'learning_rate': 1.4680731886455268e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5972/6790 [3:27:01<28:41,  2.10s/it] 88%|████████▊ | 5973/6790 [3:27:03<29:34,  2.17s/it]                                                     {'loss': 1.4352, 'learning_rate': 1.464543335574604e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5973/6790 [3:27:03<29:34,  2.17s/it] 88%|████████▊ | 5974/6790 [3:27:05<29:26,  2.16s/it]                                                     {'loss': 1.2301, 'learning_rate': 1.4610175699380547e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5974/6790 [3:27:05<29:26,  2.16s/it] 88%|████████▊ | 5975/6790 [3:27:07<28:53,  2.13s/it]                                                     {'loss': 1.186, 'learning_rate': 1.4574958925133697e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5975/6790 [3:27:07<28:53,  2.13s/it] 88%|████████▊ | 5976/6790 [3:27:09<27:47,  2.05s/it]                                                     {'loss': 1.3003, 'learning_rate': 1.4539783040771525e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5976/6790 [3:27:09<27:47,  2.05s/it] 88%|████████▊ | 5977/6790 [3:27:11<27:37,  2.04s/it]                                                     {'loss': 1.248, 'learning_rate': 1.4504648054051007e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5977/6790 [3:27:11<27:37,  2.04s/it] 88%|████████▊ | 5978/6790 [3:27:13<26:59,  1.99s/it]                                                     {'loss': 1.2855, 'learning_rate': 1.4469553972720118e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5978/6790 [3:27:13<26:59,  1.99s/it] 88%|████████▊ | 5979/6790 [3:27:15<27:24,  2.03s/it]                                                     {'loss': 1.2987, 'learning_rate': 1.4434500804517803e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5979/6790 [3:27:15<27:24,  2.03s/it] 88%|████████▊ | 5980/6790 [3:27:18<28:51,  2.14s/it]                                                     {'loss': 1.4866, 'learning_rate': 1.4399488557173947e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5980/6790 [3:27:18<28:51,  2.14s/it] 88%|████████▊ | 5981/6790 [3:27:20<27:19,  2.03s/it]                                                     {'loss': 1.4374, 'learning_rate': 1.436451723840948e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5981/6790 [3:27:20<27:19,  2.03s/it] 88%|████████▊ | 5982/6790 [3:27:22<28:01,  2.08s/it]                                                     {'loss': 1.5525, 'learning_rate': 1.4329586855936216e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5982/6790 [3:27:22<28:01,  2.08s/it] 88%|████████▊ | 5983/6790 [3:27:24<27:02,  2.01s/it]                                                     {'loss': 1.4084, 'learning_rate': 1.4294697417457014e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5983/6790 [3:27:24<27:02,  2.01s/it] 88%|████████▊ | 5984/6790 [3:27:26<26:59,  2.01s/it]                                                     {'loss': 1.2846, 'learning_rate': 1.4259848930665721e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5984/6790 [3:27:26<26:59,  2.01s/it] 88%|████████▊ | 5985/6790 [3:27:28<27:47,  2.07s/it]                                                     {'loss': 1.5169, 'learning_rate': 1.4225041403247096e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5985/6790 [3:27:28<27:47,  2.07s/it] 88%|████████▊ | 5986/6790 [3:27:30<27:03,  2.02s/it]                                                     {'loss': 1.6052, 'learning_rate': 1.4190274842876849e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5986/6790 [3:27:30<27:03,  2.02s/it] 88%|████████▊ | 5987/6790 [3:27:32<26:21,  1.97s/it]                                                     {'loss': 1.4655, 'learning_rate': 1.4155549257221733e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5987/6790 [3:27:32<26:21,  1.97s/it] 88%|████████▊ | 5988/6790 [3:27:33<26:08,  1.96s/it]                                                     {'loss': 1.3089, 'learning_rate': 1.4120864653939426e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5988/6790 [3:27:33<26:08,  1.96s/it] 88%|████████▊ | 5989/6790 [3:27:36<26:32,  1.99s/it]                                                     {'loss': 1.6142, 'learning_rate': 1.4086221040678583e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5989/6790 [3:27:36<26:32,  1.99s/it] 88%|████████▊ | 5990/6790 [3:27:38<26:36,  2.00s/it]                                                     {'loss': 1.4214, 'learning_rate': 1.4051618425078694e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5990/6790 [3:27:38<26:36,  2.00s/it] 88%|████████▊ | 5991/6790 [3:27:40<27:21,  2.05s/it]                                                     {'loss': 1.4159, 'learning_rate': 1.4017056814770502e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5991/6790 [3:27:40<27:21,  2.05s/it] 88%|████████▊ | 5992/6790 [3:27:42<26:32,  2.00s/it]                                                     {'loss': 1.325, 'learning_rate': 1.3982536217375375e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5992/6790 [3:27:42<26:32,  2.00s/it] 88%|████████▊ | 5993/6790 [3:27:43<25:46,  1.94s/it]                                                     {'loss': 1.2539, 'learning_rate': 1.3948056640505868e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5993/6790 [3:27:43<25:46,  1.94s/it] 88%|████████▊ | 5994/6790 [3:27:46<27:11,  2.05s/it]                                                     {'loss': 1.619, 'learning_rate': 1.3913618091765347e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5994/6790 [3:27:46<27:11,  2.05s/it] 88%|████████▊ | 5995/6790 [3:27:48<26:16,  1.98s/it]                                                     {'loss': 1.442, 'learning_rate': 1.3879220578748264e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5995/6790 [3:27:48<26:16,  1.98s/it] 88%|████████▊ | 5996/6790 [3:27:50<27:28,  2.08s/it]                                                     {'loss': 1.4759, 'learning_rate': 1.3844864109039912e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5996/6790 [3:27:50<27:28,  2.08s/it] 88%|████████▊ | 5997/6790 [3:27:52<26:50,  2.03s/it]                                                     {'loss': 1.3652, 'learning_rate': 1.3810548690216563e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5997/6790 [3:27:52<26:50,  2.03s/it] 88%|████████▊ | 5998/6790 [3:27:54<28:29,  2.16s/it]                                                     {'loss': 1.3823, 'learning_rate': 1.377627432984545e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5998/6790 [3:27:54<28:29,  2.16s/it] 88%|████████▊ | 5999/6790 [3:27:56<26:26,  2.01s/it]                                                     {'loss': 1.1931, 'learning_rate': 1.3742041035484731e-05, 'epoch': 0.88}
+ 88%|████████▊ | 5999/6790 [3:27:56<26:26,  2.01s/it] 88%|████████▊ | 6000/6790 [3:28:00<33:31,  2.55s/it]                                                     {'loss': 1.296, 'learning_rate': 1.3707848814683611e-05, 'epoch': 0.88}
+ 88%|████████▊ | 6000/6790 [3:28:00<33:31,  2.55s/it]/home/aiops/duanky/miniconda3/envs/lora/lib/python3.11/site-packages/torch/utils/checkpoint.py:429: UserWarning: torch.utils.checkpoint: please pass in use_reentrant=True or use_reentrant=False explicitly. The default value of use_reentrant will be updated to be False in the future. To maintain current behavior, pass use_reentrant=True. It is recommended that you use use_reentrant=False. Refer to docs for more details on the differences between the two variants.
+  warnings.warn(
+ 88%|████████▊ | 6001/6790 [3:28:02<33:10,  2.52s/it]                                                     {'loss': 1.3183, 'learning_rate': 1.367369767498199e-05, 'epoch': 0.88}
+ 88%|████████▊ | 6001/6790 [3:28:02<33:10,  2.52s/it] 88%|████████▊ | 6002/6790 [3:28:04<31:06,  2.37s/it]                                                     {'loss': 1.5309, 'learning_rate': 1.3639587623911044e-05, 'epoch': 0.88}
+ 88%|████████▊ | 6002/6790 [3:28:04<31:06,  2.37s/it] 88%|████████▊ | 6003/6790 [3:28:06<29:50,  2.27s/it]                                                     {'loss': 1.2972, 'learning_rate': 1.3605518668992578e-05, 'epoch': 0.88}
+ 88%|████████▊ | 6003/6790 [3:28:06<29:50,  2.27s/it] 88%|████████▊ | 6004/6790 [3:28:08<28:52,  2.20s/it]                                                     {'loss': 1.5102, 'learning_rate': 1.357149081773954e-05, 'epoch': 0.88}
+ 88%|████████▊ | 6004/6790 [3:28:08<28:52,  2.20s/it] 88%|████████▊ | 6005/6790 [3:28:10<28:23,  2.17s/it]                                                     {'loss': 1.4409, 'learning_rate': 1.3537504077655728e-05, 'epoch': 0.88}
+ 88%|████████▊ | 6005/6790 [3:28:10<28:23,  2.17s/it] 88%|████████▊ | 6006/6790 [3:28:13<30:01,  2.30s/it]                                                     {'loss': 1.2483, 'learning_rate': 1.3503558456235899e-05, 'epoch': 0.88}
+ 88%|████████▊ | 6006/6790 [3:28:13<30:01,  2.30s/it] 88%|████████▊ | 6007/6790 [3:28:15<28:43,  2.20s/it]                                                     {'loss': 1.3373, 'learning_rate': 1.3469653960965711e-05, 'epoch': 0.88}
+ 88%|████████▊ | 6007/6790 [3:28:15<28:43,  2.20s/it] 88%|████████▊ | 6008/6790 [3:28:17<27:48,  2.13s/it]                                                     {'loss': 1.1267, 'learning_rate': 1.3435790599321784e-05, 'epoch': 0.88}
+ 88%|████████▊ | 6008/6790 [3:28:17<27:48,  2.13s/it] 88%|████████▊ | 6009/6790 [3:28:19<27:52,  2.14s/it]                                                     {'loss': 1.5564, 'learning_rate': 1.3401968378771657e-05, 'epoch': 0.88}
+ 88%|████████▊ | 6009/6790 [3:28:19<27:52,  2.14s/it] 89%|████████▊ | 6010/6790 [3:28:21<28:13,  2.17s/it]                                                     {'loss': 1.3073, 'learning_rate': 1.3368187306773827e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6010/6790 [3:28:21<28:13,  2.17s/it] 89%|████████▊ | 6011/6790 [3:28:23<27:27,  2.11s/it]                                                     {'loss': 1.5745, 'learning_rate': 1.3334447390777626e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6011/6790 [3:28:23<27:27,  2.11s/it] 89%|████████▊ | 6012/6790 [3:28:25<26:19,  2.03s/it]                                                     {'loss': 1.2862, 'learning_rate': 1.330074863822337e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6012/6790 [3:28:25<26:19,  2.03s/it] 89%|████████▊ | 6013/6790 [3:28:27<25:42,  1.99s/it]                                                     {'loss': 1.5602, 'learning_rate': 1.3267091056542425e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6013/6790 [3:28:27<25:42,  1.99s/it] 89%|████████▊ | 6014/6790 [3:28:29<27:21,  2.12s/it]                                                     {'loss': 1.3022, 'learning_rate': 1.3233474653156808e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6014/6790 [3:28:29<27:21,  2.12s/it] 89%|████████▊ | 6015/6790 [3:28:31<25:42,  1.99s/it]                                                     {'loss': 1.1716, 'learning_rate': 1.3199899435479678e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6015/6790 [3:28:31<25:42,  1.99s/it] 89%|████████▊ | 6016/6790 [3:28:33<26:16,  2.04s/it]                                                     {'loss': 1.2029, 'learning_rate': 1.3166365410915004e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6016/6790 [3:28:33<26:16,  2.04s/it] 89%|████████▊ | 6017/6790 [3:28:35<25:53,  2.01s/it]                                                     {'loss': 1.2752, 'learning_rate': 1.3132872586857736e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6017/6790 [3:28:35<25:53,  2.01s/it] 89%|████████▊ | 6018/6790 [3:28:37<27:01,  2.10s/it]                                                     {'loss': 1.4809, 'learning_rate': 1.3099420970693654e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6018/6790 [3:28:37<27:01,  2.10s/it] 89%|████████▊ | 6019/6790 [3:28:40<27:55,  2.17s/it]                                                     {'loss': 1.4996, 'learning_rate': 1.3066010569799503e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6019/6790 [3:28:40<27:55,  2.17s/it] 89%|████████▊ | 6020/6790 [3:28:42<26:19,  2.05s/it]                                                     {'loss': 1.4317, 'learning_rate': 1.3032641391542987e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6020/6790 [3:28:42<26:19,  2.05s/it] 89%|████████▊ | 6021/6790 [3:28:44<26:41,  2.08s/it]                                                     {'loss': 1.3436, 'learning_rate': 1.2999313443282646e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6021/6790 [3:28:44<26:41,  2.08s/it] 89%|████████▊ | 6022/6790 [3:28:46<25:58,  2.03s/it]                                                     {'loss': 1.3565, 'learning_rate': 1.2966026732367887e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6022/6790 [3:28:46<25:58,  2.03s/it] 89%|████████▊ | 6023/6790 [3:28:48<26:06,  2.04s/it]                                                     {'loss': 1.5771, 'learning_rate': 1.2932781266139216e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6023/6790 [3:28:48<26:06,  2.04s/it] 89%|████████▊ | 6024/6790 [3:28:50<28:52,  2.26s/it]                                                     {'loss': 1.3886, 'learning_rate': 1.2899577051927814e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6024/6790 [3:28:51<28:52,  2.26s/it] 89%|████████▊ | 6025/6790 [3:28:52<27:28,  2.15s/it]                                                     {'loss': 1.2588, 'learning_rate': 1.2866414097055913e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6025/6790 [3:28:52<27:28,  2.15s/it] 89%|█��██████▊ | 6026/6790 [3:28:55<27:41,  2.17s/it]                                                     {'loss': 1.5249, 'learning_rate': 1.2833292408836528e-05, 'epoch': 0.89}
+ 89%|████████▊ | 6026/6790 [3:28:55<27:41,  2.17s/it] 89%|████████▉ | 6027/6790 [3:28:57<26:40,  2.10s/it]                                                     {'loss': 1.4005, 'learning_rate': 1.2800211994573752e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6027/6790 [3:28:57<26:40,  2.10s/it] 89%|████████▉ | 6028/6790 [3:28:59<26:46,  2.11s/it]                                                     {'loss': 1.5441, 'learning_rate': 1.2767172861562394e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6028/6790 [3:28:59<26:46,  2.11s/it] 89%|████████▉ | 6029/6790 [3:29:01<25:56,  2.05s/it]                                                     {'loss': 1.2481, 'learning_rate': 1.2734175017088245e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6029/6790 [3:29:01<25:56,  2.05s/it] 89%|████████▉ | 6030/6790 [3:29:03<26:36,  2.10s/it]                                                     {'loss': 1.3557, 'learning_rate': 1.2701218468428e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6030/6790 [3:29:03<26:36,  2.10s/it] 89%|████████▉ | 6031/6790 [3:29:05<27:34,  2.18s/it]                                                     {'loss': 1.4935, 'learning_rate': 1.2668303222849242e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6031/6790 [3:29:05<27:34,  2.18s/it] 89%|████████▉ | 6032/6790 [3:29:07<27:03,  2.14s/it]                                                     {'loss': 1.3847, 'learning_rate': 1.2635429287610434e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6032/6790 [3:29:07<27:03,  2.14s/it] 89%|████████▉ | 6033/6790 [3:29:09<26:17,  2.08s/it]                                                     {'loss': 1.2128, 'learning_rate': 1.2602596669960843e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6033/6790 [3:29:09<26:17,  2.08s/it] 89%|████████▉ | 6034/6790 [3:29:11<26:20,  2.09s/it]                                                     {'loss': 1.2198, 'learning_rate': 1.2569805377140854e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6034/6790 [3:29:11<26:20,  2.09s/it] 89%|████████▉ | 6035/6790 [3:29:13<25:28,  2.02s/it]                                                     {'loss': 1.3439, 'learning_rate': 1.253705541638146e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6035/6790 [3:29:13<25:28,  2.02s/it] 89%|████████▉ | 6036/6790 [3:29:15<25:43,  2.05s/it]                                                     {'loss': 1.3738, 'learning_rate': 1.2504346794904753e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6036/6790 [3:29:15<25:43,  2.05s/it] 89%|████████▉ | 6037/6790 [3:29:17<25:26,  2.03s/it]                                                     {'loss': 1.5013, 'learning_rate': 1.2471679519923608e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6037/6790 [3:29:17<25:26,  2.03s/it] 89%|████████▉ | 6038/6790 [3:29:19<25:44,  2.05s/it]                                                     {'loss': 1.5349, 'learning_rate': 1.2439053598641837e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6038/6790 [3:29:19<25:44,  2.05s/it] 89%|████████▉ | 6039/6790 [3:29:21<25:23,  2.03s/it]                                                     {'loss': 1.5457, 'learning_rate': 1.2406469038254021e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6039/6790 [3:29:21<25:23,  2.03s/it] 89%|████████▉ | 6040/6790 [3:29:23<25:32,  2.04s/it]                                                     {'loss': 1.4353, 'learning_rate': 1.2373925845945766e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6040/6790 [3:29:23<25:32,  2.04s/it] 89%|████████▉ | 6041/6790 [3:29:25<25:15,  2.02s/it]                                                     {'loss': 1.5722, 'learning_rate': 1.2341424028893445e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6041/6790 [3:29:25<25:15,  2.02s/it] 89%|████████▉ | 6042/6790 [3:29:27<25:24,  2.04s/it]                                                     {'loss': 1.304, 'learning_rate': 1.2308963594264434e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6042/6790 [3:29:27<25:24,  2.04s/it] 89%|████████▉ | 6043/6790 [3:29:30<28:45,  2.31s/it]                                                     {'loss': 1.4227, 'learning_rate': 1.2276544549216806e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6043/6790 [3:29:30<28:45,  2.31s/it] 89%|████████▉ | 6044/6790 [3:29:32<27:31,  2.21s/it]                                                     {'loss': 1.203, 'learning_rate': 1.2244166900899624e-05, 'epoch': 0.89}
+ 89%|█████���██▉ | 6044/6790 [3:29:32<27:31,  2.21s/it] 89%|████████▉ | 6045/6790 [3:29:35<27:13,  2.19s/it]                                                     {'loss': 1.5185, 'learning_rate': 1.2211830656452817e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6045/6790 [3:29:35<27:13,  2.19s/it] 89%|████████▉ | 6046/6790 [3:29:37<27:17,  2.20s/it]                                                     {'loss': 1.6148, 'learning_rate': 1.2179535823007149e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6046/6790 [3:29:37<27:17,  2.20s/it] 89%|████████▉ | 6047/6790 [3:29:39<26:32,  2.14s/it]                                                     {'loss': 1.4269, 'learning_rate': 1.214728240768428e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6047/6790 [3:29:39<26:32,  2.14s/it] 89%|████████▉ | 6048/6790 [3:29:41<25:56,  2.10s/it]                                                     {'loss': 1.4953, 'learning_rate': 1.2115070417596741e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6048/6790 [3:29:41<25:56,  2.10s/it] 89%|████████▉ | 6049/6790 [3:29:43<25:44,  2.08s/it]                                                     {'loss': 1.3946, 'learning_rate': 1.2082899859847919e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6049/6790 [3:29:43<25:44,  2.08s/it] 89%|████████▉ | 6050/6790 [3:29:45<26:43,  2.17s/it]                                                     {'loss': 1.5025, 'learning_rate': 1.2050770741532003e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6050/6790 [3:29:45<26:43,  2.17s/it] 89%|████████▉ | 6051/6790 [3:29:47<25:35,  2.08s/it]                                                     {'loss': 1.214, 'learning_rate': 1.2018683069734126e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6051/6790 [3:29:47<25:35,  2.08s/it] 89%|████████▉ | 6052/6790 [3:29:49<25:34,  2.08s/it]                                                     {'loss': 1.2567, 'learning_rate': 1.1986636851530275e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6052/6790 [3:29:49<25:34,  2.08s/it] 89%|████████▉ | 6053/6790 [3:29:51<24:46,  2.02s/it]                                                     {'loss': 1.3292, 'learning_rate': 1.1954632093987284e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6053/6790 [3:29:51<24:46,  2.02s/it] 89%|████████▉ | 6054/6790 [3:29:53<25:34,  2.08s/it]                                                     {'loss': 1.2677, 'learning_rate': 1.192266880416275e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6054/6790 [3:29:53<25:34,  2.08s/it] 89%|████████▉ | 6055/6790 [3:29:55<25:44,  2.10s/it]                                                     {'loss': 1.3575, 'learning_rate': 1.1890746989105284e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6055/6790 [3:29:55<25:44,  2.10s/it] 89%|████████▉ | 6056/6790 [3:29:57<24:37,  2.01s/it]                                                     {'loss': 1.4696, 'learning_rate': 1.1858866655854273e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6056/6790 [3:29:57<24:37,  2.01s/it] 89%|████████▉ | 6057/6790 [3:29:59<24:47,  2.03s/it]                                                     {'loss': 1.6258, 'learning_rate': 1.1827027811439961e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6057/6790 [3:29:59<24:47,  2.03s/it] 89%|████████▉ | 6058/6790 [3:30:01<24:01,  1.97s/it]                                                     {'loss': 1.4852, 'learning_rate': 1.1795230462883377e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6058/6790 [3:30:01<24:01,  1.97s/it] 89%|████████▉ | 6059/6790 [3:30:03<24:50,  2.04s/it]                                                     {'loss': 1.3161, 'learning_rate': 1.1763474617196556e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6059/6790 [3:30:03<24:50,  2.04s/it] 89%|████████▉ | 6060/6790 [3:30:06<26:59,  2.22s/it]                                                     {'loss': 1.3943, 'learning_rate': 1.1731760281382232e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6060/6790 [3:30:06<26:59,  2.22s/it] 89%|████████▉ | 6061/6790 [3:30:08<25:46,  2.12s/it]                                                     {'loss': 1.4236, 'learning_rate': 1.1700087462434073e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6061/6790 [3:30:08<25:46,  2.12s/it] 89%|████████▉ | 6062/6790 [3:30:10<24:39,  2.03s/it]                                                     {'loss': 1.4432, 'learning_rate': 1.1668456167336539e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6062/6790 [3:30:10<24:39,  2.03s/it] 89%|████████▉ | 6063/6790 [3:30:12<25:15,  2.08s/it]                                                     {'loss': 1.4954, 'learning_rate': 1.163686640306496e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6063/6790 [3:30:12<25:15,  2.08s/it] 89%|████████▉ | 6064/6790 [3:30:14<25:18,  2.09s/it]                                                     {'loss': 1.4048, 'learning_rate': 1.1605318176585522e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6064/6790 [3:30:14<25:18,  2.09s/it] 89%|████████▉ | 6065/6790 [3:30:16<24:53,  2.06s/it]                                                     {'loss': 1.5591, 'learning_rate': 1.1573811494855192e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6065/6790 [3:30:16<24:53,  2.06s/it] 89%|████████▉ | 6066/6790 [3:30:18<25:06,  2.08s/it]                                                     {'loss': 1.3389, 'learning_rate': 1.1542346364821877e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6066/6790 [3:30:18<25:06,  2.08s/it] 89%|████████▉ | 6067/6790 [3:30:20<24:24,  2.03s/it]                                                     {'loss': 1.4161, 'learning_rate': 1.1510922793424205e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6067/6790 [3:30:20<24:24,  2.03s/it] 89%|████████▉ | 6068/6790 [3:30:22<24:24,  2.03s/it]                                                     {'loss': 1.518, 'learning_rate': 1.1479540787591702e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6068/6790 [3:30:22<24:24,  2.03s/it] 89%|████████▉ | 6069/6790 [3:30:24<24:53,  2.07s/it]                                                     {'loss': 1.3934, 'learning_rate': 1.1448200354244742e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6069/6790 [3:30:24<24:53,  2.07s/it] 89%|████████▉ | 6070/6790 [3:30:27<26:01,  2.17s/it]                                                     {'loss': 1.4526, 'learning_rate': 1.141690150029453e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6070/6790 [3:30:27<26:01,  2.17s/it] 89%|████████▉ | 6071/6790 [3:30:29<25:58,  2.17s/it]                                                     {'loss': 1.4228, 'learning_rate': 1.1385644232643012e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6071/6790 [3:30:29<25:58,  2.17s/it] 89%|████████▉ | 6072/6790 [3:30:31<26:24,  2.21s/it]                                                     {'loss': 1.5928, 'learning_rate': 1.1354428558183071e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6072/6790 [3:30:31<26:24,  2.21s/it] 89%|████████▉ | 6073/6790 [3:30:33<25:48,  2.16s/it]                                                     {'loss': 1.3269, 'learning_rate': 1.1323254483798385e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6073/6790 [3:30:33<25:48,  2.16s/it] 89%|████████▉ | 6074/6790 [3:30:35<25:11,  2.11s/it]                                                     {'loss': 1.4109, 'learning_rate': 1.129212201636347e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6074/6790 [3:30:35<25:11,  2.11s/it] 89%|████████▉ | 6075/6790 [3:30:37<25:07,  2.11s/it]                                                     {'loss': 1.3357, 'learning_rate': 1.1261031162743617e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6075/6790 [3:30:37<25:07,  2.11s/it] 89%|████████▉ | 6076/6790 [3:30:39<24:37,  2.07s/it]                                                     {'loss': 1.5121, 'learning_rate': 1.1229981929794985e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6076/6790 [3:30:39<24:37,  2.07s/it] 89%|████████▉ | 6077/6790 [3:30:41<25:04,  2.11s/it]                                                     {'loss': 1.6872, 'learning_rate': 1.1198974324364541e-05, 'epoch': 0.89}
+ 89%|████████▉ | 6077/6790 [3:30:41<25:04,  2.11s/it] 90%|████████▉ | 6078/6790 [3:30:44<26:09,  2.20s/it]                                                     {'loss': 1.3467, 'learning_rate': 1.1168008353290104e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6078/6790 [3:30:44<26:09,  2.20s/it] 90%|████████▉ | 6079/6790 [3:30:46<25:26,  2.15s/it]                                                     {'loss': 1.43, 'learning_rate': 1.113708402340019e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6079/6790 [3:30:46<25:26,  2.15s/it] 90%|████████▉ | 6080/6790 [3:30:48<26:56,  2.28s/it]                                                     {'loss': 1.5412, 'learning_rate': 1.1106201341514321e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6080/6790 [3:30:48<26:56,  2.28s/it] 90%|████████▉ | 6081/6790 [3:30:50<25:30,  2.16s/it]                                                     {'loss': 1.3471, 'learning_rate': 1.107536031444274e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6081/6790 [3:30:50<25:30,  2.16s/it] 90%|████████▉ | 6082/6790 [3:30:52<24:05,  2.04s/it]                                                     {'loss': 1.3194, 'learning_rate': 1.1044560948986449e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6082/6790 [3:30:52<24:05,  2.04s/it] 90%|████████▉ | 6083/6790 [3:30:55<26:14,  2.23s/it]                                                     {'loss': 1.1874, 'learning_rate': 1.1013803251937327e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6083/6790 [3:30:55<26:14,  2.23s/it] 90%|████████▉ | 6084/6790 [3:30:57<25:19,  2.15s/it]                                                     {'loss': 1.3295, 'learning_rate': 1.0983087230078082e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6084/6790 [3:30:57<25:19,  2.15s/it] 90%|████████▉ | 6085/6790 [3:30:59<24:58,  2.12s/it]                                                     {'loss': 1.5278, 'learning_rate': 1.0952412890182206e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6085/6790 [3:30:59<24:58,  2.12s/it] 90%|████████▉ | 6086/6790 [3:31:01<24:47,  2.11s/it]                                                     {'loss': 1.4826, 'learning_rate': 1.0921780239013934e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6086/6790 [3:31:01<24:47,  2.11s/it] 90%|████████▉ | 6087/6790 [3:31:03<23:59,  2.05s/it]                                                     {'loss': 1.3879, 'learning_rate': 1.089118928332844e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6087/6790 [3:31:03<23:59,  2.05s/it] 90%|████████▉ | 6088/6790 [3:31:05<24:09,  2.06s/it]                                                     {'loss': 1.2476, 'learning_rate': 1.0860640029871594e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6088/6790 [3:31:05<24:09,  2.06s/it] 90%|████████▉ | 6089/6790 [3:31:07<24:15,  2.08s/it]                                                     {'loss': 1.5308, 'learning_rate': 1.083013248538014e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6089/6790 [3:31:07<24:15,  2.08s/it] 90%|████████▉ | 6090/6790 [3:31:09<24:03,  2.06s/it]                                                     {'loss': 1.0738, 'learning_rate': 1.0799666656581543e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6090/6790 [3:31:09<24:03,  2.06s/it] 90%|████████▉ | 6091/6790 [3:31:11<24:23,  2.09s/it]                                                     {'loss': 1.3972, 'learning_rate': 1.0769242550194203e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6091/6790 [3:31:11<24:23,  2.09s/it] 90%|████████▉ | 6092/6790 [3:31:13<23:55,  2.06s/it]                                                     {'loss': 1.5339, 'learning_rate': 1.0738860172927157e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6092/6790 [3:31:13<23:55,  2.06s/it] 90%|████████▉ | 6093/6790 [3:31:15<23:32,  2.03s/it]                                                     {'loss': 1.2741, 'learning_rate': 1.0708519531480355e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6093/6790 [3:31:15<23:32,  2.03s/it] 90%|████████▉ | 6094/6790 [3:31:17<23:12,  2.00s/it]                                                     {'loss': 1.4253, 'learning_rate': 1.0678220632544512e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6094/6790 [3:31:17<23:12,  2.00s/it] 90%|████████▉ | 6095/6790 [3:31:19<23:12,  2.00s/it]                                                     {'loss': 1.3688, 'learning_rate': 1.0647963482801149e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6095/6790 [3:31:19<23:12,  2.00s/it] 90%|████████▉ | 6096/6790 [3:31:21<23:12,  2.01s/it]                                                     {'loss': 1.4021, 'learning_rate': 1.0617748088922508e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6096/6790 [3:31:21<23:12,  2.01s/it] 90%|████████▉ | 6097/6790 [3:31:23<23:08,  2.00s/it]                                                     {'loss': 1.311, 'learning_rate': 1.0587574457571703e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6097/6790 [3:31:23<23:08,  2.00s/it] 90%|████████▉ | 6098/6790 [3:31:25<23:18,  2.02s/it]                                                     {'loss': 1.3096, 'learning_rate': 1.0557442595402677e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6098/6790 [3:31:25<23:18,  2.02s/it] 90%|████████▉ | 6099/6790 [3:31:27<22:57,  1.99s/it]                                                     {'loss': 1.2817, 'learning_rate': 1.0527352509060007e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6099/6790 [3:31:27<22:57,  1.99s/it] 90%|████████▉ | 6100/6790 [3:31:29<22:24,  1.95s/it]                                                     {'loss': 1.4517, 'learning_rate': 1.0497304205179248e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6100/6790 [3:31:29<22:24,  1.95s/it] 90%|████████▉ | 6101/6790 [3:31:31<21:39,  1.89s/it]                                                     {'loss': 1.2741, 'learning_rate': 1.0467297690386524e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6101/6790 [3:31:31<21:39,  1.89s/it] 90%|████████▉ | 6102/6790 [3:31:33<24:26,  2.13s/it]                                                     {'loss': 1.3617, 'learning_rate': 1.0437332971298986e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6102/6790 [3:31:33<24:26,  2.13s/it] 90%|████████▉ | 6103/6790 [3:31:35<24:31,  2.14s/it]                                                     {'loss': 1.3964, 'learning_rate': 1.0407410054524368e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6103/6790 [3:31:35<24:31,  2.14s/it] 90%|████████▉ | 6104/6790 [3:31:37<24:09,  2.11s/it]                                                     {'loss': 1.0664, 'learning_rate': 1.0377528946661286e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6104/6790 [3:31:37<24:09,  2.11s/it] 90%|████████▉ | 6105/6790 [3:31:39<23:17,  2.04s/it]                                                     {'loss': 1.348, 'learning_rate': 1.034768965429913e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6105/6790 [3:31:39<23:17,  2.04s/it] 90%|████████▉ | 6106/6790 [3:31:41<22:45,  2.00s/it]                                                     {'loss': 1.3209, 'learning_rate': 1.0317892184018063e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6106/6790 [3:31:41<22:45,  2.00s/it] 90%|████████▉ | 6107/6790 [3:31:44<23:42,  2.08s/it]                                                     {'loss': 1.3156, 'learning_rate': 1.028813654238896e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6107/6790 [3:31:44<23:42,  2.08s/it] 90%|████████▉ | 6108/6790 [3:31:46<23:58,  2.11s/it]                                                     {'loss': 1.3621, 'learning_rate': 1.0258422735973572e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6108/6790 [3:31:46<23:58,  2.11s/it] 90%|████████▉ | 6109/6790 [3:31:48<23:54,  2.11s/it]                                                     {'loss': 1.1599, 'learning_rate': 1.022875077132437e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6109/6790 [3:31:48<23:54,  2.11s/it] 90%|████████▉ | 6110/6790 [3:31:50<23:18,  2.06s/it]                                                     {'loss': 1.2182, 'learning_rate': 1.0199120654984628e-05, 'epoch': 0.9}
+ 90%|████████▉ | 6110/6790 [3:31:50<23:18,  2.06s/it] 90%|█████████ | 6111/6790 [3:31:52<23:38,  2.09s/it]                                                     {'loss': 1.4958, 'learning_rate': 1.01695323934883e-05, 'epoch': 0.9}
+ 90%|█████████ | 6111/6790 [3:31:52<23:38,  2.09s/it] 90%|█████████ | 6112/6790 [3:31:54<23:20,  2.07s/it]                                                     {'loss': 1.2467, 'learning_rate': 1.0139985993360301e-05, 'epoch': 0.9}
+ 90%|█████████ | 6112/6790 [3:31:54<23:20,  2.07s/it] 90%|█████████ | 6113/6790 [3:31:56<24:35,  2.18s/it]                                                     {'loss': 1.1397, 'learning_rate': 1.0110481461116084e-05, 'epoch': 0.9}
+ 90%|█████████ | 6113/6790 [3:31:56<24:35,  2.18s/it] 90%|█████████ | 6114/6790 [3:31:58<24:14,  2.15s/it]                                                     {'loss': 1.4962, 'learning_rate': 1.0081018803262043e-05, 'epoch': 0.9}
+ 90%|█████████ | 6114/6790 [3:31:58<24:14,  2.15s/it] 90%|█████████ | 6115/6790 [3:32:00<23:17,  2.07s/it]                                                     {'loss': 1.5253, 'learning_rate': 1.005159802629525e-05, 'epoch': 0.9}
+ 90%|█████████ | 6115/6790 [3:32:00<23:17,  2.07s/it] 90%|█████████ | 6116/6790 [3:32:02<22:11,  1.97s/it]                                                     {'loss': 1.2267, 'learning_rate': 1.0022219136703581e-05, 'epoch': 0.9}
+ 90%|█████████ | 6116/6790 [3:32:02<22:11,  1.97s/it] 90%|█████████ | 6117/6790 [3:32:04<22:26,  2.00s/it]                                                     {'loss': 1.3291, 'learning_rate': 9.992882140965698e-06, 'epoch': 0.9}
+ 90%|█████████ | 6117/6790 [3:32:04<22:26,  2.00s/it] 90%|█████████ | 6118/6790 [3:32:06<22:51,  2.04s/it]                                                     {'loss': 1.3846, 'learning_rate': 9.963587045550915e-06, 'epoch': 0.9}
+ 90%|█████████ | 6118/6790 [3:32:06<22:51,  2.04s/it] 90%|█████████ | 6119/6790 [3:32:08<23:20,  2.09s/it]                                                     {'loss': 1.2652, 'learning_rate': 9.934333856919398e-06, 'epoch': 0.9}
+ 90%|█████████ | 6119/6790 [3:32:08<23:20,  2.09s/it] 90%|█████████ | 6120/6790 [3:32:10<22:59,  2.06s/it]                                                     {'loss': 1.4226, 'learning_rate': 9.905122581522075e-06, 'epoch': 0.9}
+ 90%|█████████ | 6120/6790 [3:32:10<22:59,  2.06s/it] 90%|█████████ | 6121/6790 [3:32:12<22:00,  1.97s/it]                                                     {'loss': 1.46, 'learning_rate': 9.875953225800638e-06, 'epoch': 0.9}
+ 90%|█████████ | 6121/6790 [3:32:12<22:00,  1.97s/it] 90%|█████████ | 6122/6790 [3:32:15<25:52,  2.32s/it]                                                     {'loss': 1.1499, 'learning_rate': 9.846825796187408e-06, 'epoch': 0.9}
+ 90%|█████████ | 6122/6790 [3:32:15<25:52,  2.32s/it] 90%|█████████ | 6123/6790 [3:32:17<24:27,  2.20s/it]                                                     {'loss': 1.5245, 'learning_rate': 9.81774029910567e-06, 'epoch': 0.9}
+ 90%|█████████ | 6123/6790 [3:32:17<24:27,  2.20s/it] 90%|█████████ | 6124/6790 [3:32:19<23:45,  2.14s/it]                                                     {'loss': 1.5447, 'learning_rate': 9.788696740969295e-06, 'epoch': 0.9}
+ 90%|█████████ | 6124/6790 [3:32:19<23:45,  2.14s/it] 90%|█████████ | 6125/6790 [3:32:21<22:49,  2.06s/it]                                                     {'loss': 1.3237, 'learning_rate': 9.759695128182955e-06, 'epoch': 0.9}
+ 90%|█████████ | 6125/6790 [3:32:21<22:49,  2.06s/it] 90%|█████████ | 6126/6790 [3:32:23<22:56,  2.07s/it]                                                     {'loss': 1.4228, 'learning_rate': 9.730735467142093e-06, 'epoch': 0.9}
+ 90%|█████████ | 6126/6790 [3:32:23<22:56,  2.07s/it] 90%|█████████ | 6127/6790 [3:32:25<22:40,  2.05s/it]                                                     {'loss': 1.569, 'learning_rate': 9.701817764232913e-06, 'epoch': 0.9}
+ 90%|█████████ | 6127/6790 [3:32:25<22:40,  2.05s/it] 90%|█████████ | 6128/6790 [3:32:27<22:29,  2.04s/it]                                                     {'loss': 1.379, 'learning_rate': 9.672942025832287e-06, 'epoch': 0.9}
+ 90%|█████████ | 6128/6790 [3:32:27<22:29,  2.04s/it] 90%|█████████ | 6129/6790 [3:32:30<23:31,  2.14s/it]                                                     {'loss': 1.3567, 'learning_rate': 9.644108258307905e-06, 'epoch': 0.9}
+ 90%|█████████ | 6129/6790 [3:32:30<23:31,  2.14s/it] 90%|█████████ | 6130/6790 [3:32:31<22:28,  2.04s/it]                                                     {'loss': 1.1963, 'learning_rate': 9.615316468018187e-06, 'epoch': 0.9}
+ 90%|█████████ | 6130/6790 [3:32:31<22:28,  2.04s/it] 90%|█████████ | 6131/6790 [3:32:34<24:40,  2.25s/it]                                                     {'loss': 1.3879, 'learning_rate': 9.586566661312279e-06, 'epoch': 0.9}
+ 90%|█████████ | 6131/6790 [3:32:34<24:40,  2.25s/it] 90%|█████████ | 6132/6790 [3:32:36<23:58,  2.19s/it]                                                     {'loss': 1.4914, 'learning_rate': 9.557858844530153e-06, 'epoch': 0.9}
+ 90%|█████████ | 6132/6790 [3:32:36<23:58,  2.19s/it] 90%|█████████ | 6133/6790 [3:32:38<23:21,  2.13s/it]                                                     {'loss': 1.1638, 'learning_rate': 9.529193024002325e-06, 'epoch': 0.9}
+ 90%|█████████ | 6133/6790 [3:32:38<23:21,  2.13s/it] 90%|█████████ | 6134/6790 [3:32:40<22:40,  2.07s/it]                                                     {'loss': 1.2894, 'learning_rate': 9.500569206050292e-06, 'epoch': 0.9}
+ 90%|█████████ | 6134/6790 [3:32:40<22:40,  2.07s/it] 90%|█████████ | 6135/6790 [3:32:42<21:46,  2.00s/it]                                                     {'loss': 1.2984, 'learning_rate': 9.471987396986093e-06, 'epoch': 0.9}
+ 90%|█████████ | 6135/6790 [3:32:42<21:46,  2.00s/it] 90%|█████████ | 6136/6790 [3:32:44<22:24,  2.06s/it]                                                     {'loss': 1.4343, 'learning_rate': 9.443447603112599e-06, 'epoch': 0.9}
+ 90%|█████████ | 6136/6790 [3:32:44<22:24,  2.06s/it] 90%|█████████ | 6137/6790 [3:32:46<22:11,  2.04s/it]                                                     {'loss': 1.3298, 'learning_rate': 9.414949830723419e-06, 'epoch': 0.9}
+ 90%|█████████ | 6137/6790 [3:32:46<22:11,  2.04s/it] 90%|█████████ | 6138/6790 [3:32:48<22:55,  2.11s/it]                                                     {'loss': 1.4269, 'learning_rate': 9.386494086102882e-06, 'epoch': 0.9}
+ 90%|█████████ | 6138/6790 [3:32:48<22:55,  2.11s/it] 90%|█████████ | 6139/6790 [3:32:51<22:56,  2.11s/it]                                                     {'loss': 1.4037, 'learning_rate': 9.358080375526012e-06, 'epoch': 0.9}
+ 90%|█████████ | 6139/6790 [3:32:51<22:56,  2.11s/it] 90%|█████████ | 6140/6790 [3:32:53<22:22,  2.07s/it]                                                     {'loss': 1.2103, 'learning_rate': 9.3297087052586e-06, 'epoch': 0.9}
+ 90%|█████████ | 6140/6790 [3:32:53<22:22,  2.07s/it] 90%|█████████ | 6141/6790 [3:32:55<23:38,  2.19s/it]                                                     {'loss': 1.4336, 'learning_rate': 9.301379081557172e-06, 'epoch': 0.9}
+ 90%|█████████ | 6141/6790 [3:32:55<23:38,  2.19s/it] 90%|█████████ | 6142/6790 [3:32:57<22:29,  2.08s/it]                                                     {'loss': 1.546, 'learning_rate': 9.273091510668974e-06, 'epoch': 0.9}
+ 90%|█████████ | 6142/6790 [3:32:57<22:29,  2.08s/it] 90%|█████████ | 6143/6790 [3:32:59<22:29,  2.09s/it]                                                     {'loss': 1.4603, 'learning_rate': 9.24484599883193e-06, 'epoch': 0.9}
+ 90%|█████████ | 6143/6790 [3:32:59<22:29,  2.09s/it] 90%|█████████ | 6144/6790 [3:33:01<22:54,  2.13s/it]                                                     {'loss': 1.3368, 'learning_rate': 9.216642552274812e-06, 'epoch': 0.9}
+ 90%|█████████ | 6144/6790 [3:33:01<22:54,  2.13s/it] 91%|█████████ | 6145/6790 [3:33:03<23:21,  2.17s/it]                                                     {'loss': 1.4669, 'learning_rate': 9.188481177216956e-06, 'epoch': 0.91}
+ 91%|█████████ | 6145/6790 [3:33:03<23:21,  2.17s/it] 91%|█████████ | 6146/6790 [3:33:05<22:07,  2.06s/it]                                                     {'loss': 1.1892, 'learning_rate': 9.160361879868574e-06, 'epoch': 0.91}
+ 91%|█████████ | 6146/6790 [3:33:05<22:07,  2.06s/it] 91%|█████████ | 6147/6790 [3:33:08<22:48,  2.13s/it]                                                     {'loss': 1.4003, 'learning_rate': 9.132284666430414e-06, 'epoch': 0.91}
+ 91%|█████████ | 6147/6790 [3:33:08<22:48,  2.13s/it] 91%|█████████ | 6148/6790 [3:33:10<22:31,  2.10s/it]                                                     {'loss': 1.3074, 'learning_rate': 9.104249543094189e-06, 'epoch': 0.91}
+ 91%|█████████ | 6148/6790 [3:33:10<22:31,  2.10s/it] 91%|█████████ | 6149/6790 [3:33:12<22:15,  2.08s/it]                                                     {'loss': 1.3539, 'learning_rate': 9.07625651604216e-06, 'epoch': 0.91}
+ 91%|█████████ | 6149/6790 [3:33:12<22:15,  2.08s/it] 91%|█████████ | 6150/6790 [3:33:14<22:09,  2.08s/it]                                                     {'loss': 1.4183, 'learning_rate': 9.048305591447293e-06, 'epoch': 0.91}
+ 91%|█████████ | 6150/6790 [3:33:14<22:09,  2.08s/it] 91%|█████████ | 6151/6790 [3:33:16<23:15,  2.18s/it]                                                     {'loss': 1.3564, 'learning_rate': 9.020396775473327e-06, 'epoch': 0.91}
+ 91%|█████████ | 6151/6790 [3:33:16<23:15,  2.18s/it] 91%|█████████ | 6152/6790 [3:33:18<23:04,  2.17s/it]                                                     {'loss': 1.5292, 'learning_rate': 8.992530074274763e-06, 'epoch': 0.91}
+ 91%|█████████ | 6152/6790 [3:33:18<23:04,  2.17s/it] 91%|█████████ | 6153/6790 [3:33:20<22:29,  2.12s/it]                                                     {'loss': 1.306, 'learning_rate': 8.964705493996728e-06, 'epoch': 0.91}
+ 91%|█████████ | 6153/6790 [3:33:20<22:29,  2.12s/it] 91%|█████████ | 6154/6790 [3:33:22<21:47,  2.06s/it]                                                     {'loss': 1.4733, 'learning_rate': 8.936923040775047e-06, 'epoch': 0.91}
+ 91%|█████████ | 6154/6790 [3:33:22<21:47,  2.06s/it] 91%|█████████ | 6155/6790 [3:33:24<21:23,  2.02s/it]                                                     {'loss': 1.2919, 'learning_rate': 8.909182720736398e-06, 'epoch': 0.91}
+ 91%|█████████ | 6155/6790 [3:33:24<21:23,  2.02s/it] 91%|█████████ | 6156/6790 [3:33:26<20:55,  1.98s/it]                                                     {'loss': 1.3738, 'learning_rate': 8.881484539997997e-06, 'epoch': 0.91}
+ 91%|█████████ | 6156/6790 [3:33:26<20:55,  1.98s/it] 91%|█████████ | 6157/6790 [3:33:28<21:11,  2.01s/it]                                                     {'loss': 1.4029, 'learning_rate': 8.853828504667827e-06, 'epoch': 0.91}
+ 91%|█████████ | 6157/6790 [3:33:28<21:11,  2.01s/it] 91%|█████████ | 6158/6790 [3:33:30<21:00,  1.99s/it]                                                     {'loss': 1.395, 'learning_rate': 8.826214620844652e-06, 'epoch': 0.91}
+ 91%|█████████ | 6158/6790 [3:33:30<21:00,  1.99s/it] 91%|█████████ | 6159/6790 [3:33:32<20:53,  1.99s/it]                                                     {'loss': 1.4974, 'learning_rate': 8.798642894617848e-06, 'epoch': 0.91}
+ 91%|█████████ | 6159/6790 [3:33:32<20:53,  1.99s/it] 91%|█████████ | 6160/6790 [3:33:34<20:25,  1.95s/it]                                                     {'loss': 1.303, 'learning_rate': 8.771113332067504e-06, 'epoch': 0.91}
+ 91%|█████████ | 6160/6790 [3:33:34<20:25,  1.95s/it] 91%|█████████ | 6161/6790 [3:33:36<21:11,  2.02s/it]                                                     {'loss': 1.2779, 'learning_rate': 8.743625939264454e-06, 'epoch': 0.91}
+ 91%|█████████ | 6161/6790 [3:33:36<21:11,  2.02s/it] 91%|█████████ | 6162/6790 [3:33:38<21:08,  2.02s/it]                                                     {'loss': 1.3269, 'learning_rate': 8.716180722270207e-06, 'epoch': 0.91}
+ 91%|█████████ | 6162/6790 [3:33:38<21:08,  2.02s/it] 91%|█████████ | 6163/6790 [3:33:40<20:30,  1.96s/it]                                                     {'loss': 1.2134, 'learning_rate': 8.688777687137006e-06, 'epoch': 0.91}
+ 91%|█████████ | 6163/6790 [3:33:40<20:30,  1.96s/it] 91%|█████████ | 6164/6790 [3:33:42<21:38,  2.07s/it]                                                     {'loss': 1.5152, 'learning_rate': 8.66141683990771e-06, 'epoch': 0.91}
+ 91%|█████████ | 6164/6790 [3:33:42<21:38,  2.07s/it] 91%|█████████ | 6165/6790 [3:33:44<21:39,  2.08s/it]                                                     {'loss': 1.3824, 'learning_rate': 8.634098186615936e-06, 'epoch': 0.91}
+ 91%|█████████ | 6165/6790 [3:33:44<21:39,  2.08s/it] 91%|█████████ | 6166/6790 [3:33:46<20:50,  2.00s/it]                                                     {'loss': 1.2609, 'learning_rate': 8.60682173328604e-06, 'epoch': 0.91}
+ 91%|█████████ | 6166/6790 [3:33:46<20:50,  2.00s/it] 91%|█████████ | 6167/6790 [3:33:48<20:37,  1.99s/it]                                                     {'loss': 1.3841, 'learning_rate': 8.57958748593295e-06, 'epoch': 0.91}
+ 91%|█████████ | 6167/6790 [3:33:48<20:37,  1.99s/it] 91%|█████████ | 6168/6790 [3:33:50<20:46,  2.00s/it]                                                     {'loss': 1.4032, 'learning_rate': 8.552395450562389e-06, 'epoch': 0.91}
+ 91%|█████████ | 6168/6790 [3:33:50<20:46,  2.00s/it] 91%|█████████ | 6169/6790 [3:33:52<20:30,  1.98s/it]                                                     {'loss': 1.4072, 'learning_rate': 8.52524563317072e-06, 'epoch': 0.91}
+ 91%|█████████ | 6169/6790 [3:33:52<20:30,  1.98s/it] 91%|█████████ | 6170/6790 [3:33:55<23:01,  2.23s/it]                                                     {'loss': 1.2539, 'learning_rate': 8.498138039745085e-06, 'epoch': 0.91}
+ 91%|█████████ | 6170/6790 [3:33:55<23:01,  2.23s/it] 91%|█████████ | 6171/6790 [3:33:57<22:10,  2.15s/it]                                                     {'loss': 1.3413, 'learning_rate': 8.471072676263125e-06, 'epoch': 0.91}
+ 91%|█████████ | 6171/6790 [3:33:57<22:10,  2.15s/it] 91%|█████████ | 6172/6790 [3:33:59<23:33,  2.29s/it]                                                     {'loss': 1.2056, 'learning_rate': 8.444049548693377e-06, 'epoch': 0.91}
+ 91%|█████████ | 6172/6790 [3:33:59<23:33,  2.29s/it] 91%|█████████ | 6173/6790 [3:34:01<22:21,  2.17s/it]                                                     {'loss': 1.3814, 'learning_rate': 8.417068662994943e-06, 'epoch': 0.91}
+ 91%|█████████ | 6173/6790 [3:34:01<22:21,  2.17s/it] 91%|█████████ | 6174/6790 [3:34:03<22:04,  2.15s/it]                                                     {'loss': 1.4014, 'learning_rate': 8.390130025117659e-06, 'epoch': 0.91}
+ 91%|█████████ | 6174/6790 [3:34:03<22:04,  2.15s/it] 91%|█████████ | 6175/6790 [3:34:06<22:00,  2.15s/it]                                                     {'loss': 1.5039, 'learning_rate': 8.363233641002e-06, 'epoch': 0.91}
+ 91%|█████████ | 6175/6790 [3:34:06<22:00,  2.15s/it] 91%|█████████ | 6176/6790 [3:34:08<21:34,  2.11s/it]                                                     {'loss': 1.4837, 'learning_rate': 8.336379516579151e-06, 'epoch': 0.91}
+ 91%|█████████ | 6176/6790 [3:34:08<21:34,  2.11s/it] 91%|█████████ | 6177/6790 [3:34:10<22:33,  2.21s/it]                                                     {'loss': 1.4441, 'learning_rate': 8.309567657771e-06, 'epoch': 0.91}
+ 91%|█████████ | 6177/6790 [3:34:10<22:33,  2.21s/it] 91%|█████████ | 6178/6790 [3:34:12<22:53,  2.24s/it]                                                     {'loss': 1.5073, 'learning_rate': 8.282798070490105e-06, 'epoch': 0.91}
+ 91%|█████████ | 6178/6790 [3:34:12<22:53,  2.24s/it] 91%|█████████ | 6179/6790 [3:34:15<24:15,  2.38s/it]                                                     {'loss': 1.212, 'learning_rate': 8.25607076063959e-06, 'epoch': 0.91}
+ 91%|█████████ | 6179/6790 [3:34:15<24:15,  2.38s/it] 91%|█████████ | 6180/6790 [3:34:17<23:32,  2.32s/it]                                                     {'loss': 1.3807, 'learning_rate': 8.229385734113515e-06, 'epoch': 0.91}
+ 91%|█████████ | 6180/6790 [3:34:17<23:32,  2.32s/it] 91%|█████████ | 6181/6790 [3:34:19<22:03,  2.17s/it]                                                     {'loss': 1.312, 'learning_rate': 8.202742996796331e-06, 'epoch': 0.91}
+ 91%|█████████ | 6181/6790 [3:34:19<22:03,  2.17s/it] 91%|█████████ | 6182/6790 [3:34:21<21:07,  2.08s/it]                                                     {'loss': 1.318, 'learning_rate': 8.176142554563315e-06, 'epoch': 0.91}
+ 91%|█████████ | 6182/6790 [3:34:21<21:07,  2.08s/it] 91%|█████████ | 6183/6790 [3:34:24<22:42,  2.24s/it]                                                     {'loss': 1.2976, 'learning_rate': 8.14958441328042e-06, 'epoch': 0.91}
+ 91%|█████████ | 6183/6790 [3:34:24<22:42,  2.24s/it] 91%|█████████ | 6184/6790 [3:34:26<21:48,  2.16s/it]                                                     {'loss': 1.3071, 'learning_rate': 8.123068578804206e-06, 'epoch': 0.91}
+ 91%|█████████ | 6184/6790 [3:34:26<21:48,  2.16s/it] 91%|█████████ | 6185/6790 [3:34:28<21:55,  2.17s/it]                                                     {'loss': 1.3715, 'learning_rate': 8.096595056981993e-06, 'epoch': 0.91}
+ 91%|█████████ | 6185/6790 [3:34:28<21:55,  2.17s/it] 91%|█████████ | 6186/6790 [3:34:31<24:00,  2.39s/it]                                                     {'loss': 1.3279, 'learning_rate': 8.070163853651602e-06, 'epoch': 0.91}
+ 91%|█████████ | 6186/6790 [3:34:31<24:00,  2.39s/it] 91%|█████████ | 6187/6790 [3:34:32<22:23,  2.23s/it]                                                     {'loss': 1.2037, 'learning_rate': 8.043774974641793e-06, 'epoch': 0.91}
+ 91%|█████████ | 6187/6790 [3:34:32<22:23,  2.23s/it] 91%|█████████ | 6188/6790 [3:34:34<21:23,  2.13s/it]                                                     {'loss': 1.3077, 'learning_rate': 8.017428425771711e-06, 'epoch': 0.91}
+ 91%|█████████ | 6188/6790 [3:34:34<21:23,  2.13s/it] 91%|█████████ | 6189/6790 [3:34:36<20:24,  2.04s/it]                                                     {'loss': 1.3069, 'learning_rate': 7.991124212851353e-06, 'epoch': 0.91}
+ 91%|█████████ | 6189/6790 [3:34:36<20:24,  2.04s/it] 91%|█████████ | 6190/6790 [3:34:39<21:27,  2.15s/it]                                                     {'loss': 1.3007, 'learning_rate': 7.964862341681256e-06, 'epoch': 0.91}
+ 91%|█████████ | 6190/6790 [3:34:39<21:27,  2.15s/it] 91%|█████████ | 6191/6790 [3:34:40<20:33,  2.06s/it]                                                     {'loss': 1.3152, 'learning_rate': 7.938642818052766e-06, 'epoch': 0.91}
+ 91%|█████████ | 6191/6790 [3:34:40<20:33,  2.06s/it] 91%|█████████ | 6192/6790 [3:34:42<20:30,  2.06s/it]                                                     {'loss': 1.3218, 'learning_rate': 7.912465647747747e-06, 'epoch': 0.91}
+ 91%|█████████ | 6192/6790 [3:34:42<20:30,  2.06s/it] 91%|█████████ | 6193/6790 [3:34:45<21:04,  2.12s/it]                                                     {'loss': 1.4407, 'learning_rate': 7.886330836538802e-06, 'epoch': 0.91}
+ 91%|█████████ | 6193/6790 [3:34:45<21:04,  2.12s/it] 91%|█████████ | 6194/6790 [3:34:47<21:04,  2.12s/it]                                                     {'loss': 1.4555, 'learning_rate': 7.860238390189168e-06, 'epoch': 0.91}
+ 91%|█████████ | 6194/6790 [3:34:47<21:04,  2.12s/it] 91%|█████████ | 6195/6790 [3:34:49<21:00,  2.12s/it]                                                     {'loss': 1.5305, 'learning_rate': 7.834188314452751e-06, 'epoch': 0.91}
+ 91%|█████████ | 6195/6790 [3:34:49<21:00,  2.12s/it] 91%|█████████▏| 6196/6790 [3:34:51<21:03,  2.13s/it]                                                     {'loss': 1.4284, 'learning_rate': 7.80818061507409e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6196/6790 [3:34:51<21:03,  2.13s/it] 91%|█████████▏| 6197/6790 [3:34:53<20:55,  2.12s/it]                                                     {'loss': 1.6264, 'learning_rate': 7.782215297788398e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6197/6790 [3:34:53<20:55,  2.12s/it] 91%|█████████▏| 6198/6790 [3:34:55<20:51,  2.11s/it]                                                     {'loss': 1.3699, 'learning_rate': 7.75629236832156e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6198/6790 [3:34:55<20:51,  2.11s/it] 91%|█████████▏| 6199/6790 [3:34:57<20:41,  2.10s/it]                                                     {'loss': 1.4345, 'learning_rate': 7.730411832390094e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6199/6790 [3:34:57<20:41,  2.10s/it] 91%|█████████▏| 6200/6790 [3:34:59<20:05,  2.04s/it]                                                     {'loss': 1.4839, 'learning_rate': 7.704573695701145e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6200/6790 [3:34:59<20:05,  2.04s/it] 91%|█████████▏| 6201/6790 [3:35:01<19:59,  2.04s/it]                                                     {'loss': 1.5705, 'learning_rate': 7.678777963952554e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6201/6790 [3:35:01<19:59,  2.04s/it] 91%|█████████▏| 6202/6790 [3:35:04<20:28,  2.09s/it]                                                     {'loss': 1.4835, 'learning_rate': 7.653024642832818e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6202/6790 [3:35:04<20:28,  2.09s/it] 91%|█████████▏| 6203/6790 [3:35:05<19:33,  2.00s/it]                                                     {'loss': 1.1894, 'learning_rate': 7.6273137380209915e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6203/6790 [3:35:05<19:33,  2.00s/it] 91%|█████████▏| 6204/6790 [3:35:08<20:04,  2.05s/it]                                                     {'loss': 1.4679, 'learning_rate': 7.601645255186851e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6204/6790 [3:35:08<20:04,  2.05s/it] 91%|█████████▏| 6205/6790 [3:35:10<20:35,  2.11s/it]                                                     {'loss': 1.195, 'learning_rate': 7.576019199990825e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6205/6790 [3:35:10<20:35,  2.11s/it] 91%|█████████▏| 6206/6790 [3:35:12<20:17,  2.08s/it]                                                     {'loss': 1.5879, 'learning_rate': 7.55043557808397e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6206/6790 [3:35:12<20:17,  2.08s/it] 91%|█████████▏| 6207/6790 [3:35:14<20:08,  2.07s/it]                                                     {'loss': 1.4953, 'learning_rate': 7.524894395107951e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6207/6790 [3:35:14<20:08,  2.07s/it] 91%|█████████▏| 6208/6790 [3:35:16<20:00,  2.06s/it]                                                     {'loss': 1.3365, 'learning_rate': 7.4993956566951295e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6208/6790 [3:35:16<20:00,  2.06s/it] 91%|█████████▏| 6209/6790 [3:35:18<19:50,  2.05s/it]                                                     {'loss': 1.3658, 'learning_rate': 7.473939368468453e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6209/6790 [3:35:18<19:50,  2.05s/it] 91%|█████████▏| 6210/6790 [3:35:20<18:59,  1.96s/it]                                                     {'loss': 1.2165, 'learning_rate': 7.448525536041584e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6210/6790 [3:35:20<18:59,  1.96s/it] 91%|█████████▏| 6211/6790 [3:35:21<18:28,  1.91s/it]                                                     {'loss': 1.3021, 'learning_rate': 7.423154165018708e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6211/6790 [3:35:21<18:28,  1.91s/it] 91%|█████████▏| 6212/6790 [3:35:24<19:53,  2.07s/it]                                                     {'loss': 1.4221, 'learning_rate': 7.397825260994773e-06, 'epoch': 0.91}
+ 91%|█████████▏| 6212/6790 [3:35:24<19:53,  2.07s/it] 92%|█████████▏| 6213/6790 [3:35:26<18:41,  1.94s/it]                                                     {'loss': 1.2598, 'learning_rate': 7.372538829555286e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6213/6790 [3:35:26<18:41,  1.94s/it] 92%|█████████▏| 6214/6790 [3:35:28<20:15,  2.11s/it]                                                     {'loss': 1.4583, 'learning_rate': 7.347294876276367e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6214/6790 [3:35:28<20:15,  2.11s/it] 92%|█████████▏| 6215/6790 [3:35:30<19:35,  2.05s/it]                                                     {'loss': 1.3058, 'learning_rate': 7.322093406724873e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6215/6790 [3:35:30<19:35,  2.05s/it] 92%|█████████▏| 6216/6790 [3:35:32<20:26,  2.14s/it]                                                     {'loss': 1.4848, 'learning_rate': 7.296934426458157e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6216/6790 [3:35:32<20:26,  2.14s/it] 92%|█████████▏| 6217/6790 [3:35:34<19:41,  2.06s/it]                                                     {'loss': 1.3753, 'learning_rate': 7.271817941024339e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6217/6790 [3:35:34<19:41,  2.06s/it] 92%|█████████▏| 6218/6790 [3:35:36<20:22,  2.14s/it]                                                     {'loss': 1.4849, 'learning_rate': 7.246743955962054e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6218/6790 [3:35:36<20:22,  2.14s/it] 92%|█████████▏| 6219/6790 [3:35:39<22:09,  2.33s/it]                                                     {'loss': 1.4085, 'learning_rate': 7.221712476800613e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6219/6790 [3:35:39<22:09,  2.33s/it] 92%|█████████▏| 6220/6790 [3:35:41<21:18,  2.24s/it]                                                     {'loss': 1.3409, 'learning_rate': 7.196723509059977e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6220/6790 [3:35:41<21:18,  2.24s/it] 92%|█████████▏| 6221/6790 [3:35:43<20:41,  2.18s/it]                                                     {'loss': 1.4429, 'learning_rate': 7.171777058250695e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6221/6790 [3:35:43<20:41,  2.18s/it] 92%|█████████▏| 6222/6790 [3:35:45<20:10,  2.13s/it]                                                     {'loss': 1.4892, 'learning_rate': 7.146873129873899e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6222/6790 [3:35:45<20:10,  2.13s/it] 92%|█████████▏| 6223/6790 [3:35:47<19:34,  2.07s/it]                                                     {'loss': 1.1626, 'learning_rate': 7.1220117294215076e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6223/6790 [3:35:47<19:34,  2.07s/it] 92%|█████████▏| 6224/6790 [3:35:49<19:49,  2.10s/it]                                                     {'loss': 1.3454, 'learning_rate': 7.097192862375868e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6224/6790 [3:35:49<19:49,  2.10s/it] 92%|█████████▏| 6225/6790 [3:35:51<19:09,  2.03s/it]                                                     {'loss': 1.3438, 'learning_rate': 7.072416534210047e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6225/6790 [3:35:51<19:09,  2.03s/it] 92%|█████████▏| 6226/6790 [3:35:53<18:50,  2.00s/it]                                                     {'loss': 1.43, 'learning_rate': 7.047682750387741e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6226/6790 [3:35:53<18:50,  2.00s/it] 92%|█████████▏| 6227/6790 [3:35:55<18:27,  1.97s/it]                                                     {'loss': 1.4218, 'learning_rate': 7.022991516363209e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6227/6790 [3:35:55<18:27,  1.97s/it] 92%|█████████▏| 6228/6790 [3:35:57<18:23,  1.96s/it]                                                     {'loss': 1.3723, 'learning_rate': 6.998342837581362e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6228/6790 [3:35:57<18:23,  1.96s/it] 92%|█████████▏| 6229/6790 [3:35:59<18:13,  1.95s/it]                                                     {'loss': 1.355, 'learning_rate': 6.9737367194777195e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6229/6790 [3:35:59<18:13,  1.95s/it] 92%|█████████▏| 6230/6790 [3:36:01<17:59,  1.93s/it]                                                     {'loss': 1.3664, 'learning_rate': 6.949173167478407e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6230/6790 [3:36:01<17:59,  1.93s/it] 92%|█████████▏| 6231/6790 [3:36:03<18:25,  1.98s/it]                                                     {'loss': 1.3796, 'learning_rate': 6.924652187000225e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6231/6790 [3:36:03<18:25,  1.98s/it] 92%|█████████▏| 6232/6790 [3:36:05<18:58,  2.04s/it]                                                     {'loss': 1.3647, 'learning_rate': 6.900173783450448e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6232/6790 [3:36:05<18:58,  2.04s/it] 92%|█████████▏| 6233/6790 [3:36:07<18:59,  2.05s/it]                                                     {'loss': 1.3353, 'learning_rate': 6.875737962227114e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6233/6790 [3:36:07<18:59,  2.05s/it] 92%|█████████▏| 6234/6790 [3:36:09<18:32,  2.00s/it]                                                     {'loss': 1.252, 'learning_rate': 6.8513447287188e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6234/6790 [3:36:09<18:32,  2.00s/it] 92%|█████████▏| 6235/6790 [3:36:11<18:50,  2.04s/it]                                                     {'loss': 1.5959, 'learning_rate': 6.82699408830465e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6235/6790 [3:36:11<18:50,  2.04s/it] 92%|█████████▏| 6236/6790 [3:36:13<18:49,  2.04s/it]                                                     {'loss': 1.5435, 'learning_rate': 6.802686046354523e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6236/6790 [3:36:13<18:49,  2.04s/it] 92%|█████████▏| 6237/6790 [3:36:16<20:06,  2.18s/it]                                                     {'loss': 1.2959, 'learning_rate': 6.778420608228775e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6237/6790 [3:36:16<20:06,  2.18s/it] 92%|█████████▏| 6238/6790 [3:36:18<19:43,  2.14s/it]                                                     {'loss': 1.3698, 'learning_rate': 6.75419777927846e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6238/6790 [3:36:18<19:43,  2.14s/it] 92%|█████████▏| 6239/6790 [3:36:20<18:56,  2.06s/it]                                                     {'loss': 1.3192, 'learning_rate': 6.730017564845126e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6239/6790 [3:36:20<18:56,  2.06s/it] 92%|█████████▏| 6240/6790 [3:36:22<18:51,  2.06s/it]                                                     {'loss': 1.5627, 'learning_rate': 6.7058799702610196e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6240/6790 [3:36:22<18:51,  2.06s/it] 92%|█████████▏| 6241/6790 [3:36:24<18:32,  2.03s/it]                                                     {'loss': 1.424, 'learning_rate': 6.681785000848973e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6241/6790 [3:36:24<18:32,  2.03s/it] 92%|█████████▏| 6242/6790 [3:36:26<18:35,  2.04s/it]                                                     {'loss': 1.5414, 'learning_rate': 6.657732661922423e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6242/6790 [3:36:26<18:35,  2.04s/it] 92%|█████████▏| 6243/6790 [3:36:28<18:34,  2.04s/it]                                                     {'loss': 1.3602, 'learning_rate': 6.633722958785305e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6243/6790 [3:36:28<18:34,  2.04s/it] 92%|█████████▏| 6244/6790 [3:36:30<18:50,  2.07s/it]                                                     {'loss': 1.4709, 'learning_rate': 6.609755896732317e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6244/6790 [3:36:30<18:50,  2.07s/it] 92%|█████████▏| 6245/6790 [3:36:32<19:50,  2.18s/it]                                                     {'loss': 1.2848, 'learning_rate': 6.58583148104861e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6245/6790 [3:36:32<19:50,  2.18s/it] 92%|█████████▏| 6246/6790 [3:36:34<19:01,  2.10s/it]                                                     {'loss': 1.3576, 'learning_rate': 6.561949717010007e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6246/6790 [3:36:34<19:01,  2.10s/it] 92%|█████████▏| 6247/6790 [3:36:36<18:18,  2.02s/it]                                                     {'loss': 1.4012, 'learning_rate': 6.538110609882941e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6247/6790 [3:36:36<18:18,  2.02s/it] 92%|█████████▏| 6248/6790 [3:36:38<17:53,  1.98s/it]                                                     {'loss': 1.3299, 'learning_rate': 6.514314164924385e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6248/6790 [3:36:38<17:53,  1.98s/it] 92%|█████████▏| 6249/6790 [3:36:40<18:20,  2.04s/it]                                                     {'loss': 1.4487, 'learning_rate': 6.490560387381895e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6249/6790 [3:36:40<18:20,  2.04s/it] 92%|█████████▏| 6250/6790 [3:36:43<19:17,  2.14s/it]                                                     {'loss': 1.4323, 'learning_rate': 6.466849282493704e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6250/6790 [3:36:43<19:17,  2.14s/it] 92%|█████████▏| 6251/6790 [3:36:45<19:38,  2.19s/it]                                                     {'loss': 1.4925, 'learning_rate': 6.443180855488518e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6251/6790 [3:36:45<19:38,  2.19s/it] 92%|█████████▏| 6252/6790 [3:36:47<18:55,  2.11s/it]                                                     {'loss': 1.4223, 'learning_rate': 6.41955511158574e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6252/6790 [3:36:47<18:55,  2.11s/it] 92%|█████████▏| 6253/6790 [3:36:49<18:51,  2.11s/it]                                                     {'loss': 1.5097, 'learning_rate': 6.395972055995314e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6253/6790 [3:36:49<18:51,  2.11s/it] 92%|█████████▏| 6254/6790 [3:36:51<19:37,  2.20s/it]                                                     {'loss': 1.2371, 'learning_rate': 6.372431693917702e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6254/6790 [3:36:51<19:37,  2.20s/it] 92%|█████████▏| 6255/6790 [3:36:53<18:34,  2.08s/it]                                                     {'loss': 1.3387, 'learning_rate': 6.348934030544129e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6255/6790 [3:36:53<18:34,  2.08s/it] 92%|█████████▏| 6256/6790 [3:36:55<18:34,  2.09s/it]                                                     {'loss': 1.3436, 'learning_rate': 6.325479071056206e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6256/6790 [3:36:55<18:34,  2.09s/it] 92%|█████████▏| 6257/6790 [3:36:57<18:14,  2.05s/it]                                                     {'loss': 1.2656, 'learning_rate': 6.30206682062624e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6257/6790 [3:36:57<18:14,  2.05s/it] 92%|█████████▏| 6258/6790 [3:36:59<17:27,  1.97s/it]                                                     {'loss': 1.1743, 'learning_rate': 6.2786972844171235e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6258/6790 [3:36:59<17:27,  1.97s/it] 92%|█████████▏| 6259/6790 [3:37:01<16:57,  1.92s/it]                                                     {'loss': 1.2859, 'learning_rate': 6.2553704675822665e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6259/6790 [3:37:01<16:57,  1.92s/it] 92%|█████████▏| 6260/6790 [3:37:03<16:58,  1.92s/it]                                                     {'loss': 1.1406, 'learning_rate': 6.232086375265689e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6260/6790 [3:37:03<16:58,  1.92s/it] 92%|█████████▏| 6261/6790 [3:37:05<17:28,  1.98s/it]                                                     {'loss': 1.1664, 'learning_rate': 6.208845012602016e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6261/6790 [3:37:05<17:28,  1.98s/it] 92%|█████████▏| 6262/6790 [3:37:12<30:07,  3.42s/it]                                                     {'loss': 1.4308, 'learning_rate': 6.185646384716415e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6262/6790 [3:37:12<30:07,  3.42s/it] 92%|█████████▏| 6263/6790 [3:37:13<25:37,  2.92s/it]                                                     {'loss': 1.3112, 'learning_rate': 6.16249049672466e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6263/6790 [3:37:13<25:37,  2.92s/it] 92%|█████████▏| 6264/6790 [3:37:15<23:16,  2.65s/it]                                                     {'loss': 1.4863, 'learning_rate': 6.139377353733045e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6264/6790 [3:37:15<23:16,  2.65s/it] 92%|█████████▏| 6265/6790 [3:37:18<21:59,  2.51s/it]                                                     {'loss': 1.4316, 'learning_rate': 6.1163069608385135e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6265/6790 [3:37:18<21:59,  2.51s/it] 92%|█████████▏| 6266/6790 [3:37:20<21:09,  2.42s/it]                                                     {'loss': 1.435, 'learning_rate': 6.093279323128509e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6266/6790 [3:37:20<21:09,  2.42s/it] 92%|█████████▏| 6267/6790 [3:37:22<21:30,  2.47s/it]                                                     {'loss': 1.2184, 'learning_rate': 6.070294445681102e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6267/6790 [3:37:22<21:30,  2.47s/it] 92%|█████████▏| 6268/6790 [3:37:24<20:21,  2.34s/it]                                                     {'loss': 1.4539, 'learning_rate': 6.047352333564904e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6268/6790 [3:37:24<20:21,  2.34s/it] 92%|█████████▏| 6269/6790 [3:37:26<18:43,  2.16s/it]                                                     {'loss': 1.3343, 'learning_rate': 6.024452991839113e-06, 'epoch': 0.92}
+ 92%|█████���███▏| 6269/6790 [3:37:26<18:43,  2.16s/it] 92%|█████████▏| 6270/6790 [3:37:28<18:29,  2.13s/it]                                                     {'loss': 1.4104, 'learning_rate': 6.001596425553491e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6270/6790 [3:37:28<18:29,  2.13s/it] 92%|█████████▏| 6271/6790 [3:37:30<18:16,  2.11s/it]                                                     {'loss': 1.6053, 'learning_rate': 5.978782639748337e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6271/6790 [3:37:30<18:16,  2.11s/it] 92%|█████████▏| 6272/6790 [3:37:32<17:40,  2.05s/it]                                                     {'loss': 1.357, 'learning_rate': 5.956011639454562e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6272/6790 [3:37:32<17:40,  2.05s/it] 92%|█████████▏| 6273/6790 [3:37:34<17:16,  2.00s/it]                                                     {'loss': 1.4683, 'learning_rate': 5.9332834296936145e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6273/6790 [3:37:34<17:16,  2.00s/it] 92%|█████████▏| 6274/6790 [3:37:36<17:36,  2.05s/it]                                                     {'loss': 1.3899, 'learning_rate': 5.910598015477531e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6274/6790 [3:37:36<17:36,  2.05s/it] 92%|█████████▏| 6275/6790 [3:37:38<17:13,  2.01s/it]                                                     {'loss': 1.3804, 'learning_rate': 5.8879554018088425e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6275/6790 [3:37:38<17:13,  2.01s/it] 92%|█████████▏| 6276/6790 [3:37:40<16:34,  1.93s/it]                                                     {'loss': 1.3951, 'learning_rate': 5.865355593680754e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6276/6790 [3:37:40<16:34,  1.93s/it] 92%|█████████▏| 6277/6790 [3:37:42<16:14,  1.90s/it]                                                     {'loss': 1.3026, 'learning_rate': 5.8427985960769485e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6277/6790 [3:37:42<16:14,  1.90s/it] 92%|█████████▏| 6278/6790 [3:37:43<15:43,  1.84s/it]                                                     {'loss': 1.2985, 'learning_rate': 5.820284413971666e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6278/6790 [3:37:43<15:43,  1.84s/it] 92%|█████████▏| 6279/6790 [3:37:45<16:01,  1.88s/it]                                                     {'loss': 1.684, 'learning_rate': 5.797813052329737e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6279/6790 [3:37:45<16:01,  1.88s/it] 92%|█████████▏| 6280/6790 [3:37:48<18:12,  2.14s/it]                                                     {'loss': 1.4968, 'learning_rate': 5.7753845161065965e-06, 'epoch': 0.92}
+ 92%|█████████▏| 6280/6790 [3:37:48<18:12,  2.14s/it] 93%|█████████▎| 6281/6790 [3:37:50<17:53,  2.11s/it]                                                     {'loss': 1.5706, 'learning_rate': 5.7529988102480895e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6281/6790 [3:37:50<17:53,  2.11s/it] 93%|█████████▎| 6282/6790 [3:37:52<17:44,  2.10s/it]                                                     {'loss': 1.489, 'learning_rate': 5.730655939690754e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6282/6790 [3:37:52<17:44,  2.10s/it] 93%|█████████▎| 6283/6790 [3:37:54<17:42,  2.10s/it]                                                     {'loss': 1.2894, 'learning_rate': 5.708355909361651e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6283/6790 [3:37:54<17:42,  2.10s/it] 93%|█████████▎| 6284/6790 [3:37:57<18:02,  2.14s/it]                                                     {'loss': 1.4381, 'learning_rate': 5.686098724178335e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6284/6790 [3:37:57<18:02,  2.14s/it] 93%|█████████▎| 6285/6790 [3:37:58<17:08,  2.04s/it]                                                     {'loss': 1.419, 'learning_rate': 5.663884389049012e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6285/6790 [3:37:58<17:08,  2.04s/it] 93%|█████████▎| 6286/6790 [3:38:01<17:19,  2.06s/it]                                                     {'loss': 1.3172, 'learning_rate': 5.641712908872299e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6286/6790 [3:38:01<17:19,  2.06s/it] 93%|█████████▎| 6287/6790 [3:38:03<17:28,  2.08s/it]                                                     {'loss': 1.9291, 'learning_rate': 5.619584288537549e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6287/6790 [3:38:03<17:28,  2.08s/it] 93%|█████████▎| 6288/6790 [3:38:05<17:00,  2.03s/it]                                                     {'loss': 1.266, 'learning_rate': 5.5974985329244615e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6288/6790 [3:38:05<17:00,  2.03s/it] 93%|█████████▎| 6289/6790 [3:38:07<17:48,  2.13s/it]                                                     {'loss': 1.4405, 'learning_rate': 5.575455646903449e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6289/6790 [3:38:07<17:48,  2.13s/it] 93%|█████████▎| 6290/6790 [3:38:09<17:46,  2.13s/it]                                                     {'loss': 1.4735, 'learning_rate': 5.5534556353353585e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6290/6790 [3:38:09<17:46,  2.13s/it] 93%|█████████▎| 6291/6790 [3:38:11<17:37,  2.12s/it]                                                     {'loss': 1.3476, 'learning_rate': 5.531498503071686e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6291/6790 [3:38:11<17:37,  2.12s/it] 93%|█████████▎| 6292/6790 [3:38:13<17:16,  2.08s/it]                                                     {'loss': 1.1914, 'learning_rate': 5.509584254954336e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6292/6790 [3:38:13<17:16,  2.08s/it] 93%|█████████▎| 6293/6790 [3:38:15<16:53,  2.04s/it]                                                     {'loss': 1.16, 'learning_rate': 5.487712895815888e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6293/6790 [3:38:15<16:53,  2.04s/it] 93%|█████████▎| 6294/6790 [3:38:18<18:11,  2.20s/it]                                                     {'loss': 1.529, 'learning_rate': 5.465884430479395e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6294/6790 [3:38:18<18:11,  2.20s/it] 93%|█████████▎| 6295/6790 [3:38:19<17:06,  2.07s/it]                                                     {'loss': 1.3345, 'learning_rate': 5.444098863758473e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6295/6790 [3:38:19<17:06,  2.07s/it] 93%|█████████▎| 6296/6790 [3:38:21<16:50,  2.05s/it]                                                     {'loss': 1.5376, 'learning_rate': 5.422356200457235e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6296/6790 [3:38:21<16:50,  2.05s/it] 93%|█████████▎| 6297/6790 [3:38:23<16:27,  2.00s/it]                                                     {'loss': 1.5783, 'learning_rate': 5.4006564453704e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6297/6790 [3:38:23<16:27,  2.00s/it] 93%|█████████▎| 6298/6790 [3:38:25<16:32,  2.02s/it]                                                     {'loss': 1.455, 'learning_rate': 5.378999603283186e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6298/6790 [3:38:25<16:32,  2.02s/it] 93%|█████████▎| 6299/6790 [3:38:27<16:42,  2.04s/it]                                                     {'loss': 1.3282, 'learning_rate': 5.357385678971372e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6299/6790 [3:38:27<16:42,  2.04s/it] 93%|█████████▎| 6300/6790 [3:38:30<17:27,  2.14s/it]                                                     {'loss': 1.2587, 'learning_rate': 5.335814677201189e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6300/6790 [3:38:30<17:27,  2.14s/it] 93%|█████████▎| 6301/6790 [3:38:32<17:07,  2.10s/it]                                                     {'loss': 1.3213, 'learning_rate': 5.314286602729546e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6301/6790 [3:38:32<17:07,  2.10s/it] 93%|█████████▎| 6302/6790 [3:38:34<16:54,  2.08s/it]                                                     {'loss': 1.4017, 'learning_rate': 5.292801460303798e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6302/6790 [3:38:34<16:54,  2.08s/it] 93%|█████████▎| 6303/6790 [3:38:37<18:37,  2.29s/it]                                                     {'loss': 1.3345, 'learning_rate': 5.271359254661823e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6303/6790 [3:38:37<18:37,  2.29s/it] 93%|█████████▎| 6304/6790 [3:38:39<17:30,  2.16s/it]                                                     {'loss': 1.4463, 'learning_rate': 5.249959990532039e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6304/6790 [3:38:39<17:30,  2.16s/it] 93%|█████████▎| 6305/6790 [3:38:41<17:06,  2.12s/it]                                                     {'loss': 1.236, 'learning_rate': 5.228603672633403e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6305/6790 [3:38:41<17:06,  2.12s/it] 93%|█████████▎| 6306/6790 [3:38:43<17:41,  2.19s/it]                                                     {'loss': 1.5505, 'learning_rate': 5.2072903056754605e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6306/6790 [3:38:43<17:41,  2.19s/it] 93%|█████████▎| 6307/6790 [3:38:45<16:50,  2.09s/it]                                                     {'loss': 1.4274, 'learning_rate': 5.186019894358163e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6307/6790 [3:38:45<16:50,  2.09s/it] 93%|█████████▎| 6308/6790 [3:38:47<17:23,  2.16s/it]                                                     {'loss': 1.4003, 'learning_rate': 5.1647924433721125e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6308/6790 [3:38:47<17:23,  2.16s/it] 93%|█████████▎| 6309/6790 [3:38:49<16:41,  2.08s/it]                                                     {'loss': 1.0862, 'learning_rate': 5.143607957398322e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6309/6790 [3:38:49<16:41,  2.08s/it] 93%|█████████▎| 6310/6790 [3:38:51<16:20,  2.04s/it]                                                     {'loss': 1.4728, 'learning_rate': 5.1224664411084535e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6310/6790 [3:38:51<16:20,  2.04s/it] 93%|█████████▎| 6311/6790 [3:38:53<16:03,  2.01s/it]                                                     {'loss': 1.3729, 'learning_rate': 5.101367899164555e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6311/6790 [3:38:53<16:03,  2.01s/it] 93%|█████████▎| 6312/6790 [3:38:55<16:19,  2.05s/it]                                                     {'loss': 1.3206, 'learning_rate': 5.08031233621935e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6312/6790 [3:38:55<16:19,  2.05s/it] 93%|█████████▎| 6313/6790 [3:38:57<16:51,  2.12s/it]                                                     {'loss': 1.3797, 'learning_rate': 5.059299756915969e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6313/6790 [3:38:57<16:51,  2.12s/it] 93%|█████████▎| 6314/6790 [3:39:00<17:05,  2.15s/it]                                                     {'loss': 1.3674, 'learning_rate': 5.038330165888083e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6314/6790 [3:39:00<17:05,  2.15s/it] 93%|█████████▎| 6315/6790 [3:39:01<16:24,  2.07s/it]                                                     {'loss': 1.3173, 'learning_rate': 5.017403567759926e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6315/6790 [3:39:01<16:24,  2.07s/it] 93%|█████████▎| 6316/6790 [3:39:04<16:54,  2.14s/it]                                                     {'loss': 1.3095, 'learning_rate': 4.996519967146229e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6316/6790 [3:39:04<16:54,  2.14s/it] 93%|█████████▎| 6317/6790 [3:39:06<16:07,  2.05s/it]                                                     {'loss': 1.1714, 'learning_rate': 4.97567936865222e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6317/6790 [3:39:06<16:07,  2.05s/it] 93%|█████████▎| 6318/6790 [3:39:08<16:04,  2.04s/it]                                                     {'loss': 1.3876, 'learning_rate': 4.954881776873643e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6318/6790 [3:39:08<16:04,  2.04s/it] 93%|█████████▎| 6319/6790 [3:39:10<16:17,  2.07s/it]                                                     {'loss': 1.5247, 'learning_rate': 4.9341271963968534e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6319/6790 [3:39:10<16:17,  2.07s/it] 93%|█████████▎| 6320/6790 [3:39:12<16:55,  2.16s/it]                                                     {'loss': 1.3545, 'learning_rate': 4.91341563179859e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6320/6790 [3:39:12<16:55,  2.16s/it] 93%|█████████▎| 6321/6790 [3:39:14<16:22,  2.09s/it]                                                     {'loss': 1.1571, 'learning_rate': 4.892747087646155e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6321/6790 [3:39:14<16:22,  2.09s/it] 93%|█████████▎| 6322/6790 [3:39:16<16:33,  2.12s/it]                                                     {'loss': 1.379, 'learning_rate': 4.872121568497412e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6322/6790 [3:39:16<16:33,  2.12s/it] 93%|█████████▎| 6323/6790 [3:39:18<15:59,  2.06s/it]                                                     {'loss': 1.392, 'learning_rate': 4.8515390789006575e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6323/6790 [3:39:18<15:59,  2.06s/it] 93%|█████████▎| 6324/6790 [3:39:21<17:02,  2.20s/it]                                                     {'loss': 1.1906, 'learning_rate': 4.8309996233947495e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6324/6790 [3:39:21<17:02,  2.20s/it] 93%|█████████▎| 6325/6790 [3:39:23<16:24,  2.12s/it]                                                     {'loss': 1.1949, 'learning_rate': 4.810503206509043e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6325/6790 [3:39:23<16:24,  2.12s/it] 93%|█████████▎| 6326/6790 [3:39:25<16:24,  2.12s/it]                                                     {'loss': 1.3054, 'learning_rate': 4.79004983276341e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6326/6790 [3:39:25<16:24,  2.12s/it] 93%|█████████▎| 6327/6790 [3:39:27<16:12,  2.10s/it]                                                     {'loss': 1.4838, 'learning_rate': 4.769639506668222e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6327/6790 [3:39:27<16:12,  2.10s/it] 93%|█████████▎| 6328/6790 [3:39:29<16:33,  2.15s/it]                                                     {'loss': 1.3136, 'learning_rate': 4.749272232724344e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6328/6790 [3:39:29<16:33,  2.15s/it] 93%|█████████▎| 6329/6790 [3:39:31<16:00,  2.08s/it]                                                     {'loss': 1.4133, 'learning_rate': 4.728948015423184e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6329/6790 [3:39:31<16:00,  2.08s/it] 93%|█████████▎| 6330/6790 [3:39:33<15:34,  2.03s/it]                                                     {'loss': 1.338, 'learning_rate': 4.708666859246602e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6330/6790 [3:39:33<15:34,  2.03s/it] 93%|█████████▎| 6331/6790 [3:39:35<16:43,  2.19s/it]                                                     {'loss': 1.2527, 'learning_rate': 4.688428768667064e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6331/6790 [3:39:35<16:43,  2.19s/it] 93%|█████████▎| 6332/6790 [3:39:38<16:42,  2.19s/it]                                                     {'loss': 1.3485, 'learning_rate': 4.668233748147355e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6332/6790 [3:39:38<16:42,  2.19s/it] 93%|█████████▎| 6333/6790 [3:39:40<17:00,  2.23s/it]                                                     {'loss': 1.5086, 'learning_rate': 4.64808180214098e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6333/6790 [3:39:40<17:00,  2.23s/it] 93%|█████████▎| 6334/6790 [3:39:42<15:45,  2.07s/it]                                                     {'loss': 1.2866, 'learning_rate': 4.627972935091785e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6334/6790 [3:39:42<15:45,  2.07s/it] 93%|█████████▎| 6335/6790 [3:39:44<15:21,  2.03s/it]                                                     {'loss': 1.4553, 'learning_rate': 4.607907151434199e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6335/6790 [3:39:44<15:21,  2.03s/it] 93%|█████████▎| 6336/6790 [3:39:46<15:48,  2.09s/it]                                                     {'loss': 1.3767, 'learning_rate': 4.587884455593106e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6336/6790 [3:39:46<15:48,  2.09s/it] 93%|█████████▎| 6337/6790 [3:39:48<15:11,  2.01s/it]                                                     {'loss': 1.4658, 'learning_rate': 4.5679048519839065e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6337/6790 [3:39:48<15:11,  2.01s/it] 93%|█████████▎| 6338/6790 [3:39:50<15:04,  2.00s/it]                                                     {'loss': 1.3989, 'learning_rate': 4.547968345012543e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6338/6790 [3:39:50<15:04,  2.00s/it] 93%|█████████▎| 6339/6790 [3:39:51<14:43,  1.96s/it]                                                     {'loss': 1.5206, 'learning_rate': 4.528074939075322e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6339/6790 [3:39:51<14:43,  1.96s/it] 93%|█████████▎| 6340/6790 [3:39:54<15:24,  2.06s/it]                                                     {'loss': 1.4005, 'learning_rate': 4.508224638559199e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6340/6790 [3:39:54<15:24,  2.06s/it] 93%|█████████▎| 6341/6790 [3:39:56<15:58,  2.14s/it]                                                     {'loss': 1.5784, 'learning_rate': 4.488417447841542e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6341/6790 [3:39:56<15:58,  2.14s/it] 93%|█████████▎| 6342/6790 [3:39:58<16:04,  2.15s/it]                                                     {'loss': 1.562, 'learning_rate': 4.468653371290255e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6342/6790 [3:39:58<16:04,  2.15s/it] 93%|█████████▎| 6343/6790 [3:40:00<16:03,  2.16s/it]                                                     {'loss': 1.6309, 'learning_rate': 4.448932413263629e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6343/6790 [3:40:00<16:03,  2.16s/it] 93%|█��███████▎| 6344/6790 [3:40:03<16:01,  2.16s/it]                                                     {'loss': 1.2477, 'learning_rate': 4.429254578110608e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6344/6790 [3:40:03<16:01,  2.16s/it] 93%|█████████▎| 6345/6790 [3:40:05<16:47,  2.26s/it]                                                     {'loss': 1.285, 'learning_rate': 4.4096198701704785e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6345/6790 [3:40:05<16:47,  2.26s/it] 93%|█████████▎| 6346/6790 [3:40:07<16:19,  2.21s/it]                                                     {'loss': 1.2743, 'learning_rate': 4.39002829377313e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6346/6790 [3:40:07<16:19,  2.21s/it] 93%|█████████▎| 6347/6790 [3:40:09<15:58,  2.16s/it]                                                     {'loss': 1.5175, 'learning_rate': 4.370479853238863e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6347/6790 [3:40:09<15:58,  2.16s/it] 93%|█████████▎| 6348/6790 [3:40:11<15:33,  2.11s/it]                                                     {'loss': 1.4775, 'learning_rate': 4.3509745528785396e-06, 'epoch': 0.93}
+ 93%|█████████▎| 6348/6790 [3:40:11<15:33,  2.11s/it] 94%|█████████▎| 6349/6790 [3:40:13<15:09,  2.06s/it]                                                     {'loss': 1.4413, 'learning_rate': 4.331512396993409e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6349/6790 [3:40:13<15:09,  2.06s/it] 94%|█████████▎| 6350/6790 [3:40:15<15:01,  2.05s/it]                                                     {'loss': 1.4829, 'learning_rate': 4.312093389875283e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6350/6790 [3:40:15<15:01,  2.05s/it] 94%|█████████▎| 6351/6790 [3:40:17<14:31,  1.99s/it]                                                     {'loss': 1.3674, 'learning_rate': 4.292717535806423e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6351/6790 [3:40:17<14:31,  1.99s/it] 94%|█████████▎| 6352/6790 [3:40:19<15:01,  2.06s/it]                                                     {'loss': 1.3286, 'learning_rate': 4.2733848390596135e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6352/6790 [3:40:19<15:01,  2.06s/it] 94%|█████████▎| 6353/6790 [3:40:22<15:32,  2.13s/it]                                                     {'loss': 1.3643, 'learning_rate': 4.254095303898087e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6353/6790 [3:40:22<15:32,  2.13s/it] 94%|█████████▎| 6354/6790 [3:40:23<15:02,  2.07s/it]                                                     {'loss': 1.2622, 'learning_rate': 4.2348489345755304e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6354/6790 [3:40:23<15:02,  2.07s/it] 94%|█████████▎| 6355/6790 [3:40:26<15:06,  2.08s/it]                                                     {'loss': 1.3504, 'learning_rate': 4.215645735336238e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6355/6790 [3:40:26<15:06,  2.08s/it] 94%|█████████▎| 6356/6790 [3:40:28<14:55,  2.06s/it]                                                     {'loss': 1.405, 'learning_rate': 4.196485710414799e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6356/6790 [3:40:28<14:55,  2.06s/it] 94%|█████████▎| 6357/6790 [3:40:30<15:01,  2.08s/it]                                                     {'loss': 1.4258, 'learning_rate': 4.177368864036413e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6357/6790 [3:40:30<15:01,  2.08s/it] 94%|█████████▎| 6358/6790 [3:40:32<15:18,  2.13s/it]                                                     {'loss': 1.5621, 'learning_rate': 4.158295200416728e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6358/6790 [3:40:32<15:18,  2.13s/it] 94%|█████████▎| 6359/6790 [3:40:34<15:04,  2.10s/it]                                                     {'loss': 1.1796, 'learning_rate': 4.139264723761893e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6359/6790 [3:40:34<15:04,  2.10s/it] 94%|█████████▎| 6360/6790 [3:40:36<14:51,  2.07s/it]                                                     {'loss': 1.5369, 'learning_rate': 4.120277438268438e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6360/6790 [3:40:36<14:51,  2.07s/it] 94%|█████████▎| 6361/6790 [3:40:38<15:35,  2.18s/it]                                                     {'loss': 1.4529, 'learning_rate': 4.101333348123482e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6361/6790 [3:40:38<15:35,  2.18s/it] 94%|█████████▎| 6362/6790 [3:40:40<15:05,  2.12s/it]                                                     {'loss': 1.3501, 'learning_rate': 4.082432457504548e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6362/6790 [3:40:40<15:05,  2.12s/it] 94%|█████████▎| 6363/6790 [3:40:43<16:12,  2.28s/it]                                                     {'loss': 1.1344, 'learning_rate': 4.0635747705797035e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6363/6790 [3:40:43<16:12,  2.28s/it] 94%|█████████▎| 6364/6790 [3:40:46<16:32,  2.33s/it]                                                     {'loss': 1.2099, 'learning_rate': 4.044760291507333e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6364/6790 [3:40:46<16:32,  2.33s/it] 94%|█████████▎| 6365/6790 [3:40:48<15:57,  2.25s/it]                                                     {'loss': 1.4082, 'learning_rate': 4.025989024436538e-06, 'epoch': 0.94}
+ 94%|█████████▎| 6365/6790 [3:40:48<15:57,  2.25s/it] 94%|█████████▍| 6366/6790 [3:40:50<15:22,  2.18s/it]                                                     {'loss': 1.2382, 'learning_rate': 4.007260973506655e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6366/6790 [3:40:50<15:22,  2.18s/it] 94%|█████████▍| 6367/6790 [3:40:52<14:51,  2.11s/it]                                                     {'loss': 1.4051, 'learning_rate': 3.988576142847622e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6367/6790 [3:40:52<14:51,  2.11s/it] 94%|█████████▍| 6368/6790 [3:40:53<14:29,  2.06s/it]                                                     {'loss': 1.4283, 'learning_rate': 3.969934536579789e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6368/6790 [3:40:54<14:29,  2.06s/it] 94%|█████████▍| 6369/6790 [3:40:55<13:54,  1.98s/it]                                                     {'loss': 1.3594, 'learning_rate': 3.951336158814045e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6369/6790 [3:40:55<13:54,  1.98s/it] 94%|█████████▍| 6370/6790 [3:40:57<13:56,  1.99s/it]                                                     {'loss': 1.4871, 'learning_rate': 3.932781013651709e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6370/6790 [3:40:57<13:56,  1.99s/it] 94%|█████████▍| 6371/6790 [3:40:59<13:44,  1.97s/it]                                                     {'loss': 1.4512, 'learning_rate': 3.914269105184487e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6371/6790 [3:40:59<13:44,  1.97s/it] 94%|█████████▍| 6372/6790 [3:41:01<13:19,  1.91s/it]                                                     {'loss': 1.4866, 'learning_rate': 3.895800437494646e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6372/6790 [3:41:01<13:19,  1.91s/it] 94%|█████████▍| 6373/6790 [3:41:03<13:40,  1.97s/it]                                                     {'loss': 1.3517, 'learning_rate': 3.877375014654927e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6373/6790 [3:41:03<13:40,  1.97s/it] 94%|█████████▍| 6374/6790 [3:41:05<14:10,  2.04s/it]                                                     {'loss': 1.5058, 'learning_rate': 3.8589928407284815e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6374/6790 [3:41:05<14:10,  2.04s/it] 94%|█████████▍| 6375/6790 [3:41:08<14:49,  2.14s/it]                                                     {'loss': 1.1106, 'learning_rate': 3.840653919768911e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6375/6790 [3:41:08<14:49,  2.14s/it] 94%|█████████▍| 6376/6790 [3:41:10<14:44,  2.14s/it]                                                     {'loss': 1.3463, 'learning_rate': 3.822358255820357e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6376/6790 [3:41:10<14:44,  2.14s/it] 94%|█████████▍| 6377/6790 [3:41:12<14:31,  2.11s/it]                                                     {'loss': 1.1781, 'learning_rate': 3.80410585291735e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6377/6790 [3:41:12<14:31,  2.11s/it] 94%|█████████▍| 6378/6790 [3:41:14<14:28,  2.11s/it]                                                     {'loss': 1.403, 'learning_rate': 3.785896715084891e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6378/6790 [3:41:14<14:28,  2.11s/it] 94%|█████████▍| 6379/6790 [3:41:16<14:12,  2.08s/it]                                                     {'loss': 1.1146, 'learning_rate': 3.767730846338502e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6379/6790 [3:41:16<14:12,  2.08s/it] 94%|█████████▍| 6380/6790 [3:41:18<13:55,  2.04s/it]                                                     {'loss': 1.5162, 'learning_rate': 3.749608250684067e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6380/6790 [3:41:18<13:55,  2.04s/it] 94%|█████████▍| 6381/6790 [3:41:20<13:37,  2.00s/it]                                                     {'loss': 1.5614, 'learning_rate': 3.7315289321180113e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6381/6790 [3:41:20<13:37,  2.00s/it] 94%|█████████▍| 6382/6790 [3:41:22<13:30,  1.99s/it]                                                     {'loss': 1.3303, 'learning_rate': 3.7134928946271465e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6382/6790 [3:41:22<13:30,  1.99s/it] 94%|█████████▍| 6383/6790 [3:41:24<14:14,  2.10s/it]                                                     {'loss': 1.3118, 'learning_rate': 3.6955001421888014e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6383/6790 [3:41:24<14:14,  2.10s/it] 94%|█████████▍| 6384/6790 [3:41:26<13:43,  2.03s/it]                                                     {'loss': 1.2362, 'learning_rate': 3.6775506787707582e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6384/6790 [3:41:26<13:43,  2.03s/it] 94%|█████████▍| 6385/6790 [3:41:28<14:33,  2.16s/it]                                                     {'loss': 1.3872, 'learning_rate': 3.6596445083311613e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6385/6790 [3:41:28<14:33,  2.16s/it] 94%|█████████▍| 6386/6790 [3:41:30<14:07,  2.10s/it]                                                     {'loss': 1.4579, 'learning_rate': 3.6417816348186972e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6386/6790 [3:41:30<14:07,  2.10s/it] 94%|█████████▍| 6387/6790 [3:41:32<13:21,  1.99s/it]                                                     {'loss': 1.3774, 'learning_rate': 3.6239620621725255e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6387/6790 [3:41:32<13:21,  1.99s/it] 94%|█████████▍| 6388/6790 [3:41:34<13:23,  2.00s/it]                                                     {'loss': 1.6327, 'learning_rate': 3.606185794322192e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6388/6790 [3:41:34<13:23,  2.00s/it] 94%|█████████▍| 6389/6790 [3:41:36<13:18,  1.99s/it]                                                     {'loss': 1.3171, 'learning_rate': 3.5884528351876946e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6389/6790 [3:41:36<13:18,  1.99s/it] 94%|█████████▍| 6390/6790 [3:41:38<13:11,  1.98s/it]                                                     {'loss': 1.2919, 'learning_rate': 3.5707631886795047e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6390/6790 [3:41:38<13:11,  1.98s/it] 94%|█████████▍| 6391/6790 [3:41:40<13:32,  2.04s/it]                                                     {'loss': 1.3629, 'learning_rate': 3.5531168586985687e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6391/6790 [3:41:40<13:32,  2.04s/it] 94%|█████████▍| 6392/6790 [3:41:42<13:05,  1.97s/it]                                                     {'loss': 1.3831, 'learning_rate': 3.535513849136218e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6392/6790 [3:41:42<13:05,  1.97s/it] 94%|█████████▍| 6393/6790 [3:41:44<13:27,  2.03s/it]                                                     {'loss': 1.3427, 'learning_rate': 3.51795416387426e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6393/6790 [3:41:44<13:27,  2.03s/it] 94%|█████████▍| 6394/6790 [3:41:47<14:05,  2.14s/it]                                                     {'loss': 1.2978, 'learning_rate': 3.500437806784995e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6394/6790 [3:41:47<14:05,  2.14s/it] 94%|█████████▍| 6395/6790 [3:41:49<13:39,  2.07s/it]                                                     {'loss': 1.436, 'learning_rate': 3.4829647817310906e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6395/6790 [3:41:49<13:39,  2.07s/it] 94%|█████████▍| 6396/6790 [3:41:51<13:33,  2.06s/it]                                                     {'loss': 1.5323, 'learning_rate': 3.465535092565686e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6396/6790 [3:41:51<13:33,  2.06s/it] 94%|█████████▍| 6397/6790 [3:41:53<13:45,  2.10s/it]                                                     {'loss': 1.3364, 'learning_rate': 3.448148743132418e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6397/6790 [3:41:53<13:45,  2.10s/it] 94%|█████████▍| 6398/6790 [3:41:55<13:27,  2.06s/it]                                                     {'loss': 1.5616, 'learning_rate': 3.430805737265286e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6398/6790 [3:41:55<13:27,  2.06s/it] 94%|█████████▍| 6399/6790 [3:41:57<13:16,  2.04s/it]                                                     {'loss': 1.4388, 'learning_rate': 3.413506078788764e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6399/6790 [3:41:57<13:16,  2.04s/it] 94%|█████████▍| 6400/6790 [3:41:59<13:38,  2.10s/it]                                                     {'loss': 1.4617, 'learning_rate': 3.3962497715177565e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6400/6790 [3:41:59<13:38,  2.10s/it] 94%|█████████▍| 6401/6790 [3:42:01<13:05,  2.02s/it]                                                     {'loss': 1.2314, 'learning_rate': 3.3790368192576636e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6401/6790 [3:42:01<13:05,  2.02s/it] 94%|█████████▍| 6402/6790 [3:42:03<12:49,  1.98s/it]                                                     {'loss': 1.4488, 'learning_rate': 3.3618672258042493e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6402/6790 [3:42:03<12:49,  1.98s/it] 94%|█████████▍| 6403/6790 [3:42:05<12:29,  1.94s/it]                                                     {'loss': 1.1199, 'learning_rate': 3.344740994943751e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6403/6790 [3:42:05<12:29,  1.94s/it] 94%|█████████▍| 6404/6790 [3:42:07<13:04,  2.03s/it]                                                     {'loss': 1.4976, 'learning_rate': 3.3276581304528377e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6404/6790 [3:42:07<13:04,  2.03s/it] 94%|█████████▍| 6405/6790 [3:42:09<13:01,  2.03s/it]                                                     {'loss': 1.4256, 'learning_rate': 3.310618636098628e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6405/6790 [3:42:09<13:01,  2.03s/it] 94%|█████████▍| 6406/6790 [3:42:11<12:54,  2.02s/it]                                                     {'loss': 1.2671, 'learning_rate': 3.2936225156386948e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6406/6790 [3:42:11<12:54,  2.02s/it] 94%|█████████▍| 6407/6790 [3:42:13<12:33,  1.97s/it]                                                     {'loss': 1.4124, 'learning_rate': 3.2766697728209506e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6407/6790 [3:42:13<12:33,  1.97s/it] 94%|█████████▍| 6408/6790 [3:42:15<12:33,  1.97s/it]                                                     {'loss': 1.3918, 'learning_rate': 3.259760411383872e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6408/6790 [3:42:15<12:33,  1.97s/it] 94%|█████████▍| 6409/6790 [3:42:16<12:05,  1.90s/it]                                                     {'loss': 1.4397, 'learning_rate': 3.242894435056276e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6409/6790 [3:42:16<12:05,  1.90s/it] 94%|█████████▍| 6410/6790 [3:42:19<12:51,  2.03s/it]                                                     {'loss': 1.2393, 'learning_rate': 3.2260718475574323e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6410/6790 [3:42:19<12:51,  2.03s/it] 94%|█████████▍| 6411/6790 [3:42:21<13:01,  2.06s/it]                                                     {'loss': 1.4588, 'learning_rate': 3.2092926525970845e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6411/6790 [3:42:21<13:01,  2.06s/it] 94%|█████████▍| 6412/6790 [3:42:23<13:07,  2.08s/it]                                                     {'loss': 1.5005, 'learning_rate': 3.192556853875384e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6412/6790 [3:42:23<13:07,  2.08s/it] 94%|█████████▍| 6413/6790 [3:42:25<13:05,  2.08s/it]                                                     {'loss': 1.3553, 'learning_rate': 3.1758644550828664e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6413/6790 [3:42:25<13:05,  2.08s/it] 94%|█████████▍| 6414/6790 [3:42:27<12:44,  2.03s/it]                                                     {'loss': 1.5217, 'learning_rate': 3.1592154599005663e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6414/6790 [3:42:27<12:44,  2.03s/it] 94%|█████████▍| 6415/6790 [3:42:29<12:31,  2.00s/it]                                                     {'loss': 1.5481, 'learning_rate': 3.1426098719998797e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6415/6790 [3:42:29<12:31,  2.00s/it] 94%|█████████▍| 6416/6790 [3:42:31<12:12,  1.96s/it]                                                     {'loss': 1.2677, 'learning_rate': 3.126047695042722e-06, 'epoch': 0.94}
+ 94%|█████████▍| 6416/6790 [3:42:31<12:12,  1.96s/it] 95%|█████████▍| 6417/6790 [3:42:33<12:16,  1.97s/it]                                                     {'loss': 1.434, 'learning_rate': 3.109528932681327e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6417/6790 [3:42:33<12:16,  1.97s/it] 95%|█████████▍| 6418/6790 [3:42:35<12:26,  2.01s/it]                                                     {'loss': 1.2764, 'learning_rate': 3.0930535885584254e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6418/6790 [3:42:35<12:26,  2.01s/it] 95%|█████████▍| 6419/6790 [3:42:37<12:16,  1.98s/it]                                                     {'loss': 1.2656, 'learning_rate': 3.0766216663071777e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6419/6790 [3:42:37<12:16,  1.98s/it] 95%|█████████▍| 6420/6790 [3:42:39<12:09,  1.97s/it]                                                     {'loss': 1.3524, 'learning_rate': 3.06023316955113e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6420/6790 [3:42:39<12:09,  1.97s/it] 95%|█████████▍| 6421/6790 [3:42:41<12:36,  2.05s/it]                                                     {'loss': 1.5712, 'learning_rate': 3.0438881019042573e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6421/6790 [3:42:41<12:36,  2.05s/it] 95%|█████████▍| 6422/6790 [3:42:43<12:34,  2.05s/it]                                                     {'loss': 1.4544, 'learning_rate': 3.0275864669709884e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6422/6790 [3:42:43<12:34,  2.05s/it] 95%|█████████▍| 6423/6790 [3:42:45<12:33,  2.05s/it]                                                     {'loss': 1.2888, 'learning_rate': 3.0113282683461806e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6423/6790 [3:42:45<12:33,  2.05s/it] 95%|█████████▍| 6424/6790 [3:42:47<12:17,  2.01s/it]                                                     {'loss': 1.365, 'learning_rate': 2.995113509615011e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6424/6790 [3:42:47<12:17,  2.01s/it] 95%|█████████▍| 6425/6790 [3:42:49<12:11,  2.00s/it]                                                     {'loss': 1.3237, 'learning_rate': 2.97894219435324e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6425/6790 [3:42:49<12:11,  2.00s/it] 95%|█████████▍| 6426/6790 [3:42:51<12:29,  2.06s/it]                                                     {'loss': 1.2303, 'learning_rate': 2.9628143261268838e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6426/6790 [3:42:51<12:29,  2.06s/it] 95%|█████████▍| 6427/6790 [3:42:53<12:53,  2.13s/it]                                                     {'loss': 1.5118, 'learning_rate': 2.9467299084925405e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6427/6790 [3:42:54<12:53,  2.13s/it] 95%|█████████▍| 6428/6790 [3:42:56<13:26,  2.23s/it]                                                     {'loss': 1.2449, 'learning_rate': 2.930688944997062e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6428/6790 [3:42:56<13:26,  2.23s/it] 95%|█████████▍| 6429/6790 [3:42:58<12:52,  2.14s/it]                                                     {'loss': 1.1347, 'learning_rate': 2.914691439177841e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6429/6790 [3:42:58<12:52,  2.14s/it] 95%|█████████▍| 6430/6790 [3:43:00<12:37,  2.10s/it]                                                     {'loss': 1.5487, 'learning_rate': 2.898737394562634e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6430/6790 [3:43:00<12:37,  2.10s/it] 95%|█████████▍| 6431/6790 [3:43:02<12:17,  2.05s/it]                                                     {'loss': 1.1935, 'learning_rate': 2.882826814669648e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6431/6790 [3:43:02<12:17,  2.05s/it] 95%|█████████▍| 6432/6790 [3:43:04<12:04,  2.02s/it]                                                     {'loss': 1.5164, 'learning_rate': 2.86695970300741e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6432/6790 [3:43:04<12:04,  2.02s/it] 95%|█████████▍| 6433/6790 [3:43:06<11:53,  2.00s/it]                                                     {'loss': 1.204, 'learning_rate': 2.851136063075033e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6433/6790 [3:43:06<11:53,  2.00s/it] 95%|█████████▍| 6434/6790 [3:43:08<12:06,  2.04s/it]                                                     {'loss': 1.31, 'learning_rate': 2.8353558983618354e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6434/6790 [3:43:08<12:06,  2.04s/it] 95%|█████████▍| 6435/6790 [3:43:10<12:31,  2.12s/it]                                                     {'loss': 1.3494, 'learning_rate': 2.819619212347746e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6435/6790 [3:43:10<12:31,  2.12s/it] 95%|█████████▍| 6436/6790 [3:43:12<12:29,  2.12s/it]                                                     {'loss': 1.5916, 'learning_rate': 2.803926008502944e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6436/6790 [3:43:12<12:29,  2.12s/it] 95%|█████████▍| 6437/6790 [3:43:14<12:18,  2.09s/it]                                                     {'loss': 1.4911, 'learning_rate': 2.788276290288128e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6437/6790 [3:43:14<12:18,  2.09s/it] 95%|█████████▍| 6438/6790 [3:43:16<12:01,  2.05s/it]                                                     {'loss': 1.3095, 'learning_rate': 2.7726700611544034e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6438/6790 [3:43:16<12:01,  2.05s/it] 95%|█████████▍| 6439/6790 [3:43:18<11:53,  2.03s/it]                                                     {'loss': 1.2832, 'learning_rate': 2.757107324543151e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6439/6790 [3:43:18<11:53,  2.03s/it] 95%|█████████▍| 6440/6790 [3:43:20<12:11,  2.09s/it]                                                     {'loss': 1.4175, 'learning_rate': 2.7415880838863817e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6440/6790 [3:43:20<12:11,  2.09s/it] 95%|█████████▍| 6441/6790 [3:43:22<11:50,  2.04s/it]                                                     {'loss': 1.2496, 'learning_rate': 2.7261123426063127e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6441/6790 [3:43:22<11:50,  2.04s/it] 95%|█████████▍| 6442/6790 [3:43:24<11:36,  2.00s/it]                                                     {'loss': 1.3253, 'learning_rate': 2.7106801041156594e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6442/6790 [3:43:24<11:36,  2.00s/it] 95%|█████████▍| 6443/6790 [3:43:26<11:49,  2.04s/it]                                                     {'loss': 1.3449, 'learning_rate': 2.6952913718175655e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6443/6790 [3:43:26<11:49,  2.04s/it] 95%|█████████▍| 6444/6790 [3:43:28<11:37,  2.02s/it]                                                     {'loss': 1.3498, 'learning_rate': 2.679946149105561e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6444/6790 [3:43:28<11:37,  2.02s/it] 95%|█████████▍| 6445/6790 [3:43:30<11:14,  1.95s/it]                                                     {'loss': 1.3841, 'learning_rate': 2.664644439363517e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6445/6790 [3:43:30<11:14,  1.95s/it] 95%|█████████▍| 6446/6790 [3:43:32<10:57,  1.91s/it]                                                     {'loss': 1.5952, 'learning_rate': 2.6493862459657793e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6446/6790 [3:43:32<10:57,  1.91s/it] 95%|█████████▍| 6447/6790 [3:43:34<11:12,  1.96s/it]                                                     {'loss': 1.5952, 'learning_rate': 2.634171572277122e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6447/6790 [3:43:34<11:12,  1.96s/it] 95%|█████████▍| 6448/6790 [3:43:36<11:03,  1.94s/it]                                                     {'loss': 1.4735, 'learning_rate': 2.6190004216526397e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6448/6790 [3:43:36<11:03,  1.94s/it] 95%|█████████▍| 6449/6790 [3:43:38<11:11,  1.97s/it]                                                     {'loss': 1.3801, 'learning_rate': 2.6038727974378784e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6449/6790 [3:43:38<11:11,  1.97s/it] 95%|█████████▍| 6450/6790 [3:43:40<11:11,  1.97s/it]                                                     {'loss': 1.5419, 'learning_rate': 2.588788702968792e-06, 'epoch': 0.95}
+ 95%|█████████▍| 6450/6790 [3:43:40<11:11,  1.97s/it] 95%|█████████▌| 6451/6790 [3:43:42<11:07,  1.97s/it]                                                     {'loss': 1.4223, 'learning_rate': 2.573748141571697e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6451/6790 [3:43:42<11:07,  1.97s/it] 95%|█████████▌| 6452/6790 [3:43:44<11:08,  1.98s/it]                                                     {'loss': 1.534, 'learning_rate': 2.558751116563385e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6452/6790 [3:43:44<11:08,  1.98s/it] 95%|█████████▌| 6453/6790 [3:43:46<11:21,  2.02s/it]                                                     {'loss': 1.2964, 'learning_rate': 2.5437976312509213e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6453/6790 [3:43:46<11:21,  2.02s/it] 95%|█████████▌| 6454/6790 [3:43:48<11:33,  2.06s/it]                                                     {'loss': 1.386, 'learning_rate': 2.5288876889318915e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6454/6790 [3:43:48<11:33,  2.06s/it] 95%|█████████▌| 6455/6790 [3:43:50<11:07,  1.99s/it]                                                     {'loss': 1.1211, 'learning_rate': 2.514021292894242e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6455/6790 [3:43:50<11:07,  1.99s/it] 95%|█████████▌| 6456/6790 [3:43:53<12:37,  2.27s/it]                                                     {'loss': 1.3265, 'learning_rate': 2.4991984464162843e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6456/6790 [3:43:53<12:37,  2.27s/it] 95%|█████████▌| 6457/6790 [3:43:55<12:11,  2.20s/it]                                                     {'loss': 1.441, 'learning_rate': 2.484419152766737e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6457/6790 [3:43:55<12:11,  2.20s/it] 95%|█████████▌| 6458/6790 [3:43:57<11:48,  2.14s/it]                                                     {'loss': 1.5946, 'learning_rate': 2.469683415204749e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6458/6790 [3:43:57<11:48,  2.14s/it] 95%|█████████▌| 6459/6790 [3:43:59<11:10,  2.03s/it]                                                     {'loss': 1.3289, 'learning_rate': 2.4549912369798754e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6459/6790 [3:43:59<11:10,  2.03s/it] 95%|█████████▌| 6460/6790 [3:44:01<11:26,  2.08s/it]                                                     {'loss': 1.2698, 'learning_rate': 2.440342621331948e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6460/6790 [3:44:01<11:26,  2.08s/it] 95%|█████████▌| 6461/6790 [3:44:03<11:32,  2.10s/it]                                                     {'loss': 1.3745, 'learning_rate': 2.425737571491338e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6461/6790 [3:44:03<11:32,  2.10s/it] 95%|█████████▌| 6462/6790 [3:44:05<11:27,  2.10s/it]                                                     {'loss': 1.2129, 'learning_rate': 2.411176090678735e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6462/6790 [3:44:05<11:27,  2.10s/it] 95%|█████████▌| 6463/6790 [3:44:07<11:13,  2.06s/it]                                                     {'loss': 1.4093, 'learning_rate': 2.396658182105216e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6463/6790 [3:44:07<11:13,  2.06s/it] 95%|█████████▌| 6464/6790 [3:44:10<12:29,  2.30s/it]                                                     {'loss': 1.3971, 'learning_rate': 2.382183848972286e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6464/6790 [3:44:10<12:29,  2.30s/it] 95%|█████████▌| 6465/6790 [3:44:12<12:38,  2.33s/it]                                                     {'loss': 1.5789, 'learning_rate': 2.367753094471814e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6465/6790 [3:44:13<12:38,  2.33s/it] 95%|█████████▌| 6466/6790 [3:44:14<12:02,  2.23s/it]                                                     {'loss': 1.5422, 'learning_rate': 2.3533659217860548e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6466/6790 [3:44:14<12:02,  2.23s/it] 95%|█████████▌| 6467/6790 [3:44:16<11:21,  2.11s/it]                                                     {'loss': 1.4052, 'learning_rate': 2.3390223340876928e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6467/6790 [3:44:16<11:21,  2.11s/it] 95%|█████████▌| 6468/6790 [3:44:18<10:48,  2.01s/it]                                                     {'loss': 1.2796, 'learning_rate': 2.324722334539753e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6468/6790 [3:44:18<10:48,  2.01s/it] 95%|█████████▌| 6469/6790 [3:44:20<10:48,  2.02s/it]                                                     {'loss': 1.2625, 'learning_rate': 2.3104659262956907e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6469/6790 [3:44:20<10:48,  2.02s/it] 95%|█████████▌| 6470/6790 [3:44:22<10:30,  1.97s/it]                                                     {'loss': 1.2793, 'learning_rate': 2.2962531124992803e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6470/6790 [3:44:22<10:30,  1.97s/it] 95%|█████████▌| 6471/6790 [3:44:24<10:44,  2.02s/it]                                                     {'loss': 1.5038, 'learning_rate': 2.2820838962847256e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6471/6790 [3:44:24<10:44,  2.02s/it] 95%|█████████▌| 6472/6790 [3:44:26<10:23,  1.96s/it]                                                     {'loss': 1.4026, 'learning_rate': 2.267958280776705e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6472/6790 [3:44:26<10:23,  1.96s/it] 95%|█████████▌| 6473/6790 [3:44:28<10:12,  1.93s/it]                                                     {'loss': 1.1856, 'learning_rate': 2.253876269090105e-06, 'epoch': 0.95}
+ 95%|█���███████▌| 6473/6790 [3:44:28<10:12,  1.93s/it] 95%|█████████▌| 6474/6790 [3:44:30<10:53,  2.07s/it]                                                     {'loss': 1.5117, 'learning_rate': 2.2398378643303296e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6474/6790 [3:44:30<10:53,  2.07s/it] 95%|█████████▌| 6475/6790 [3:44:32<10:59,  2.09s/it]                                                     {'loss': 1.5982, 'learning_rate': 2.2258430695931033e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6475/6790 [3:44:32<10:59,  2.09s/it] 95%|█████████▌| 6476/6790 [3:44:34<10:43,  2.05s/it]                                                     {'loss': 1.3119, 'learning_rate': 2.211891887964579e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6476/6790 [3:44:34<10:43,  2.05s/it] 95%|█████████▌| 6477/6790 [3:44:36<10:21,  1.99s/it]                                                     {'loss': 1.4127, 'learning_rate': 2.1979843225212294e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6477/6790 [3:44:36<10:21,  1.99s/it] 95%|█████████▌| 6478/6790 [3:44:38<10:12,  1.96s/it]                                                     {'loss': 1.4028, 'learning_rate': 2.1841203763300013e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6478/6790 [3:44:38<10:12,  1.96s/it] 95%|█████████▌| 6479/6790 [3:44:41<11:34,  2.23s/it]                                                     {'loss': 1.2173, 'learning_rate': 2.1703000524481156e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6479/6790 [3:44:41<11:34,  2.23s/it] 95%|█████████▌| 6480/6790 [3:44:43<11:04,  2.14s/it]                                                     {'loss': 1.3159, 'learning_rate': 2.15652335392329e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6480/6790 [3:44:43<11:04,  2.14s/it] 95%|█████████▌| 6481/6790 [3:44:45<11:07,  2.16s/it]                                                     {'loss': 1.4166, 'learning_rate': 2.142790283793494e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6481/6790 [3:44:45<11:07,  2.16s/it] 95%|█████████▌| 6482/6790 [3:44:47<11:11,  2.18s/it]                                                     {'loss': 1.6906, 'learning_rate': 2.129100845087173e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6482/6790 [3:44:47<11:11,  2.18s/it] 95%|█████████▌| 6483/6790 [3:44:50<11:24,  2.23s/it]                                                     {'loss': 1.3564, 'learning_rate': 2.115455040823089e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6483/6790 [3:44:50<11:24,  2.23s/it] 95%|█████████▌| 6484/6790 [3:44:52<10:59,  2.16s/it]                                                     {'loss': 1.4178, 'learning_rate': 2.101852874010479e-06, 'epoch': 0.95}
+ 95%|█████████▌| 6484/6790 [3:44:52<10:59,  2.16s/it] 96%|█████████▌| 6485/6790 [3:44:54<10:45,  2.12s/it]                                                     {'loss': 1.3638, 'learning_rate': 2.0882943476487895e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6485/6790 [3:44:54<10:45,  2.12s/it] 96%|█████████▌| 6486/6790 [3:44:56<10:24,  2.05s/it]                                                     {'loss': 1.3469, 'learning_rate': 2.0747794647280495e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6486/6790 [3:44:56<10:24,  2.05s/it] 96%|█████████▌| 6487/6790 [3:44:57<09:54,  1.96s/it]                                                     {'loss': 1.1446, 'learning_rate': 2.061308228228498e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6487/6790 [3:44:57<09:54,  1.96s/it] 96%|█████████▌| 6488/6790 [3:45:00<10:43,  2.13s/it]                                                     {'loss': 1.2049, 'learning_rate': 2.047880641120803e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6488/6790 [3:45:00<10:43,  2.13s/it] 96%|█████████▌| 6489/6790 [3:45:02<10:37,  2.12s/it]                                                     {'loss': 1.4777, 'learning_rate': 2.034496706366018e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6489/6790 [3:45:02<10:37,  2.12s/it] 96%|█████████▌| 6490/6790 [3:45:04<10:14,  2.05s/it]                                                     {'loss': 1.3919, 'learning_rate': 2.021156426915605e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6490/6790 [3:45:04<10:14,  2.05s/it] 96%|█████████▌| 6491/6790 [3:45:06<09:52,  1.98s/it]                                                     {'loss': 1.293, 'learning_rate': 2.0078598057113205e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6491/6790 [3:45:06<09:52,  1.98s/it] 96%|█████████▌| 6492/6790 [3:45:08<10:16,  2.07s/it]                                                     {'loss': 1.5131, 'learning_rate': 1.994606845685332e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6492/6790 [3:45:08<10:16,  2.07s/it] 96%|█████████▌| 6493/6790 [3:45:10<10:06,  2.04s/it]                                                     {'loss': 1.1727, 'learning_rate': 1.981397549760189e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6493/6790 [3:45:10<10:06,  2.04s/it] 96%|█████████▌| 6494/6790 [3:45:12<10:10,  2.06s/it]                                                     {'loss': 1.3839, 'learning_rate': 1.9682319208488064e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6494/6790 [3:45:12<10:10,  2.06s/it] 96%|█████████▌| 6495/6790 [3:45:14<10:37,  2.16s/it]                                                     {'loss': 1.4506, 'learning_rate': 1.955109961854462e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6495/6790 [3:45:14<10:37,  2.16s/it] 96%|█████████▌| 6496/6790 [3:45:16<10:09,  2.07s/it]                                                     {'loss': 1.2526, 'learning_rate': 1.9420316756707968e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6496/6790 [3:45:16<10:09,  2.07s/it] 96%|█████████▌| 6497/6790 [3:45:18<10:06,  2.07s/it]                                                     {'loss': 1.3646, 'learning_rate': 1.928997065181859e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6497/6790 [3:45:18<10:06,  2.07s/it] 96%|█████████▌| 6498/6790 [3:45:21<10:23,  2.13s/it]                                                     {'loss': 1.4008, 'learning_rate': 1.9160061332619937e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6498/6790 [3:45:21<10:23,  2.13s/it] 96%|█████████▌| 6499/6790 [3:45:23<10:45,  2.22s/it]                                                     {'loss': 1.5154, 'learning_rate': 1.9030588827759766e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6499/6790 [3:45:23<10:45,  2.22s/it] 96%|█████████▌| 6500/6790 [3:45:25<10:13,  2.11s/it]                                                     {'loss': 1.3647, 'learning_rate': 1.8901553165789676e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6500/6790 [3:45:25<10:13,  2.11s/it] 96%|█████████▌| 6501/6790 [3:45:27<09:53,  2.06s/it]                                                     {'loss': 1.4697, 'learning_rate': 1.8772954375164242e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6501/6790 [3:45:27<09:53,  2.06s/it] 96%|█████████▌| 6502/6790 [3:45:29<09:33,  1.99s/it]                                                     {'loss': 1.5209, 'learning_rate': 1.864479248424189e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6502/6790 [3:45:29<09:33,  1.99s/it] 96%|█████████▌| 6503/6790 [3:45:31<09:23,  1.96s/it]                                                     {'loss': 1.3601, 'learning_rate': 1.8517067521285126e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6503/6790 [3:45:31<09:23,  1.96s/it] 96%|█████████▌| 6504/6790 [3:45:33<09:46,  2.05s/it]                                                     {'loss': 1.4565, 'learning_rate': 1.838977951445986e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6504/6790 [3:45:33<09:46,  2.05s/it] 96%|█████████▌| 6505/6790 [3:45:35<09:53,  2.08s/it]                                                     {'loss': 1.4823, 'learning_rate': 1.8262928491835196e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6505/6790 [3:45:35<09:53,  2.08s/it] 96%|█████████▌| 6506/6790 [3:45:37<09:41,  2.05s/it]                                                     {'loss': 1.3295, 'learning_rate': 1.813651448138498e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6506/6790 [3:45:37<09:41,  2.05s/it] 96%|█████████▌| 6507/6790 [3:45:39<09:21,  1.98s/it]                                                     {'loss': 1.3867, 'learning_rate': 1.8010537510985358e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6507/6790 [3:45:39<09:21,  1.98s/it] 96%|█████████▌| 6508/6790 [3:45:41<09:30,  2.02s/it]                                                     {'loss': 1.3976, 'learning_rate': 1.7884997608416997e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6508/6790 [3:45:41<09:30,  2.02s/it] 96%|█████████▌| 6509/6790 [3:45:43<09:40,  2.06s/it]                                                     {'loss': 1.2514, 'learning_rate': 1.7759894801363975e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6509/6790 [3:45:43<09:40,  2.06s/it] 96%|█████████▌| 6510/6790 [3:45:45<09:22,  2.01s/it]                                                     {'loss': 1.2551, 'learning_rate': 1.7635229117413998e-06, 'epoch': 0.96}
+ 96%|████��████▌| 6510/6790 [3:45:45<09:22,  2.01s/it] 96%|█████████▌| 6511/6790 [3:45:47<10:09,  2.18s/it]                                                     {'loss': 1.3564, 'learning_rate': 1.7511000584057968e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6511/6790 [3:45:47<10:09,  2.18s/it] 96%|█████████▌| 6512/6790 [3:45:50<10:16,  2.22s/it]                                                     {'loss': 1.1028, 'learning_rate': 1.7387209228691082e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6512/6790 [3:45:50<10:16,  2.22s/it] 96%|█████████▌| 6513/6790 [3:45:52<09:45,  2.11s/it]                                                     {'loss': 1.4626, 'learning_rate': 1.7263855078611724e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6513/6790 [3:45:52<09:45,  2.11s/it] 96%|█████████▌| 6514/6790 [3:45:54<09:39,  2.10s/it]                                                     {'loss': 1.325, 'learning_rate': 1.7140938161021692e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6514/6790 [3:45:54<09:39,  2.10s/it] 96%|█████████▌| 6515/6790 [3:45:56<09:30,  2.08s/it]                                                     {'loss': 1.392, 'learning_rate': 1.7018458503026858e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6515/6790 [3:45:56<09:30,  2.08s/it] 96%|█████████▌| 6516/6790 [3:45:58<09:32,  2.09s/it]                                                     {'loss': 1.499, 'learning_rate': 1.6896416131636283e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6516/6790 [3:45:58<09:32,  2.09s/it] 96%|█████████▌| 6517/6790 [3:46:00<09:32,  2.10s/it]                                                     {'loss': 1.5353, 'learning_rate': 1.6774811073762664e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6517/6790 [3:46:00<09:32,  2.10s/it] 96%|█████████▌| 6518/6790 [3:46:02<09:13,  2.04s/it]                                                     {'loss': 1.4494, 'learning_rate': 1.6653643356222326e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6518/6790 [3:46:02<09:13,  2.04s/it] 96%|█████████▌| 6519/6790 [3:46:05<10:09,  2.25s/it]                                                     {'loss': 1.402, 'learning_rate': 1.653291300573523e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6519/6790 [3:46:05<10:09,  2.25s/it] 96%|█████████▌| 6520/6790 [3:46:06<09:32,  2.12s/it]                                                     {'loss': 1.0973, 'learning_rate': 1.6412620048924965e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6520/6790 [3:46:06<09:32,  2.12s/it] 96%|█████████▌| 6521/6790 [3:46:08<09:18,  2.08s/it]                                                     {'loss': 1.467, 'learning_rate': 1.6292764512318092e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6521/6790 [3:46:08<09:18,  2.08s/it] 96%|█████████▌| 6522/6790 [3:46:10<08:59,  2.01s/it]                                                     {'loss': 1.3731, 'learning_rate': 1.617334642234547e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6522/6790 [3:46:10<08:59,  2.01s/it] 96%|█████████▌| 6523/6790 [3:46:12<09:08,  2.05s/it]                                                     {'loss': 1.4258, 'learning_rate': 1.6054365805341142e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6523/6790 [3:46:12<09:08,  2.05s/it] 96%|█████████▌| 6524/6790 [3:46:14<09:03,  2.04s/it]                                                     {'loss': 1.4865, 'learning_rate': 1.5935822687542567e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6524/6790 [3:46:14<09:03,  2.04s/it] 96%|█████████▌| 6525/6790 [3:46:17<09:26,  2.14s/it]                                                     {'loss': 1.454, 'learning_rate': 1.581771709509061e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6525/6790 [3:46:17<09:26,  2.14s/it] 96%|█████████▌| 6526/6790 [3:46:19<09:27,  2.15s/it]                                                     {'loss': 1.4696, 'learning_rate': 1.5700049054030442e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6526/6790 [3:46:19<09:27,  2.15s/it] 96%|█████████▌| 6527/6790 [3:46:21<09:02,  2.06s/it]                                                     {'loss': 1.4305, 'learning_rate': 1.5582818590309744e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6527/6790 [3:46:21<09:02,  2.06s/it] 96%|█████████▌| 6528/6790 [3:46:23<08:48,  2.02s/it]                                                     {'loss': 1.2455, 'learning_rate': 1.5466025729780064e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6528/6790 [3:46:23<08:48,  2.02s/it] 96%|█████████▌| 6529/6790 [3:46:25<08:49,  2.03s/it]                                                     {'loss': 1.3615, 'learning_rate': 1.534967049819702e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6529/6790 [3:46:25<08:49,  2.03s/it] 96%|█████████▌| 6530/6790 [3:46:27<08:35,  1.98s/it]                                                     {'loss': 1.4442, 'learning_rate': 1.523375292121898e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6530/6790 [3:46:27<08:35,  1.98s/it] 96%|█████████▌| 6531/6790 [3:46:29<08:27,  1.96s/it]                                                     {'loss': 1.4512, 'learning_rate': 1.5118273024407936e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6531/6790 [3:46:29<08:27,  1.96s/it] 96%|█████████▌| 6532/6790 [3:46:30<08:23,  1.95s/it]                                                     {'loss': 1.3508, 'learning_rate': 1.5003230833229521e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6532/6790 [3:46:31<08:23,  1.95s/it] 96%|█████████▌| 6533/6790 [3:46:33<08:59,  2.10s/it]                                                     {'loss': 1.3483, 'learning_rate': 1.4888626373053216e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6533/6790 [3:46:33<08:59,  2.10s/it] 96%|█████████▌| 6534/6790 [3:46:35<08:41,  2.04s/it]                                                     {'loss': 1.3233, 'learning_rate': 1.477445966915103e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6534/6790 [3:46:35<08:41,  2.04s/it] 96%|█████████▌| 6535/6790 [3:46:37<08:57,  2.11s/it]                                                     {'loss': 1.4958, 'learning_rate': 1.466073074669927e-06, 'epoch': 0.96}
+ 96%|█████████▌| 6535/6790 [3:46:37<08:57,  2.11s/it] 96%|█████████▋| 6536/6790 [3:46:39<08:54,  2.10s/it]                                                     {'loss': 1.4578, 'learning_rate': 1.4547439630777205e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6536/6790 [3:46:39<08:54,  2.10s/it] 96%|█████████▋| 6537/6790 [3:46:41<08:39,  2.05s/it]                                                     {'loss': 1.4326, 'learning_rate': 1.4434586346367963e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6537/6790 [3:46:41<08:39,  2.05s/it] 96%|█████████▋| 6538/6790 [3:46:43<08:38,  2.06s/it]                                                     {'loss': 1.3098, 'learning_rate': 1.4322170918357857e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6538/6790 [3:46:43<08:38,  2.06s/it] 96%|█████████▋| 6539/6790 [3:46:45<08:43,  2.09s/it]                                                     {'loss': 1.3383, 'learning_rate': 1.4210193371536617e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6539/6790 [3:46:45<08:43,  2.09s/it] 96%|█████████▋| 6540/6790 [3:46:47<08:44,  2.10s/it]                                                     {'loss': 1.4456, 'learning_rate': 1.40986537305976e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6540/6790 [3:46:48<08:44,  2.10s/it] 96%|█████████▋| 6541/6790 [3:46:49<08:24,  2.02s/it]                                                     {'loss': 1.3122, 'learning_rate': 1.3987552020137573e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6541/6790 [3:46:49<08:24,  2.02s/it] 96%|█████████▋| 6542/6790 [3:46:51<08:08,  1.97s/it]                                                     {'loss': 1.3909, 'learning_rate': 1.3876888264656496e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6542/6790 [3:46:51<08:08,  1.97s/it] 96%|█████████▋| 6543/6790 [3:46:54<08:46,  2.13s/it]                                                     {'loss': 1.3425, 'learning_rate': 1.376666248855818e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6543/6790 [3:46:54<08:46,  2.13s/it] 96%|█████████▋| 6544/6790 [3:46:56<08:23,  2.05s/it]                                                     {'loss': 1.2708, 'learning_rate': 1.3656874716149403e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6544/6790 [3:46:56<08:23,  2.05s/it] 96%|█████████▋| 6545/6790 [3:46:58<08:18,  2.03s/it]                                                     {'loss': 1.6726, 'learning_rate': 1.3547524971640356e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6545/6790 [3:46:58<08:18,  2.03s/it] 96%|█████████▋| 6546/6790 [3:46:59<07:58,  1.96s/it]                                                     {'loss': 1.3114, 'learning_rate': 1.3438613279145084e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6546/6790 [3:46:59<07:58,  1.96s/it] 96%|█████████▋| 6547/6790 [3:47:01<07:31,  1.86s/it]                                                     {'loss': 1.2676, 'learning_rate': 1.3330139662680597e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6547/6790 [3:47:01<07:31,  1.86s/it] 96%|█████████▋| 6548/6790 [3:47:03<07:34,  1.88s/it]                                                     {'loss': 1.3375, 'learning_rate': 1.3222104146167536e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6548/6790 [3:47:03<07:34,  1.88s/it] 96%|█████████▋| 6549/6790 [3:47:05<07:43,  1.92s/it]                                                     {'loss': 1.4467, 'learning_rate': 1.3114506753429956e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6549/6790 [3:47:05<07:43,  1.92s/it] 96%|█████████▋| 6550/6790 [3:47:07<07:51,  1.96s/it]                                                     {'loss': 1.505, 'learning_rate': 1.30073475081951e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6550/6790 [3:47:07<07:51,  1.96s/it] 96%|█████████▋| 6551/6790 [3:47:09<08:19,  2.09s/it]                                                     {'loss': 1.4103, 'learning_rate': 1.2900626434093844e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6551/6790 [3:47:09<08:19,  2.09s/it] 96%|█████████▋| 6552/6790 [3:47:12<08:30,  2.14s/it]                                                     {'loss': 1.4109, 'learning_rate': 1.2794343554660248e-06, 'epoch': 0.96}
+ 96%|█████████▋| 6552/6790 [3:47:12<08:30,  2.14s/it] 97%|█████████▋| 6553/6790 [3:47:14<08:21,  2.12s/it]                                                     {'loss': 1.3536, 'learning_rate': 1.2688498893331347e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6553/6790 [3:47:14<08:21,  2.12s/it] 97%|█████████▋| 6554/6790 [3:47:16<08:11,  2.08s/it]                                                     {'loss': 1.4806, 'learning_rate': 1.2583092473448687e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6554/6790 [3:47:16<08:11,  2.08s/it] 97%|█████████▋| 6555/6790 [3:47:18<08:03,  2.06s/it]                                                     {'loss': 1.4553, 'learning_rate': 1.2478124318256124e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6555/6790 [3:47:18<08:03,  2.06s/it] 97%|█████████▋| 6556/6790 [3:47:20<08:14,  2.11s/it]                                                     {'loss': 1.3629, 'learning_rate': 1.2373594450900917e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6556/6790 [3:47:20<08:14,  2.11s/it] 97%|█████████▋| 6557/6790 [3:47:22<08:25,  2.17s/it]                                                     {'loss': 1.4014, 'learning_rate': 1.2269502894434627e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6557/6790 [3:47:22<08:25,  2.17s/it] 97%|█████████▋| 6558/6790 [3:47:24<07:48,  2.02s/it]                                                     {'loss': 1.2964, 'learning_rate': 1.2165849671810892e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6558/6790 [3:47:24<07:48,  2.02s/it] 97%|█████████▋| 6559/6790 [3:47:26<07:42,  2.00s/it]                                                     {'loss': 1.4203, 'learning_rate': 1.206263480588765e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6559/6790 [3:47:26<07:42,  2.00s/it] 97%|█████████▋| 6560/6790 [3:47:28<07:19,  1.91s/it]                                                     {'loss': 1.2367, 'learning_rate': 1.1959858319425588e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6560/6790 [3:47:28<07:19,  1.91s/it] 97%|█████████▋| 6561/6790 [3:47:30<07:22,  1.93s/it]                                                     {'loss': 1.6081, 'learning_rate': 1.185752023508946e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6561/6790 [3:47:30<07:22,  1.93s/it] 97%|█████████▋| 6562/6790 [3:47:36<12:34,  3.31s/it]                                                     {'loss': 1.3179, 'learning_rate': 1.1755620575446103e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6562/6790 [3:47:36<12:34,  3.31s/it] 97%|█████████▋| 6563/6790 [3:47:38<11:10,  2.95s/it]                                                     {'loss': 1.309, 'learning_rate': 1.1654159362966876e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6563/6790 [3:47:38<11:10,  2.95s/it] 97%|█████████▋| 6564/6790 [3:47:40<10:12,  2.71s/it]                                                     {'loss': 1.2885, 'learning_rate': 1.1553136620025663e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6564/6790 [3:47:40<10:12,  2.71s/it] 97%|█████████▋| 6565/6790 [3:47:42<09:20,  2.49s/it]                                                     {'loss': 1.5031, 'learning_rate': 1.1452552368900416e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6565/6790 [3:47:42<09:20,  2.49s/it] 97%|█████████▋| 6566/6790 [3:47:44<08:53,  2.38s/it]                                                     {'loss': 1.268, 'learning_rate': 1.1352406631771618e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6566/6790 [3:47:44<08:53,  2.38s/it] 97%|█████████▋| 6567/6790 [3:47:46<08:26,  2.27s/it]                                                     {'loss': 1.265, 'learning_rate': 1.1252699430723379e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6567/6790 [3:47:46<08:26,  2.27s/it] 97%|█████████▋| 6568/6790 [3:47:49<08:22,  2.26s/it]                                                     {'loss': 1.4656, 'learning_rate': 1.1153430787743225e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6568/6790 [3:47:49<08:22,  2.26s/it] 97%|█████████▋| 6569/6790 [3:47:51<08:14,  2.24s/it]                                                     {'loss': 1.4708, 'learning_rate': 1.1054600724722086e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6569/6790 [3:47:51<08:14,  2.24s/it] 97%|█████████▋| 6570/6790 [3:47:53<08:00,  2.18s/it]                                                     {'loss': 1.4797, 'learning_rate': 1.0956209263453421e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6570/6790 [3:47:53<08:00,  2.18s/it] 97%|█████████▋| 6571/6790 [3:47:55<07:42,  2.11s/it]                                                     {'loss': 1.1997, 'learning_rate': 1.085825642563476e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6571/6790 [3:47:55<07:42,  2.11s/it] 97%|█████████▋| 6572/6790 [3:47:57<07:32,  2.08s/it]                                                     {'loss': 1.5688, 'learning_rate': 1.0760742232866605e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6572/6790 [3:47:57<07:32,  2.08s/it] 97%|█████████▋| 6573/6790 [3:47:59<07:23,  2.04s/it]                                                     {'loss': 1.3884, 'learning_rate': 1.0663666706652864e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6573/6790 [3:47:59<07:23,  2.04s/it] 97%|█████████▋| 6574/6790 [3:48:01<07:22,  2.05s/it]                                                     {'loss': 1.5206, 'learning_rate': 1.0567029868400413e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6574/6790 [3:48:01<07:22,  2.05s/it] 97%|█████████▋| 6575/6790 [3:48:03<07:04,  1.97s/it]                                                     {'loss': 1.4144, 'learning_rate': 1.0470831739419762e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6575/6790 [3:48:03<07:04,  1.97s/it] 97%|█████████▋| 6576/6790 [3:48:05<07:04,  1.99s/it]                                                     {'loss': 1.6423, 'learning_rate': 1.0375072340924608e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6576/6790 [3:48:05<07:04,  1.99s/it] 97%|█████████▋| 6577/6790 [3:48:07<07:06,  2.00s/it]                                                     {'loss': 1.5823, 'learning_rate': 1.0279751694031392e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6577/6790 [3:48:07<07:06,  2.00s/it] 97%|█████████▋| 6578/6790 [3:48:09<07:04,  2.00s/it]                                                     {'loss': 1.6964, 'learning_rate': 1.0184869819760633e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6578/6790 [3:48:09<07:04,  2.00s/it] 97%|█████████▋| 6579/6790 [3:48:11<06:55,  1.97s/it]                                                     {'loss': 1.4869, 'learning_rate': 1.0090426739035153e-06, 'epoch': 0.97}
+ 97%|█████████▋| 6579/6790 [3:48:11<06:55,  1.97s/it] 97%|█████████▋| 6580/6790 [3:48:13<06:54,  1.97s/it]                                                     {'loss': 1.577, 'learning_rate': 9.996422472682066e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6580/6790 [3:48:13<06:54,  1.97s/it] 97%|█████████▋| 6581/6790 [3:48:15<06:58,  2.00s/it]                                                     {'loss': 1.3398, 'learning_rate': 9.902857041431012e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6581/6790 [3:48:15<06:58,  2.00s/it] 97%|█████████▋| 6582/6790 [3:48:17<07:09,  2.06s/it]                                                     {'loss': 1.561, 'learning_rate': 9.8097304659146e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6582/6790 [3:48:17<07:09,  2.06s/it] 97%|█████████▋| 6583/6790 [3:48:19<06:51,  1.99s/it]                                                     {'loss': 1.3791, 'learning_rate': 9.717042766669736e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6583/6790 [3:48:19<06:51,  1.99s/it] 97%|█████████▋| 6584/6790 [3:48:20<06:30,  1.90s/it]                                                     {'loss': 1.4111, 'learning_rate': 9.624793964135404e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6584/6790 [3:48:20<06:30,  1.90s/it] 97%|█████████▋| 6585/6790 [3:48:22<06:37,  1.94s/it]                                                     {'loss': 1.3305, 'learning_rate': 9.532984078654217e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6585/6790 [3:48:22<06:37,  1.94s/it] 97%|█████████▋| 6586/6790 [3:48:25<06:49,  2.01s/it]                                                     {'loss': 1.3525, 'learning_rate': 9.441613130472648e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6586/6790 [3:48:25<06:49,  2.01s/it] 97%|█████████▋| 6587/6790 [3:48:27<07:07,  2.10s/it]                                                     {'loss': 1.5991, 'learning_rate': 9.350681139739248e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6587/6790 [3:48:27<07:07,  2.10s/it] 97%|█████████▋| 6588/6790 [3:48:29<07:07,  2.11s/it]                                                     {'loss': 1.3874, 'learning_rate': 9.260188126506642e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6588/6790 [3:48:29<07:07,  2.11s/it] 97%|█████████▋| 6589/6790 [3:48:33<08:40,  2.59s/it]                                                     {'loss': 1.2392, 'learning_rate': 9.170134110729977e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6589/6790 [3:48:33<08:40,  2.59s/it] 97%|█████████▋| 6590/6790 [3:48:36<09:10,  2.75s/it]                                                     {'loss': 1.2917, 'learning_rate': 9.080519112268482e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6590/6790 [3:48:36<09:10,  2.75s/it] 97%|█████████▋| 6591/6790 [3:48:38<08:25,  2.54s/it]                                                     {'loss': 1.5525, 'learning_rate': 8.991343150883458e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6591/6790 [3:48:38<08:25,  2.54s/it] 97%|█████████▋| 6592/6790 [3:48:40<07:44,  2.35s/it]                                                     {'loss': 1.3139, 'learning_rate': 8.902606246240286e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6592/6790 [3:48:40<07:44,  2.35s/it] 97%|█████████▋| 6593/6790 [3:48:42<07:33,  2.30s/it]                                                     {'loss': 1.5467, 'learning_rate': 8.814308417907091e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6593/6790 [3:48:42<07:33,  2.30s/it] 97%|█████████▋| 6594/6790 [3:48:44<07:38,  2.34s/it]                                                     {'loss': 1.3918, 'learning_rate': 8.726449685355409e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6594/6790 [3:48:44<07:38,  2.34s/it] 97%|█████████▋| 6595/6790 [3:48:47<07:32,  2.32s/it]                                                     {'loss': 1.4031, 'learning_rate': 8.639030067959964e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6595/6790 [3:48:47<07:32,  2.32s/it] 97%|█████████▋| 6596/6790 [3:48:49<07:14,  2.24s/it]                                                     {'loss': 1.4638, 'learning_rate': 8.552049584998001e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6596/6790 [3:48:49<07:14,  2.24s/it] 97%|█████████▋| 6597/6790 [3:48:51<06:49,  2.12s/it]                                                     {'loss': 1.3642, 'learning_rate': 8.465508255650845e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6597/6790 [3:48:51<06:49,  2.12s/it] 97%|█████████▋| 6598/6790 [3:48:53<07:06,  2.22s/it]                                                     {'loss': 1.5509, 'learning_rate': 8.37940609900234e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6598/6790 [3:48:53<07:06,  2.22s/it] 97%|█████████▋| 6599/6790 [3:48:55<06:43,  2.11s/it]                                                     {'loss': 1.5135, 'learning_rate': 8.293743134039966e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6599/6790 [3:48:55<06:43,  2.11s/it] 97%|█████████▋| 6600/6790 [3:48:58<07:11,  2.27s/it]                                                     {'loss': 1.4045, 'learning_rate': 8.208519379653945e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6600/6790 [3:48:58<07:11,  2.27s/it] 97%|█████████▋| 6601/6790 [3:49:01<07:48,  2.48s/it]                                                     {'loss': 1.2775, 'learning_rate': 8.12373485463791e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6601/6790 [3:49:01<07:48,  2.48s/it] 97%|█████████▋| 6602/6790 [3:49:02<07:06,  2.27s/it]                                                     {'loss': 1.3994, 'learning_rate': 8.039389577688239e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6602/6790 [3:49:02<07:06,  2.27s/it] 97%|█████████▋| 6603/6790 [3:49:04<06:52,  2.21s/it]                                                     {'loss': 1.2749, 'learning_rate': 7.955483567404942e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6603/6790 [3:49:04<06:52,  2.21s/it] 97%|█████████▋| 6604/6790 [3:49:06<06:25,  2.07s/it]                                                     {'loss': 1.2856, 'learning_rate': 7.872016842290997e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6604/6790 [3:49:06<06:25,  2.07s/it] 97%|█████████▋| 6605/6790 [3:49:08<06:35,  2.14s/it]                                                     {'loss': 1.2984, 'learning_rate': 7.788989420752568e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6605/6790 [3:49:08<06:35,  2.14s/it] 97%|█████████▋| 6606/6790 [3:49:11<06:31,  2.13s/it]                                                     {'loss': 1.2955, 'learning_rate': 7.706401321098344e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6606/6790 [3:49:11<06:31,  2.13s/it] 97%|█████████▋| 6607/6790 [3:49:12<06:03,  1.99s/it]                                                     {'loss': 1.2613, 'learning_rate': 7.62425256154109e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6607/6790 [3:49:12<06:03,  1.99s/it] 97%|█████████▋| 6608/6790 [3:49:14<05:53,  1.94s/it]                                                     {'loss': 1.3002, 'learning_rate': 7.542543160196314e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6608/6790 [3:49:14<05:53,  1.94s/it] 97%|█████████▋| 6609/6790 [3:49:16<06:17,  2.09s/it]                                                     {'loss': 1.53, 'learning_rate': 7.46127313508227e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6609/6790 [3:49:16<06:17,  2.09s/it] 97%|█████████▋| 6610/6790 [3:49:19<06:27,  2.15s/it]                                                     {'loss': 1.3418, 'learning_rate': 7.3804425041204e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6610/6790 [3:49:19<06:27,  2.15s/it] 97%|█████████▋| 6611/6790 [3:49:21<06:13,  2.09s/it]                                                     {'loss': 1.4577, 'learning_rate': 7.300051285136e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6611/6790 [3:49:21<06:13,  2.09s/it] 97%|█████████▋| 6612/6790 [3:49:23<06:04,  2.05s/it]                                                     {'loss': 1.422, 'learning_rate': 7.22009949585667e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6612/6790 [3:49:23<06:04,  2.05s/it] 97%|█████████▋| 6613/6790 [3:49:25<06:02,  2.05s/it]                                                     {'loss': 1.3527, 'learning_rate': 7.140587153913192e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6613/6790 [3:49:25<06:02,  2.05s/it] 97%|█████████▋| 6614/6790 [3:49:27<06:13,  2.12s/it]                                                     {'loss': 1.4097, 'learning_rate': 7.061514276839765e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6614/6790 [3:49:27<06:13,  2.12s/it] 97%|█████████▋| 6615/6790 [3:49:29<05:55,  2.03s/it]                                                     {'loss': 1.2669, 'learning_rate': 6.982880882073772e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6615/6790 [3:49:29<05:55,  2.03s/it] 97%|█████████▋| 6616/6790 [3:49:31<06:02,  2.08s/it]                                                     {'loss': 1.6345, 'learning_rate': 6.9046869869549e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6616/6790 [3:49:31<06:02,  2.08s/it] 97%|█████████▋| 6617/6790 [3:49:33<05:55,  2.06s/it]                                                     {'loss': 1.2876, 'learning_rate': 6.826932608726689e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6617/6790 [3:49:33<05:55,  2.06s/it] 97%|█████████▋| 6618/6790 [3:49:35<05:47,  2.02s/it]                                                     {'loss': 1.2469, 'learning_rate': 6.749617764535865e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6618/6790 [3:49:35<05:47,  2.02s/it] 97%|█████████▋| 6619/6790 [3:49:37<05:46,  2.03s/it]                                                     {'loss': 1.2733, 'learning_rate': 6.672742471431237e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6619/6790 [3:49:37<05:46,  2.03s/it] 97%|█████████▋| 6620/6790 [3:49:39<05:54,  2.09s/it]                                                     {'loss': 1.3167, 'learning_rate': 6.59630674636591e-07, 'epoch': 0.97}
+ 97%|█████████▋| 6620/6790 [3:49:39<05:54,  2.09s/it] 98%|█████████▊| 6621/6790 [3:49:41<05:50,  2.07s/it]                                                     {'loss': 1.3815, 'learning_rate': 6.520310606195069e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6621/6790 [3:49:41<05:50,  2.07s/it] 98%|█████████▊| 6622/6790 [3:49:44<06:04,  2.17s/it]                                                     {'loss': 1.4965, 'learning_rate': 6.444754067677528e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6622/6790 [3:49:44<06:04,  2.17s/it] 98%|█████████▊| 6623/6790 [3:49:46<05:51,  2.11s/it]                                                     {'loss': 1.2602, 'learning_rate': 6.36963714747485e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6623/6790 [3:49:46<05:51,  2.11s/it] 98%|█████████▊| 6624/6790 [3:49:48<05:38,  2.04s/it]                                                     {'loss': 1.3723, 'learning_rate': 6.294959862152227e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6624/6790 [3:49:48<05:38,  2.04s/it] 98%|█████████▊| 6625/6790 [3:49:50<05:34,  2.02s/it]                                                     {'loss': 1.3724, 'learning_rate': 6.220722228176934e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6625/6790 [3:49:50<05:34,  2.02s/it] 98%|█████████▊| 6626/6790 [3:49:51<05:18,  1.94s/it]                                                     {'loss': 1.1157, 'learning_rate': 6.146924261920095e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6626/6790 [3:49:51<05:18,  1.94s/it] 98%|█████████▊| 6627/6790 [3:49:53<05:21,  1.97s/it]                                                     {'loss': 1.4682, 'learning_rate': 6.073565979655804e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6627/6790 [3:49:53<05:21,  1.97s/it] 98%|█████████▊| 6628/6790 [3:49:55<05:30,  2.04s/it]                                                     {'loss': 1.4245, 'learning_rate': 6.000647397560455e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6628/6790 [3:49:56<05:30,  2.04s/it] 98%|█████████▊| 6629/6790 [3:49:58<05:28,  2.04s/it]                                                     {'loss': 1.4181, 'learning_rate': 5.92816853171474e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6629/6790 [3:49:58<05:28,  2.04s/it] 98%|█████████▊| 6630/6790 [3:50:00<05:35,  2.10s/it]                                                     {'loss': 1.4086, 'learning_rate': 5.856129398100985e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6630/6790 [3:50:00<05:35,  2.10s/it] 98%|█████████▊| 6631/6790 [3:50:02<05:21,  2.02s/it]                                                     {'loss': 1.366, 'learning_rate': 5.784530012605816e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6631/6790 [3:50:02<05:21,  2.02s/it] 98%|█████████▊| 6632/6790 [3:50:04<05:14,  1.99s/it]                                                     {'loss': 1.2711, 'learning_rate': 5.713370391018158e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6632/6790 [3:50:04<05:14,  1.99s/it] 98%|█████████▊| 6633/6790 [3:50:06<05:16,  2.02s/it]                                                     {'loss': 1.3619, 'learning_rate': 5.642650549029904e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6633/6790 [3:50:06<05:16,  2.02s/it] 98%|█████████▊| 6634/6790 [3:50:08<05:15,  2.03s/it]                                                     {'loss': 1.5602, 'learning_rate': 5.572370502236357e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6634/6790 [3:50:08<05:15,  2.03s/it] 98%|█████████▊| 6635/6790 [3:50:10<05:16,  2.05s/it]                                                     {'loss': 1.5481, 'learning_rate': 5.502530266135564e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6635/6790 [3:50:10<05:16,  2.05s/it] 98%|█████████▊| 6636/6790 [3:50:12<05:16,  2.05s/it]                                                     {'loss': 1.4261, 'learning_rate': 5.43312985612876e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6636/6790 [3:50:12<05:16,  2.05s/it] 98%|█████████▊| 6637/6790 [3:50:14<05:13,  2.05s/it]                                                     {'loss': 1.3848, 'learning_rate': 5.364169287520149e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6637/6790 [3:50:14<05:13,  2.05s/it] 98%|█████████▊| 6638/6790 [3:50:16<05:06,  2.02s/it]                                                     {'loss': 1.3057, 'learning_rate': 5.295648575516677e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6638/6790 [3:50:16<05:06,  2.02s/it] 98%|█████████▊| 6639/6790 [3:50:18<05:21,  2.13s/it]                                                     {'loss': 1.3704, 'learning_rate': 5.2275677352287e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6639/6790 [3:50:18<05:21,  2.13s/it] 98%|█████████▊| 6640/6790 [3:50:20<05:03,  2.02s/it]                                                     {'loss': 1.1564, 'learning_rate': 5.159926781669322e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6640/6790 [3:50:20<05:03,  2.02s/it] 98%|█████████▊| 6641/6790 [3:50:22<05:04,  2.04s/it]                                                     {'loss': 1.5856, 'learning_rate': 5.09272572975461e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6641/6790 [3:50:22<05:04,  2.04s/it] 98%|█████████▊| 6642/6790 [3:50:24<05:18,  2.15s/it]                                                     {'loss': 1.3687, 'learning_rate': 5.025964594304045e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6642/6790 [3:50:24<05:18,  2.15s/it] 98%|█████████▊| 6643/6790 [3:50:27<05:27,  2.23s/it]                                                     {'loss': 1.5208, 'learning_rate': 4.959643390039625e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6643/6790 [3:50:27<05:27,  2.23s/it] 98%|█████████▊| 6644/6790 [3:50:29<05:16,  2.17s/it]                                                     {'loss': 1.4854, 'learning_rate': 4.893762131586322e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6644/6790 [3:50:29<05:16,  2.17s/it] 98%|█████████▊| 6645/6790 [3:50:31<05:05,  2.11s/it]                                                     {'loss': 1.329, 'learning_rate': 4.828320833472289e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6645/6790 [3:50:31<05:05,  2.11s/it] 98%|█████████▊| 6646/6790 [3:50:33<04:59,  2.08s/it]                                                     {'loss': 1.4699, 'learning_rate': 4.763319510128872e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6646/6790 [3:50:33<04:59,  2.08s/it] 98%|█████████▊| 6647/6790 [3:50:35<04:54,  2.06s/it]                                                     {'loss': 1.6399, 'learning_rate': 4.6987581758899393e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6647/6790 [3:50:35<04:54,  2.06s/it] 98%|█████████▊| 6648/6790 [3:50:37<04:51,  2.05s/it]                                                     {'loss': 1.4154, 'learning_rate': 4.634636844992546e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6648/6790 [3:50:37<04:51,  2.05s/it] 98%|█████████▊| 6649/6790 [3:50:40<05:13,  2.22s/it]                                                     {'loss': 1.1629, 'learning_rate': 4.570955531576715e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6649/6790 [3:50:40<05:13,  2.22s/it] 98%|█████████▊| 6650/6790 [3:50:42<05:09,  2.21s/it]                                                     {'loss': 1.2946, 'learning_rate': 4.5077142496856575e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6650/6790 [3:50:42<05:09,  2.21s/it] 98%|█████████▊| 6651/6790 [3:50:44<04:58,  2.15s/it]                                                     {'loss': 1.5475, 'learning_rate': 4.444913013264884e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6651/6790 [3:50:44<04:58,  2.15s/it] 98%|█████████▊| 6652/6790 [3:50:46<04:54,  2.14s/it]                                                     {'loss': 1.3281, 'learning_rate': 4.382551836163762e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6652/6790 [3:50:46<04:54,  2.14s/it] 98%|█████████▊| 6653/6790 [3:50:48<04:45,  2.09s/it]                                                     {'loss': 1.2722, 'learning_rate': 4.3206307321337347e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6653/6790 [3:50:48<04:45,  2.09s/it] 98%|█████████▊| 6654/6790 [3:50:50<04:50,  2.13s/it]                                                     {'loss': 1.3559, 'learning_rate': 4.259149714830102e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6654/6790 [3:50:50<04:50,  2.13s/it] 98%|█████████▊| 6655/6790 [3:50:52<04:46,  2.12s/it]                                                     {'loss': 1.1246, 'learning_rate': 4.1981087978102405e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6655/6790 [3:50:52<04:46,  2.12s/it] 98%|█████████▊| 6656/6790 [3:50:54<04:39,  2.09s/it]                                                     {'loss': 1.065, 'learning_rate': 4.1375079945351615e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6656/6790 [3:50:54<04:39,  2.09s/it] 98%|█████████▊| 6657/6790 [3:50:56<04:27,  2.01s/it]                                                     {'loss': 1.3417, 'learning_rate': 4.0773473183681743e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6657/6790 [3:50:56<04:27,  2.01s/it] 98%|█████████▊| 6658/6790 [3:50:58<04:21,  1.98s/it]                                                     {'loss': 1.1001, 'learning_rate': 4.0176267825762226e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6658/6790 [3:50:58<04:21,  1.98s/it] 98%|█████████▊| 6659/6790 [3:51:00<04:15,  1.95s/it]                                                     {'loss': 1.2098, 'learning_rate': 3.958346400328994e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6659/6790 [3:51:00<04:15,  1.95s/it] 98%|█████████▊| 6660/6790 [3:51:02<04:15,  1.97s/it]                                                     {'loss': 1.4595, 'learning_rate': 3.899506184698476e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6660/6790 [3:51:02<04:15,  1.97s/it] 98%|█████████▊| 6661/6790 [3:51:05<04:54,  2.28s/it]                                                     {'loss': 1.2434, 'learning_rate': 3.8411061486605113e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6661/6790 [3:51:05<04:54,  2.28s/it] 98%|█████████▊| 6662/6790 [3:51:07<04:44,  2.23s/it]                                                     {'loss': 1.4995, 'learning_rate': 3.7831463050934655e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6662/6790 [3:51:07<04:44,  2.23s/it] 98%|█████████▊| 6663/6790 [3:51:09<04:37,  2.18s/it]                                                     {'loss': 1.345, 'learning_rate': 3.725626666778226e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6663/6790 [3:51:09<04:37,  2.18s/it] 98%|█████████▊| 6664/6790 [3:51:11<04:30,  2.15s/it]                                                     {'loss': 1.5135, 'learning_rate': 3.668547246399534e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6664/6790 [3:51:11<04:30,  2.15s/it] 98%|█████████▊| 6665/6790 [3:51:13<04:39,  2.24s/it]                                                     {'loss': 1.4252, 'learning_rate': 3.6119080565442107e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6665/6790 [3:51:13<04:39,  2.24s/it] 98%|█████████▊| 6666/6790 [3:51:15<04:19,  2.10s/it]                                                     {'loss': 1.3423, 'learning_rate': 3.5557091097024873e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6666/6790 [3:51:15<04:19,  2.10s/it] 98%|█████████▊| 6667/6790 [3:51:17<04:15,  2.08s/it]                                                     {'loss': 1.4507, 'learning_rate': 3.4999504182668954e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6667/6790 [3:51:17<04:15,  2.08s/it] 98%|█████████▊| 6668/6790 [3:51:19<04:02,  1.99s/it]                                                     {'loss': 1.3101, 'learning_rate': 3.444631994534042e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6668/6790 [3:51:19<04:02,  1.99s/it] 98%|█████████▊| 6669/6790 [3:51:21<03:58,  1.97s/it]                                                     {'loss': 1.4264, 'learning_rate': 3.389753850702171e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6669/6790 [3:51:21<03:58,  1.97s/it] 98%|█████████▊| 6670/6790 [3:51:23<03:54,  1.95s/it]                                                     {'loss': 1.5286, 'learning_rate': 3.3353159988731564e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6670/6790 [3:51:23<03:54,  1.95s/it] 98%|█████████▊| 6671/6790 [3:51:25<04:00,  2.02s/it]                                                     {'loss': 1.3142, 'learning_rate': 3.28131845105184e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6671/6790 [3:51:25<04:00,  2.02s/it] 98%|█████████▊| 6672/6790 [3:51:28<04:19,  2.20s/it]                                                     {'loss': 1.5317, 'learning_rate': 3.2277612191453644e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6672/6790 [3:51:28<04:19,  2.20s/it] 98%|█████████▊| 6673/6790 [3:51:30<04:04,  2.09s/it]                                                     {'loss': 1.4644, 'learning_rate': 3.174644314964503e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6673/6790 [3:51:30<04:04,  2.09s/it] 98%|█████████▊| 6674/6790 [3:51:31<03:55,  2.03s/it]                                                     {'loss': 1.2378, 'learning_rate': 3.121967750222332e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6674/6790 [3:51:31<03:55,  2.03s/it] 98%|█████████▊| 6675/6790 [3:51:33<03:51,  2.01s/it]                                                     {'loss': 1.4269, 'learning_rate': 3.0697315365351144e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6675/6790 [3:51:33<03:51,  2.01s/it] 98%|█████████▊| 6676/6790 [3:51:35<03:39,  1.93s/it]                                                     {'loss': 1.364, 'learning_rate': 3.017935685422302e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6676/6790 [3:51:35<03:39,  1.93s/it] 98%|█████████▊| 6677/6790 [3:51:37<03:43,  1.98s/it]                                                     {'loss': 1.6057, 'learning_rate': 2.966580208305425e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6677/6790 [3:51:37<03:43,  1.98s/it] 98%|█████████▊| 6678/6790 [3:51:39<03:47,  2.03s/it]                                                     {'loss': 1.4072, 'learning_rate': 2.9156651165096473e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6678/6790 [3:51:39<03:47,  2.03s/it] 98%|█████████▊| 6679/6790 [3:51:41<03:37,  1.96s/it]                                                     {'loss': 1.2139, 'learning_rate': 2.8651904212626537e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6679/6790 [3:51:41<03:37,  1.96s/it] 98%|█████████▊| 6680/6790 [3:51:44<03:52,  2.12s/it]                                                     {'loss': 1.4888, 'learning_rate': 2.815156133695096e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6680/6790 [3:51:44<03:52,  2.12s/it] 98%|█████████▊| 6681/6790 [3:51:46<03:44,  2.06s/it]                                                     {'loss': 1.3937, 'learning_rate': 2.765562264840593e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6681/6790 [3:51:46<03:44,  2.06s/it] 98%|█████████▊| 6682/6790 [3:51:47<03:36,  2.01s/it]                                                     {'loss': 1.3734, 'learning_rate': 2.71640882563573e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6682/6790 [3:51:47<03:36,  2.01s/it] 98%|█████████▊| 6683/6790 [3:51:49<03:27,  1.94s/it]                                                     {'loss': 1.4409, 'learning_rate': 2.6676958269193917e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6683/6790 [3:51:49<03:27,  1.94s/it] 98%|█████████▊| 6684/6790 [3:51:51<03:34,  2.03s/it]                                                     {'loss': 1.4715, 'learning_rate': 2.6194232794343186e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6684/6790 [3:51:51<03:34,  2.03s/it] 98%|█████████▊| 6685/6790 [3:51:54<03:38,  2.08s/it]                                                     {'loss': 1.2652, 'learning_rate': 2.571591193824885e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6685/6790 [3:51:54<03:38,  2.08s/it] 98%|█████████▊| 6686/6790 [3:51:56<03:37,  2.09s/it]                                                     {'loss': 1.5625, 'learning_rate': 2.5241995806395415e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6686/6790 [3:51:56<03:37,  2.09s/it] 98%|█████████▊| 6687/6790 [3:51:58<03:35,  2.09s/it]                                                     {'loss': 1.6186, 'learning_rate': 2.477248450328817e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6687/6790 [3:51:58<03:35,  2.09s/it] 98%|█████████▊| 6688/6790 [3:52:00<03:36,  2.12s/it]                                                     {'loss': 1.3642, 'learning_rate': 2.430737813246653e-07, 'epoch': 0.98}
+ 98%|█████████▊| 6688/6790 [3:52:00<03:36,  2.12s/it] 99%|█████████▊| 6689/6790 [3:52:02<03:28,  2.06s/it]                                                     {'loss': 1.2507, 'learning_rate': 2.3846676796490665e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6689/6790 [3:52:02<03:28,  2.06s/it] 99%|█████████▊| 6690/6790 [3:52:04<03:22,  2.03s/it]                                                     {'loss': 1.3329, 'learning_rate': 2.3390380596959304e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6690/6790 [3:52:04<03:22,  2.03s/it] 99%|█████████▊| 6691/6790 [3:52:06<03:18,  2.00s/it]                                                     {'loss': 1.4109, 'learning_rate': 2.2938489634494186e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6691/6790 [3:52:06<03:18,  2.00s/it] 99%|█████████▊| 6692/6790 [3:52:08<03:16,  2.01s/it]                                                     {'loss': 1.386, 'learning_rate': 2.2491004008742267e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6692/6790 [3:52:08<03:16,  2.01s/it] 99%|█████████▊| 6693/6790 [3:52:10<03:20,  2.07s/it]                                                     {'loss': 1.3703, 'learning_rate': 2.2047923818384608e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6693/6790 [3:52:10<03:20,  2.07s/it] 99%|█████████▊| 6694/6790 [3:52:12<03:12,  2.01s/it]                                                     {'loss': 1.25, 'learning_rate': 2.1609249161131938e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6694/6790 [3:52:12<03:12,  2.01s/it] 99%|█████████▊| 6695/6790 [3:52:14<03:16,  2.07s/it]                                                     {'loss': 1.3213, 'learning_rate': 2.1174980133717993e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6695/6790 [3:52:14<03:16,  2.07s/it] 99%|█████████▊| 6696/6790 [3:52:17<03:21,  2.14s/it]                                                     {'loss': 1.4131, 'learning_rate': 2.0745116831908385e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6696/6790 [3:52:17<03:21,  2.14s/it] 99%|█████████▊| 6697/6790 [3:52:18<03:13,  2.08s/it]                                                     {'loss': 1.6598, 'learning_rate': 2.03196593504984e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6697/6790 [3:52:18<03:13,  2.08s/it] 99%|█████████▊| 6698/6790 [3:52:21<03:15,  2.12s/it]                                                     {'loss': 1.2261, 'learning_rate': 1.9898607783306322e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6698/6790 [3:52:21<03:15,  2.12s/it] 99%|█████████▊| 6699/6790 [3:52:23<03:05,  2.03s/it]                                                     {'loss': 1.318, 'learning_rate': 1.9481962223182325e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6699/6790 [3:52:23<03:05,  2.03s/it] 99%|█████████▊| 6700/6790 [3:52:24<03:00,  2.00s/it]                                                     {'loss': 1.4787, 'learning_rate': 1.906972276200847e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6700/6790 [3:52:24<03:00,  2.00s/it] 99%|█████████▊| 6701/6790 [3:52:27<03:04,  2.08s/it]                                                     {'loss': 1.4636, 'learning_rate': 1.866188949068981e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6701/6790 [3:52:27<03:04,  2.08s/it] 99%|█████████▊| 6702/6790 [3:52:29<03:05,  2.10s/it]                                                     {'loss': 1.3088, 'learning_rate': 1.8258462499161078e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6702/6790 [3:52:29<03:05,  2.10s/it] 99%|█████████▊| 6703/6790 [3:52:31<02:59,  2.06s/it]                                                     {'loss': 1.29, 'learning_rate': 1.7859441876386662e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6703/6790 [3:52:31<02:59,  2.06s/it] 99%|█████████▊| 6704/6790 [3:52:33<03:12,  2.23s/it]                                                     {'loss': 1.3525, 'learning_rate': 1.74648277103584e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6704/6790 [3:52:33<03:12,  2.23s/it] 99%|█████████▊| 6705/6790 [3:52:35<03:03,  2.16s/it]                                                     {'loss': 1.1552, 'learning_rate': 1.7074620088095571e-07, 'epoch': 0.99}
+ 99%|█████████▊| 6705/6790 [3:52:35<03:03,  2.16s/it] 99%|█████████▉| 6706/6790 [3:52:37<02:58,  2.12s/it]                                                     {'loss': 1.4564, 'learning_rate': 1.6688819095649343e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6706/6790 [3:52:37<02:58,  2.12s/it] 99%|█████████▉| 6707/6790 [3:52:40<02:54,  2.10s/it]                                                     {'loss': 1.3894, 'learning_rate': 1.6307424818091665e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6707/6790 [3:52:40<02:54,  2.10s/it] 99%|█████████▉| 6708/6790 [3:52:42<02:58,  2.18s/it]                                                     {'loss': 1.4767, 'learning_rate': 1.5930437339533033e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6708/6790 [3:52:42<02:58,  2.18s/it] 99%|█████████▉| 6709/6790 [3:52:44<02:52,  2.13s/it]                                                     {'loss': 1.3341, 'learning_rate': 1.5557856743102506e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6709/6790 [3:52:44<02:52,  2.13s/it] 99%|█████████▉| 6710/6790 [3:52:46<02:51,  2.14s/it]                                                     {'loss': 1.4408, 'learning_rate': 1.5189683110965468e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6710/6790 [3:52:46<02:51,  2.14s/it] 99%|█████████▉| 6711/6790 [3:52:49<03:01,  2.30s/it]                                                     {'loss': 1.4974, 'learning_rate': 1.4825916524305872e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6711/6790 [3:52:49<03:01,  2.30s/it] 99%|█████████▉| 6712/6790 [3:52:51<02:49,  2.17s/it]                                                     {'loss': 1.2147, 'learning_rate': 1.446655706334621e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6712/6790 [3:52:51<02:49,  2.17s/it] 99%|█████████▉| 6713/6790 [3:52:52<02:40,  2.08s/it]                                                     {'loss': 1.2278, 'learning_rate': 1.411160480732976e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6713/6790 [3:52:52<02:40,  2.08s/it] 99%|█████████▉| 6714/6790 [3:52:54<02:31,  2.00s/it]                                                     {'loss': 1.2546, 'learning_rate': 1.3761059834533906e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6714/6790 [3:52:54<02:31,  2.00s/it] 99%|█████████▉| 6715/6790 [3:52:56<02:24,  1.93s/it]                                                     {'loss': 1.3251, 'learning_rate': 1.341492222225682e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6715/6790 [3:52:56<02:24,  1.93s/it] 99%|█████████▉| 6716/6790 [3:52:58<02:23,  1.94s/it]                                                     {'loss': 1.4991, 'learning_rate': 1.3073192046828554e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6716/6790 [3:52:58<02:23,  1.94s/it] 99%|█████████▉| 6717/6790 [3:53:00<02:21,  1.94s/it]                                                     {'loss': 1.6758, 'learning_rate': 1.2735869383611042e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6717/6790 [3:53:00<02:21,  1.94s/it] 99%|█████████▉| 6718/6790 [3:53:02<02:19,  1.94s/it]                                                     {'loss': 1.5667, 'learning_rate': 1.2402954306987012e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6718/6790 [3:53:02<02:19,  1.94s/it] 99%|█████████▉| 6719/6790 [3:53:04<02:22,  2.01s/it]                                                     {'loss': 1.48, 'learning_rate': 1.2074446890373293e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6719/6790 [3:53:04<02:22,  2.01s/it] 99%|█████████▉| 6720/6790 [3:53:06<02:24,  2.07s/it]                                                     {'loss': 1.4253, 'learning_rate': 1.1750347206211931e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6720/6790 [3:53:06<02:24,  2.07s/it] 99%|█████████▉| 6721/6790 [3:53:08<02:19,  2.02s/it]                                                     {'loss': 1.4481, 'learning_rate': 1.1430655325972428e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6721/6790 [3:53:08<02:19,  2.02s/it] 99%|█████████▉| 6722/6790 [3:53:10<02:23,  2.10s/it]                                                     {'loss': 1.4429, 'learning_rate': 1.1115371320151725e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6722/6790 [3:53:10<02:23,  2.10s/it] 99%|█████████▉| 6723/6790 [3:53:13<02:19,  2.09s/it]                                                     {'loss': 1.4281, 'learning_rate': 1.0804495258278646e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6723/6790 [3:53:13<02:19,  2.09s/it] 99%|█████████▉| 6724/6790 [3:53:14<02:15,  2.05s/it]                                                     {'loss': 1.3079, 'learning_rate': 1.0498027208907246e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6724/6790 [3:53:14<02:15,  2.05s/it] 99%|█████████▉| 6725/6790 [3:53:17<02:14,  2.06s/it]                                                     {'loss': 1.4989, 'learning_rate': 1.019596723961902e-07, 'epoch': 0.99}
+ 99%|█████████▉| 6725/6790 [3:53:17<02:14,  2.06s/it] 99%|█████████▉| 6726/6790 [3:53:18<02:08,  2.01s/it]                                                     {'loss': 1.2539, 'learning_rate': 9.898315417025128e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6726/6790 [3:53:18<02:08,  2.01s/it] 99%|█████████▉| 6727/6790 [3:53:20<02:03,  1.96s/it]                                                     {'loss': 1.276, 'learning_rate': 9.605071806761957e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6727/6790 [3:53:20<02:03,  1.96s/it] 99%|█████████▉| 6728/6790 [3:53:22<02:04,  2.00s/it]                                                     {'loss': 1.4578, 'learning_rate': 9.316236473495554e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6728/6790 [3:53:22<02:04,  2.00s/it] 99%|█████████▉| 6729/6790 [3:53:24<02:01,  1.98s/it]                                                     {'loss': 1.5099, 'learning_rate': 9.031809480923859e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6729/6790 [3:53:24<02:01,  1.98s/it] 99%|█████████▉| 6730/6790 [3:53:26<01:58,  1.98s/it]                                                     {'loss': 1.6455, 'learning_rate': 8.751790891763367e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6730/6790 [3:53:26<01:58,  1.98s/it] 99%|█████████▉| 6731/6790 [3:53:28<01:51,  1.89s/it]                                                     {'loss': 1.4508, 'learning_rate': 8.476180767764685e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6731/6790 [3:53:28<01:51,  1.89s/it] 99%|█████████▉| 6732/6790 [3:53:30<01:48,  1.87s/it]                                                     {'loss': 1.3991, 'learning_rate': 8.204979169708082e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6732/6790 [3:53:30<01:48,  1.87s/it] 99%|█████████▉| 6733/6790 [3:53:32<01:53,  1.98s/it]                                                     {'loss': 1.0512, 'learning_rate': 7.938186157399053e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6733/6790 [3:53:32<01:53,  1.98s/it] 99%|█████████▉| 6734/6790 [3:53:34<01:49,  1.96s/it]                                                     {'loss': 1.6503, 'learning_rate': 7.675801789666093e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6734/6790 [3:53:34<01:49,  1.96s/it] 99%|█████████▉| 6735/6790 [3:53:36<01:55,  2.10s/it]                                                     {'loss': 1.4658, 'learning_rate': 7.417826124374028e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6735/6790 [3:53:36<01:55,  2.10s/it] 99%|█████████▉| 6736/6790 [3:53:39<01:58,  2.20s/it]                                                     {'loss': 1.3528, 'learning_rate': 7.164259218410685e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6736/6790 [3:53:39<01:58,  2.20s/it] 99%|█████████▉| 6737/6790 [3:53:41<01:53,  2.14s/it]                                                     {'loss': 1.2556, 'learning_rate': 6.915101127691337e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6737/6790 [3:53:41<01:53,  2.14s/it] 99%|█████████▉| 6738/6790 [3:53:43<01:52,  2.17s/it]                                                     {'loss': 1.4744, 'learning_rate': 6.670351907163142e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6738/6790 [3:53:43<01:52,  2.17s/it] 99%|█████████▉| 6739/6790 [3:53:45<01:47,  2.10s/it]                                                     {'loss': 1.3826, 'learning_rate': 6.43001161079626e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6739/6790 [3:53:45<01:47,  2.10s/it] 99%|█████████▉| 6740/6790 [3:53:48<01:54,  2.29s/it]                                                     {'loss': 1.5147, 'learning_rate': 6.1940802915883e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6740/6790 [3:53:48<01:54,  2.29s/it] 99%|█████████▉| 6741/6790 [3:53:50<01:54,  2.33s/it]                                                     {'loss': 1.4849, 'learning_rate': 5.962558001570973e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6741/6790 [3:53:50<01:54,  2.33s/it] 99%|█████████▉| 6742/6790 [3:53:52<01:47,  2.24s/it]                                                     {'loss': 1.3439, 'learning_rate': 5.7354447917967733e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6742/6790 [3:53:52<01:47,  2.24s/it] 99%|█████████▉| 6743/6790 [3:53:54<01:41,  2.17s/it]                                                     {'loss': 1.5426, 'learning_rate': 5.512740712350084e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6743/6790 [3:53:54<01:41,  2.17s/it] 99%|█████████▉| 6744/6790 [3:53:56<01:35,  2.07s/it]                                                     {'loss': 1.1159, 'learning_rate': 5.294445812340509e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6744/6790 [3:53:56<01:35,  2.07s/it] 99%|█████████▉| 6745/6790 [3:53:58<01:31,  2.04s/it]                                                     {'loss': 1.504, 'learning_rate': 5.08056013990732e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6745/6790 [3:53:58<01:31,  2.04s/it] 99%|█████████▉| 6746/6790 [3:54:00<01:25,  1.95s/it]                                                     {'loss': 1.3718, 'learning_rate': 4.871083742217231e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6746/6790 [3:54:00<01:25,  1.95s/it] 99%|█████████▉| 6747/6790 [3:54:02<01:26,  2.02s/it]                                                     {'loss': 1.3144, 'learning_rate': 4.6660166654599604e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6747/6790 [3:54:02<01:26,  2.02s/it] 99%|█████████▉| 6748/6790 [3:54:04<01:24,  2.00s/it]                                                     {'loss': 1.1728, 'learning_rate': 4.465358954861554e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6748/6790 [3:54:04<01:24,  2.00s/it] 99%|█████████▉| 6749/6790 [3:54:06<01:22,  2.01s/it]                                                     {'loss': 1.323, 'learning_rate': 4.26911065466884e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6749/6790 [3:54:06<01:22,  2.01s/it] 99%|█████████▉| 6750/6790 [3:54:08<01:21,  2.04s/it]                                                     {'loss': 1.4129, 'learning_rate': 4.0772718081583117e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6750/6790 [3:54:08<01:21,  2.04s/it] 99%|█████████▉| 6751/6790 [3:54:10<01:15,  1.94s/it]                                                     {'loss': 1.3214, 'learning_rate': 3.8898424576339076e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6751/6790 [3:54:10<01:15,  1.94s/it] 99%|█████████▉| 6752/6790 [3:54:12<01:15,  2.00s/it]                                                     {'loss': 1.4118, 'learning_rate': 3.706822644429231e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6752/6790 [3:54:12<01:15,  2.00s/it] 99%|█████████▉| 6753/6790 [3:54:14<01:13,  1.99s/it]                                                     {'loss': 1.4302, 'learning_rate': 3.528212408903109e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6753/6790 [3:54:14<01:13,  1.99s/it] 99%|█████████▉| 6754/6790 [3:54:16<01:13,  2.03s/it]                                                     {'loss': 1.4281, 'learning_rate': 3.3540117904418135e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6754/6790 [3:54:16<01:13,  2.03s/it] 99%|█████████▉| 6755/6790 [3:54:18<01:07,  1.94s/it]                                                     {'loss': 1.1033, 'learning_rate': 3.184220827459061e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6755/6790 [3:54:18<01:07,  1.94s/it] 99%|█████████▉| 6756/6790 [3:54:20<01:12,  2.13s/it]                                                     {'loss': 1.3901, 'learning_rate': 3.0188395574004545e-08, 'epoch': 0.99}
+ 99%|█████████▉| 6756/6790 [3:54:20<01:12,  2.13s/it]100%|█████████▉| 6757/6790 [3:54:22<01:07,  2.04s/it]                                                     {'loss': 1.3718, 'learning_rate': 2.857868016732379e-08, 'epoch': 1.0}
+100%|█████████▉| 6757/6790 [3:54:22<01:07,  2.04s/it]100%|█████████▉| 6758/6790 [3:54:24<01:04,  2.01s/it]                                                     {'loss': 1.4077, 'learning_rate': 2.701306240955326e-08, 'epoch': 1.0}
+100%|█████████▉| 6758/6790 [3:54:24<01:04,  2.01s/it]100%|█████████▉| 6759/6790 [3:54:26<01:01,  1.98s/it]                                                     {'loss': 1.569, 'learning_rate': 2.5491542645905696e-08, 'epoch': 1.0}
+100%|█████████▉| 6759/6790 [3:54:26<01:01,  1.98s/it]100%|█████████▉| 6760/6790 [3:54:28<00:58,  1.94s/it]                                                     {'loss': 1.4604, 'learning_rate': 2.401412121195712e-08, 'epoch': 1.0}
+100%|█████████▉| 6760/6790 [3:54:28<00:58,  1.94s/it]100%|█████████▉| 6761/6790 [3:54:30<00:59,  2.07s/it]                                                     {'loss': 1.5441, 'learning_rate': 2.258079843344696e-08, 'epoch': 1.0}
+100%|█████████▉| 6761/6790 [3:54:30<00:59,  2.07s/it]100%|█████████▉| 6762/6790 [3:54:32<00:56,  2.03s/it]                                                     {'loss': 1.3107, 'learning_rate': 2.1191574626500123e-08, 'epoch': 1.0}
+100%|█████████▉| 6762/6790 [3:54:32<00:56,  2.03s/it]100%|█████████▉| 6763/6790 [3:54:34<00:56,  2.08s/it]                                                     {'loss': 1.6658, 'learning_rate': 1.9846450097449343e-08, 'epoch': 1.0}
+100%|█████████▉| 6763/6790 [3:54:34<00:56,  2.08s/it]100%|█████████▉| 6764/6790 [3:54:37<00:55,  2.13s/it]                                                     {'loss': 1.6106, 'learning_rate': 1.854542514292401e-08, 'epoch': 1.0}
+100%|█████████▉| 6764/6790 [3:54:37<00:55,  2.13s/it]100%|█████████▉| 6765/6790 [3:54:39<00:53,  2.13s/it]                                                     {'loss': 1.6491, 'learning_rate': 1.7288500049805755e-08, 'epoch': 1.0}
+100%|█████████▉| 6765/6790 [3:54:39<00:53,  2.13s/it]100%|█████████▉| 6766/6790 [3:54:41<00:51,  2.13s/it]                                                     {'loss': 1.4351, 'learning_rate': 1.6075675095317266e-08, 'epoch': 1.0}
+100%|█████████▉| 6766/6790 [3:54:41<00:51,  2.13s/it]100%|█████████▉| 6767/6790 [3:54:43<00:48,  2.10s/it]                                                     {'loss': 1.4211, 'learning_rate': 1.490695054686686e-08, 'epoch': 1.0}
+100%|█████████▉| 6767/6790 [3:54:43<00:48,  2.10s/it]100%|█████████▉| 6768/6790 [3:54:45<00:44,  2.02s/it]                                                     {'loss': 1.1718, 'learning_rate': 1.3782326662203915e-08, 'epoch': 1.0}
+100%|█████████▉| 6768/6790 [3:54:45<00:44,  2.02s/it]100%|█████████▉| 6769/6790 [3:54:47<00:42,  2.01s/it]                                                     {'loss': 1.5413, 'learning_rate': 1.2701803689307846e-08, 'epoch': 1.0}
+100%|█████████▉| 6769/6790 [3:54:47<00:42,  2.01s/it]100%|█████████▉| 6770/6790 [3:54:48<00:39,  1.95s/it]                                                     {'loss': 1.6053, 'learning_rate': 1.166538186647692e-08, 'epoch': 1.0}
+100%|█████████▉| 6770/6790 [3:54:48<00:39,  1.95s/it]100%|█████████▉| 6771/6790 [3:54:51<00:39,  2.06s/it]                                                     {'loss': 1.455, 'learning_rate': 1.0673061422261654e-08, 'epoch': 1.0}
+100%|█████████▉| 6771/6790 [3:54:51<00:39,  2.06s/it]100%|█████████▉| 6772/6790 [3:54:53<00:35,  2.00s/it]                                                     {'loss': 1.2974, 'learning_rate': 9.724842575487003e-09, 'epoch': 1.0}
+100%|█████████▉| 6772/6790 [3:54:53<00:35,  2.00s/it]100%|█████████▉| 6773/6790 [3:54:55<00:36,  2.16s/it]                                                     {'loss': 1.2568, 'learning_rate': 8.820725535252372e-09, 'epoch': 1.0}
+100%|█████████▉| 6773/6790 [3:54:55<00:36,  2.16s/it]100%|█████████▉| 6774/6790 [3:54:58<00:35,  2.23s/it]                                                     {'loss': 1.4638, 'learning_rate': 7.960710500931612e-09, 'epoch': 1.0}
+100%|█████████▉| 6774/6790 [3:54:58<00:35,  2.23s/it]100%|█████████▉| 6775/6790 [3:55:00<00:33,  2.20s/it]                                                     {'loss': 1.2325, 'learning_rate': 7.1447976621730195e-09, 'epoch': 1.0}
+100%|█████████▉| 6775/6790 [3:55:00<00:33,  2.20s/it]100%|█████████▉| 6776/6790 [3:55:02<00:30,  2.18s/it]                                                     {'loss': 1.4303, 'learning_rate': 6.372987198899338e-09, 'epoch': 1.0}
+100%|█████████▉| 6776/6790 [3:55:02<00:30,  2.18s/it]100%|█████████▉| 6777/6790 [3:55:04<00:28,  2.20s/it]                                                     {'loss': 1.2633, 'learning_rate': 5.645279281307758e-09, 'epoch': 1.0}
+100%|█████████▉| 6777/6790 [3:55:04<00:28,  2.20s/it]100%|█████████▉| 6778/6790 [3:55:06<00:26,  2.25s/it]                                                     {'loss': 1.3667, 'learning_rate': 4.961674069892119e-09, 'epoch': 1.0}
+100%|█████████▉| 6778/6790 [3:55:06<00:26,  2.25s/it]100%|█████████▉| 6779/6790 [3:55:09<00:25,  2.28s/it]                                                     {'loss': 1.3288, 'learning_rate': 4.3221717153763e-09, 'epoch': 1.0}
+100%|█████████▉| 6779/6790 [3:55:09<00:25,  2.28s/it]100%|█████████▉| 6780/6790 [3:55:11<00:21,  2.18s/it]                                                     {'loss': 1.3344, 'learning_rate': 3.7267723588030325e-09, 'epoch': 1.0}
+100%|█████████▉| 6780/6790 [3:55:11<00:21,  2.18s/it]100%|█████████▉| 6781/6790 [3:55:13<00:21,  2.33s/it]                                                     {'loss': 1.5975, 'learning_rate': 3.1754761314450876e-09, 'epoch': 1.0}
+100%|█████████▉| 6781/6790 [3:55:13<00:21,  2.33s/it]100%|█████████▉| 6782/6790 [3:55:16<00:18,  2.37s/it]                                                     {'loss': 1.6209, 'learning_rate': 2.668283154916296e-09, 'epoch': 1.0}
+100%|█████████▉| 6782/6790 [3:55:16<00:18,  2.37s/it]100%|█████████▉| 6783/6790 [3:55:18<00:16,  2.29s/it]                                                     {'loss': 1.5006, 'learning_rate': 2.2051935410161152e-09, 'epoch': 1.0}
+100%|█████████▉| 6783/6790 [3:55:18<00:16,  2.29s/it]100%|█████████▉| 6784/6790 [3:55:20<00:13,  2.17s/it]                                                     {'loss': 1.1915, 'learning_rate': 1.786207391885064e-09, 'epoch': 1.0}
+100%|█████████▉| 6784/6790 [3:55:20<00:13,  2.17s/it]100%|█████████▉| 6785/6790 [3:55:22<00:10,  2.14s/it]                                                     {'loss': 1.3209, 'learning_rate': 1.411324799915903e-09, 'epoch': 1.0}
+100%|█████████▉| 6785/6790 [3:55:22<00:10,  2.14s/it]100%|█████████▉| 6786/6790 [3:55:24<00:08,  2.20s/it]                                                     {'loss': 1.5836, 'learning_rate': 1.0805458477980424e-09, 'epoch': 1.0}
+100%|█████████▉| 6786/6790 [3:55:24<00:08,  2.20s/it]100%|█████████▉| 6787/6790 [3:55:26<00:06,  2.12s/it]                                                     {'loss': 1.5578, 'learning_rate': 7.938706084287262e-10, 'epoch': 1.0}
+100%|█████████▉| 6787/6790 [3:55:26<00:06,  2.12s/it]100%|█████████▉| 6788/6790 [3:55:28<00:04,  2.15s/it]                                                     {'loss': 1.5099, 'learning_rate': 5.512991450684624e-10, 'epoch': 1.0}
+100%|█████████▉| 6788/6790 [3:55:28<00:04,  2.15s/it]100%|█████████▉| 6789/6790 [3:55:31<00:02,  2.24s/it]                                                     {'loss': 1.4081, 'learning_rate': 3.528315112077962e-10, 'epoch': 1.0}
+100%|█████████▉| 6789/6790 [3:55:31<00:02,  2.24s/it]100%|██████████| 6790/6790 [3:55:33<00:00,  2.15s/it]                                                     {'loss': 1.3599, 'learning_rate': 1.9846775058951494e-10, 'epoch': 1.0}
+100%|██████████| 6790/6790 [3:55:33<00:00,  2.15s/it]                                                     {'train_runtime': 14141.1719, 'train_samples_per_second': 15.365, 'train_steps_per_second': 0.48, 'train_loss': 1.4742020828910007, 'epoch': 1.0}
+100%|██████████| 6790/6790 [3:55:33<00:00,  2.15s/it]100%|██████████| 6790/6790 [3:55:33<00:00,  2.08s/it]
+wandb: 
+wandb: Run history:
+wandb:                    train/epoch ▁▁▁▁▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███
+wandb:              train/global_step ▁▁▁▂▂▂▂▂▂▃▃▃▃▃▃▄▄▄▄▄▅▅▅▅▅▅▆▆▆▆▆▇▇▇▇▇▇███
+wandb:            train/learning_rate ▅███████▇▇▇▇▇▆▆▆▆▅▅▅▄▄▄▄▃▃▃▃▂▂▂▂▂▁▁▁▁▁▁▁
+wandb:                     train/loss █▆▄▆▆▃▇▅▃▆▆▆▅▂▂▃▃█▄▆▄▆▂▆▂▃▂▄▁▂▄▂▂▃▃▅▃▄▂▁
+wandb:               train/total_flos ▁
+wandb:               train/train_loss ▁
+wandb:            train/train_runtime ▁
+wandb: train/train_samples_per_second ▁
+wandb:   train/train_steps_per_second ▁
+wandb: 
+wandb: Run summary:
+wandb:                    train/epoch 1.0
+wandb:              train/global_step 6790
+wandb:            train/learning_rate 0.0
+wandb:                     train/loss 1.3599
+wandb:               train/total_flos 1.229365279469863e+18
+wandb:               train/train_loss 1.4742
+wandb:            train/train_runtime 14141.1719
+wandb: train/train_samples_per_second 15.365
+wandb:   train/train_steps_per_second 0.48
+wandb: 
+wandb: 🚀 View run belle_dolphine-p14 at: https://wandb.ai/nus_keyu/lora-moe/runs/o5uuhyd3
+wandb: Synced 6 W&B file(s), 0 media file(s), 0 artifact file(s) and 0 other file(s)
+wandb: Find logs at: ./wandb/run-20231229_144811-o5uuhyd3/logs