sengi commited on
Commit
9e64091
·
verified ·
1 Parent(s): 26d62dd

Model save

Browse files
README.md CHANGED
@@ -1,16 +1,12 @@
1
  ---
2
  library_name: peft
3
  tags:
4
- - alignment-handbook
5
- - trl
6
- - sft
7
- - generated_from_trainer
8
  - trl
9
  - sft
10
  - alignment-handbook
11
  - generated_from_trainer
12
  datasets:
13
- - HuggingFaceH4/ultrachat_200k
14
  base_model: mistralai/Mistral-7B-v0.1
15
  model-index:
16
  - name: zephyr-7b-pl-qlora
@@ -22,7 +18,7 @@ should probably proofread and complete it, then remove this comment. -->
22
 
23
  # zephyr-7b-pl-qlora
24
 
25
- This model is a fine-tuned version of [mistralai/Mistral-7B-v0.1](https://huggingface.co/mistralai/Mistral-7B-v0.1) on the HuggingFaceH4/ultrachat_200k dataset.
26
 
27
  ## Model description
28
 
@@ -52,7 +48,7 @@ The following hyperparameters were used during training:
52
  - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
53
  - lr_scheduler_type: cosine
54
  - lr_scheduler_warmup_ratio: 0.1
55
- - training_steps: 1
56
  - mixed_precision_training: Native AMP
57
 
58
  ### Training results
 
1
  ---
2
  library_name: peft
3
  tags:
 
 
 
 
4
  - trl
5
  - sft
6
  - alignment-handbook
7
  - generated_from_trainer
8
  datasets:
9
+ - generator
10
  base_model: mistralai/Mistral-7B-v0.1
11
  model-index:
12
  - name: zephyr-7b-pl-qlora
 
18
 
19
  # zephyr-7b-pl-qlora
20
 
21
+ This model is a fine-tuned version of [mistralai/Mistral-7B-v0.1](https://huggingface.co/mistralai/Mistral-7B-v0.1) on the generator dataset.
22
 
23
  ## Model description
24
 
 
48
  - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
49
  - lr_scheduler_type: cosine
50
  - lr_scheduler_warmup_ratio: 0.1
51
+ - training_steps: 100
52
  - mixed_precision_training: Native AMP
53
 
54
  ### Training results
all_results.json CHANGED
@@ -1,8 +1,8 @@
1
  {
2
- "epoch": 0.21,
3
- "train_loss": 15.370767613482842,
4
- "train_runtime": 10.0734,
5
  "train_samples": 207865,
6
- "train_samples_per_second": 0.794,
7
- "train_steps_per_second": 0.099
8
  }
 
1
  {
2
+ "epoch": 0.01,
3
+ "train_loss": 13996.267578125,
4
+ "train_runtime": 449.6404,
5
  "train_samples": 207865,
6
+ "train_samples_per_second": 1.779,
7
+ "train_steps_per_second": 0.222
8
  }
lora_0/adapter_config.json CHANGED
@@ -23,13 +23,13 @@
23
  "rank_pattern": {},
24
  "revision": null,
25
  "target_modules": [
26
- "down_proj",
 
 
27
  "o_proj",
28
  "k_proj",
29
- "q_proj",
30
- "gate_proj",
31
  "up_proj",
32
- "v_proj"
33
  ],
34
  "task_type": null,
35
  "use_dora": false,
 
23
  "rank_pattern": {},
24
  "revision": null,
25
  "target_modules": [
26
+ "gate_proj",
27
+ "q_proj",
28
+ "v_proj",
29
  "o_proj",
30
  "k_proj",
 
 
31
  "up_proj",
32
+ "down_proj"
33
  ],
34
  "task_type": null,
35
  "use_dora": false,
lora_0/adapter_model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:1115637aaf8135f62aaaf10041922f70ece834333b01ba61c0d256a426d6e9c6
3
  size 167832240
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:dba2e465325cced80a4478a6ecdb57fd17a47e36ceda7f92fd43bcd28a952cff
3
  size 167832240
train_results.json CHANGED
@@ -1,8 +1,8 @@
1
  {
2
- "epoch": 0.21,
3
- "train_loss": 15.370767613482842,
4
- "train_runtime": 10.0734,
5
  "train_samples": 207865,
6
- "train_samples_per_second": 0.794,
7
- "train_steps_per_second": 0.099
8
  }
 
1
  {
2
+ "epoch": 0.01,
3
+ "train_loss": 13996.267578125,
4
+ "train_runtime": 449.6404,
5
  "train_samples": 207865,
6
+ "train_samples_per_second": 1.779,
7
+ "train_steps_per_second": 0.222
8
  }
trainer_state.json CHANGED
@@ -1,9 +1,9 @@
1
  {
2
  "best_metric": null,
3
  "best_model_checkpoint": null,
4
- "epoch": 0.21234723736301567,
5
  "eval_steps": 500,
6
- "global_step": 3701,
7
  "is_hyper_param_search": false,
8
  "is_local_process_zero": true,
9
  "is_world_process_zero": true,
@@ -11,4465 +11,31 @@
11
  {
12
  "epoch": 0.0,
13
  "learning_rate": 0.0,
14
- "loss": 0.0,
15
  "step": 1
16
  },
17
- {
18
- "epoch": 0.0,
19
- "learning_rate": 0.0,
20
- "loss": 0.0,
21
- "step": 5
22
- },
23
- {
24
- "epoch": 0.0,
25
- "learning_rate": 0.0,
26
- "loss": 0.0,
27
- "step": 10
28
- },
29
- {
30
- "epoch": 0.0,
31
- "learning_rate": 2.2948938611589213e-07,
32
- "loss": 0.0,
33
- "step": 15
34
- },
35
- {
36
- "epoch": 0.0,
37
- "learning_rate": 6.884681583476765e-07,
38
- "loss": -3.4891,
39
- "step": 20
40
- },
41
- {
42
- "epoch": 0.0,
43
- "learning_rate": 1.2621916236374069e-06,
44
- "loss": -49.4445,
45
- "step": 25
46
- },
47
- {
48
- "epoch": 0.0,
49
- "learning_rate": 1.721170395869191e-06,
50
- "loss": -195.5057,
51
- "step": 30
52
- },
53
- {
54
- "epoch": 0.0,
55
- "learning_rate": 2.2948938611589215e-06,
56
- "loss": -497.6609,
57
- "step": 35
58
- },
59
- {
60
- "epoch": 0.0,
61
- "learning_rate": 2.868617326448652e-06,
62
- "loss": -1031.3963,
63
- "step": 40
64
- },
65
- {
66
- "epoch": 0.0,
67
- "learning_rate": 3.442340791738382e-06,
68
- "loss": -1685.1105,
69
- "step": 45
70
- },
71
- {
72
- "epoch": 0.0,
73
- "learning_rate": 4.016064257028113e-06,
74
- "loss": -2646.2359,
75
- "step": 50
76
- },
77
- {
78
- "epoch": 0.0,
79
- "learning_rate": 4.589787722317843e-06,
80
- "loss": -3794.2527,
81
- "step": 55
82
- },
83
- {
84
- "epoch": 0.0,
85
- "learning_rate": 5.163511187607573e-06,
86
- "loss": -5546.7516,
87
- "step": 60
88
- },
89
- {
90
- "epoch": 0.0,
91
- "learning_rate": 5.737234652897304e-06,
92
- "loss": -7180.4102,
93
- "step": 65
94
- },
95
- {
96
- "epoch": 0.0,
97
- "learning_rate": 6.310958118187034e-06,
98
- "loss": -10111.5016,
99
- "step": 70
100
- },
101
- {
102
- "epoch": 0.0,
103
- "learning_rate": 6.884681583476764e-06,
104
- "loss": -12410.3125,
105
- "step": 75
106
- },
107
- {
108
- "epoch": 0.0,
109
- "learning_rate": 7.4584050487664955e-06,
110
- "loss": -16288.9766,
111
- "step": 80
112
- },
113
- {
114
- "epoch": 0.0,
115
- "learning_rate": 8.032128514056226e-06,
116
- "loss": -19432.7328,
117
- "step": 85
118
- },
119
- {
120
- "epoch": 0.01,
121
- "learning_rate": 8.605851979345956e-06,
122
- "loss": -23566.2641,
123
- "step": 90
124
- },
125
  {
126
  "epoch": 0.01,
127
- "learning_rate": 9.179575444635686e-06,
128
- "loss": -28124.4,
129
- "step": 95
130
- },
131
- {
132
- "epoch": 0.01,
133
- "learning_rate": 9.753298909925416e-06,
134
- "loss": -33192.5531,
135
  "step": 100
136
  },
137
  {
138
  "epoch": 0.01,
139
- "learning_rate": 1.0327022375215146e-05,
140
- "loss": -40076.6687,
141
- "step": 105
142
- },
143
- {
144
- "epoch": 0.01,
145
- "learning_rate": 1.0900745840504876e-05,
146
- "loss": -46810.9156,
147
- "step": 110
148
- },
149
- {
150
- "epoch": 0.01,
151
- "learning_rate": 1.1474469305794608e-05,
152
- "loss": -51101.25,
153
- "step": 115
154
- },
155
- {
156
- "epoch": 0.01,
157
- "learning_rate": 1.2048192771084338e-05,
158
- "loss": -56708.5563,
159
- "step": 120
160
- },
161
- {
162
- "epoch": 0.01,
163
- "learning_rate": 1.2621916236374069e-05,
164
- "loss": -59233.925,
165
- "step": 125
166
- },
167
- {
168
- "epoch": 0.01,
169
- "learning_rate": 1.3195639701663797e-05,
170
- "loss": -64193.0687,
171
- "step": 130
172
- },
173
- {
174
- "epoch": 0.01,
175
- "learning_rate": 1.3769363166953527e-05,
176
- "loss": -72945.3625,
177
- "step": 135
178
- },
179
- {
180
- "epoch": 0.01,
181
- "learning_rate": 1.434308663224326e-05,
182
- "loss": -87274.1375,
183
- "step": 140
184
- },
185
- {
186
- "epoch": 0.01,
187
- "learning_rate": 1.4916810097532991e-05,
188
- "loss": -106688.7375,
189
- "step": 145
190
- },
191
- {
192
- "epoch": 0.01,
193
- "learning_rate": 1.549053356282272e-05,
194
- "loss": -126941.775,
195
- "step": 150
196
- },
197
- {
198
- "epoch": 0.01,
199
- "learning_rate": 1.606425702811245e-05,
200
- "loss": -147417.55,
201
- "step": 155
202
- },
203
- {
204
- "epoch": 0.01,
205
- "learning_rate": 1.663798049340218e-05,
206
- "loss": -173031.2875,
207
- "step": 160
208
- },
209
- {
210
- "epoch": 0.01,
211
- "learning_rate": 1.721170395869191e-05,
212
- "loss": -197558.775,
213
- "step": 165
214
- },
215
- {
216
- "epoch": 0.01,
217
- "learning_rate": 1.7785427423981642e-05,
218
- "loss": -223929.7,
219
- "step": 170
220
- },
221
- {
222
- "epoch": 0.01,
223
- "learning_rate": 1.8244406196213425e-05,
224
- "loss": -241816.85,
225
- "step": 175
226
- },
227
- {
228
- "epoch": 0.01,
229
- "learning_rate": 1.8703384968445207e-05,
230
- "loss": -249209.5,
231
- "step": 180
232
- },
233
- {
234
- "epoch": 0.01,
235
- "learning_rate": 1.9162363740676993e-05,
236
- "loss": -260632.2,
237
- "step": 185
238
- },
239
- {
240
- "epoch": 0.01,
241
- "learning_rate": 1.9736087205966724e-05,
242
- "loss": -274344.5,
243
- "step": 190
244
- },
245
- {
246
- "epoch": 0.01,
247
- "learning_rate": 2.0309810671256454e-05,
248
- "loss": -283097.8,
249
- "step": 195
250
- },
251
- {
252
- "epoch": 0.01,
253
- "learning_rate": 2.0883534136546184e-05,
254
- "loss": -291180.1,
255
- "step": 200
256
- },
257
- {
258
- "epoch": 0.01,
259
- "learning_rate": 2.1457257601835918e-05,
260
- "loss": -296606.175,
261
- "step": 205
262
- },
263
- {
264
- "epoch": 0.01,
265
- "learning_rate": 2.2030981067125648e-05,
266
- "loss": -297583.2,
267
- "step": 210
268
- },
269
- {
270
- "epoch": 0.01,
271
- "learning_rate": 2.2604704532415378e-05,
272
- "loss": -304103.9,
273
- "step": 215
274
- },
275
- {
276
- "epoch": 0.01,
277
- "learning_rate": 2.3178427997705108e-05,
278
- "loss": -305754.625,
279
- "step": 220
280
- },
281
- {
282
- "epoch": 0.01,
283
- "learning_rate": 2.3752151462994838e-05,
284
- "loss": -308790.725,
285
- "step": 225
286
- },
287
- {
288
- "epoch": 0.01,
289
- "learning_rate": 2.432587492828457e-05,
290
- "loss": -311960.7,
291
- "step": 230
292
- },
293
- {
294
- "epoch": 0.01,
295
- "learning_rate": 2.48995983935743e-05,
296
- "loss": -313037.675,
297
- "step": 235
298
- },
299
- {
300
- "epoch": 0.01,
301
- "learning_rate": 2.547332185886403e-05,
302
- "loss": -315313.825,
303
- "step": 240
304
- },
305
- {
306
- "epoch": 0.01,
307
- "learning_rate": 2.6047045324153755e-05,
308
- "loss": -316755.775,
309
- "step": 245
310
- },
311
- {
312
- "epoch": 0.01,
313
- "learning_rate": 2.662076878944349e-05,
314
- "loss": -317376.0,
315
- "step": 250
316
- },
317
- {
318
- "epoch": 0.01,
319
- "learning_rate": 2.7194492254733223e-05,
320
- "loss": -319665.85,
321
- "step": 255
322
- },
323
- {
324
- "epoch": 0.01,
325
- "learning_rate": 2.776821572002295e-05,
326
- "loss": -318471.65,
327
- "step": 260
328
- },
329
- {
330
- "epoch": 0.02,
331
- "learning_rate": 2.8341939185312683e-05,
332
- "loss": -318968.55,
333
- "step": 265
334
- },
335
- {
336
- "epoch": 0.02,
337
- "learning_rate": 2.891566265060241e-05,
338
- "loss": -320207.2,
339
- "step": 270
340
- },
341
- {
342
- "epoch": 0.02,
343
- "learning_rate": 2.9489386115892143e-05,
344
- "loss": -322860.7,
345
- "step": 275
346
- },
347
- {
348
- "epoch": 0.02,
349
- "learning_rate": 3.006310958118187e-05,
350
- "loss": -322976.675,
351
- "step": 280
352
- },
353
- {
354
- "epoch": 0.02,
355
- "learning_rate": 3.0636833046471604e-05,
356
- "loss": -323030.4,
357
- "step": 285
358
- },
359
- {
360
- "epoch": 0.02,
361
- "learning_rate": 3.121055651176134e-05,
362
- "loss": -325049.75,
363
- "step": 290
364
- },
365
- {
366
- "epoch": 0.02,
367
- "learning_rate": 3.1784279977051064e-05,
368
- "loss": -323279.2,
369
- "step": 295
370
- },
371
- {
372
- "epoch": 0.02,
373
- "learning_rate": 3.23580034423408e-05,
374
- "loss": -326394.3,
375
- "step": 300
376
- },
377
- {
378
- "epoch": 0.02,
379
- "learning_rate": 3.2931726907630524e-05,
380
- "loss": -327546.45,
381
- "step": 305
382
- },
383
- {
384
- "epoch": 0.02,
385
- "learning_rate": 3.350545037292026e-05,
386
- "loss": -326381.95,
387
- "step": 310
388
- },
389
- {
390
- "epoch": 0.02,
391
- "learning_rate": 3.4079173838209984e-05,
392
- "loss": -329224.875,
393
- "step": 315
394
- },
395
- {
396
- "epoch": 0.02,
397
- "learning_rate": 3.465289730349972e-05,
398
- "loss": -327763.2,
399
- "step": 320
400
- },
401
- {
402
- "epoch": 0.02,
403
- "learning_rate": 3.5226620768789445e-05,
404
- "loss": -327674.775,
405
- "step": 325
406
- },
407
- {
408
- "epoch": 0.02,
409
- "learning_rate": 3.580034423407918e-05,
410
- "loss": -328802.05,
411
- "step": 330
412
- },
413
- {
414
- "epoch": 0.02,
415
- "learning_rate": 3.6374067699368905e-05,
416
- "loss": -331079.025,
417
- "step": 335
418
- },
419
- {
420
- "epoch": 0.02,
421
- "learning_rate": 3.694779116465863e-05,
422
- "loss": -329059.075,
423
- "step": 340
424
- },
425
- {
426
- "epoch": 0.02,
427
- "learning_rate": 3.7521514629948365e-05,
428
- "loss": -329749.675,
429
- "step": 345
430
- },
431
- {
432
- "epoch": 0.02,
433
- "learning_rate": 3.809523809523809e-05,
434
- "loss": -331523.05,
435
- "step": 350
436
- },
437
- {
438
- "epoch": 0.02,
439
- "learning_rate": 3.8668961560527826e-05,
440
- "loss": -332232.7,
441
- "step": 355
442
- },
443
- {
444
- "epoch": 0.02,
445
- "learning_rate": 3.924268502581756e-05,
446
- "loss": -332449.35,
447
- "step": 360
448
- },
449
- {
450
- "epoch": 0.02,
451
- "learning_rate": 3.9816408491107286e-05,
452
- "loss": -334742.55,
453
- "step": 365
454
- },
455
- {
456
- "epoch": 0.02,
457
- "learning_rate": 4.039013195639702e-05,
458
- "loss": -333736.15,
459
- "step": 370
460
- },
461
- {
462
- "epoch": 0.02,
463
- "learning_rate": 4.0963855421686746e-05,
464
- "loss": -333792.225,
465
- "step": 375
466
- },
467
- {
468
- "epoch": 0.02,
469
- "learning_rate": 4.153757888697648e-05,
470
- "loss": -335570.45,
471
- "step": 380
472
- },
473
- {
474
- "epoch": 0.02,
475
- "learning_rate": 4.211130235226621e-05,
476
- "loss": -333872.35,
477
- "step": 385
478
- },
479
- {
480
- "epoch": 0.02,
481
- "learning_rate": 4.268502581755594e-05,
482
- "loss": -337072.675,
483
- "step": 390
484
- },
485
- {
486
- "epoch": 0.02,
487
- "learning_rate": 4.3258749282845674e-05,
488
- "loss": -333726.425,
489
- "step": 395
490
- },
491
- {
492
- "epoch": 0.02,
493
- "learning_rate": 4.38324727481354e-05,
494
- "loss": -336459.75,
495
- "step": 400
496
- },
497
- {
498
- "epoch": 0.02,
499
- "learning_rate": 4.4406196213425134e-05,
500
- "loss": -336860.1,
501
- "step": 405
502
- },
503
- {
504
- "epoch": 0.02,
505
- "learning_rate": 4.497991967871486e-05,
506
- "loss": -335018.575,
507
- "step": 410
508
- },
509
- {
510
- "epoch": 0.02,
511
- "learning_rate": 4.543889845094665e-05,
512
- "loss": -338024.925,
513
- "step": 415
514
- },
515
- {
516
- "epoch": 0.02,
517
- "learning_rate": 4.601262191623638e-05,
518
- "loss": -336729.825,
519
- "step": 420
520
- },
521
- {
522
- "epoch": 0.02,
523
- "learning_rate": 4.658634538152611e-05,
524
- "loss": -337681.2,
525
- "step": 425
526
- },
527
- {
528
- "epoch": 0.02,
529
- "learning_rate": 4.716006884681584e-05,
530
- "loss": -339095.5,
531
- "step": 430
532
- },
533
- {
534
- "epoch": 0.02,
535
- "learning_rate": 4.773379231210557e-05,
536
- "loss": -339637.8,
537
- "step": 435
538
- },
539
- {
540
- "epoch": 0.03,
541
- "learning_rate": 4.83075157773953e-05,
542
- "loss": -340333.75,
543
- "step": 440
544
- },
545
- {
546
- "epoch": 0.03,
547
- "learning_rate": 4.888123924268503e-05,
548
- "loss": -340316.65,
549
- "step": 445
550
- },
551
- {
552
- "epoch": 0.03,
553
- "learning_rate": 4.945496270797476e-05,
554
- "loss": -339421.7,
555
- "step": 450
556
- },
557
- {
558
- "epoch": 0.03,
559
- "learning_rate": 5.002868617326449e-05,
560
- "loss": -338028.95,
561
- "step": 455
562
- },
563
- {
564
- "epoch": 0.03,
565
- "learning_rate": 5.060240963855422e-05,
566
- "loss": -342042.3,
567
- "step": 460
568
- },
569
- {
570
- "epoch": 0.03,
571
- "learning_rate": 5.1176133103843945e-05,
572
- "loss": -341357.9,
573
- "step": 465
574
- },
575
- {
576
- "epoch": 0.03,
577
- "learning_rate": 5.174985656913368e-05,
578
- "loss": -341011.45,
579
- "step": 470
580
- },
581
- {
582
- "epoch": 0.03,
583
- "learning_rate": 5.232358003442341e-05,
584
- "loss": -340367.0,
585
- "step": 475
586
- },
587
- {
588
- "epoch": 0.03,
589
- "learning_rate": 5.289730349971313e-05,
590
- "loss": -341737.35,
591
- "step": 480
592
- },
593
- {
594
- "epoch": 0.03,
595
- "learning_rate": 5.3471026965002866e-05,
596
- "loss": -340334.725,
597
- "step": 485
598
- },
599
- {
600
- "epoch": 0.03,
601
- "learning_rate": 5.40447504302926e-05,
602
- "loss": -341142.3,
603
- "step": 490
604
- },
605
- {
606
- "epoch": 0.03,
607
- "learning_rate": 5.461847389558233e-05,
608
- "loss": -342525.2,
609
- "step": 495
610
- },
611
- {
612
- "epoch": 0.03,
613
- "learning_rate": 5.519219736087207e-05,
614
- "loss": -344089.7,
615
- "step": 500
616
- },
617
- {
618
- "epoch": 0.03,
619
- "learning_rate": 5.576592082616179e-05,
620
- "loss": -343456.65,
621
- "step": 505
622
- },
623
- {
624
- "epoch": 0.03,
625
- "learning_rate": 5.633964429145152e-05,
626
- "loss": -345602.1,
627
- "step": 510
628
- },
629
- {
630
- "epoch": 0.03,
631
- "learning_rate": 5.6913367756741254e-05,
632
- "loss": -343630.25,
633
- "step": 515
634
- },
635
- {
636
- "epoch": 0.03,
637
- "learning_rate": 5.748709122203099e-05,
638
- "loss": -342957.575,
639
- "step": 520
640
- },
641
- {
642
- "epoch": 0.03,
643
- "learning_rate": 5.806081468732072e-05,
644
- "loss": -343699.775,
645
- "step": 525
646
- },
647
- {
648
- "epoch": 0.03,
649
- "learning_rate": 5.863453815261044e-05,
650
- "loss": -345816.2,
651
- "step": 530
652
- },
653
- {
654
- "epoch": 0.03,
655
- "learning_rate": 5.9208261617900174e-05,
656
- "loss": -343947.55,
657
- "step": 535
658
- },
659
- {
660
- "epoch": 0.03,
661
- "learning_rate": 5.978198508318991e-05,
662
- "loss": -346215.525,
663
- "step": 540
664
- },
665
- {
666
- "epoch": 0.03,
667
- "learning_rate": 6.035570854847964e-05,
668
- "loss": -345165.4,
669
- "step": 545
670
- },
671
- {
672
- "epoch": 0.03,
673
- "learning_rate": 6.092943201376936e-05,
674
- "loss": -344990.8,
675
- "step": 550
676
- },
677
- {
678
- "epoch": 0.03,
679
- "learning_rate": 6.15031554790591e-05,
680
- "loss": -347143.95,
681
- "step": 555
682
- },
683
- {
684
- "epoch": 0.03,
685
- "learning_rate": 6.207687894434883e-05,
686
- "loss": -346346.4,
687
- "step": 560
688
- },
689
- {
690
- "epoch": 0.03,
691
- "learning_rate": 6.265060240963856e-05,
692
- "loss": -344992.35,
693
- "step": 565
694
- },
695
- {
696
- "epoch": 0.03,
697
- "learning_rate": 6.32243258749283e-05,
698
- "loss": -346478.0,
699
- "step": 570
700
- },
701
- {
702
- "epoch": 0.03,
703
- "learning_rate": 6.379804934021802e-05,
704
- "loss": -347404.6,
705
- "step": 575
706
- },
707
- {
708
- "epoch": 0.03,
709
- "learning_rate": 6.437177280550775e-05,
710
- "loss": -347950.25,
711
- "step": 580
712
- },
713
- {
714
- "epoch": 0.03,
715
- "learning_rate": 6.494549627079748e-05,
716
- "loss": -346535.225,
717
- "step": 585
718
- },
719
- {
720
- "epoch": 0.03,
721
- "learning_rate": 6.551921973608722e-05,
722
- "loss": -344840.4,
723
- "step": 590
724
- },
725
- {
726
- "epoch": 0.03,
727
- "learning_rate": 6.609294320137695e-05,
728
- "loss": -347641.45,
729
- "step": 595
730
- },
731
- {
732
- "epoch": 0.03,
733
- "learning_rate": 6.666666666666667e-05,
734
- "loss": -347243.75,
735
- "step": 600
736
- },
737
- {
738
- "epoch": 0.03,
739
- "learning_rate": 6.72403901319564e-05,
740
- "loss": -344839.0,
741
- "step": 605
742
- },
743
- {
744
- "epoch": 0.03,
745
- "learning_rate": 6.781411359724614e-05,
746
- "loss": -346694.6,
747
- "step": 610
748
- },
749
- {
750
- "epoch": 0.04,
751
- "learning_rate": 6.838783706253587e-05,
752
- "loss": -346482.1,
753
- "step": 615
754
- },
755
- {
756
- "epoch": 0.04,
757
- "learning_rate": 6.896156052782559e-05,
758
- "loss": -346953.025,
759
- "step": 620
760
- },
761
- {
762
- "epoch": 0.04,
763
- "learning_rate": 6.953528399311532e-05,
764
- "loss": -346146.7,
765
- "step": 625
766
- },
767
- {
768
- "epoch": 0.04,
769
- "learning_rate": 7.010900745840506e-05,
770
- "loss": -348154.8,
771
- "step": 630
772
- },
773
- {
774
- "epoch": 0.04,
775
- "learning_rate": 7.068273092369478e-05,
776
- "loss": -348350.55,
777
- "step": 635
778
- },
779
- {
780
- "epoch": 0.04,
781
- "learning_rate": 7.125645438898451e-05,
782
- "loss": -349716.075,
783
- "step": 640
784
- },
785
- {
786
- "epoch": 0.04,
787
- "learning_rate": 7.183017785427424e-05,
788
- "loss": -347439.1,
789
- "step": 645
790
- },
791
- {
792
- "epoch": 0.04,
793
- "learning_rate": 7.240390131956398e-05,
794
- "loss": -348563.45,
795
- "step": 650
796
- },
797
- {
798
- "epoch": 0.04,
799
- "learning_rate": 7.29776247848537e-05,
800
- "loss": -348391.825,
801
- "step": 655
802
- },
803
- {
804
- "epoch": 0.04,
805
- "learning_rate": 7.355134825014343e-05,
806
- "loss": -350483.05,
807
- "step": 660
808
- },
809
- {
810
- "epoch": 0.04,
811
- "learning_rate": 7.412507171543317e-05,
812
- "loss": -350731.125,
813
- "step": 665
814
- },
815
- {
816
- "epoch": 0.04,
817
- "learning_rate": 7.469879518072289e-05,
818
- "loss": -349929.325,
819
- "step": 670
820
- },
821
- {
822
- "epoch": 0.04,
823
- "learning_rate": 7.527251864601262e-05,
824
- "loss": -351055.2,
825
- "step": 675
826
- },
827
- {
828
- "epoch": 0.04,
829
- "learning_rate": 7.584624211130235e-05,
830
- "loss": -350916.6,
831
- "step": 680
832
- },
833
- {
834
- "epoch": 0.04,
835
- "learning_rate": 7.641996557659209e-05,
836
- "loss": -350173.8,
837
- "step": 685
838
- },
839
- {
840
- "epoch": 0.04,
841
- "learning_rate": 7.69936890418818e-05,
842
- "loss": -351153.0,
843
- "step": 690
844
- },
845
- {
846
- "epoch": 0.04,
847
- "learning_rate": 7.756741250717154e-05,
848
- "loss": -349882.6,
849
- "step": 695
850
- },
851
- {
852
- "epoch": 0.04,
853
- "learning_rate": 7.814113597246127e-05,
854
- "loss": -352142.4,
855
- "step": 700
856
- },
857
- {
858
- "epoch": 0.04,
859
- "learning_rate": 7.8714859437751e-05,
860
- "loss": -350261.2,
861
- "step": 705
862
- },
863
- {
864
- "epoch": 0.04,
865
- "learning_rate": 7.928858290304074e-05,
866
- "loss": -350545.325,
867
- "step": 710
868
- },
869
- {
870
- "epoch": 0.04,
871
- "learning_rate": 7.986230636833046e-05,
872
- "loss": -351217.85,
873
- "step": 715
874
- },
875
- {
876
- "epoch": 0.04,
877
- "learning_rate": 8.04360298336202e-05,
878
- "loss": -351533.35,
879
- "step": 720
880
- },
881
- {
882
- "epoch": 0.04,
883
- "learning_rate": 8.100975329890993e-05,
884
- "loss": -350845.225,
885
- "step": 725
886
- },
887
- {
888
- "epoch": 0.04,
889
- "learning_rate": 8.158347676419966e-05,
890
- "loss": -352349.6,
891
- "step": 730
892
- },
893
- {
894
- "epoch": 0.04,
895
- "learning_rate": 8.21572002294894e-05,
896
- "loss": -351294.8,
897
- "step": 735
898
- },
899
- {
900
- "epoch": 0.04,
901
- "learning_rate": 8.273092369477911e-05,
902
- "loss": -351867.35,
903
- "step": 740
904
- },
905
- {
906
- "epoch": 0.04,
907
- "learning_rate": 8.330464716006885e-05,
908
- "loss": -351626.4,
909
- "step": 745
910
- },
911
- {
912
- "epoch": 0.04,
913
- "learning_rate": 8.387837062535858e-05,
914
- "loss": -353080.1,
915
- "step": 750
916
- },
917
- {
918
- "epoch": 0.04,
919
- "learning_rate": 8.445209409064832e-05,
920
- "loss": -352073.8,
921
- "step": 755
922
- },
923
- {
924
- "epoch": 0.04,
925
- "learning_rate": 8.502581755593804e-05,
926
- "loss": -351819.75,
927
- "step": 760
928
- },
929
- {
930
- "epoch": 0.04,
931
- "learning_rate": 8.559954102122777e-05,
932
- "loss": -352359.45,
933
- "step": 765
934
- },
935
- {
936
- "epoch": 0.04,
937
- "learning_rate": 8.61732644865175e-05,
938
- "loss": -354546.0,
939
- "step": 770
940
- },
941
- {
942
- "epoch": 0.04,
943
- "learning_rate": 8.674698795180724e-05,
944
- "loss": -353960.15,
945
- "step": 775
946
- },
947
- {
948
- "epoch": 0.04,
949
- "learning_rate": 8.732071141709697e-05,
950
- "loss": -353622.075,
951
- "step": 780
952
- },
953
- {
954
- "epoch": 0.05,
955
- "learning_rate": 8.789443488238669e-05,
956
- "loss": -352742.6,
957
- "step": 785
958
- },
959
- {
960
- "epoch": 0.05,
961
- "learning_rate": 8.846815834767642e-05,
962
- "loss": -353329.025,
963
- "step": 790
964
- },
965
- {
966
- "epoch": 0.05,
967
- "learning_rate": 8.904188181296616e-05,
968
- "loss": -353635.4,
969
- "step": 795
970
- },
971
- {
972
- "epoch": 0.05,
973
- "learning_rate": 8.961560527825589e-05,
974
- "loss": -352711.4,
975
- "step": 800
976
- },
977
- {
978
- "epoch": 0.05,
979
- "learning_rate": 9.018932874354562e-05,
980
- "loss": -353263.5,
981
- "step": 805
982
- },
983
- {
984
- "epoch": 0.05,
985
- "learning_rate": 9.076305220883534e-05,
986
- "loss": -354502.3,
987
- "step": 810
988
- },
989
- {
990
- "epoch": 0.05,
991
- "learning_rate": 9.133677567412508e-05,
992
- "loss": -353995.45,
993
- "step": 815
994
- },
995
- {
996
- "epoch": 0.05,
997
- "learning_rate": 9.191049913941481e-05,
998
- "loss": -353419.0,
999
- "step": 820
1000
- },
1001
- {
1002
- "epoch": 0.05,
1003
- "learning_rate": 9.248422260470454e-05,
1004
- "loss": -352814.725,
1005
- "step": 825
1006
- },
1007
- {
1008
- "epoch": 0.05,
1009
- "learning_rate": 9.305794606999426e-05,
1010
- "loss": -353624.425,
1011
- "step": 830
1012
- },
1013
- {
1014
- "epoch": 0.05,
1015
- "learning_rate": 9.3631669535284e-05,
1016
- "loss": -354307.7,
1017
- "step": 835
1018
- },
1019
- {
1020
- "epoch": 0.05,
1021
- "learning_rate": 9.420539300057373e-05,
1022
- "loss": -356302.85,
1023
- "step": 840
1024
- },
1025
- {
1026
- "epoch": 0.05,
1027
- "learning_rate": 9.477911646586346e-05,
1028
- "loss": -354939.2,
1029
- "step": 845
1030
- },
1031
- {
1032
- "epoch": 0.05,
1033
- "learning_rate": 9.53528399311532e-05,
1034
- "loss": -355997.0,
1035
- "step": 850
1036
- },
1037
- {
1038
- "epoch": 0.05,
1039
- "learning_rate": 9.592656339644292e-05,
1040
- "loss": -355250.575,
1041
- "step": 855
1042
- },
1043
- {
1044
- "epoch": 0.05,
1045
- "learning_rate": 9.650028686173265e-05,
1046
- "loss": -356108.8,
1047
- "step": 860
1048
- },
1049
- {
1050
- "epoch": 0.05,
1051
- "learning_rate": 9.707401032702239e-05,
1052
- "loss": -355865.0,
1053
- "step": 865
1054
- },
1055
- {
1056
- "epoch": 0.05,
1057
- "learning_rate": 9.764773379231212e-05,
1058
- "loss": -357137.325,
1059
- "step": 870
1060
- },
1061
- {
1062
- "epoch": 0.05,
1063
- "learning_rate": 9.822145725760184e-05,
1064
- "loss": -356673.4,
1065
- "step": 875
1066
- },
1067
- {
1068
- "epoch": 0.05,
1069
- "learning_rate": 9.879518072289157e-05,
1070
- "loss": -356866.7,
1071
- "step": 880
1072
- },
1073
- {
1074
- "epoch": 0.05,
1075
- "learning_rate": 9.93689041881813e-05,
1076
- "loss": -357192.3,
1077
- "step": 885
1078
- },
1079
- {
1080
- "epoch": 0.05,
1081
- "learning_rate": 9.994262765347103e-05,
1082
- "loss": -357552.65,
1083
- "step": 890
1084
- },
1085
- {
1086
- "epoch": 0.05,
1087
- "learning_rate": 0.00010051635111876076,
1088
- "loss": -356663.25,
1089
- "step": 895
1090
- },
1091
- {
1092
- "epoch": 0.05,
1093
- "learning_rate": 0.00010109007458405049,
1094
- "loss": -357417.25,
1095
- "step": 900
1096
- },
1097
- {
1098
- "epoch": 0.05,
1099
- "learning_rate": 0.00010166379804934023,
1100
- "loss": -355161.525,
1101
- "step": 905
1102
- },
1103
- {
1104
- "epoch": 0.05,
1105
- "learning_rate": 0.00010223752151462995,
1106
- "loss": -357030.05,
1107
- "step": 910
1108
- },
1109
- {
1110
- "epoch": 0.05,
1111
- "learning_rate": 0.00010281124497991968,
1112
- "loss": -355600.7,
1113
- "step": 915
1114
- },
1115
- {
1116
- "epoch": 0.05,
1117
- "learning_rate": 0.00010338496844520941,
1118
- "loss": -354340.6,
1119
- "step": 920
1120
- },
1121
- {
1122
- "epoch": 0.05,
1123
- "learning_rate": 0.00010395869191049913,
1124
- "loss": -355534.325,
1125
- "step": 925
1126
- },
1127
- {
1128
- "epoch": 0.05,
1129
- "learning_rate": 0.00010453241537578888,
1130
- "loss": -353909.575,
1131
- "step": 930
1132
- },
1133
- {
1134
- "epoch": 0.05,
1135
- "learning_rate": 0.0001051061388410786,
1136
- "loss": -355348.65,
1137
- "step": 935
1138
- },
1139
- {
1140
- "epoch": 0.05,
1141
- "learning_rate": 0.00010567986230636832,
1142
- "loss": -356926.1,
1143
- "step": 940
1144
- },
1145
- {
1146
- "epoch": 0.05,
1147
- "learning_rate": 0.00010625358577165807,
1148
- "loss": -354640.25,
1149
- "step": 945
1150
- },
1151
- {
1152
- "epoch": 0.05,
1153
- "learning_rate": 0.00010682730923694779,
1154
- "loss": -358615.6,
1155
- "step": 950
1156
- },
1157
- {
1158
- "epoch": 0.05,
1159
- "learning_rate": 0.00010740103270223754,
1160
- "loss": -357837.25,
1161
- "step": 955
1162
- },
1163
- {
1164
- "epoch": 0.06,
1165
- "learning_rate": 0.00010797475616752726,
1166
- "loss": -355897.675,
1167
- "step": 960
1168
- },
1169
- {
1170
- "epoch": 0.06,
1171
- "learning_rate": 0.00010854847963281698,
1172
- "loss": -356186.9,
1173
- "step": 965
1174
- },
1175
- {
1176
- "epoch": 0.06,
1177
- "learning_rate": 0.00010912220309810672,
1178
- "loss": -359630.8,
1179
- "step": 970
1180
- },
1181
- {
1182
- "epoch": 0.06,
1183
- "learning_rate": 0.00010969592656339644,
1184
- "loss": -358727.8,
1185
- "step": 975
1186
- },
1187
- {
1188
- "epoch": 0.06,
1189
- "learning_rate": 0.00011026965002868619,
1190
- "loss": -357651.55,
1191
- "step": 980
1192
- },
1193
- {
1194
- "epoch": 0.06,
1195
- "learning_rate": 0.00011084337349397591,
1196
- "loss": -355946.15,
1197
- "step": 985
1198
- },
1199
- {
1200
- "epoch": 0.06,
1201
- "learning_rate": 0.00011141709695926563,
1202
- "loss": -358857.8,
1203
- "step": 990
1204
- },
1205
- {
1206
- "epoch": 0.06,
1207
- "learning_rate": 0.00011199082042455538,
1208
- "loss": -356487.45,
1209
- "step": 995
1210
- },
1211
- {
1212
- "epoch": 0.06,
1213
- "learning_rate": 0.0001125645438898451,
1214
- "loss": -357650.75,
1215
- "step": 1000
1216
- },
1217
- {
1218
- "epoch": 0.06,
1219
- "learning_rate": 0.00011313826735513482,
1220
- "loss": -355688.925,
1221
- "step": 1005
1222
- },
1223
- {
1224
- "epoch": 0.06,
1225
- "learning_rate": 0.00011371199082042456,
1226
- "loss": -357238.75,
1227
- "step": 1010
1228
- },
1229
- {
1230
- "epoch": 0.06,
1231
- "learning_rate": 0.00011428571428571428,
1232
- "loss": -357904.6,
1233
- "step": 1015
1234
- },
1235
- {
1236
- "epoch": 0.06,
1237
- "learning_rate": 0.00011485943775100403,
1238
- "loss": -357494.35,
1239
- "step": 1020
1240
- },
1241
- {
1242
- "epoch": 0.06,
1243
- "learning_rate": 0.00011543316121629375,
1244
- "loss": -359447.875,
1245
- "step": 1025
1246
- },
1247
- {
1248
- "epoch": 0.06,
1249
- "learning_rate": 0.00011600688468158347,
1250
- "loss": -360096.1,
1251
- "step": 1030
1252
- },
1253
- {
1254
- "epoch": 0.06,
1255
- "learning_rate": 0.00011658060814687322,
1256
- "loss": -358404.4,
1257
- "step": 1035
1258
- },
1259
- {
1260
- "epoch": 0.06,
1261
- "learning_rate": 0.00011715433161216294,
1262
- "loss": -357519.725,
1263
- "step": 1040
1264
- },
1265
- {
1266
- "epoch": 0.06,
1267
- "learning_rate": 0.00011772805507745268,
1268
- "loss": -358595.95,
1269
- "step": 1045
1270
- },
1271
- {
1272
- "epoch": 0.06,
1273
- "learning_rate": 0.0001183017785427424,
1274
- "loss": -358205.5,
1275
- "step": 1050
1276
- },
1277
- {
1278
- "epoch": 0.06,
1279
- "learning_rate": 0.00011887550200803212,
1280
- "loss": -357902.125,
1281
- "step": 1055
1282
- },
1283
- {
1284
- "epoch": 0.06,
1285
- "learning_rate": 0.00011944922547332187,
1286
- "loss": -355905.0,
1287
- "step": 1060
1288
- },
1289
- {
1290
- "epoch": 0.06,
1291
- "learning_rate": 0.00012002294893861159,
1292
- "loss": -358576.875,
1293
- "step": 1065
1294
- },
1295
- {
1296
- "epoch": 0.06,
1297
- "learning_rate": 0.00012059667240390134,
1298
- "loss": -357161.15,
1299
- "step": 1070
1300
- },
1301
- {
1302
- "epoch": 0.06,
1303
- "learning_rate": 0.00012117039586919106,
1304
- "loss": -356980.475,
1305
- "step": 1075
1306
- },
1307
- {
1308
- "epoch": 0.06,
1309
- "learning_rate": 0.00012174411933448078,
1310
- "loss": -358677.8,
1311
- "step": 1080
1312
- },
1313
- {
1314
- "epoch": 0.06,
1315
- "learning_rate": 0.00012231784279977053,
1316
- "loss": -361365.85,
1317
- "step": 1085
1318
- },
1319
- {
1320
- "epoch": 0.06,
1321
- "learning_rate": 0.00012289156626506023,
1322
- "loss": -358446.7,
1323
- "step": 1090
1324
- },
1325
- {
1326
- "epoch": 0.06,
1327
- "learning_rate": 0.00012346528973035,
1328
- "loss": -360241.0,
1329
- "step": 1095
1330
- },
1331
- {
1332
- "epoch": 0.06,
1333
- "learning_rate": 0.0001240390131956397,
1334
- "loss": -357614.0,
1335
- "step": 1100
1336
- },
1337
- {
1338
- "epoch": 0.06,
1339
- "learning_rate": 0.00012461273666092943,
1340
- "loss": -358462.175,
1341
- "step": 1105
1342
- },
1343
- {
1344
- "epoch": 0.06,
1345
- "learning_rate": 0.00012518646012621917,
1346
- "loss": -359095.15,
1347
- "step": 1110
1348
- },
1349
- {
1350
- "epoch": 0.06,
1351
- "learning_rate": 0.0001257601835915089,
1352
- "loss": -360547.825,
1353
- "step": 1115
1354
- },
1355
- {
1356
- "epoch": 0.06,
1357
- "learning_rate": 0.00012633390705679863,
1358
- "loss": -358881.2,
1359
- "step": 1120
1360
- },
1361
- {
1362
- "epoch": 0.06,
1363
- "learning_rate": 0.00012690763052208837,
1364
- "loss": -358529.925,
1365
- "step": 1125
1366
- },
1367
- {
1368
- "epoch": 0.06,
1369
- "learning_rate": 0.00012748135398737807,
1370
- "loss": -360481.125,
1371
- "step": 1130
1372
- },
1373
- {
1374
- "epoch": 0.07,
1375
- "learning_rate": 0.00012805507745266783,
1376
- "loss": -360687.55,
1377
- "step": 1135
1378
- },
1379
- {
1380
- "epoch": 0.07,
1381
- "learning_rate": 0.00012862880091795754,
1382
- "loss": -361122.95,
1383
- "step": 1140
1384
- },
1385
- {
1386
- "epoch": 0.07,
1387
- "learning_rate": 0.0001292025243832473,
1388
- "loss": -360700.1,
1389
- "step": 1145
1390
- },
1391
- {
1392
- "epoch": 0.07,
1393
- "learning_rate": 0.000129776247848537,
1394
- "loss": -359606.85,
1395
- "step": 1150
1396
- },
1397
- {
1398
- "epoch": 0.07,
1399
- "learning_rate": 0.00013034997131382674,
1400
- "loss": -359177.65,
1401
- "step": 1155
1402
- },
1403
- {
1404
- "epoch": 0.07,
1405
- "learning_rate": 0.00013092369477911648,
1406
- "loss": -360164.15,
1407
- "step": 1160
1408
- },
1409
- {
1410
- "epoch": 0.07,
1411
- "learning_rate": 0.0001314974182444062,
1412
- "loss": -360854.2,
1413
- "step": 1165
1414
- },
1415
- {
1416
- "epoch": 0.07,
1417
- "learning_rate": 0.00013207114170969592,
1418
- "loss": -361289.55,
1419
- "step": 1170
1420
- },
1421
- {
1422
- "epoch": 0.07,
1423
- "learning_rate": 0.00013264486517498568,
1424
- "loss": -359114.45,
1425
- "step": 1175
1426
- },
1427
- {
1428
- "epoch": 0.07,
1429
- "learning_rate": 0.00013321858864027538,
1430
- "loss": -360385.675,
1431
- "step": 1180
1432
- },
1433
- {
1434
- "epoch": 0.07,
1435
- "learning_rate": 0.00013379231210556514,
1436
- "loss": -362112.625,
1437
- "step": 1185
1438
- },
1439
- {
1440
- "epoch": 0.07,
1441
- "learning_rate": 0.00013436603557085485,
1442
- "loss": -362259.45,
1443
- "step": 1190
1444
- },
1445
- {
1446
- "epoch": 0.07,
1447
- "learning_rate": 0.00013493975903614458,
1448
- "loss": -363982.25,
1449
- "step": 1195
1450
- },
1451
- {
1452
- "epoch": 0.07,
1453
- "learning_rate": 0.00013551348250143432,
1454
- "loss": -362026.25,
1455
- "step": 1200
1456
- },
1457
- {
1458
- "epoch": 0.07,
1459
- "learning_rate": 0.00013608720596672405,
1460
- "loss": -362380.625,
1461
- "step": 1205
1462
- },
1463
- {
1464
- "epoch": 0.07,
1465
- "learning_rate": 0.00013666092943201378,
1466
- "loss": -360134.85,
1467
- "step": 1210
1468
- },
1469
- {
1470
- "epoch": 0.07,
1471
- "learning_rate": 0.00013723465289730352,
1472
- "loss": -363139.05,
1473
- "step": 1215
1474
- },
1475
- {
1476
- "epoch": 0.07,
1477
- "learning_rate": 0.00013780837636259322,
1478
- "loss": -361801.5,
1479
- "step": 1220
1480
- },
1481
- {
1482
- "epoch": 0.07,
1483
- "learning_rate": 0.00013838209982788298,
1484
- "loss": -361492.95,
1485
- "step": 1225
1486
- },
1487
- {
1488
- "epoch": 0.07,
1489
- "learning_rate": 0.0001389558232931727,
1490
- "loss": -361177.0,
1491
- "step": 1230
1492
- },
1493
- {
1494
- "epoch": 0.07,
1495
- "learning_rate": 0.00013952954675846242,
1496
- "loss": -359543.225,
1497
- "step": 1235
1498
- },
1499
- {
1500
- "epoch": 0.07,
1501
- "learning_rate": 0.00014010327022375216,
1502
- "loss": -361196.2,
1503
- "step": 1240
1504
- },
1505
- {
1506
- "epoch": 0.07,
1507
- "learning_rate": 0.0001406769936890419,
1508
- "loss": -362095.25,
1509
- "step": 1245
1510
- },
1511
- {
1512
- "epoch": 0.07,
1513
- "learning_rate": 0.00014125071715433162,
1514
- "loss": -360909.45,
1515
- "step": 1250
1516
- },
1517
- {
1518
- "epoch": 0.07,
1519
- "learning_rate": 0.00014182444061962136,
1520
- "loss": -360705.05,
1521
- "step": 1255
1522
- },
1523
- {
1524
- "epoch": 0.07,
1525
- "learning_rate": 0.0001423981640849111,
1526
- "loss": -359824.35,
1527
- "step": 1260
1528
- },
1529
- {
1530
- "epoch": 0.07,
1531
- "learning_rate": 0.0001429718875502008,
1532
- "loss": -363746.275,
1533
- "step": 1265
1534
- },
1535
- {
1536
- "epoch": 0.07,
1537
- "learning_rate": 0.00014354561101549053,
1538
- "loss": -361251.4,
1539
- "step": 1270
1540
- },
1541
- {
1542
- "epoch": 0.07,
1543
- "learning_rate": 0.00014411933448078027,
1544
- "loss": -362261.975,
1545
- "step": 1275
1546
- },
1547
- {
1548
- "epoch": 0.07,
1549
- "learning_rate": 0.00014469305794607,
1550
- "loss": -360860.95,
1551
- "step": 1280
1552
- },
1553
- {
1554
- "epoch": 0.07,
1555
- "learning_rate": 0.00014526678141135973,
1556
- "loss": -360790.65,
1557
- "step": 1285
1558
- },
1559
- {
1560
- "epoch": 0.07,
1561
- "learning_rate": 0.00014584050487664947,
1562
- "loss": -363039.325,
1563
- "step": 1290
1564
- },
1565
- {
1566
- "epoch": 0.07,
1567
- "learning_rate": 0.00014641422834193917,
1568
- "loss": -361957.125,
1569
- "step": 1295
1570
- },
1571
- {
1572
- "epoch": 0.07,
1573
- "learning_rate": 0.00014698795180722893,
1574
- "loss": -363227.75,
1575
- "step": 1300
1576
- },
1577
- {
1578
- "epoch": 0.07,
1579
- "learning_rate": 0.00014756167527251864,
1580
- "loss": -363475.55,
1581
- "step": 1305
1582
- },
1583
- {
1584
- "epoch": 0.08,
1585
- "learning_rate": 0.00014813539873780837,
1586
- "loss": -363008.35,
1587
- "step": 1310
1588
- },
1589
- {
1590
- "epoch": 0.08,
1591
- "learning_rate": 0.0001487091222030981,
1592
- "loss": -363893.85,
1593
- "step": 1315
1594
- },
1595
- {
1596
- "epoch": 0.08,
1597
- "learning_rate": 0.00014928284566838784,
1598
- "loss": -364085.125,
1599
- "step": 1320
1600
- },
1601
- {
1602
- "epoch": 0.08,
1603
- "learning_rate": 0.00014985656913367757,
1604
- "loss": -364163.2,
1605
- "step": 1325
1606
- },
1607
- {
1608
- "epoch": 0.08,
1609
- "learning_rate": 0.0001504302925989673,
1610
- "loss": -365433.5,
1611
- "step": 1330
1612
- },
1613
- {
1614
- "epoch": 0.08,
1615
- "learning_rate": 0.00015100401606425701,
1616
- "loss": -363770.375,
1617
- "step": 1335
1618
- },
1619
- {
1620
- "epoch": 0.08,
1621
- "learning_rate": 0.00015157773952954677,
1622
- "loss": -363925.7,
1623
- "step": 1340
1624
- },
1625
- {
1626
- "epoch": 0.08,
1627
- "learning_rate": 0.00015215146299483648,
1628
- "loss": -365160.825,
1629
- "step": 1345
1630
- },
1631
- {
1632
- "epoch": 0.08,
1633
- "learning_rate": 0.00015272518646012624,
1634
- "loss": -365413.325,
1635
- "step": 1350
1636
- },
1637
- {
1638
- "epoch": 0.08,
1639
- "learning_rate": 0.00015329890992541595,
1640
- "loss": -366124.675,
1641
- "step": 1355
1642
- },
1643
- {
1644
- "epoch": 0.08,
1645
- "learning_rate": 0.00015387263339070568,
1646
- "loss": -365539.125,
1647
- "step": 1360
1648
- },
1649
- {
1650
- "epoch": 0.08,
1651
- "learning_rate": 0.00015444635685599542,
1652
- "loss": -366397.4,
1653
- "step": 1365
1654
- },
1655
- {
1656
- "epoch": 0.08,
1657
- "learning_rate": 0.00015502008032128515,
1658
- "loss": -365261.925,
1659
- "step": 1370
1660
- },
1661
- {
1662
- "epoch": 0.08,
1663
- "learning_rate": 0.00015559380378657488,
1664
- "loss": -365231.175,
1665
- "step": 1375
1666
- },
1667
- {
1668
- "epoch": 0.08,
1669
- "learning_rate": 0.00015616752725186462,
1670
- "loss": -365399.5,
1671
- "step": 1380
1672
- },
1673
- {
1674
- "epoch": 0.08,
1675
- "learning_rate": 0.00015674125071715432,
1676
- "loss": -363881.425,
1677
- "step": 1385
1678
- },
1679
- {
1680
- "epoch": 0.08,
1681
- "learning_rate": 0.00015731497418244408,
1682
- "loss": -365521.1,
1683
- "step": 1390
1684
- },
1685
- {
1686
- "epoch": 0.08,
1687
- "learning_rate": 0.0001578886976477338,
1688
- "loss": -365215.9,
1689
- "step": 1395
1690
- },
1691
- {
1692
- "epoch": 0.08,
1693
- "learning_rate": 0.00015846242111302355,
1694
- "loss": -364513.7,
1695
- "step": 1400
1696
- },
1697
- {
1698
- "epoch": 0.08,
1699
- "learning_rate": 0.00015903614457831326,
1700
- "loss": -364748.6,
1701
- "step": 1405
1702
- },
1703
- {
1704
- "epoch": 0.08,
1705
- "learning_rate": 0.000159609868043603,
1706
- "loss": -363320.75,
1707
- "step": 1410
1708
- },
1709
- {
1710
- "epoch": 0.08,
1711
- "learning_rate": 0.00016018359150889272,
1712
- "loss": -363812.2,
1713
- "step": 1415
1714
- },
1715
- {
1716
- "epoch": 0.08,
1717
- "learning_rate": 0.00016075731497418246,
1718
- "loss": -364653.9,
1719
- "step": 1420
1720
- },
1721
- {
1722
- "epoch": 0.08,
1723
- "learning_rate": 0.0001613310384394722,
1724
- "loss": -364665.55,
1725
- "step": 1425
1726
- },
1727
- {
1728
- "epoch": 0.08,
1729
- "learning_rate": 0.00016190476190476192,
1730
- "loss": -365881.2,
1731
- "step": 1430
1732
- },
1733
- {
1734
- "epoch": 0.08,
1735
- "learning_rate": 0.00016247848537005163,
1736
- "loss": -366169.075,
1737
- "step": 1435
1738
- },
1739
- {
1740
- "epoch": 0.08,
1741
- "learning_rate": 0.0001630522088353414,
1742
- "loss": -365195.8,
1743
- "step": 1440
1744
- },
1745
- {
1746
- "epoch": 0.08,
1747
- "learning_rate": 0.0001636259323006311,
1748
- "loss": -362595.15,
1749
- "step": 1445
1750
- },
1751
- {
1752
- "epoch": 0.08,
1753
- "learning_rate": 0.00016419965576592083,
1754
- "loss": -362970.7,
1755
- "step": 1450
1756
- },
1757
- {
1758
- "epoch": 0.08,
1759
- "learning_rate": 0.00016477337923121056,
1760
- "loss": -364486.675,
1761
- "step": 1455
1762
- },
1763
- {
1764
- "epoch": 0.08,
1765
- "learning_rate": 0.0001653471026965003,
1766
- "loss": -366094.55,
1767
- "step": 1460
1768
- },
1769
- {
1770
- "epoch": 0.08,
1771
- "learning_rate": 0.00016592082616179003,
1772
- "loss": -366584.675,
1773
- "step": 1465
1774
- },
1775
- {
1776
- "epoch": 0.08,
1777
- "learning_rate": 0.00016649454962707977,
1778
- "loss": -365571.7,
1779
- "step": 1470
1780
- },
1781
- {
1782
- "epoch": 0.08,
1783
- "learning_rate": 0.00016706827309236947,
1784
- "loss": -366305.35,
1785
- "step": 1475
1786
- },
1787
- {
1788
- "epoch": 0.08,
1789
- "learning_rate": 0.00016764199655765923,
1790
- "loss": -364763.65,
1791
- "step": 1480
1792
- },
1793
- {
1794
- "epoch": 0.09,
1795
- "learning_rate": 0.00016821572002294894,
1796
- "loss": -366345.225,
1797
- "step": 1485
1798
- },
1799
- {
1800
- "epoch": 0.09,
1801
- "learning_rate": 0.00016878944348823867,
1802
- "loss": -365956.0,
1803
- "step": 1490
1804
- },
1805
- {
1806
- "epoch": 0.09,
1807
- "learning_rate": 0.0001693631669535284,
1808
- "loss": -365422.15,
1809
- "step": 1495
1810
- },
1811
- {
1812
- "epoch": 0.09,
1813
- "learning_rate": 0.00016993689041881814,
1814
- "loss": -366308.25,
1815
- "step": 1500
1816
- },
1817
- {
1818
- "epoch": 0.09,
1819
- "learning_rate": 0.00017051061388410787,
1820
- "loss": -367875.15,
1821
- "step": 1505
1822
- },
1823
- {
1824
- "epoch": 0.09,
1825
- "learning_rate": 0.0001710843373493976,
1826
- "loss": -364890.275,
1827
- "step": 1510
1828
- },
1829
- {
1830
- "epoch": 0.09,
1831
- "learning_rate": 0.00017165806081468734,
1832
- "loss": -364779.925,
1833
- "step": 1515
1834
- },
1835
- {
1836
- "epoch": 0.09,
1837
- "learning_rate": 0.00017223178427997705,
1838
- "loss": -367256.55,
1839
- "step": 1520
1840
- },
1841
- {
1842
- "epoch": 0.09,
1843
- "learning_rate": 0.00017280550774526678,
1844
- "loss": -367925.85,
1845
- "step": 1525
1846
- },
1847
- {
1848
- "epoch": 0.09,
1849
- "learning_rate": 0.00017337923121055651,
1850
- "loss": -366563.575,
1851
- "step": 1530
1852
- },
1853
- {
1854
- "epoch": 0.09,
1855
- "learning_rate": 0.00017395295467584625,
1856
- "loss": -367666.95,
1857
- "step": 1535
1858
- },
1859
- {
1860
- "epoch": 0.09,
1861
- "learning_rate": 0.00017452667814113598,
1862
- "loss": -366986.625,
1863
- "step": 1540
1864
- },
1865
- {
1866
- "epoch": 0.09,
1867
- "learning_rate": 0.00017510040160642571,
1868
- "loss": -365646.4,
1869
- "step": 1545
1870
- },
1871
- {
1872
- "epoch": 0.09,
1873
- "learning_rate": 0.00017567412507171542,
1874
- "loss": -367983.925,
1875
- "step": 1550
1876
- },
1877
- {
1878
- "epoch": 0.09,
1879
- "learning_rate": 0.00017624784853700518,
1880
- "loss": -366123.125,
1881
- "step": 1555
1882
- },
1883
- {
1884
- "epoch": 0.09,
1885
- "learning_rate": 0.0001768215720022949,
1886
- "loss": -367173.025,
1887
- "step": 1560
1888
- },
1889
- {
1890
- "epoch": 0.09,
1891
- "learning_rate": 0.00017739529546758465,
1892
- "loss": -369332.575,
1893
- "step": 1565
1894
- },
1895
- {
1896
- "epoch": 0.09,
1897
- "learning_rate": 0.00017796901893287436,
1898
- "loss": -368102.05,
1899
- "step": 1570
1900
- },
1901
- {
1902
- "epoch": 0.09,
1903
- "learning_rate": 0.0001785427423981641,
1904
- "loss": -368694.55,
1905
- "step": 1575
1906
- },
1907
- {
1908
- "epoch": 0.09,
1909
- "learning_rate": 0.00017911646586345382,
1910
- "loss": -369101.475,
1911
- "step": 1580
1912
- },
1913
- {
1914
- "epoch": 0.09,
1915
- "learning_rate": 0.00017969018932874356,
1916
- "loss": -370433.575,
1917
- "step": 1585
1918
- },
1919
- {
1920
- "epoch": 0.09,
1921
- "learning_rate": 0.00018026391279403326,
1922
- "loss": -368229.25,
1923
- "step": 1590
1924
- },
1925
- {
1926
- "epoch": 0.09,
1927
- "learning_rate": 0.00018083763625932302,
1928
- "loss": -370543.525,
1929
- "step": 1595
1930
- },
1931
- {
1932
- "epoch": 0.09,
1933
- "learning_rate": 0.00018141135972461273,
1934
- "loss": -368325.2,
1935
- "step": 1600
1936
- },
1937
- {
1938
- "epoch": 0.09,
1939
- "learning_rate": 0.0001819850831899025,
1940
- "loss": -366829.8,
1941
- "step": 1605
1942
- },
1943
- {
1944
- "epoch": 0.09,
1945
- "learning_rate": 0.0001825588066551922,
1946
- "loss": -370263.3,
1947
- "step": 1610
1948
- },
1949
- {
1950
- "epoch": 0.09,
1951
- "learning_rate": 0.00018313253012048193,
1952
- "loss": -370699.8,
1953
- "step": 1615
1954
- },
1955
- {
1956
- "epoch": 0.09,
1957
- "learning_rate": 0.00018370625358577166,
1958
- "loss": -369021.75,
1959
- "step": 1620
1960
- },
1961
- {
1962
- "epoch": 0.09,
1963
- "learning_rate": 0.0001842799770510614,
1964
- "loss": -367038.475,
1965
- "step": 1625
1966
- },
1967
- {
1968
- "epoch": 0.09,
1969
- "learning_rate": 0.00018485370051635113,
1970
- "loss": -370615.5,
1971
- "step": 1630
1972
- },
1973
- {
1974
- "epoch": 0.09,
1975
- "learning_rate": 0.00018542742398164086,
1976
- "loss": -370063.65,
1977
- "step": 1635
1978
- },
1979
- {
1980
- "epoch": 0.09,
1981
- "learning_rate": 0.00018600114744693057,
1982
- "loss": -372375.2,
1983
- "step": 1640
1984
- },
1985
- {
1986
- "epoch": 0.09,
1987
- "learning_rate": 0.00018657487091222033,
1988
- "loss": -370148.15,
1989
- "step": 1645
1990
- },
1991
- {
1992
- "epoch": 0.09,
1993
- "learning_rate": 0.00018714859437751004,
1994
- "loss": -371129.6,
1995
- "step": 1650
1996
- },
1997
- {
1998
- "epoch": 0.09,
1999
- "learning_rate": 0.0001877223178427998,
2000
- "loss": -369848.225,
2001
- "step": 1655
2002
- },
2003
- {
2004
- "epoch": 0.1,
2005
- "learning_rate": 0.0001882960413080895,
2006
- "loss": -371611.225,
2007
- "step": 1660
2008
- },
2009
- {
2010
- "epoch": 0.1,
2011
- "learning_rate": 0.00018886976477337924,
2012
- "loss": -370429.4,
2013
- "step": 1665
2014
- },
2015
- {
2016
- "epoch": 0.1,
2017
- "learning_rate": 0.00018944348823866897,
2018
- "loss": -369488.8,
2019
- "step": 1670
2020
- },
2021
- {
2022
- "epoch": 0.1,
2023
- "learning_rate": 0.0001900172117039587,
2024
- "loss": -368976.45,
2025
- "step": 1675
2026
- },
2027
- {
2028
- "epoch": 0.1,
2029
- "learning_rate": 0.00019059093516924844,
2030
- "loss": -369330.65,
2031
- "step": 1680
2032
- },
2033
- {
2034
- "epoch": 0.1,
2035
- "learning_rate": 0.00019116465863453817,
2036
- "loss": -369349.7,
2037
- "step": 1685
2038
- },
2039
- {
2040
- "epoch": 0.1,
2041
- "learning_rate": 0.00019173838209982788,
2042
- "loss": -370086.65,
2043
- "step": 1690
2044
- },
2045
- {
2046
- "epoch": 0.1,
2047
- "learning_rate": 0.00019231210556511764,
2048
- "loss": -368275.9,
2049
- "step": 1695
2050
- },
2051
- {
2052
- "epoch": 0.1,
2053
- "learning_rate": 0.00019288582903040735,
2054
- "loss": -371039.125,
2055
- "step": 1700
2056
- },
2057
- {
2058
- "epoch": 0.1,
2059
- "learning_rate": 0.0001934595524956971,
2060
- "loss": -368649.225,
2061
- "step": 1705
2062
- },
2063
- {
2064
- "epoch": 0.1,
2065
- "learning_rate": 0.0001940332759609868,
2066
- "loss": -370923.7,
2067
- "step": 1710
2068
- },
2069
- {
2070
- "epoch": 0.1,
2071
- "learning_rate": 0.00019460699942627655,
2072
- "loss": -370107.775,
2073
- "step": 1715
2074
- },
2075
- {
2076
- "epoch": 0.1,
2077
- "learning_rate": 0.00019518072289156628,
2078
- "loss": -371011.2,
2079
- "step": 1720
2080
- },
2081
- {
2082
- "epoch": 0.1,
2083
- "learning_rate": 0.00019575444635685601,
2084
- "loss": -368382.9,
2085
- "step": 1725
2086
- },
2087
- {
2088
- "epoch": 0.1,
2089
- "learning_rate": 0.00019632816982214572,
2090
- "loss": -372018.875,
2091
- "step": 1730
2092
- },
2093
- {
2094
- "epoch": 0.1,
2095
- "learning_rate": 0.00019690189328743548,
2096
- "loss": -369914.925,
2097
- "step": 1735
2098
- },
2099
- {
2100
- "epoch": 0.1,
2101
- "learning_rate": 0.0001974756167527252,
2102
- "loss": -370497.65,
2103
- "step": 1740
2104
- },
2105
- {
2106
- "epoch": 0.1,
2107
- "learning_rate": 0.00019804934021801492,
2108
- "loss": -371605.45,
2109
- "step": 1745
2110
- },
2111
- {
2112
- "epoch": 0.1,
2113
- "learning_rate": 0.00019862306368330465,
2114
- "loss": -370938.55,
2115
- "step": 1750
2116
- },
2117
- {
2118
- "epoch": 0.1,
2119
- "learning_rate": 0.0001991967871485944,
2120
- "loss": -369546.8,
2121
- "step": 1755
2122
- },
2123
- {
2124
- "epoch": 0.1,
2125
- "learning_rate": 0.00019977051061388412,
2126
- "loss": -371349.5,
2127
- "step": 1760
2128
- },
2129
- {
2130
- "epoch": 0.1,
2131
- "learning_rate": 0.0001999999819495587,
2132
- "loss": -369888.225,
2133
- "step": 1765
2134
- },
2135
- {
2136
- "epoch": 0.1,
2137
- "learning_rate": 0.00019999987164132972,
2138
- "loss": -372648.9,
2139
- "step": 1770
2140
- },
2141
- {
2142
- "epoch": 0.1,
2143
- "learning_rate": 0.00019999966105300522,
2144
- "loss": -372354.45,
2145
- "step": 1775
2146
- },
2147
- {
2148
- "epoch": 0.1,
2149
- "learning_rate": 0.0001999993501847964,
2150
- "loss": -371826.925,
2151
- "step": 1780
2152
- },
2153
- {
2154
- "epoch": 0.1,
2155
- "learning_rate": 0.00019999893903701498,
2156
- "loss": -373579.85,
2157
- "step": 1785
2158
- },
2159
- {
2160
- "epoch": 0.1,
2161
- "learning_rate": 0.00019999842761007325,
2162
- "loss": -372518.15,
2163
- "step": 1790
2164
- },
2165
- {
2166
- "epoch": 0.1,
2167
- "learning_rate": 0.0001999978159044841,
2168
- "loss": -373327.5,
2169
- "step": 1795
2170
- },
2171
- {
2172
- "epoch": 0.1,
2173
- "learning_rate": 0.0001999971039208609,
2174
- "loss": -374031.8,
2175
- "step": 1800
2176
- },
2177
- {
2178
- "epoch": 0.1,
2179
- "learning_rate": 0.00019999629165991768,
2180
- "loss": -375497.475,
2181
- "step": 1805
2182
- },
2183
- {
2184
- "epoch": 0.1,
2185
- "learning_rate": 0.00019999537912246892,
2186
- "loss": -371809.95,
2187
- "step": 1810
2188
- },
2189
- {
2190
- "epoch": 0.1,
2191
- "learning_rate": 0.00019999436630942975,
2192
- "loss": -372979.475,
2193
- "step": 1815
2194
- },
2195
- {
2196
- "epoch": 0.1,
2197
- "learning_rate": 0.00019999325322181584,
2198
- "loss": -373760.6,
2199
- "step": 1820
2200
- },
2201
- {
2202
- "epoch": 0.1,
2203
- "learning_rate": 0.0001999920398607434,
2204
- "loss": -374876.575,
2205
- "step": 1825
2206
- },
2207
- {
2208
- "epoch": 0.1,
2209
- "learning_rate": 0.00019999072622742912,
2210
- "loss": -375073.9,
2211
- "step": 1830
2212
- },
2213
- {
2214
- "epoch": 0.11,
2215
- "learning_rate": 0.0001999893123231904,
2216
- "loss": -374234.1,
2217
- "step": 1835
2218
- },
2219
- {
2220
- "epoch": 0.11,
2221
- "learning_rate": 0.00019998779814944505,
2222
- "loss": -374232.375,
2223
- "step": 1840
2224
- },
2225
- {
2226
- "epoch": 0.11,
2227
- "learning_rate": 0.00019998618370771148,
2228
- "loss": -373467.0,
2229
- "step": 1845
2230
- },
2231
- {
2232
- "epoch": 0.11,
2233
- "learning_rate": 0.0001999844689996087,
2234
- "loss": -374076.4,
2235
- "step": 1850
2236
- },
2237
- {
2238
- "epoch": 0.11,
2239
- "learning_rate": 0.00019998265402685622,
2240
- "loss": -374997.65,
2241
- "step": 1855
2242
- },
2243
- {
2244
- "epoch": 0.11,
2245
- "learning_rate": 0.00019998073879127408,
2246
- "loss": -375139.15,
2247
- "step": 1860
2248
- },
2249
- {
2250
- "epoch": 0.11,
2251
- "learning_rate": 0.00019997872329478286,
2252
- "loss": -374068.475,
2253
- "step": 1865
2254
- },
2255
- {
2256
- "epoch": 0.11,
2257
- "learning_rate": 0.00019997660753940375,
2258
- "loss": -374126.4,
2259
- "step": 1870
2260
- },
2261
- {
2262
- "epoch": 0.11,
2263
- "learning_rate": 0.0001999743915272584,
2264
- "loss": -375399.95,
2265
- "step": 1875
2266
- },
2267
- {
2268
- "epoch": 0.11,
2269
- "learning_rate": 0.00019997207526056907,
2270
- "loss": -375400.4,
2271
- "step": 1880
2272
- },
2273
- {
2274
- "epoch": 0.11,
2275
- "learning_rate": 0.0001999696587416585,
2276
- "loss": -373046.0,
2277
- "step": 1885
2278
- },
2279
- {
2280
- "epoch": 0.11,
2281
- "learning_rate": 0.00019996714197294995,
2282
- "loss": -372806.025,
2283
- "step": 1890
2284
- },
2285
- {
2286
- "epoch": 0.11,
2287
- "learning_rate": 0.00019996452495696726,
2288
- "loss": -373136.95,
2289
- "step": 1895
2290
- },
2291
- {
2292
- "epoch": 0.11,
2293
- "learning_rate": 0.0001999618076963348,
2294
- "loss": -373399.475,
2295
- "step": 1900
2296
- },
2297
- {
2298
- "epoch": 0.11,
2299
- "learning_rate": 0.00019995899019377742,
2300
- "loss": -374226.25,
2301
- "step": 1905
2302
- },
2303
- {
2304
- "epoch": 0.11,
2305
- "learning_rate": 0.00019995607245212052,
2306
- "loss": -373977.6,
2307
- "step": 1910
2308
- },
2309
- {
2310
- "epoch": 0.11,
2311
- "learning_rate": 0.00019995305447429002,
2312
- "loss": -372141.325,
2313
- "step": 1915
2314
- },
2315
- {
2316
- "epoch": 0.11,
2317
- "learning_rate": 0.00019994993626331237,
2318
- "loss": -374759.85,
2319
- "step": 1920
2320
- },
2321
- {
2322
- "epoch": 0.11,
2323
- "learning_rate": 0.00019994671782231453,
2324
- "loss": -375066.575,
2325
- "step": 1925
2326
- },
2327
- {
2328
- "epoch": 0.11,
2329
- "learning_rate": 0.00019994339915452395,
2330
- "loss": -373136.5,
2331
- "step": 1930
2332
- },
2333
- {
2334
- "epoch": 0.11,
2335
- "learning_rate": 0.00019993998026326853,
2336
- "loss": -376071.1,
2337
- "step": 1935
2338
- },
2339
- {
2340
- "epoch": 0.11,
2341
- "learning_rate": 0.00019993646115197685,
2342
- "loss": -373615.7,
2343
- "step": 1940
2344
- },
2345
- {
2346
- "epoch": 0.11,
2347
- "learning_rate": 0.0001999328418241778,
2348
- "loss": -374433.275,
2349
- "step": 1945
2350
- },
2351
- {
2352
- "epoch": 0.11,
2353
- "learning_rate": 0.0001999291222835009,
2354
- "loss": -374596.6,
2355
- "step": 1950
2356
- },
2357
- {
2358
- "epoch": 0.11,
2359
- "learning_rate": 0.00019992530253367608,
2360
- "loss": -372932.975,
2361
- "step": 1955
2362
- },
2363
- {
2364
- "epoch": 0.11,
2365
- "learning_rate": 0.0001999213825785338,
2366
- "loss": -375415.55,
2367
- "step": 1960
2368
- },
2369
- {
2370
- "epoch": 0.11,
2371
- "learning_rate": 0.00019991736242200506,
2372
- "loss": -374878.0,
2373
- "step": 1965
2374
- },
2375
- {
2376
- "epoch": 0.11,
2377
- "learning_rate": 0.00019991324206812116,
2378
- "loss": -375141.8,
2379
- "step": 1970
2380
- },
2381
- {
2382
- "epoch": 0.11,
2383
- "learning_rate": 0.00019990902152101412,
2384
- "loss": -373080.95,
2385
- "step": 1975
2386
- },
2387
- {
2388
- "epoch": 0.11,
2389
- "learning_rate": 0.00019990470078491625,
2390
- "loss": -376766.65,
2391
- "step": 1980
2392
- },
2393
- {
2394
- "epoch": 0.11,
2395
- "learning_rate": 0.0001999002798641604,
2396
- "loss": -374474.125,
2397
- "step": 1985
2398
- },
2399
- {
2400
- "epoch": 0.11,
2401
- "learning_rate": 0.00019989575876317993,
2402
- "loss": -378217.05,
2403
- "step": 1990
2404
- },
2405
- {
2406
- "epoch": 0.11,
2407
- "learning_rate": 0.0001998911374865085,
2408
- "loss": -374596.1,
2409
- "step": 1995
2410
- },
2411
- {
2412
- "epoch": 0.11,
2413
- "learning_rate": 0.00019988641603878047,
2414
- "loss": -375783.3,
2415
- "step": 2000
2416
- },
2417
- {
2418
- "epoch": 0.12,
2419
- "learning_rate": 0.0001998815944247304,
2420
- "loss": -376494.65,
2421
- "step": 2005
2422
- },
2423
- {
2424
- "epoch": 0.12,
2425
- "learning_rate": 0.0001998766726491935,
2426
- "loss": -376611.325,
2427
- "step": 2010
2428
- },
2429
- {
2430
- "epoch": 0.12,
2431
- "learning_rate": 0.00019987165071710527,
2432
- "loss": -374997.375,
2433
- "step": 2015
2434
- },
2435
- {
2436
- "epoch": 0.12,
2437
- "learning_rate": 0.0001998665286335018,
2438
- "loss": -375301.7,
2439
- "step": 2020
2440
- },
2441
- {
2442
- "epoch": 0.12,
2443
- "learning_rate": 0.00019986130640351946,
2444
- "loss": -375884.9,
2445
- "step": 2025
2446
- },
2447
- {
2448
- "epoch": 0.12,
2449
- "learning_rate": 0.00019985598403239512,
2450
- "loss": -374623.95,
2451
- "step": 2030
2452
- },
2453
- {
2454
- "epoch": 0.12,
2455
- "learning_rate": 0.00019985056152546608,
2456
- "loss": -375190.3,
2457
- "step": 2035
2458
- },
2459
- {
2460
- "epoch": 0.12,
2461
- "learning_rate": 0.00019984503888817004,
2462
- "loss": -376001.15,
2463
- "step": 2040
2464
- },
2465
- {
2466
- "epoch": 0.12,
2467
- "learning_rate": 0.0001998394161260451,
2468
- "loss": -376446.7,
2469
- "step": 2045
2470
- },
2471
- {
2472
- "epoch": 0.12,
2473
- "learning_rate": 0.00019983369324472983,
2474
- "loss": -376786.6,
2475
- "step": 2050
2476
- },
2477
- {
2478
- "epoch": 0.12,
2479
- "learning_rate": 0.00019982787024996307,
2480
- "loss": -377994.125,
2481
- "step": 2055
2482
- },
2483
- {
2484
- "epoch": 0.12,
2485
- "learning_rate": 0.00019982194714758417,
2486
- "loss": -377141.1,
2487
- "step": 2060
2488
- },
2489
- {
2490
- "epoch": 0.12,
2491
- "learning_rate": 0.00019981592394353287,
2492
- "loss": -377329.175,
2493
- "step": 2065
2494
- },
2495
- {
2496
- "epoch": 0.12,
2497
- "learning_rate": 0.00019980980064384916,
2498
- "loss": -378761.0,
2499
- "step": 2070
2500
- },
2501
- {
2502
- "epoch": 0.12,
2503
- "learning_rate": 0.0001998035772546736,
2504
- "loss": -378007.975,
2505
- "step": 2075
2506
- },
2507
- {
2508
- "epoch": 0.12,
2509
- "learning_rate": 0.00019979725378224697,
2510
- "loss": -376513.1,
2511
- "step": 2080
2512
- },
2513
- {
2514
- "epoch": 0.12,
2515
- "learning_rate": 0.00019979083023291043,
2516
- "loss": -374871.65,
2517
- "step": 2085
2518
- },
2519
- {
2520
- "epoch": 0.12,
2521
- "learning_rate": 0.0001997843066131056,
2522
- "loss": -377070.95,
2523
- "step": 2090
2524
- },
2525
- {
2526
- "epoch": 0.12,
2527
- "learning_rate": 0.00019977768292937431,
2528
- "loss": -376784.475,
2529
- "step": 2095
2530
- },
2531
- {
2532
- "epoch": 0.12,
2533
- "learning_rate": 0.00019977095918835886,
2534
- "loss": -376203.975,
2535
- "step": 2100
2536
- },
2537
- {
2538
- "epoch": 0.12,
2539
- "learning_rate": 0.00019976413539680182,
2540
- "loss": -376471.5,
2541
- "step": 2105
2542
- },
2543
- {
2544
- "epoch": 0.12,
2545
- "learning_rate": 0.00019975721156154606,
2546
- "loss": -378366.35,
2547
- "step": 2110
2548
- },
2549
- {
2550
- "epoch": 0.12,
2551
- "learning_rate": 0.0001997501876895349,
2552
- "loss": -380470.325,
2553
- "step": 2115
2554
- },
2555
- {
2556
- "epoch": 0.12,
2557
- "learning_rate": 0.0001997430637878118,
2558
- "loss": -379603.125,
2559
- "step": 2120
2560
- },
2561
- {
2562
- "epoch": 0.12,
2563
- "learning_rate": 0.0001997358398635207,
2564
- "loss": -379410.3,
2565
- "step": 2125
2566
- },
2567
- {
2568
- "epoch": 0.12,
2569
- "learning_rate": 0.00019972851592390574,
2570
- "loss": -378729.1,
2571
- "step": 2130
2572
- },
2573
- {
2574
- "epoch": 0.12,
2575
- "learning_rate": 0.00019972109197631137,
2576
- "loss": -381401.65,
2577
- "step": 2135
2578
- },
2579
- {
2580
- "epoch": 0.12,
2581
- "learning_rate": 0.00019971356802818234,
2582
- "loss": -376794.175,
2583
- "step": 2140
2584
- },
2585
- {
2586
- "epoch": 0.12,
2587
- "learning_rate": 0.00019970594408706373,
2588
- "loss": -377792.475,
2589
- "step": 2145
2590
- },
2591
- {
2592
- "epoch": 0.12,
2593
- "learning_rate": 0.0001996982201606008,
2594
- "loss": -379310.85,
2595
- "step": 2150
2596
- },
2597
- {
2598
- "epoch": 0.12,
2599
- "learning_rate": 0.00019969039625653912,
2600
- "loss": -376466.35,
2601
- "step": 2155
2602
- },
2603
- {
2604
- "epoch": 0.12,
2605
- "learning_rate": 0.00019968247238272456,
2606
- "loss": -377192.2,
2607
- "step": 2160
2608
- },
2609
- {
2610
- "epoch": 0.12,
2611
- "learning_rate": 0.0001996744485471031,
2612
- "loss": -379389.775,
2613
- "step": 2165
2614
- },
2615
- {
2616
- "epoch": 0.12,
2617
- "learning_rate": 0.0001996663247577212,
2618
- "loss": -378994.55,
2619
- "step": 2170
2620
- },
2621
- {
2622
- "epoch": 0.12,
2623
- "learning_rate": 0.0001996581010227253,
2624
- "loss": -377849.05,
2625
- "step": 2175
2626
- },
2627
- {
2628
- "epoch": 0.13,
2629
- "learning_rate": 0.00019964977735036223,
2630
- "loss": -380360.15,
2631
- "step": 2180
2632
- },
2633
- {
2634
- "epoch": 0.13,
2635
- "learning_rate": 0.000199641353748979,
2636
- "loss": -376151.325,
2637
- "step": 2185
2638
- },
2639
- {
2640
- "epoch": 0.13,
2641
- "learning_rate": 0.0001996328302270228,
2642
- "loss": -379724.675,
2643
- "step": 2190
2644
- },
2645
- {
2646
- "epoch": 0.13,
2647
- "learning_rate": 0.00019962420679304102,
2648
- "loss": -380463.875,
2649
- "step": 2195
2650
- },
2651
- {
2652
- "epoch": 0.13,
2653
- "learning_rate": 0.00019961548345568127,
2654
- "loss": -377221.05,
2655
- "step": 2200
2656
- },
2657
- {
2658
- "epoch": 0.13,
2659
- "learning_rate": 0.00019960666022369132,
2660
- "loss": -379056.475,
2661
- "step": 2205
2662
- },
2663
- {
2664
- "epoch": 0.13,
2665
- "learning_rate": 0.00019959773710591917,
2666
- "loss": -378709.625,
2667
- "step": 2210
2668
- },
2669
- {
2670
- "epoch": 0.13,
2671
- "learning_rate": 0.0001995887141113129,
2672
- "loss": -379229.1,
2673
- "step": 2215
2674
- },
2675
- {
2676
- "epoch": 0.13,
2677
- "learning_rate": 0.0001995795912489208,
2678
- "loss": -380581.875,
2679
- "step": 2220
2680
- },
2681
- {
2682
- "epoch": 0.13,
2683
- "learning_rate": 0.0001995703685278913,
2684
- "loss": -380266.475,
2685
- "step": 2225
2686
- },
2687
- {
2688
- "epoch": 0.13,
2689
- "learning_rate": 0.00019956104595747297,
2690
- "loss": -380923.05,
2691
- "step": 2230
2692
- },
2693
- {
2694
- "epoch": 0.13,
2695
- "learning_rate": 0.00019955162354701452,
2696
- "loss": -379820.1,
2697
- "step": 2235
2698
- },
2699
- {
2700
- "epoch": 0.13,
2701
- "learning_rate": 0.0001995421013059647,
2702
- "loss": -378100.25,
2703
- "step": 2240
2704
- },
2705
- {
2706
- "epoch": 0.13,
2707
- "learning_rate": 0.00019953247924387252,
2708
- "loss": -378512.35,
2709
- "step": 2245
2710
- },
2711
- {
2712
- "epoch": 0.13,
2713
- "learning_rate": 0.00019952275737038696,
2714
- "loss": -378658.975,
2715
- "step": 2250
2716
- },
2717
- {
2718
- "epoch": 0.13,
2719
- "learning_rate": 0.00019951293569525714,
2720
- "loss": -380244.1,
2721
- "step": 2255
2722
- },
2723
- {
2724
- "epoch": 0.13,
2725
- "learning_rate": 0.00019950301422833223,
2726
- "loss": -379381.4,
2727
- "step": 2260
2728
- },
2729
- {
2730
- "epoch": 0.13,
2731
- "learning_rate": 0.00019949299297956157,
2732
- "loss": -379346.25,
2733
- "step": 2265
2734
- },
2735
- {
2736
- "epoch": 0.13,
2737
- "learning_rate": 0.00019948287195899441,
2738
- "loss": -381164.475,
2739
- "step": 2270
2740
- },
2741
- {
2742
- "epoch": 0.13,
2743
- "learning_rate": 0.0001994726511767802,
2744
- "loss": -381646.4,
2745
- "step": 2275
2746
- },
2747
- {
2748
- "epoch": 0.13,
2749
- "learning_rate": 0.0001994623306431683,
2750
- "loss": -382291.45,
2751
- "step": 2280
2752
- },
2753
- {
2754
- "epoch": 0.13,
2755
- "learning_rate": 0.00019945191036850824,
2756
- "loss": -381426.8,
2757
- "step": 2285
2758
- },
2759
- {
2760
- "epoch": 0.13,
2761
- "learning_rate": 0.00019944139036324942,
2762
- "loss": -380680.5,
2763
- "step": 2290
2764
- },
2765
- {
2766
- "epoch": 0.13,
2767
- "learning_rate": 0.00019943077063794138,
2768
- "loss": -379971.85,
2769
- "step": 2295
2770
- },
2771
- {
2772
- "epoch": 0.13,
2773
- "learning_rate": 0.00019942005120323356,
2774
- "loss": -380942.95,
2775
- "step": 2300
2776
- },
2777
- {
2778
- "epoch": 0.13,
2779
- "learning_rate": 0.0001994092320698755,
2780
- "loss": -380319.025,
2781
- "step": 2305
2782
- },
2783
- {
2784
- "epoch": 0.13,
2785
- "learning_rate": 0.00019939831324871656,
2786
- "loss": -382115.65,
2787
- "step": 2310
2788
- },
2789
- {
2790
- "epoch": 0.13,
2791
- "learning_rate": 0.00019938729475070624,
2792
- "loss": -381474.275,
2793
- "step": 2315
2794
- },
2795
- {
2796
- "epoch": 0.13,
2797
- "learning_rate": 0.00019937617658689384,
2798
- "loss": -380908.375,
2799
- "step": 2320
2800
- },
2801
- {
2802
- "epoch": 0.13,
2803
- "learning_rate": 0.00019936495876842877,
2804
- "loss": -382077.0,
2805
- "step": 2325
2806
- },
2807
- {
2808
- "epoch": 0.13,
2809
- "learning_rate": 0.0001993536413065602,
2810
- "loss": -381410.025,
2811
- "step": 2330
2812
- },
2813
- {
2814
- "epoch": 0.13,
2815
- "learning_rate": 0.00019934222421263734,
2816
- "loss": -382348.975,
2817
- "step": 2335
2818
- },
2819
- {
2820
- "epoch": 0.13,
2821
- "learning_rate": 0.00019933070749810928,
2822
- "loss": -380548.25,
2823
- "step": 2340
2824
- },
2825
- {
2826
- "epoch": 0.13,
2827
- "learning_rate": 0.00019931909117452498,
2828
- "loss": -381308.7,
2829
- "step": 2345
2830
- },
2831
- {
2832
- "epoch": 0.13,
2833
- "learning_rate": 0.00019930737525353337,
2834
- "loss": -383941.775,
2835
- "step": 2350
2836
- },
2837
- {
2838
- "epoch": 0.14,
2839
- "learning_rate": 0.00019929555974688317,
2840
- "loss": -381028.575,
2841
- "step": 2355
2842
- },
2843
- {
2844
- "epoch": 0.14,
2845
- "learning_rate": 0.000199283644666423,
2846
- "loss": -381415.6,
2847
- "step": 2360
2848
- },
2849
- {
2850
- "epoch": 0.14,
2851
- "learning_rate": 0.00019927163002410133,
2852
- "loss": -380644.25,
2853
- "step": 2365
2854
- },
2855
- {
2856
- "epoch": 0.14,
2857
- "learning_rate": 0.0001992595158319664,
2858
- "loss": -379236.3,
2859
- "step": 2370
2860
- },
2861
- {
2862
- "epoch": 0.14,
2863
- "learning_rate": 0.00019924730210216652,
2864
- "loss": -383746.7,
2865
- "step": 2375
2866
- },
2867
- {
2868
- "epoch": 0.14,
2869
- "learning_rate": 0.00019923498884694948,
2870
- "loss": -383131.4,
2871
- "step": 2380
2872
- },
2873
- {
2874
- "epoch": 0.14,
2875
- "learning_rate": 0.0001992225760786631,
2876
- "loss": -383897.0,
2877
- "step": 2385
2878
- },
2879
- {
2880
- "epoch": 0.14,
2881
- "learning_rate": 0.00019921006380975496,
2882
- "loss": -382192.75,
2883
- "step": 2390
2884
- },
2885
- {
2886
- "epoch": 0.14,
2887
- "learning_rate": 0.00019919745205277236,
2888
- "loss": -384938.525,
2889
- "step": 2395
2890
- },
2891
- {
2892
- "epoch": 0.14,
2893
- "learning_rate": 0.0001991847408203624,
2894
- "loss": -382230.3,
2895
- "step": 2400
2896
- },
2897
- {
2898
- "epoch": 0.14,
2899
- "learning_rate": 0.00019917193012527194,
2900
- "loss": -383274.35,
2901
- "step": 2405
2902
- },
2903
- {
2904
- "epoch": 0.14,
2905
- "learning_rate": 0.00019915901998034756,
2906
- "loss": -382033.775,
2907
- "step": 2410
2908
- },
2909
- {
2910
- "epoch": 0.14,
2911
- "learning_rate": 0.00019914601039853558,
2912
- "loss": -384337.975,
2913
- "step": 2415
2914
- },
2915
- {
2916
- "epoch": 0.14,
2917
- "learning_rate": 0.00019913290139288208,
2918
- "loss": -383088.7,
2919
- "step": 2420
2920
- },
2921
- {
2922
- "epoch": 0.14,
2923
- "learning_rate": 0.00019911969297653275,
2924
- "loss": -384575.35,
2925
- "step": 2425
2926
- },
2927
- {
2928
- "epoch": 0.14,
2929
- "learning_rate": 0.000199106385162733,
2930
- "loss": -384732.75,
2931
- "step": 2430
2932
- },
2933
- {
2934
- "epoch": 0.14,
2935
- "learning_rate": 0.000199092977964828,
2936
- "loss": -381957.525,
2937
- "step": 2435
2938
- },
2939
- {
2940
- "epoch": 0.14,
2941
- "learning_rate": 0.00019907947139626253,
2942
- "loss": -383987.4,
2943
- "step": 2440
2944
- },
2945
- {
2946
- "epoch": 0.14,
2947
- "learning_rate": 0.00019906586547058095,
2948
- "loss": -385980.9,
2949
- "step": 2445
2950
- },
2951
- {
2952
- "epoch": 0.14,
2953
- "learning_rate": 0.00019905216020142734,
2954
- "loss": -384454.15,
2955
- "step": 2450
2956
- },
2957
- {
2958
- "epoch": 0.14,
2959
- "learning_rate": 0.00019903835560254536,
2960
- "loss": -383701.65,
2961
- "step": 2455
2962
- },
2963
- {
2964
- "epoch": 0.14,
2965
- "learning_rate": 0.0001990244516877783,
2966
- "loss": -386540.15,
2967
- "step": 2460
2968
- },
2969
- {
2970
- "epoch": 0.14,
2971
- "learning_rate": 0.00019901044847106904,
2972
- "loss": -384910.45,
2973
- "step": 2465
2974
- },
2975
- {
2976
- "epoch": 0.14,
2977
- "learning_rate": 0.00019899634596646002,
2978
- "loss": -385993.225,
2979
- "step": 2470
2980
- },
2981
- {
2982
- "epoch": 0.14,
2983
- "learning_rate": 0.0001989821441880933,
2984
- "loss": -384914.4,
2985
- "step": 2475
2986
- },
2987
- {
2988
- "epoch": 0.14,
2989
- "learning_rate": 0.0001989678431502104,
2990
- "loss": -384792.5,
2991
- "step": 2480
2992
- },
2993
- {
2994
- "epoch": 0.14,
2995
- "learning_rate": 0.0001989534428671525,
2996
- "loss": -386860.775,
2997
- "step": 2485
2998
- },
2999
- {
3000
- "epoch": 0.14,
3001
- "learning_rate": 0.00019893894335336017,
3002
- "loss": -386077.15,
3003
- "step": 2490
3004
- },
3005
- {
3006
- "epoch": 0.14,
3007
- "learning_rate": 0.0001989243446233736,
3008
- "loss": -387537.225,
3009
- "step": 2495
3010
- },
3011
- {
3012
- "epoch": 0.14,
3013
- "learning_rate": 0.0001989096466918324,
3014
- "loss": -386423.8,
3015
- "step": 2500
3016
- },
3017
- {
3018
- "epoch": 0.14,
3019
- "learning_rate": 0.00019889484957347575,
3020
- "loss": -387536.45,
3021
- "step": 2505
3022
- },
3023
- {
3024
- "epoch": 0.14,
3025
- "learning_rate": 0.00019887995328314215,
3026
- "loss": -387344.85,
3027
- "step": 2510
3028
- },
3029
- {
3030
- "epoch": 0.14,
3031
- "learning_rate": 0.0001988649578357697,
3032
- "loss": -385629.8,
3033
- "step": 2515
3034
- },
3035
- {
3036
- "epoch": 0.14,
3037
- "learning_rate": 0.0001988498632463958,
3038
- "loss": -386901.975,
3039
- "step": 2520
3040
- },
3041
- {
3042
- "epoch": 0.14,
3043
- "learning_rate": 0.0001988346695301574,
3044
- "loss": -385991.45,
3045
- "step": 2525
3046
- },
3047
- {
3048
- "epoch": 0.15,
3049
- "learning_rate": 0.00019881937670229076,
3050
- "loss": -387151.35,
3051
- "step": 2530
3052
- },
3053
- {
3054
- "epoch": 0.15,
3055
- "learning_rate": 0.00019880398477813157,
3056
- "loss": -388640.1,
3057
- "step": 2535
3058
- },
3059
- {
3060
- "epoch": 0.15,
3061
- "learning_rate": 0.0001987884937731149,
3062
- "loss": -386557.35,
3063
- "step": 2540
3064
- },
3065
- {
3066
- "epoch": 0.15,
3067
- "learning_rate": 0.00019877290370277516,
3068
- "loss": -387900.95,
3069
- "step": 2545
3070
- },
3071
- {
3072
- "epoch": 0.15,
3073
- "learning_rate": 0.0001987572145827461,
3074
- "loss": -388339.55,
3075
- "step": 2550
3076
- },
3077
- {
3078
- "epoch": 0.15,
3079
- "learning_rate": 0.0001987414264287608,
3080
- "loss": -389637.45,
3081
- "step": 2555
3082
- },
3083
- {
3084
- "epoch": 0.15,
3085
- "learning_rate": 0.00019872553925665164,
3086
- "loss": -387942.825,
3087
- "step": 2560
3088
- },
3089
- {
3090
- "epoch": 0.15,
3091
- "learning_rate": 0.00019870955308235036,
3092
- "loss": -386618.725,
3093
- "step": 2565
3094
- },
3095
- {
3096
- "epoch": 0.15,
3097
- "learning_rate": 0.00019869346792188787,
3098
- "loss": -388027.925,
3099
- "step": 2570
3100
- },
3101
- {
3102
- "epoch": 0.15,
3103
- "learning_rate": 0.0001986772837913945,
3104
- "loss": -388338.6,
3105
- "step": 2575
3106
- },
3107
- {
3108
- "epoch": 0.15,
3109
- "learning_rate": 0.00019866100070709962,
3110
- "loss": -387953.725,
3111
- "step": 2580
3112
- },
3113
- {
3114
- "epoch": 0.15,
3115
- "learning_rate": 0.00019864461868533201,
3116
- "loss": -387030.95,
3117
- "step": 2585
3118
- },
3119
- {
3120
- "epoch": 0.15,
3121
- "learning_rate": 0.0001986281377425196,
3122
- "loss": -387630.4,
3123
- "step": 2590
3124
- },
3125
- {
3126
- "epoch": 0.15,
3127
- "learning_rate": 0.00019861155789518948,
3128
- "loss": -387084.9,
3129
- "step": 2595
3130
- },
3131
- {
3132
- "epoch": 0.15,
3133
- "learning_rate": 0.00019859487915996796,
3134
- "loss": -387936.3,
3135
- "step": 2600
3136
- },
3137
- {
3138
- "epoch": 0.15,
3139
- "learning_rate": 0.00019857810155358058,
3140
- "loss": -387557.475,
3141
- "step": 2605
3142
- },
3143
- {
3144
- "epoch": 0.15,
3145
- "learning_rate": 0.0001985612250928519,
3146
- "loss": -387064.125,
3147
- "step": 2610
3148
- },
3149
- {
3150
- "epoch": 0.15,
3151
- "learning_rate": 0.00019854424979470566,
3152
- "loss": -389489.6,
3153
- "step": 2615
3154
- },
3155
- {
3156
- "epoch": 0.15,
3157
- "learning_rate": 0.00019852717567616477,
3158
- "loss": -386877.95,
3159
- "step": 2620
3160
- },
3161
- {
3162
- "epoch": 0.15,
3163
- "learning_rate": 0.00019851000275435116,
3164
- "loss": -388247.55,
3165
- "step": 2625
3166
- },
3167
- {
3168
- "epoch": 0.15,
3169
- "learning_rate": 0.00019849273104648592,
3170
- "loss": -388444.175,
3171
- "step": 2630
3172
- },
3173
- {
3174
- "epoch": 0.15,
3175
- "learning_rate": 0.00019847536056988912,
3176
- "loss": -388085.125,
3177
- "step": 2635
3178
- },
3179
- {
3180
- "epoch": 0.15,
3181
- "learning_rate": 0.0001984578913419799,
3182
- "loss": -390132.025,
3183
- "step": 2640
3184
- },
3185
- {
3186
- "epoch": 0.15,
3187
- "learning_rate": 0.00019844032338027647,
3188
- "loss": -390666.85,
3189
- "step": 2645
3190
- },
3191
- {
3192
- "epoch": 0.15,
3193
- "learning_rate": 0.000198422656702396,
3194
- "loss": -387382.45,
3195
- "step": 2650
3196
- },
3197
- {
3198
- "epoch": 0.15,
3199
- "learning_rate": 0.00019840489132605472,
3200
- "loss": -389585.45,
3201
- "step": 2655
3202
- },
3203
- {
3204
- "epoch": 0.15,
3205
- "learning_rate": 0.00019838702726906774,
3206
- "loss": -387664.7,
3207
- "step": 2660
3208
- },
3209
- {
3210
- "epoch": 0.15,
3211
- "learning_rate": 0.00019836906454934918,
3212
- "loss": -389010.9,
3213
- "step": 2665
3214
- },
3215
- {
3216
- "epoch": 0.15,
3217
- "learning_rate": 0.00019835100318491214,
3218
- "loss": -388872.45,
3219
- "step": 2670
3220
- },
3221
- {
3222
- "epoch": 0.15,
3223
- "learning_rate": 0.00019833284319386855,
3224
- "loss": -389068.725,
3225
- "step": 2675
3226
- },
3227
- {
3228
- "epoch": 0.15,
3229
- "learning_rate": 0.00019831458459442931,
3230
- "loss": -386642.95,
3231
- "step": 2680
3232
- },
3233
- {
3234
- "epoch": 0.15,
3235
- "learning_rate": 0.0001982962274049042,
3236
- "loss": -389572.8,
3237
- "step": 2685
3238
- },
3239
- {
3240
- "epoch": 0.15,
3241
- "learning_rate": 0.00019827777164370178,
3242
- "loss": -389664.675,
3243
- "step": 2690
3244
- },
3245
- {
3246
- "epoch": 0.15,
3247
- "learning_rate": 0.0001982592173293296,
3248
- "loss": -389267.95,
3249
- "step": 2695
3250
- },
3251
- {
3252
- "epoch": 0.15,
3253
- "learning_rate": 0.00019824056448039396,
3254
- "loss": -389436.8,
3255
- "step": 2700
3256
- },
3257
- {
3258
- "epoch": 0.16,
3259
- "learning_rate": 0.00019822181311559994,
3260
- "loss": -391930.425,
3261
- "step": 2705
3262
- },
3263
- {
3264
- "epoch": 0.16,
3265
- "learning_rate": 0.00019820296325375153,
3266
- "loss": -387965.325,
3267
- "step": 2710
3268
- },
3269
- {
3270
- "epoch": 0.16,
3271
- "learning_rate": 0.00019818401491375132,
3272
- "loss": -388510.625,
3273
- "step": 2715
3274
- },
3275
- {
3276
- "epoch": 0.16,
3277
- "learning_rate": 0.0001981649681146008,
3278
- "loss": -388122.625,
3279
- "step": 2720
3280
- },
3281
- {
3282
- "epoch": 0.16,
3283
- "learning_rate": 0.0001981458228754001,
3284
- "loss": -388644.0,
3285
- "step": 2725
3286
- },
3287
- {
3288
- "epoch": 0.16,
3289
- "learning_rate": 0.00019812657921534818,
3290
- "loss": -389955.125,
3291
- "step": 2730
3292
- },
3293
- {
3294
- "epoch": 0.16,
3295
- "learning_rate": 0.0001981072371537426,
3296
- "loss": -388322.6,
3297
- "step": 2735
3298
- },
3299
- {
3300
- "epoch": 0.16,
3301
- "learning_rate": 0.00019808779670997957,
3302
- "loss": -389384.75,
3303
- "step": 2740
3304
- },
3305
- {
3306
- "epoch": 0.16,
3307
- "learning_rate": 0.00019806825790355406,
3308
- "loss": -389707.55,
3309
- "step": 2745
3310
- },
3311
- {
3312
- "epoch": 0.16,
3313
- "learning_rate": 0.0001980486207540596,
3314
- "loss": -389918.25,
3315
- "step": 2750
3316
- },
3317
- {
3318
- "epoch": 0.16,
3319
- "learning_rate": 0.0001980288852811884,
3320
- "loss": -390486.3,
3321
- "step": 2755
3322
- },
3323
- {
3324
- "epoch": 0.16,
3325
- "learning_rate": 0.00019800905150473125,
3326
- "loss": -390199.275,
3327
- "step": 2760
3328
- },
3329
- {
3330
- "epoch": 0.16,
3331
- "learning_rate": 0.00019798911944457744,
3332
- "loss": -392517.55,
3333
- "step": 2765
3334
- },
3335
- {
3336
- "epoch": 0.16,
3337
- "learning_rate": 0.00019796908912071495,
3338
- "loss": -390256.425,
3339
- "step": 2770
3340
- },
3341
- {
3342
- "epoch": 0.16,
3343
- "learning_rate": 0.00019794896055323017,
3344
- "loss": -388095.225,
3345
- "step": 2775
3346
- },
3347
- {
3348
- "epoch": 0.16,
3349
- "learning_rate": 0.00019792873376230815,
3350
- "loss": -389728.6,
3351
- "step": 2780
3352
- },
3353
- {
3354
- "epoch": 0.16,
3355
- "learning_rate": 0.00019790840876823232,
3356
- "loss": -387683.15,
3357
- "step": 2785
3358
- },
3359
- {
3360
- "epoch": 0.16,
3361
- "learning_rate": 0.00019788798559138457,
3362
- "loss": -389113.1,
3363
- "step": 2790
3364
- },
3365
- {
3366
- "epoch": 0.16,
3367
- "learning_rate": 0.00019786746425224543,
3368
- "loss": -392035.95,
3369
- "step": 2795
3370
- },
3371
- {
3372
- "epoch": 0.16,
3373
- "learning_rate": 0.00019784684477139366,
3374
- "loss": -390833.95,
3375
- "step": 2800
3376
- },
3377
- {
3378
- "epoch": 0.16,
3379
- "learning_rate": 0.00019782612716950652,
3380
- "loss": -390160.825,
3381
- "step": 2805
3382
- },
3383
- {
3384
- "epoch": 0.16,
3385
- "learning_rate": 0.00019780531146735972,
3386
- "loss": -393249.15,
3387
- "step": 2810
3388
- },
3389
- {
3390
- "epoch": 0.16,
3391
- "learning_rate": 0.00019778439768582725,
3392
- "loss": -391862.85,
3393
- "step": 2815
3394
- },
3395
- {
3396
- "epoch": 0.16,
3397
- "learning_rate": 0.00019776338584588153,
3398
- "loss": -389768.2,
3399
- "step": 2820
3400
- },
3401
- {
3402
- "epoch": 0.16,
3403
- "learning_rate": 0.00019774227596859324,
3404
- "loss": -391630.1,
3405
- "step": 2825
3406
- },
3407
- {
3408
- "epoch": 0.16,
3409
- "learning_rate": 0.00019772106807513146,
3410
- "loss": -392128.275,
3411
- "step": 2830
3412
- },
3413
- {
3414
- "epoch": 0.16,
3415
- "learning_rate": 0.00019769976218676346,
3416
- "loss": -391493.35,
3417
- "step": 2835
3418
- },
3419
- {
3420
- "epoch": 0.16,
3421
- "learning_rate": 0.00019767835832485485,
3422
- "loss": -390874.9,
3423
- "step": 2840
3424
- },
3425
- {
3426
- "epoch": 0.16,
3427
- "learning_rate": 0.0001976568565108695,
3428
- "loss": -392315.375,
3429
- "step": 2845
3430
- },
3431
- {
3432
- "epoch": 0.16,
3433
- "learning_rate": 0.00019763525676636947,
3434
- "loss": -393350.75,
3435
- "step": 2850
3436
- },
3437
- {
3438
- "epoch": 0.16,
3439
- "learning_rate": 0.000197613559113015,
3440
- "loss": -392181.875,
3441
- "step": 2855
3442
- },
3443
- {
3444
- "epoch": 0.16,
3445
- "learning_rate": 0.00019759176357256455,
3446
- "loss": -392112.25,
3447
- "step": 2860
3448
- },
3449
- {
3450
- "epoch": 0.16,
3451
- "learning_rate": 0.00019756987016687476,
3452
- "loss": -393530.525,
3453
- "step": 2865
3454
- },
3455
- {
3456
- "epoch": 0.16,
3457
- "learning_rate": 0.00019754787891790039,
3458
- "loss": -392892.175,
3459
- "step": 2870
3460
- },
3461
- {
3462
- "epoch": 0.16,
3463
- "learning_rate": 0.00019752578984769432,
3464
- "loss": -391638.65,
3465
- "step": 2875
3466
- },
3467
- {
3468
- "epoch": 0.17,
3469
- "learning_rate": 0.00019750360297840746,
3470
- "loss": -390896.4,
3471
- "step": 2880
3472
- },
3473
- {
3474
- "epoch": 0.17,
3475
- "learning_rate": 0.00019748131833228892,
3476
- "loss": -393401.7,
3477
- "step": 2885
3478
- },
3479
- {
3480
- "epoch": 0.17,
3481
- "learning_rate": 0.00019745893593168577,
3482
- "loss": -391131.8,
3483
- "step": 2890
3484
- },
3485
- {
3486
- "epoch": 0.17,
3487
- "learning_rate": 0.00019743645579904312,
3488
- "loss": -394043.15,
3489
- "step": 2895
3490
- },
3491
- {
3492
- "epoch": 0.17,
3493
- "learning_rate": 0.00019741387795690408,
3494
- "loss": -391290.3,
3495
- "step": 2900
3496
- },
3497
- {
3498
- "epoch": 0.17,
3499
- "learning_rate": 0.00019739120242790982,
3500
- "loss": -392632.6,
3501
- "step": 2905
3502
- },
3503
- {
3504
- "epoch": 0.17,
3505
- "learning_rate": 0.00019736842923479935,
3506
- "loss": -393573.65,
3507
- "step": 2910
3508
- },
3509
- {
3510
- "epoch": 0.17,
3511
- "learning_rate": 0.0001973455584004097,
3512
- "loss": -392218.625,
3513
- "step": 2915
3514
- },
3515
- {
3516
- "epoch": 0.17,
3517
- "learning_rate": 0.00019732258994767583,
3518
- "loss": -392381.75,
3519
- "step": 2920
3520
- },
3521
- {
3522
- "epoch": 0.17,
3523
- "learning_rate": 0.00019729952389963053,
3524
- "loss": -395136.075,
3525
- "step": 2925
3526
- },
3527
- {
3528
- "epoch": 0.17,
3529
- "learning_rate": 0.00019727636027940445,
3530
- "loss": -396081.0,
3531
- "step": 2930
3532
- },
3533
- {
3534
- "epoch": 0.17,
3535
- "learning_rate": 0.00019725309911022617,
3536
- "loss": -394324.7,
3537
- "step": 2935
3538
- },
3539
- {
3540
- "epoch": 0.17,
3541
- "learning_rate": 0.00019722974041542203,
3542
- "loss": -394096.8,
3543
- "step": 2940
3544
- },
3545
- {
3546
- "epoch": 0.17,
3547
- "learning_rate": 0.00019720628421841617,
3548
- "loss": -395350.625,
3549
- "step": 2945
3550
- },
3551
- {
3552
- "epoch": 0.17,
3553
- "learning_rate": 0.00019718273054273051,
3554
- "loss": -393836.025,
3555
- "step": 2950
3556
- },
3557
- {
3558
- "epoch": 0.17,
3559
- "learning_rate": 0.00019715907941198477,
3560
- "loss": -393069.25,
3561
- "step": 2955
3562
- },
3563
- {
3564
- "epoch": 0.17,
3565
- "learning_rate": 0.0001971353308498963,
3566
- "loss": -393328.0,
3567
- "step": 2960
3568
- },
3569
- {
3570
- "epoch": 0.17,
3571
- "learning_rate": 0.00019711148488028025,
3572
- "loss": -391875.05,
3573
- "step": 2965
3574
- },
3575
- {
3576
- "epoch": 0.17,
3577
- "learning_rate": 0.0001970875415270494,
3578
- "loss": -393253.6,
3579
- "step": 2970
3580
- },
3581
- {
3582
- "epoch": 0.17,
3583
- "learning_rate": 0.0001970635008142142,
3584
- "loss": -393998.3,
3585
- "step": 2975
3586
- },
3587
- {
3588
- "epoch": 0.17,
3589
- "learning_rate": 0.00019703936276588272,
3590
- "loss": -392105.475,
3591
- "step": 2980
3592
- },
3593
- {
3594
- "epoch": 0.17,
3595
- "learning_rate": 0.00019701512740626068,
3596
- "loss": -393645.9,
3597
- "step": 2985
3598
- },
3599
- {
3600
- "epoch": 0.17,
3601
- "learning_rate": 0.00019699079475965132,
3602
- "loss": -395303.55,
3603
- "step": 2990
3604
- },
3605
- {
3606
- "epoch": 0.17,
3607
- "learning_rate": 0.00019696636485045548,
3608
- "loss": -395705.85,
3609
- "step": 2995
3610
- },
3611
- {
3612
- "epoch": 0.17,
3613
- "learning_rate": 0.00019694183770317154,
3614
- "loss": -394201.825,
3615
- "step": 3000
3616
- },
3617
- {
3618
- "epoch": 0.17,
3619
- "learning_rate": 0.00019691721334239536,
3620
- "loss": -395230.95,
3621
- "step": 3005
3622
- },
3623
- {
3624
- "epoch": 0.17,
3625
- "learning_rate": 0.00019689249179282033,
3626
- "loss": -394836.2,
3627
- "step": 3010
3628
- },
3629
- {
3630
- "epoch": 0.17,
3631
- "learning_rate": 0.00019686767307923727,
3632
- "loss": -393954.225,
3633
- "step": 3015
3634
- },
3635
- {
3636
- "epoch": 0.17,
3637
- "learning_rate": 0.0001968427572265344,
3638
- "loss": -396644.95,
3639
- "step": 3020
3640
- },
3641
- {
3642
- "epoch": 0.17,
3643
- "learning_rate": 0.00019681774425969745,
3644
- "loss": -395644.775,
3645
- "step": 3025
3646
- },
3647
- {
3648
- "epoch": 0.17,
3649
- "learning_rate": 0.00019679263420380942,
3650
- "loss": -395046.575,
3651
- "step": 3030
3652
- },
3653
- {
3654
- "epoch": 0.17,
3655
- "learning_rate": 0.0001967674270840508,
3656
- "loss": -394854.95,
3657
- "step": 3035
3658
- },
3659
- {
3660
- "epoch": 0.17,
3661
- "learning_rate": 0.0001967421229256993,
3662
- "loss": -394871.25,
3663
- "step": 3040
3664
- },
3665
- {
3666
- "epoch": 0.17,
3667
- "learning_rate": 0.00019671672175413,
3668
- "loss": -393875.2,
3669
- "step": 3045
3670
- },
3671
- {
3672
- "epoch": 0.17,
3673
- "learning_rate": 0.00019669122359481525,
3674
- "loss": -393479.0,
3675
- "step": 3050
3676
- },
3677
- {
3678
- "epoch": 0.18,
3679
- "learning_rate": 0.00019666562847332463,
3680
- "loss": -397136.75,
3681
- "step": 3055
3682
- },
3683
- {
3684
- "epoch": 0.18,
3685
- "learning_rate": 0.00019663993641532508,
3686
- "loss": -395903.5,
3687
- "step": 3060
3688
- },
3689
- {
3690
- "epoch": 0.18,
3691
- "learning_rate": 0.00019661414744658054,
3692
- "loss": -394798.65,
3693
- "step": 3065
3694
- },
3695
- {
3696
- "epoch": 0.18,
3697
- "learning_rate": 0.0001965882615929523,
3698
- "loss": -395297.3,
3699
- "step": 3070
3700
- },
3701
- {
3702
- "epoch": 0.18,
3703
- "learning_rate": 0.00019656227888039876,
3704
- "loss": -395166.65,
3705
- "step": 3075
3706
- },
3707
- {
3708
- "epoch": 0.18,
3709
- "learning_rate": 0.00019653619933497542,
3710
- "loss": -395804.4,
3711
- "step": 3080
3712
- },
3713
- {
3714
- "epoch": 0.18,
3715
- "learning_rate": 0.00019651002298283493,
3716
- "loss": -394364.975,
3717
- "step": 3085
3718
- },
3719
- {
3720
- "epoch": 0.18,
3721
- "learning_rate": 0.00019648374985022695,
3722
- "loss": -395611.7,
3723
- "step": 3090
3724
- },
3725
- {
3726
- "epoch": 0.18,
3727
- "learning_rate": 0.00019645737996349828,
3728
- "loss": -395336.9,
3729
- "step": 3095
3730
- },
3731
- {
3732
- "epoch": 0.18,
3733
- "learning_rate": 0.0001964309133490927,
3734
- "loss": -396879.65,
3735
- "step": 3100
3736
- },
3737
- {
3738
- "epoch": 0.18,
3739
- "learning_rate": 0.00019640435003355098,
3740
- "loss": -397369.15,
3741
- "step": 3105
3742
- },
3743
- {
3744
- "epoch": 0.18,
3745
- "learning_rate": 0.00019637769004351085,
3746
- "loss": -396093.0,
3747
- "step": 3110
3748
- },
3749
- {
3750
- "epoch": 0.18,
3751
- "learning_rate": 0.00019635093340570706,
3752
- "loss": -397766.0,
3753
- "step": 3115
3754
- },
3755
- {
3756
- "epoch": 0.18,
3757
- "learning_rate": 0.0001963240801469712,
3758
- "loss": -395342.125,
3759
- "step": 3120
3760
- },
3761
- {
3762
- "epoch": 0.18,
3763
- "learning_rate": 0.0001962971302942317,
3764
- "loss": -395822.7,
3765
- "step": 3125
3766
- },
3767
- {
3768
- "epoch": 0.18,
3769
- "learning_rate": 0.0001962700838745141,
3770
- "loss": -397181.9,
3771
- "step": 3130
3772
- },
3773
- {
3774
- "epoch": 0.18,
3775
- "learning_rate": 0.00019624294091494045,
3776
- "loss": -394394.1,
3777
- "step": 3135
3778
- },
3779
- {
3780
- "epoch": 0.18,
3781
- "learning_rate": 0.00019621570144272987,
3782
- "loss": -396456.625,
3783
- "step": 3140
3784
- },
3785
- {
3786
- "epoch": 0.18,
3787
- "learning_rate": 0.00019618836548519812,
3788
- "loss": -396242.55,
3789
- "step": 3145
3790
- },
3791
- {
3792
- "epoch": 0.18,
3793
- "learning_rate": 0.0001961609330697578,
3794
- "loss": -399480.3,
3795
- "step": 3150
3796
- },
3797
- {
3798
- "epoch": 0.18,
3799
- "learning_rate": 0.0001961334042239181,
3800
- "loss": -395399.025,
3801
- "step": 3155
3802
- },
3803
- {
3804
- "epoch": 0.18,
3805
- "learning_rate": 0.00019610577897528515,
3806
- "loss": -397448.45,
3807
- "step": 3160
3808
- },
3809
- {
3810
- "epoch": 0.18,
3811
- "learning_rate": 0.0001960780573515615,
3812
- "loss": -397776.85,
3813
- "step": 3165
3814
- },
3815
- {
3816
- "epoch": 0.18,
3817
- "learning_rate": 0.0001960502393805465,
3818
- "loss": -397287.55,
3819
- "step": 3170
3820
- },
3821
- {
3822
- "epoch": 0.18,
3823
- "learning_rate": 0.00019602232509013606,
3824
- "loss": -397851.1,
3825
- "step": 3175
3826
- },
3827
- {
3828
- "epoch": 0.18,
3829
- "learning_rate": 0.0001959943145083227,
3830
- "loss": -397603.525,
3831
- "step": 3180
3832
- },
3833
- {
3834
- "epoch": 0.18,
3835
- "learning_rate": 0.0001959662076631955,
3836
- "loss": -398141.85,
3837
- "step": 3185
3838
- },
3839
- {
3840
- "epoch": 0.18,
3841
- "learning_rate": 0.00019593800458294006,
3842
- "loss": -397223.125,
3843
- "step": 3190
3844
- },
3845
- {
3846
- "epoch": 0.18,
3847
- "learning_rate": 0.00019590970529583852,
3848
- "loss": -388728.0,
3849
- "step": 3195
3850
- },
3851
- {
3852
- "epoch": 0.18,
3853
- "learning_rate": 0.00019588130983026942,
3854
- "loss": -397655.1,
3855
- "step": 3200
3856
- },
3857
- {
3858
- "epoch": 0.18,
3859
- "learning_rate": 0.00019585281821470781,
3860
- "loss": -396993.0,
3861
- "step": 3205
3862
- },
3863
- {
3864
- "epoch": 0.18,
3865
- "learning_rate": 0.0001958242304777252,
3866
- "loss": -398863.0,
3867
- "step": 3210
3868
- },
3869
- {
3870
- "epoch": 0.18,
3871
- "learning_rate": 0.00019579554664798937,
3872
- "loss": -396665.725,
3873
- "step": 3215
3874
- },
3875
- {
3876
- "epoch": 0.18,
3877
- "learning_rate": 0.00019576676675426454,
3878
- "loss": -397439.25,
3879
- "step": 3220
3880
- },
3881
- {
3882
- "epoch": 0.19,
3883
- "learning_rate": 0.00019573789082541124,
3884
- "loss": -398167.975,
3885
- "step": 3225
3886
- },
3887
- {
3888
- "epoch": 0.19,
3889
- "learning_rate": 0.0001957089188903864,
3890
- "loss": -397248.225,
3891
- "step": 3230
3892
- },
3893
- {
3894
- "epoch": 0.19,
3895
- "learning_rate": 0.000195679850978243,
3896
- "loss": -396948.4,
3897
- "step": 3235
3898
- },
3899
- {
3900
- "epoch": 0.19,
3901
- "learning_rate": 0.00019565068711813058,
3902
- "loss": -397715.95,
3903
- "step": 3240
3904
- },
3905
- {
3906
- "epoch": 0.19,
3907
- "learning_rate": 0.00019562142733929458,
3908
- "loss": -398244.45,
3909
- "step": 3245
3910
- },
3911
- {
3912
- "epoch": 0.19,
3913
- "learning_rate": 0.00019559207167107684,
3914
- "loss": -399350.225,
3915
- "step": 3250
3916
- },
3917
- {
3918
- "epoch": 0.19,
3919
- "learning_rate": 0.00019556262014291527,
3920
- "loss": -398066.65,
3921
- "step": 3255
3922
- },
3923
- {
3924
- "epoch": 0.19,
3925
- "learning_rate": 0.0001955330727843439,
3926
- "loss": -398218.25,
3927
- "step": 3260
3928
- },
3929
- {
3930
- "epoch": 0.19,
3931
- "learning_rate": 0.00019550342962499295,
3932
- "loss": -399172.75,
3933
- "step": 3265
3934
- },
3935
- {
3936
- "epoch": 0.19,
3937
- "learning_rate": 0.00019547369069458862,
3938
- "loss": -398298.225,
3939
- "step": 3270
3940
- },
3941
- {
3942
- "epoch": 0.19,
3943
- "learning_rate": 0.00019544385602295318,
3944
- "loss": -399286.825,
3945
- "step": 3275
3946
- },
3947
- {
3948
- "epoch": 0.19,
3949
- "learning_rate": 0.00019541392564000488,
3950
- "loss": -399987.925,
3951
- "step": 3280
3952
- },
3953
- {
3954
- "epoch": 0.19,
3955
- "learning_rate": 0.00019538389957575802,
3956
- "loss": -397577.95,
3957
- "step": 3285
3958
- },
3959
- {
3960
- "epoch": 0.19,
3961
- "learning_rate": 0.00019535377786032276,
3962
- "loss": -398827.45,
3963
- "step": 3290
3964
- },
3965
- {
3966
- "epoch": 0.19,
3967
- "learning_rate": 0.00019532356052390524,
3968
- "loss": -399248.95,
3969
- "step": 3295
3970
- },
3971
- {
3972
- "epoch": 0.19,
3973
- "learning_rate": 0.0001952932475968075,
3974
- "loss": -398613.525,
3975
- "step": 3300
3976
- },
3977
- {
3978
- "epoch": 0.19,
3979
- "learning_rate": 0.00019526283910942734,
3980
- "loss": -398833.35,
3981
- "step": 3305
3982
- },
3983
- {
3984
- "epoch": 0.19,
3985
- "learning_rate": 0.00019523233509225854,
3986
- "loss": -397386.525,
3987
- "step": 3310
3988
- },
3989
- {
3990
- "epoch": 0.19,
3991
- "learning_rate": 0.00019520173557589055,
3992
- "loss": -399222.55,
3993
- "step": 3315
3994
- },
3995
- {
3996
- "epoch": 0.19,
3997
- "learning_rate": 0.00019517104059100864,
3998
- "loss": -402082.975,
3999
- "step": 3320
4000
- },
4001
- {
4002
- "epoch": 0.19,
4003
- "learning_rate": 0.00019514025016839385,
4004
- "loss": -399304.1,
4005
- "step": 3325
4006
- },
4007
- {
4008
- "epoch": 0.19,
4009
- "learning_rate": 0.0001951093643389228,
4010
- "loss": -397691.575,
4011
- "step": 3330
4012
- },
4013
- {
4014
- "epoch": 0.19,
4015
- "learning_rate": 0.00019507838313356795,
4016
- "loss": -401452.35,
4017
- "step": 3335
4018
- },
4019
- {
4020
- "epoch": 0.19,
4021
- "learning_rate": 0.0001950473065833973,
4022
- "loss": -399971.9,
4023
- "step": 3340
4024
- },
4025
- {
4026
- "epoch": 0.19,
4027
- "learning_rate": 0.00019501613471957445,
4028
- "loss": -399510.8,
4029
- "step": 3345
4030
- },
4031
- {
4032
- "epoch": 0.19,
4033
- "learning_rate": 0.00019498486757335866,
4034
- "loss": -400017.45,
4035
- "step": 3350
4036
- },
4037
- {
4038
- "epoch": 0.19,
4039
- "learning_rate": 0.00019495350517610466,
4040
- "loss": -398051.725,
4041
- "step": 3355
4042
- },
4043
- {
4044
- "epoch": 0.19,
4045
- "learning_rate": 0.00019492204755926275,
4046
- "loss": -399884.7,
4047
- "step": 3360
4048
- },
4049
- {
4050
- "epoch": 0.19,
4051
- "learning_rate": 0.00019489049475437871,
4052
- "loss": -400094.3,
4053
- "step": 3365
4054
- },
4055
- {
4056
- "epoch": 0.19,
4057
- "learning_rate": 0.00019485884679309374,
4058
- "loss": -399655.45,
4059
- "step": 3370
4060
- },
4061
- {
4062
- "epoch": 0.19,
4063
- "learning_rate": 0.0001948271037071445,
4064
- "loss": -399197.55,
4065
- "step": 3375
4066
- },
4067
- {
4068
- "epoch": 0.19,
4069
- "learning_rate": 0.00019479526552836302,
4070
- "loss": -398674.65,
4071
- "step": 3380
4072
- },
4073
- {
4074
- "epoch": 0.19,
4075
- "learning_rate": 0.0001947633322886767,
4076
- "loss": -398032.525,
4077
- "step": 3385
4078
- },
4079
- {
4080
- "epoch": 0.19,
4081
- "learning_rate": 0.00019473130402010829,
4082
- "loss": -401128.2,
4083
- "step": 3390
4084
- },
4085
- {
4086
- "epoch": 0.19,
4087
- "learning_rate": 0.00019469918075477573,
4088
- "loss": -400998.175,
4089
- "step": 3395
4090
- },
4091
- {
4092
- "epoch": 0.2,
4093
- "learning_rate": 0.0001946669625248924,
4094
- "loss": -400135.4,
4095
- "step": 3400
4096
- },
4097
- {
4098
- "epoch": 0.2,
4099
- "learning_rate": 0.00019463464936276677,
4100
- "loss": -400291.95,
4101
- "step": 3405
4102
- },
4103
- {
4104
- "epoch": 0.2,
4105
- "learning_rate": 0.00019460224130080255,
4106
- "loss": -400901.8,
4107
- "step": 3410
4108
- },
4109
- {
4110
- "epoch": 0.2,
4111
- "learning_rate": 0.00019456973837149861,
4112
- "loss": -399600.0,
4113
- "step": 3415
4114
- },
4115
- {
4116
- "epoch": 0.2,
4117
- "learning_rate": 0.00019453714060744897,
4118
- "loss": -398669.55,
4119
- "step": 3420
4120
- },
4121
- {
4122
- "epoch": 0.2,
4123
- "learning_rate": 0.00019450444804134276,
4124
- "loss": -401376.125,
4125
- "step": 3425
4126
- },
4127
- {
4128
- "epoch": 0.2,
4129
- "learning_rate": 0.0001944716607059641,
4130
- "loss": -400382.35,
4131
- "step": 3430
4132
- },
4133
- {
4134
- "epoch": 0.2,
4135
- "learning_rate": 0.00019443877863419226,
4136
- "loss": -401191.475,
4137
- "step": 3435
4138
- },
4139
- {
4140
- "epoch": 0.2,
4141
- "learning_rate": 0.00019440580185900146,
4142
- "loss": -398218.35,
4143
- "step": 3440
4144
- },
4145
- {
4146
- "epoch": 0.2,
4147
- "learning_rate": 0.00019437273041346084,
4148
- "loss": -398885.275,
4149
- "step": 3445
4150
- },
4151
- {
4152
- "epoch": 0.2,
4153
- "learning_rate": 0.00019433956433073454,
4154
- "loss": -400480.625,
4155
- "step": 3450
4156
- },
4157
- {
4158
- "epoch": 0.2,
4159
- "learning_rate": 0.00019430630364408158,
4160
- "loss": -401564.5,
4161
- "step": 3455
4162
- },
4163
- {
4164
- "epoch": 0.2,
4165
- "learning_rate": 0.0001942729483868559,
4166
- "loss": -400380.425,
4167
- "step": 3460
4168
- },
4169
- {
4170
- "epoch": 0.2,
4171
- "learning_rate": 0.00019423949859250612,
4172
- "loss": -400995.05,
4173
- "step": 3465
4174
- },
4175
- {
4176
- "epoch": 0.2,
4177
- "learning_rate": 0.00019420595429457587,
4178
- "loss": -399079.45,
4179
- "step": 3470
4180
- },
4181
- {
4182
- "epoch": 0.2,
4183
- "learning_rate": 0.0001941723155267034,
4184
- "loss": -400499.1,
4185
- "step": 3475
4186
- },
4187
- {
4188
- "epoch": 0.2,
4189
- "learning_rate": 0.00019413858232262174,
4190
- "loss": -400577.25,
4191
- "step": 3480
4192
- },
4193
- {
4194
- "epoch": 0.2,
4195
- "learning_rate": 0.00019410475471615864,
4196
- "loss": -402237.525,
4197
- "step": 3485
4198
- },
4199
- {
4200
- "epoch": 0.2,
4201
- "learning_rate": 0.00019407083274123647,
4202
- "loss": -401237.55,
4203
- "step": 3490
4204
- },
4205
- {
4206
- "epoch": 0.2,
4207
- "learning_rate": 0.0001940368164318723,
4208
- "loss": -400670.4,
4209
- "step": 3495
4210
- },
4211
- {
4212
- "epoch": 0.2,
4213
- "learning_rate": 0.00019400270582217775,
4214
- "loss": -396488.45,
4215
- "step": 3500
4216
- },
4217
- {
4218
- "epoch": 0.2,
4219
- "learning_rate": 0.00019396850094635903,
4220
- "loss": -399970.975,
4221
- "step": 3505
4222
- },
4223
- {
4224
- "epoch": 0.2,
4225
- "learning_rate": 0.00019393420183871682,
4226
- "loss": -398315.575,
4227
- "step": 3510
4228
- },
4229
- {
4230
- "epoch": 0.2,
4231
- "learning_rate": 0.0001938998085336464,
4232
- "loss": -399823.95,
4233
- "step": 3515
4234
- },
4235
- {
4236
- "epoch": 0.2,
4237
- "learning_rate": 0.00019386532106563736,
4238
- "loss": -400712.55,
4239
- "step": 3520
4240
- },
4241
- {
4242
- "epoch": 0.2,
4243
- "learning_rate": 0.00019383073946927396,
4244
- "loss": -399312.4,
4245
- "step": 3525
4246
- },
4247
- {
4248
- "epoch": 0.2,
4249
- "learning_rate": 0.00019379606377923456,
4250
- "loss": -398362.975,
4251
- "step": 3530
4252
- },
4253
- {
4254
- "epoch": 0.2,
4255
- "learning_rate": 0.0001937612940302921,
4256
- "loss": -400884.1,
4257
- "step": 3535
4258
- },
4259
- {
4260
- "epoch": 0.2,
4261
- "learning_rate": 0.0001937264302573137,
4262
- "loss": -399776.4,
4263
- "step": 3540
4264
- },
4265
- {
4266
- "epoch": 0.2,
4267
- "learning_rate": 0.0001936914724952609,
4268
- "loss": -401188.525,
4269
- "step": 3545
4270
- },
4271
- {
4272
- "epoch": 0.2,
4273
- "learning_rate": 0.00019365642077918938,
4274
- "loss": -401755.075,
4275
- "step": 3550
4276
- },
4277
- {
4278
- "epoch": 0.2,
4279
- "learning_rate": 0.0001936212751442491,
4280
- "loss": -400210.55,
4281
- "step": 3555
4282
- },
4283
- {
4284
- "epoch": 0.2,
4285
- "learning_rate": 0.00019358603562568416,
4286
- "loss": -399624.95,
4287
- "step": 3560
4288
- },
4289
- {
4290
- "epoch": 0.2,
4291
- "learning_rate": 0.00019355070225883286,
4292
- "loss": -401644.9,
4293
- "step": 3565
4294
- },
4295
- {
4296
- "epoch": 0.2,
4297
- "learning_rate": 0.00019351527507912753,
4298
- "loss": -400682.0,
4299
- "step": 3570
4300
- },
4301
- {
4302
- "epoch": 0.21,
4303
- "learning_rate": 0.00019347975412209464,
4304
- "loss": -401702.8,
4305
- "step": 3575
4306
- },
4307
- {
4308
- "epoch": 0.21,
4309
- "learning_rate": 0.00019344413942335472,
4310
- "loss": -400528.5,
4311
- "step": 3580
4312
- },
4313
- {
4314
- "epoch": 0.21,
4315
- "learning_rate": 0.00019340843101862227,
4316
- "loss": -399457.5,
4317
- "step": 3585
4318
- },
4319
- {
4320
- "epoch": 0.21,
4321
- "learning_rate": 0.00019337262894370571,
4322
- "loss": -401715.05,
4323
- "step": 3590
4324
- },
4325
- {
4326
- "epoch": 0.21,
4327
- "learning_rate": 0.0001933367332345075,
4328
- "loss": -400080.725,
4329
- "step": 3595
4330
- },
4331
- {
4332
- "epoch": 0.21,
4333
- "learning_rate": 0.0001933007439270239,
4334
- "loss": -401478.75,
4335
- "step": 3600
4336
- },
4337
- {
4338
- "epoch": 0.21,
4339
- "learning_rate": 0.00019326466105734502,
4340
- "loss": -402403.775,
4341
- "step": 3605
4342
- },
4343
- {
4344
- "epoch": 0.21,
4345
- "learning_rate": 0.00019322848466165495,
4346
- "loss": -401417.75,
4347
- "step": 3610
4348
- },
4349
- {
4350
- "epoch": 0.21,
4351
- "learning_rate": 0.0001931922147762314,
4352
- "loss": -400876.6,
4353
- "step": 3615
4354
- },
4355
- {
4356
- "epoch": 0.21,
4357
- "learning_rate": 0.0001931558514374459,
4358
- "loss": -400685.55,
4359
- "step": 3620
4360
- },
4361
- {
4362
- "epoch": 0.21,
4363
- "learning_rate": 0.00019311939468176368,
4364
- "loss": -403060.075,
4365
- "step": 3625
4366
- },
4367
- {
4368
- "epoch": 0.21,
4369
- "learning_rate": 0.00019308284454574363,
4370
- "loss": -403845.575,
4371
- "step": 3630
4372
- },
4373
- {
4374
- "epoch": 0.21,
4375
- "learning_rate": 0.00019304620106603838,
4376
- "loss": -400785.5,
4377
- "step": 3635
4378
- },
4379
- {
4380
- "epoch": 0.21,
4381
- "learning_rate": 0.00019300946427939407,
4382
- "loss": -400253.05,
4383
- "step": 3640
4384
- },
4385
- {
4386
- "epoch": 0.21,
4387
- "learning_rate": 0.00019297263422265039,
4388
- "loss": -403627.075,
4389
- "step": 3645
4390
- },
4391
- {
4392
- "epoch": 0.21,
4393
- "learning_rate": 0.00019293571093274066,
4394
- "loss": -403050.35,
4395
- "step": 3650
4396
- },
4397
- {
4398
- "epoch": 0.21,
4399
- "learning_rate": 0.0001928986944466916,
4400
- "loss": -401369.1,
4401
- "step": 3655
4402
- },
4403
- {
4404
- "epoch": 0.21,
4405
- "learning_rate": 0.0001928615848016234,
4406
- "loss": -403266.25,
4407
- "step": 3660
4408
- },
4409
- {
4410
- "epoch": 0.21,
4411
- "learning_rate": 0.00019282438203474978,
4412
- "loss": -403239.3,
4413
- "step": 3665
4414
- },
4415
- {
4416
- "epoch": 0.21,
4417
- "learning_rate": 0.00019278708618337766,
4418
- "loss": -403675.45,
4419
- "step": 3670
4420
- },
4421
- {
4422
- "epoch": 0.21,
4423
- "learning_rate": 0.00019274969728490747,
4424
- "loss": -402626.525,
4425
- "step": 3675
4426
- },
4427
- {
4428
- "epoch": 0.21,
4429
- "learning_rate": 0.00019271221537683287,
4430
- "loss": -401520.5,
4431
- "step": 3680
4432
- },
4433
- {
4434
- "epoch": 0.21,
4435
- "learning_rate": 0.0001926746404967408,
4436
- "loss": -403857.225,
4437
- "step": 3685
4438
- },
4439
- {
4440
- "epoch": 0.21,
4441
- "learning_rate": 0.00019263697268231142,
4442
- "loss": -403731.9,
4443
- "step": 3690
4444
- },
4445
- {
4446
- "epoch": 0.21,
4447
- "learning_rate": 0.0001925992119713181,
4448
- "loss": -400502.8,
4449
- "step": 3695
4450
- },
4451
- {
4452
- "epoch": 0.21,
4453
- "learning_rate": 0.0001925613584016274,
4454
- "loss": -401636.4,
4455
- "step": 3700
4456
- },
4457
- {
4458
- "epoch": 0.21,
4459
- "step": 3701,
4460
- "total_flos": 2.6175422208105513e+18,
4461
- "train_loss": 15.370767613482842,
4462
- "train_runtime": 10.0734,
4463
- "train_samples_per_second": 0.794,
4464
- "train_steps_per_second": 0.099
4465
  }
4466
  ],
4467
- "logging_steps": 5,
4468
- "max_steps": 1,
4469
  "num_input_tokens_seen": 0,
4470
  "num_train_epochs": 1,
4471
  "save_steps": 100,
4472
- "total_flos": 2.6175422208105513e+18,
4473
  "train_batch_size": 2,
4474
  "trial_name": null,
4475
  "trial_params": null
 
1
  {
2
  "best_metric": null,
3
  "best_model_checkpoint": null,
4
+ "epoch": 0.005737563830397613,
5
  "eval_steps": 500,
6
+ "global_step": 100,
7
  "is_hyper_param_search": false,
8
  "is_local_process_zero": true,
9
  "is_world_process_zero": true,
 
11
  {
12
  "epoch": 0.0,
13
  "learning_rate": 0.0,
14
+ "loss": 58005.6328,
15
  "step": 1
16
  },
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
17
  {
18
  "epoch": 0.01,
19
+ "learning_rate": 1.339745962155613e-05,
20
+ "loss": 13551.7285,
 
 
 
 
 
 
21
  "step": 100
22
  },
23
  {
24
  "epoch": 0.01,
25
+ "step": 100,
26
+ "total_flos": 7.072526552059085e+16,
27
+ "train_loss": 13996.267578125,
28
+ "train_runtime": 449.6404,
29
+ "train_samples_per_second": 1.779,
30
+ "train_steps_per_second": 0.222
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
31
  }
32
  ],
33
+ "logging_steps": 100,
34
+ "max_steps": 100,
35
  "num_input_tokens_seen": 0,
36
  "num_train_epochs": 1,
37
  "save_steps": 100,
38
+ "total_flos": 7.072526552059085e+16,
39
  "train_batch_size": 2,
40
  "trial_name": null,
41
  "trial_params": null