init

Files changed (7) hide show

config.json +61 -0
optimizer.pt +3 -0
pytorch_model.bin +3 -0
rng_state.pth +3 -0
scheduler.pt +3 -0
trainer_state.json +2502 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,61 @@

+{
+  "add_cross_proj": false,
+  "architectures": [
+    "BaseModel"
+  ],
+  "backbone_dim": 1024,
+  "data_roots": [
+    "DATA/MSR-Action3D/video"
+  ],
+  "dataset": "MSRACTION3D",
+  "dataset_list": [
+    "MSRACTION3D"
+  ],
+  "depth": 1,
+  "depths": 5,
+  "dim": 1024,
+  "dim_head": 128,
+  "dropout1": 0.0,
+  "dropout_rate": 0.0,
+  "epochs": 45,
+  "frames_per_clip": 24,
+  "head": 8,
+  "heads": 8,
+  "hidden_dim": 256,
+  "label_smoothing": 0.0,
+  "loss_weight": 0.1,
+  "lr": 0.03,
+  "meta_list": [
+    "DATA/MSR-Action3D/msr.list"
+  ],
+  "mlp_dim": 2048,
+  "model": "PSTTransformer",
+  "model_init": null,
+  "model_type": "points",
+  "nsamples": 32,
+  "num_basis": 16,
+  "num_points": 2048,
+  "num_token": 4,
+  "output_dir": "MSRACTION3D_PSTTransformer-1024-5-8_0.3_0.03_32_45_one_stage_256-8-16-4-0.1-0.1",
+  "pretrain": false,
+  "print_freq": 10,
+  "probing": false,
+  "radius": 0.3,
+  "resume": null,
+  "seed": 0,
+  "spatial_stride": 32,
+  "start_epoch": 0,
+  "step_between_clips": 1,
+  "tem": 0.1,
+  "temporal_kernel_size": 3,
+  "temporal_stride": 1,
+  "torch_dtype": "float32",
+  "train_batch_size": 32,
+  "train_mode": "one_stage",
+  "transformers_version": "4.17.0",
+  "use_info": false,
+  "use_multi_dataset": false,
+  "warmup_ratio": 0.1,
+  "weight_decay": 0.0001,
+  "workers": 16
+}

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ecef1a4a2220b5b80bc1103d581719f8e1babf23f4527b3a6cf9c84f3570c222
+size 169156630

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4f2cefb23f39661699f2032e43288e3104f44209476e1ff6f288ec8004b54a27
+size 169164758

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1b0b80a54b0dd0190ba59af6afac4f4b5443720520bc2961e2c0dc91a2211472
+size 14503

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5c16bc44ea24fae4e3a49155d4d375e356b224f81846e27e38cd9aff65f537da
+size 559

trainer_state.json ADDED Viewed

	@@ -0,0 +1,2502 @@

+{
+  "best_metric": 0.9629629629629629,
+  "best_model_checkpoint": "MSRACTION3D_PSTTransformer-1024-5-8_0.3_0.03_32_45_one_stage_256-8-16-4-0.1-0.1/checkpoint-3080",
+  "epoch": 22.0,
+  "global_step": 3080,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.07,
+      "learning_rate": 0.00047619047619047614,
+      "loss": 3.6787,
+      "step": 10
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 0.0009523809523809523,
+      "loss": 3.5393,
+      "step": 20
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 0.0014285714285714284,
+      "loss": 3.4301,
+      "step": 30
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 0.0019047619047619045,
+      "loss": 3.4075,
+      "step": 40
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.0023809523809523807,
+      "loss": 3.422,
+      "step": 50
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 0.0028571428571428567,
+      "loss": 3.3775,
+      "step": 60
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 0.003333333333333333,
+      "loss": 3.2896,
+      "step": 70
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 0.003809523809523809,
+      "loss": 3.2576,
+      "step": 80
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 0.004285714285714285,
+      "loss": 3.3384,
+      "step": 90
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 0.0047619047619047615,
+      "loss": 3.143,
+      "step": 100
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 0.005238095238095238,
+      "loss": 3.1019,
+      "step": 110
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 0.005714285714285713,
+      "loss": 3.0289,
+      "step": 120
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 0.00619047619047619,
+      "loss": 3.0,
+      "step": 130
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 0.006666666666666666,
+      "loss": 2.8949,
+      "step": 140
+    },
+    {
+      "epoch": 1.0,
+      "eval_acc": 0.38890963405526513,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.0,
+        0.0,
+        0.0,
+        0.6428571428571429,
+        0.38461538461538464,
+        0.0,
+        0.0,
+        0.0,
+        0.0,
+        0.0,
+        0.0,
+        1.0,
+        0.0,
+        1.0,
+        1.0,
+        0.0,
+        1.0,
+        0.9333333333333333
+      ],
+      "eval_loss": 3.017345905303955,
+      "eval_video_acc": 0.4208754208754209,
+      "step": 140
+    },
+    {
+      "epoch": 1.07,
+      "learning_rate": 0.007142857142857142,
+      "loss": 2.8072,
+      "step": 150
+    },
+    {
+      "epoch": 1.14,
+      "learning_rate": 0.007619047619047618,
+      "loss": 2.6376,
+      "step": 160
+    },
+    {
+      "epoch": 1.21,
+      "learning_rate": 0.008095238095238095,
+      "loss": 2.4713,
+      "step": 170
+    },
+    {
+      "epoch": 1.29,
+      "learning_rate": 0.00857142857142857,
+      "loss": 2.2518,
+      "step": 180
+    },
+    {
+      "epoch": 1.36,
+      "learning_rate": 0.009047619047619047,
+      "loss": 2.1082,
+      "step": 190
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 0.009523809523809523,
+      "loss": 1.8796,
+      "step": 200
+    },
+    {
+      "epoch": 1.5,
+      "learning_rate": 0.009999999999999998,
+      "loss": 1.875,
+      "step": 210
+    },
+    {
+      "epoch": 1.57,
+      "learning_rate": 0.010476190476190476,
+      "loss": 1.7755,
+      "step": 220
+    },
+    {
+      "epoch": 1.64,
+      "learning_rate": 0.010952380952380951,
+      "loss": 1.6826,
+      "step": 230
+    },
+    {
+      "epoch": 1.71,
+      "learning_rate": 0.011428571428571427,
+      "loss": 1.4767,
+      "step": 240
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 0.011904761904761904,
+      "loss": 1.4295,
+      "step": 250
+    },
+    {
+      "epoch": 1.86,
+      "learning_rate": 0.01238095238095238,
+      "loss": 1.316,
+      "step": 260
+    },
+    {
+      "epoch": 1.93,
+      "learning_rate": 0.012857142857142855,
+      "loss": 1.2257,
+      "step": 270
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 0.013333333333333332,
+      "loss": 1.1236,
+      "step": 280
+    },
+    {
+      "epoch": 2.0,
+      "eval_acc": 0.7233009708737864,
+      "eval_class_acc": [
+        1.0,
+        0.9333333333333333,
+        0.0,
+        0.06666666666666667,
+        1.0,
+        0.5,
+        0.9230769230769231,
+        0.3333333333333333,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.9333333333333333,
+        1.0,
+        0.7142857142857143,
+        1.0,
+        1.0,
+        1.0,
+        0.8,
+        0.6666666666666666
+      ],
+      "eval_loss": 1.5495434999465942,
+      "eval_video_acc": 0.7946127946127947,
+      "step": 280
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 0.013809523809523808,
+      "loss": 1.0654,
+      "step": 290
+    },
+    {
+      "epoch": 2.14,
+      "learning_rate": 0.014285714285714284,
+      "loss": 0.9545,
+      "step": 300
+    },
+    {
+      "epoch": 2.21,
+      "learning_rate": 0.01476190476190476,
+      "loss": 0.9556,
+      "step": 310
+    },
+    {
+      "epoch": 2.29,
+      "learning_rate": 0.015238095238095236,
+      "loss": 1.0418,
+      "step": 320
+    },
+    {
+      "epoch": 2.36,
+      "learning_rate": 0.015714285714285715,
+      "loss": 0.8845,
+      "step": 330
+    },
+    {
+      "epoch": 2.43,
+      "learning_rate": 0.01619047619047619,
+      "loss": 0.8185,
+      "step": 340
+    },
+    {
+      "epoch": 2.5,
+      "learning_rate": 0.016666666666666666,
+      "loss": 0.896,
+      "step": 350
+    },
+    {
+      "epoch": 2.57,
+      "learning_rate": 0.01714285714285714,
+      "loss": 0.7475,
+      "step": 360
+    },
+    {
+      "epoch": 2.64,
+      "learning_rate": 0.017619047619047618,
+      "loss": 0.6462,
+      "step": 370
+    },
+    {
+      "epoch": 2.71,
+      "learning_rate": 0.018095238095238095,
+      "loss": 0.7224,
+      "step": 380
+    },
+    {
+      "epoch": 2.79,
+      "learning_rate": 0.018571428571428572,
+      "loss": 0.6435,
+      "step": 390
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 0.019047619047619046,
+      "loss": 0.7465,
+      "step": 400
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 0.019523809523809523,
+      "loss": 0.5651,
+      "step": 410
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 0.019999999999999997,
+      "loss": 0.5651,
+      "step": 420
+    },
+    {
+      "epoch": 3.0,
+      "eval_acc": 0.7022031366691561,
+      "eval_class_acc": [
+        0.52,
+        1.0,
+        0.26666666666666666,
+        0.9333333333333333,
+        0.6666666666666666,
+        0.07142857142857142,
+        0.6923076923076923,
+        0.6666666666666666,
+        1.0,
+        1.0,
+        1.0,
+        0.7142857142857143,
+        0.8666666666666667,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.6,
+        0.9333333333333333,
+        0.8
+      ],
+      "eval_loss": 1.3151836395263672,
+      "eval_video_acc": 0.7777777777777778,
+      "step": 420
+    },
+    {
+      "epoch": 3.07,
+      "learning_rate": 0.020476190476190478,
+      "loss": 0.6111,
+      "step": 430
+    },
+    {
+      "epoch": 3.14,
+      "learning_rate": 0.02095238095238095,
+      "loss": 0.4362,
+      "step": 440
+    },
+    {
+      "epoch": 3.21,
+      "learning_rate": 0.02142857142857143,
+      "loss": 0.4242,
+      "step": 450
+    },
+    {
+      "epoch": 3.29,
+      "learning_rate": 0.021904761904761903,
+      "loss": 0.4637,
+      "step": 460
+    },
+    {
+      "epoch": 3.36,
+      "learning_rate": 0.02238095238095238,
+      "loss": 0.4735,
+      "step": 470
+    },
+    {
+      "epoch": 3.43,
+      "learning_rate": 0.022857142857142854,
+      "loss": 0.4226,
+      "step": 480
+    },
+    {
+      "epoch": 3.5,
+      "learning_rate": 0.023333333333333334,
+      "loss": 0.416,
+      "step": 490
+    },
+    {
+      "epoch": 3.57,
+      "learning_rate": 0.023809523809523808,
+      "loss": 0.4731,
+      "step": 500
+    },
+    {
+      "epoch": 3.64,
+      "learning_rate": 0.024285714285714285,
+      "loss": 0.4295,
+      "step": 510
+    },
+    {
+      "epoch": 3.71,
+      "learning_rate": 0.02476190476190476,
+      "loss": 0.438,
+      "step": 520
+    },
+    {
+      "epoch": 3.79,
+      "learning_rate": 0.025238095238095237,
+      "loss": 0.3597,
+      "step": 530
+    },
+    {
+      "epoch": 3.86,
+      "learning_rate": 0.02571428571428571,
+      "loss": 0.4251,
+      "step": 540
+    },
+    {
+      "epoch": 3.93,
+      "learning_rate": 0.02619047619047619,
+      "loss": 0.4373,
+      "step": 550
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 0.026666666666666665,
+      "loss": 0.4428,
+      "step": 560
+    },
+    {
+      "epoch": 4.0,
+      "eval_acc": 0.8162808065720687,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.2,
+        0.6666666666666666,
+        0.8333333333333334,
+        0.7142857142857143,
+        0.9230769230769231,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.7142857142857143,
+        0.9333333333333333,
+        1.0,
+        0.8571428571428571,
+        1.0,
+        1.0,
+        1.0,
+        0.8,
+        0.8
+      ],
+      "eval_loss": 1.0944032669067383,
+      "eval_video_acc": 0.8754208754208754,
+      "step": 560
+    },
+    {
+      "epoch": 4.07,
+      "learning_rate": 0.027142857142857142,
+      "loss": 0.3566,
+      "step": 570
+    },
+    {
+      "epoch": 4.14,
+      "learning_rate": 0.027619047619047616,
+      "loss": 0.4102,
+      "step": 580
+    },
+    {
+      "epoch": 4.21,
+      "learning_rate": 0.028095238095238093,
+      "loss": 0.3356,
+      "step": 590
+    },
+    {
+      "epoch": 4.29,
+      "learning_rate": 0.028571428571428567,
+      "loss": 0.3179,
+      "step": 600
+    },
+    {
+      "epoch": 4.36,
+      "learning_rate": 0.029047619047619048,
+      "loss": 0.35,
+      "step": 610
+    },
+    {
+      "epoch": 4.43,
+      "learning_rate": 0.02952380952380952,
+      "loss": 0.3292,
+      "step": 620
+    },
+    {
+      "epoch": 4.5,
+      "learning_rate": 0.03,
+      "loss": 0.2739,
+      "step": 630
+    },
+    {
+      "epoch": 4.57,
+      "learning_rate": 0.029947089947089944,
+      "loss": 0.2906,
+      "step": 640
+    },
+    {
+      "epoch": 4.64,
+      "learning_rate": 0.029894179894179893,
+      "loss": 0.2102,
+      "step": 650
+    },
+    {
+      "epoch": 4.71,
+      "learning_rate": 0.02984126984126984,
+      "loss": 0.2772,
+      "step": 660
+    },
+    {
+      "epoch": 4.79,
+      "learning_rate": 0.029788359788359788,
+      "loss": 0.2697,
+      "step": 670
+    },
+    {
+      "epoch": 4.86,
+      "learning_rate": 0.029735449735449733,
+      "loss": 0.2263,
+      "step": 680
+    },
+    {
+      "epoch": 4.93,
+      "learning_rate": 0.029682539682539682,
+      "loss": 0.2248,
+      "step": 690
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 0.029629629629629627,
+      "loss": 0.2748,
+      "step": 700
+    },
+    {
+      "epoch": 5.0,
+      "eval_acc": 0.8498879761015683,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.6,
+        0.6666666666666666,
+        1.0,
+        0.7142857142857143,
+        1.0,
+        0.9333333333333333,
+        1.0,
+        1.0,
+        1.0,
+        0.6428571428571429,
+        0.9333333333333333,
+        1.0,
+        0.7857142857142857,
+        1.0,
+        1.0,
+        0.8,
+        1.0,
+        1.0
+      ],
+      "eval_loss": 0.9322287440299988,
+      "eval_video_acc": 0.9057239057239057,
+      "step": 700
+    },
+    {
+      "epoch": 5.07,
+      "learning_rate": 0.029576719576719576,
+      "loss": 0.2495,
+      "step": 710
+    },
+    {
+      "epoch": 5.14,
+      "learning_rate": 0.02952380952380952,
+      "loss": 0.1861,
+      "step": 720
+    },
+    {
+      "epoch": 5.21,
+      "learning_rate": 0.02947089947089947,
+      "loss": 0.2198,
+      "step": 730
+    },
+    {
+      "epoch": 5.29,
+      "learning_rate": 0.029417989417989416,
+      "loss": 0.2297,
+      "step": 740
+    },
+    {
+      "epoch": 5.36,
+      "learning_rate": 0.029365079365079365,
+      "loss": 0.2068,
+      "step": 750
+    },
+    {
+      "epoch": 5.43,
+      "learning_rate": 0.02931216931216931,
+      "loss": 0.156,
+      "step": 760
+    },
+    {
+      "epoch": 5.5,
+      "learning_rate": 0.02925925925925926,
+      "loss": 0.1786,
+      "step": 770
+    },
+    {
+      "epoch": 5.57,
+      "learning_rate": 0.029206349206349205,
+      "loss": 0.1559,
+      "step": 780
+    },
+    {
+      "epoch": 5.64,
+      "learning_rate": 0.029153439153439153,
+      "loss": 0.1368,
+      "step": 790
+    },
+    {
+      "epoch": 5.71,
+      "learning_rate": 0.0291005291005291,
+      "loss": 0.1487,
+      "step": 800
+    },
+    {
+      "epoch": 5.79,
+      "learning_rate": 0.029047619047619048,
+      "loss": 0.1568,
+      "step": 810
+    },
+    {
+      "epoch": 5.86,
+      "learning_rate": 0.028994708994708993,
+      "loss": 0.189,
+      "step": 820
+    },
+    {
+      "epoch": 5.93,
+      "learning_rate": 0.028941798941798942,
+      "loss": 0.2026,
+      "step": 830
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 0.028888888888888888,
+      "loss": 0.1484,
+      "step": 840
+    },
+    {
+      "epoch": 6.0,
+      "eval_acc": 0.8177744585511576,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.3333333333333333,
+        0.6666666666666666,
+        1.0,
+        0.42857142857142855,
+        0.9230769230769231,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.5,
+        0.9333333333333333,
+        1.0,
+        0.7857142857142857,
+        1.0,
+        1.0,
+        0.7333333333333333,
+        1.0,
+        1.0
+      ],
+      "eval_loss": 0.9785287380218506,
+      "eval_video_acc": 0.8686868686868687,
+      "step": 840
+    },
+    {
+      "epoch": 6.07,
+      "learning_rate": 0.028835978835978836,
+      "loss": 0.1432,
+      "step": 850
+    },
+    {
+      "epoch": 6.14,
+      "learning_rate": 0.028783068783068782,
+      "loss": 0.1536,
+      "step": 860
+    },
+    {
+      "epoch": 6.21,
+      "learning_rate": 0.02873015873015873,
+      "loss": 0.1551,
+      "step": 870
+    },
+    {
+      "epoch": 6.29,
+      "learning_rate": 0.028677248677248676,
+      "loss": 0.1417,
+      "step": 880
+    },
+    {
+      "epoch": 6.36,
+      "learning_rate": 0.02862433862433862,
+      "loss": 0.1583,
+      "step": 890
+    },
+    {
+      "epoch": 6.43,
+      "learning_rate": 0.028571428571428567,
+      "loss": 0.1924,
+      "step": 900
+    },
+    {
+      "epoch": 6.5,
+      "learning_rate": 0.028518518518518516,
+      "loss": 0.1267,
+      "step": 910
+    },
+    {
+      "epoch": 6.57,
+      "learning_rate": 0.02846560846560846,
+      "loss": 0.1504,
+      "step": 920
+    },
+    {
+      "epoch": 6.64,
+      "learning_rate": 0.02841269841269841,
+      "loss": 0.0749,
+      "step": 930
+    },
+    {
+      "epoch": 6.71,
+      "learning_rate": 0.028359788359788356,
+      "loss": 0.1419,
+      "step": 940
+    },
+    {
+      "epoch": 6.79,
+      "learning_rate": 0.028306878306878305,
+      "loss": 0.1327,
+      "step": 950
+    },
+    {
+      "epoch": 6.86,
+      "learning_rate": 0.02825396825396825,
+      "loss": 0.1353,
+      "step": 960
+    },
+    {
+      "epoch": 6.93,
+      "learning_rate": 0.0282010582010582,
+      "loss": 0.1104,
+      "step": 970
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 0.028148148148148144,
+      "loss": 0.0935,
+      "step": 980
+    },
+    {
+      "epoch": 7.0,
+      "eval_acc": 0.8388722927557879,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.4,
+        0.6,
+        1.0,
+        0.5714285714285714,
+        1.0,
+        0.9333333333333333,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.9333333333333333,
+        1.0,
+        0.7857142857142857,
+        1.0,
+        1.0,
+        0.8666666666666667,
+        1.0,
+        0.8666666666666667
+      ],
+      "eval_loss": 1.0954984426498413,
+      "eval_video_acc": 0.898989898989899,
+      "step": 980
+    },
+    {
+      "epoch": 7.07,
+      "learning_rate": 0.028095238095238093,
+      "loss": 0.1043,
+      "step": 990
+    },
+    {
+      "epoch": 7.14,
+      "learning_rate": 0.02804232804232804,
+      "loss": 0.094,
+      "step": 1000
+    },
+    {
+      "epoch": 7.21,
+      "learning_rate": 0.027989417989417988,
+      "loss": 0.1152,
+      "step": 1010
+    },
+    {
+      "epoch": 7.29,
+      "learning_rate": 0.027936507936507933,
+      "loss": 0.0819,
+      "step": 1020
+    },
+    {
+      "epoch": 7.36,
+      "learning_rate": 0.027883597883597882,
+      "loss": 0.1038,
+      "step": 1030
+    },
+    {
+      "epoch": 7.43,
+      "learning_rate": 0.027830687830687827,
+      "loss": 0.1088,
+      "step": 1040
+    },
+    {
+      "epoch": 7.5,
+      "learning_rate": 0.027777777777777776,
+      "loss": 0.0714,
+      "step": 1050
+    },
+    {
+      "epoch": 7.57,
+      "learning_rate": 0.02772486772486772,
+      "loss": 0.1374,
+      "step": 1060
+    },
+    {
+      "epoch": 7.64,
+      "learning_rate": 0.02767195767195767,
+      "loss": 0.1317,
+      "step": 1070
+    },
+    {
+      "epoch": 7.71,
+      "learning_rate": 0.027619047619047616,
+      "loss": 0.093,
+      "step": 1080
+    },
+    {
+      "epoch": 7.79,
+      "learning_rate": 0.027566137566137565,
+      "loss": 0.1007,
+      "step": 1090
+    },
+    {
+      "epoch": 7.86,
+      "learning_rate": 0.02751322751322751,
+      "loss": 0.0858,
+      "step": 1100
+    },
+    {
+      "epoch": 7.93,
+      "learning_rate": 0.02746031746031746,
+      "loss": 0.0691,
+      "step": 1110
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 0.027407407407407405,
+      "loss": 0.1203,
+      "step": 1120
+    },
+    {
+      "epoch": 8.0,
+      "eval_acc": 0.8553024645257655,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.5333333333333333,
+        0.6666666666666666,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.7142857142857143,
+        0.9333333333333333,
+        1.0,
+        0.7857142857142857,
+        0.9333333333333333,
+        1.0,
+        1.0,
+        1.0,
+        0.9333333333333333
+      ],
+      "eval_loss": 1.051971197128296,
+      "eval_video_acc": 0.9259259259259259,
+      "step": 1120
+    },
+    {
+      "epoch": 8.07,
+      "learning_rate": 0.027354497354497354,
+      "loss": 0.063,
+      "step": 1130
+    },
+    {
+      "epoch": 8.14,
+      "learning_rate": 0.0273015873015873,
+      "loss": 0.0833,
+      "step": 1140
+    },
+    {
+      "epoch": 8.21,
+      "learning_rate": 0.027248677248677248,
+      "loss": 0.0818,
+      "step": 1150
+    },
+    {
+      "epoch": 8.29,
+      "learning_rate": 0.027195767195767193,
+      "loss": 0.0556,
+      "step": 1160
+    },
+    {
+      "epoch": 8.36,
+      "learning_rate": 0.027142857142857142,
+      "loss": 0.0517,
+      "step": 1170
+    },
+    {
+      "epoch": 8.43,
+      "learning_rate": 0.027089947089947088,
+      "loss": 0.095,
+      "step": 1180
+    },
+    {
+      "epoch": 8.5,
+      "learning_rate": 0.027037037037037037,
+      "loss": 0.1294,
+      "step": 1190
+    },
+    {
+      "epoch": 8.57,
+      "learning_rate": 0.026984126984126982,
+      "loss": 0.0574,
+      "step": 1200
+    },
+    {
+      "epoch": 8.64,
+      "learning_rate": 0.02693121693121693,
+      "loss": 0.0648,
+      "step": 1210
+    },
+    {
+      "epoch": 8.71,
+      "learning_rate": 0.026878306878306876,
+      "loss": 0.0459,
+      "step": 1220
+    },
+    {
+      "epoch": 8.79,
+      "learning_rate": 0.026825396825396825,
+      "loss": 0.0598,
+      "step": 1230
+    },
+    {
+      "epoch": 8.86,
+      "learning_rate": 0.02677248677248677,
+      "loss": 0.1033,
+      "step": 1240
+    },
+    {
+      "epoch": 8.93,
+      "learning_rate": 0.02671957671957672,
+      "loss": 0.0823,
+      "step": 1250
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 0.026666666666666665,
+      "loss": 0.0453,
+      "step": 1260
+    },
+    {
+      "epoch": 9.0,
+      "eval_acc": 0.8650112023898432,
+      "eval_class_acc": [
+        0.96,
+        1.0,
+        0.6,
+        0.7333333333333333,
+        1.0,
+        0.9285714285714286,
+        0.9230769230769231,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.8571428571428571,
+        0.9333333333333333,
+        1.0,
+        0.7857142857142857,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.8
+      ],
+      "eval_loss": 1.0059863328933716,
+      "eval_video_acc": 0.9259259259259259,
+      "step": 1260
+    },
+    {
+      "epoch": 9.07,
+      "learning_rate": 0.026613756613756614,
+      "loss": 0.0605,
+      "step": 1270
+    },
+    {
+      "epoch": 9.14,
+      "learning_rate": 0.02656084656084656,
+      "loss": 0.0949,
+      "step": 1280
+    },
+    {
+      "epoch": 9.21,
+      "learning_rate": 0.026507936507936508,
+      "loss": 0.07,
+      "step": 1290
+    },
+    {
+      "epoch": 9.29,
+      "learning_rate": 0.026455026455026454,
+      "loss": 0.0809,
+      "step": 1300
+    },
+    {
+      "epoch": 9.36,
+      "learning_rate": 0.026402116402116402,
+      "loss": 0.0589,
+      "step": 1310
+    },
+    {
+      "epoch": 9.43,
+      "learning_rate": 0.026349206349206348,
+      "loss": 0.0417,
+      "step": 1320
+    },
+    {
+      "epoch": 9.5,
+      "learning_rate": 0.026296296296296297,
+      "loss": 0.0398,
+      "step": 1330
+    },
+    {
+      "epoch": 9.57,
+      "learning_rate": 0.026243386243386242,
+      "loss": 0.036,
+      "step": 1340
+    },
+    {
+      "epoch": 9.64,
+      "learning_rate": 0.02619047619047619,
+      "loss": 0.0664,
+      "step": 1350
+    },
+    {
+      "epoch": 9.71,
+      "learning_rate": 0.026137566137566137,
+      "loss": 0.0912,
+      "step": 1360
+    },
+    {
+      "epoch": 9.79,
+      "learning_rate": 0.026084656084656085,
+      "loss": 0.0801,
+      "step": 1370
+    },
+    {
+      "epoch": 9.86,
+      "learning_rate": 0.02603174603174603,
+      "loss": 0.053,
+      "step": 1380
+    },
+    {
+      "epoch": 9.93,
+      "learning_rate": 0.02597883597883598,
+      "loss": 0.1071,
+      "step": 1390
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 0.025925925925925925,
+      "loss": 0.0659,
+      "step": 1400
+    },
+    {
+      "epoch": 10.0,
+      "eval_acc": 0.8454070201643017,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.3333333333333333,
+        0.6666666666666666,
+        1.0,
+        0.42857142857142855,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.6666666666666666,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0
+      ],
+      "eval_loss": 1.262329339981079,
+      "eval_video_acc": 0.9057239057239057,
+      "step": 1400
+    },
+    {
+      "epoch": 10.07,
+      "learning_rate": 0.02587301587301587,
+      "loss": 0.0369,
+      "step": 1410
+    },
+    {
+      "epoch": 10.14,
+      "learning_rate": 0.025820105820105816,
+      "loss": 0.054,
+      "step": 1420
+    },
+    {
+      "epoch": 10.21,
+      "learning_rate": 0.025767195767195765,
+      "loss": 0.0623,
+      "step": 1430
+    },
+    {
+      "epoch": 10.29,
+      "learning_rate": 0.02571428571428571,
+      "loss": 0.0432,
+      "step": 1440
+    },
+    {
+      "epoch": 10.36,
+      "learning_rate": 0.02566137566137566,
+      "loss": 0.0396,
+      "step": 1450
+    },
+    {
+      "epoch": 10.43,
+      "learning_rate": 0.025608465608465605,
+      "loss": 0.0294,
+      "step": 1460
+    },
+    {
+      "epoch": 10.5,
+      "learning_rate": 0.025555555555555554,
+      "loss": 0.0671,
+      "step": 1470
+    },
+    {
+      "epoch": 10.57,
+      "learning_rate": 0.0255026455026455,
+      "loss": 0.0697,
+      "step": 1480
+    },
+    {
+      "epoch": 10.64,
+      "learning_rate": 0.025449735449735448,
+      "loss": 0.0503,
+      "step": 1490
+    },
+    {
+      "epoch": 10.71,
+      "learning_rate": 0.025396825396825393,
+      "loss": 0.0418,
+      "step": 1500
+    },
+    {
+      "epoch": 10.79,
+      "learning_rate": 0.025343915343915342,
+      "loss": 0.0451,
+      "step": 1510
+    },
+    {
+      "epoch": 10.86,
+      "learning_rate": 0.025291005291005288,
+      "loss": 0.043,
+      "step": 1520
+    },
+    {
+      "epoch": 10.93,
+      "learning_rate": 0.025238095238095237,
+      "loss": 0.0266,
+      "step": 1530
+    },
+    {
+      "epoch": 11.0,
+      "learning_rate": 0.025185185185185182,
+      "loss": 0.0225,
+      "step": 1540
+    },
+    {
+      "epoch": 11.0,
+      "eval_acc": 0.8334578043315908,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.6,
+        0.7333333333333333,
+        1.0,
+        0.9285714285714286,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.42857142857142855,
+        0.6666666666666666,
+        1.0,
+        0.8571428571428571,
+        0.9333333333333333,
+        1.0,
+        1.0,
+        1.0,
+        1.0
+      ],
+      "eval_loss": 1.2618277072906494,
+      "eval_video_acc": 0.9090909090909091,
+      "step": 1540
+    },
+    {
+      "epoch": 11.07,
+      "learning_rate": 0.02513227513227513,
+      "loss": 0.0291,
+      "step": 1550
+    },
+    {
+      "epoch": 11.14,
+      "learning_rate": 0.025079365079365076,
+      "loss": 0.0208,
+      "step": 1560
+    },
+    {
+      "epoch": 11.21,
+      "learning_rate": 0.025026455026455025,
+      "loss": 0.0209,
+      "step": 1570
+    },
+    {
+      "epoch": 11.29,
+      "learning_rate": 0.02497354497354497,
+      "loss": 0.0212,
+      "step": 1580
+    },
+    {
+      "epoch": 11.36,
+      "learning_rate": 0.02492063492063492,
+      "loss": 0.0283,
+      "step": 1590
+    },
+    {
+      "epoch": 11.43,
+      "learning_rate": 0.024867724867724865,
+      "loss": 0.0513,
+      "step": 1600
+    },
+    {
+      "epoch": 11.5,
+      "learning_rate": 0.024814814814814814,
+      "loss": 0.0297,
+      "step": 1610
+    },
+    {
+      "epoch": 11.57,
+      "learning_rate": 0.02476190476190476,
+      "loss": 0.0254,
+      "step": 1620
+    },
+    {
+      "epoch": 11.64,
+      "learning_rate": 0.024708994708994708,
+      "loss": 0.0262,
+      "step": 1630
+    },
+    {
+      "epoch": 11.71,
+      "learning_rate": 0.024656084656084654,
+      "loss": 0.0363,
+      "step": 1640
+    },
+    {
+      "epoch": 11.79,
+      "learning_rate": 0.024603174603174603,
+      "loss": 0.0265,
+      "step": 1650
+    },
+    {
+      "epoch": 11.86,
+      "learning_rate": 0.024550264550264548,
+      "loss": 0.0186,
+      "step": 1660
+    },
+    {
+      "epoch": 11.93,
+      "learning_rate": 0.024497354497354497,
+      "loss": 0.0188,
+      "step": 1670
+    },
+    {
+      "epoch": 12.0,
+      "learning_rate": 0.024444444444444442,
+      "loss": 0.0222,
+      "step": 1680
+    },
+    {
+      "epoch": 12.0,
+      "eval_acc": 0.8743465272591486,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.6666666666666666,
+        0.6666666666666666,
+        0.8333333333333334,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.7142857142857143,
+        0.9333333333333333,
+        1.0,
+        0.9285714285714286,
+        0.9333333333333333,
+        1.0,
+        1.0,
+        1.0,
+        0.9333333333333333
+      ],
+      "eval_loss": 1.0290738344192505,
+      "eval_video_acc": 0.9326599326599326,
+      "step": 1680
+    },
+    {
+      "epoch": 12.07,
+      "learning_rate": 0.02439153439153439,
+      "loss": 0.0161,
+      "step": 1690
+    },
+    {
+      "epoch": 12.14,
+      "learning_rate": 0.024338624338624337,
+      "loss": 0.0166,
+      "step": 1700
+    },
+    {
+      "epoch": 12.21,
+      "learning_rate": 0.024285714285714285,
+      "loss": 0.0196,
+      "step": 1710
+    },
+    {
+      "epoch": 12.29,
+      "learning_rate": 0.02423280423280423,
+      "loss": 0.0169,
+      "step": 1720
+    },
+    {
+      "epoch": 12.36,
+      "learning_rate": 0.02417989417989418,
+      "loss": 0.0166,
+      "step": 1730
+    },
+    {
+      "epoch": 12.43,
+      "learning_rate": 0.024126984126984125,
+      "loss": 0.0191,
+      "step": 1740
+    },
+    {
+      "epoch": 12.5,
+      "learning_rate": 0.024074074074074074,
+      "loss": 0.013,
+      "step": 1750
+    },
+    {
+      "epoch": 12.57,
+      "learning_rate": 0.02402116402116402,
+      "loss": 0.0136,
+      "step": 1760
+    },
+    {
+      "epoch": 12.64,
+      "learning_rate": 0.02396825396825397,
+      "loss": 0.0175,
+      "step": 1770
+    },
+    {
+      "epoch": 12.71,
+      "learning_rate": 0.023915343915343914,
+      "loss": 0.0175,
+      "step": 1780
+    },
+    {
+      "epoch": 12.79,
+      "learning_rate": 0.023862433862433863,
+      "loss": 0.0189,
+      "step": 1790
+    },
+    {
+      "epoch": 12.86,
+      "learning_rate": 0.023809523809523808,
+      "loss": 0.0311,
+      "step": 1800
+    },
+    {
+      "epoch": 12.93,
+      "learning_rate": 0.023756613756613757,
+      "loss": 0.0198,
+      "step": 1810
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 0.023703703703703703,
+      "loss": 0.0128,
+      "step": 1820
+    },
+    {
+      "epoch": 13.0,
+      "eval_acc": 0.871545929798357,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.6666666666666666,
+        0.4666666666666667,
+        1.0,
+        0.9285714285714286,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.9333333333333333,
+        1.0,
+        0.8571428571428571,
+        0.9333333333333333,
+        0.9333333333333333,
+        1.0,
+        1.0,
+        1.0
+      ],
+      "eval_loss": 0.9901056885719299,
+      "eval_video_acc": 0.936026936026936,
+      "step": 1820
+    },
+    {
+      "epoch": 13.07,
+      "learning_rate": 0.02365079365079365,
+      "loss": 0.0139,
+      "step": 1830
+    },
+    {
+      "epoch": 13.14,
+      "learning_rate": 0.023597883597883597,
+      "loss": 0.0191,
+      "step": 1840
+    },
+    {
+      "epoch": 13.21,
+      "learning_rate": 0.023544973544973546,
+      "loss": 0.014,
+      "step": 1850
+    },
+    {
+      "epoch": 13.29,
+      "learning_rate": 0.02349206349206349,
+      "loss": 0.0228,
+      "step": 1860
+    },
+    {
+      "epoch": 13.36,
+      "learning_rate": 0.02343915343915344,
+      "loss": 0.013,
+      "step": 1870
+    },
+    {
+      "epoch": 13.43,
+      "learning_rate": 0.023386243386243386,
+      "loss": 0.0183,
+      "step": 1880
+    },
+    {
+      "epoch": 13.5,
+      "learning_rate": 0.023333333333333334,
+      "loss": 0.0209,
+      "step": 1890
+    },
+    {
+      "epoch": 13.57,
+      "learning_rate": 0.02328042328042328,
+      "loss": 0.0133,
+      "step": 1900
+    },
+    {
+      "epoch": 13.64,
+      "learning_rate": 0.02322751322751323,
+      "loss": 0.026,
+      "step": 1910
+    },
+    {
+      "epoch": 13.71,
+      "learning_rate": 0.023174603174603174,
+      "loss": 0.0223,
+      "step": 1920
+    },
+    {
+      "epoch": 13.79,
+      "learning_rate": 0.02312169312169312,
+      "loss": 0.0136,
+      "step": 1930
+    },
+    {
+      "epoch": 13.86,
+      "learning_rate": 0.023068783068783065,
+      "loss": 0.0149,
+      "step": 1940
+    },
+    {
+      "epoch": 13.93,
+      "learning_rate": 0.023015873015873014,
+      "loss": 0.0155,
+      "step": 1950
+    },
+    {
+      "epoch": 14.0,
+      "learning_rate": 0.02296296296296296,
+      "loss": 0.0167,
+      "step": 1960
+    },
+    {
+      "epoch": 14.0,
+      "eval_acc": 0.8765870052277819,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.7333333333333333,
+        0.6,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.7857142857142857,
+        0.9333333333333333,
+        1.0,
+        0.7857142857142857,
+        1.0,
+        1.0,
+        1.0,
+        0.9333333333333333,
+        0.8666666666666667
+      ],
+      "eval_loss": 0.932759702205658,
+      "eval_video_acc": 0.9326599326599326,
+      "step": 1960
+    },
+    {
+      "epoch": 14.07,
+      "learning_rate": 0.022910052910052908,
+      "loss": 0.0149,
+      "step": 1970
+    },
+    {
+      "epoch": 14.14,
+      "learning_rate": 0.022857142857142854,
+      "loss": 0.0104,
+      "step": 1980
+    },
+    {
+      "epoch": 14.21,
+      "learning_rate": 0.022804232804232803,
+      "loss": 0.0126,
+      "step": 1990
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 0.022751322751322748,
+      "loss": 0.0105,
+      "step": 2000
+    },
+    {
+      "epoch": 14.36,
+      "learning_rate": 0.022698412698412697,
+      "loss": 0.0093,
+      "step": 2010
+    },
+    {
+      "epoch": 14.43,
+      "learning_rate": 0.022645502645502642,
+      "loss": 0.0114,
+      "step": 2020
+    },
+    {
+      "epoch": 14.5,
+      "learning_rate": 0.02259259259259259,
+      "loss": 0.0102,
+      "step": 2030
+    },
+    {
+      "epoch": 14.57,
+      "learning_rate": 0.022539682539682537,
+      "loss": 0.0098,
+      "step": 2040
+    },
+    {
+      "epoch": 14.64,
+      "learning_rate": 0.022486772486772486,
+      "loss": 0.0155,
+      "step": 2050
+    },
+    {
+      "epoch": 14.71,
+      "learning_rate": 0.02243386243386243,
+      "loss": 0.0137,
+      "step": 2060
+    },
+    {
+      "epoch": 14.79,
+      "learning_rate": 0.02238095238095238,
+      "loss": 0.0106,
+      "step": 2070
+    },
+    {
+      "epoch": 14.86,
+      "learning_rate": 0.022328042328042325,
+      "loss": 0.0119,
+      "step": 2080
+    },
+    {
+      "epoch": 14.93,
+      "learning_rate": 0.022275132275132274,
+      "loss": 0.0211,
+      "step": 2090
+    },
+    {
+      "epoch": 15.0,
+      "learning_rate": 0.02222222222222222,
+      "loss": 0.02,
+      "step": 2100
+    },
+    {
+      "epoch": 15.0,
+      "eval_acc": 0.8577296489917849,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.8666666666666667,
+        0.7333333333333333,
+        1.0,
+        0.9285714285714286,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.5714285714285714,
+        0.9333333333333333,
+        1.0,
+        0.9285714285714286,
+        0.9333333333333333,
+        1.0,
+        0.6,
+        1.0,
+        0.9333333333333333
+      ],
+      "eval_loss": 1.1454888582229614,
+      "eval_video_acc": 0.9225589225589226,
+      "step": 2100
+    },
+    {
+      "epoch": 15.07,
+      "learning_rate": 0.02216931216931217,
+      "loss": 0.013,
+      "step": 2110
+    },
+    {
+      "epoch": 15.14,
+      "learning_rate": 0.022116402116402114,
+      "loss": 0.0116,
+      "step": 2120
+    },
+    {
+      "epoch": 15.21,
+      "learning_rate": 0.022063492063492063,
+      "loss": 0.0106,
+      "step": 2130
+    },
+    {
+      "epoch": 15.29,
+      "learning_rate": 0.022010582010582008,
+      "loss": 0.0089,
+      "step": 2140
+    },
+    {
+      "epoch": 15.36,
+      "learning_rate": 0.021957671957671957,
+      "loss": 0.0091,
+      "step": 2150
+    },
+    {
+      "epoch": 15.43,
+      "learning_rate": 0.021904761904761903,
+      "loss": 0.0104,
+      "step": 2160
+    },
+    {
+      "epoch": 15.5,
+      "learning_rate": 0.02185185185185185,
+      "loss": 0.0119,
+      "step": 2170
+    },
+    {
+      "epoch": 15.57,
+      "learning_rate": 0.021798941798941797,
+      "loss": 0.0087,
+      "step": 2180
+    },
+    {
+      "epoch": 15.64,
+      "learning_rate": 0.021746031746031746,
+      "loss": 0.0077,
+      "step": 2190
+    },
+    {
+      "epoch": 15.71,
+      "learning_rate": 0.02169312169312169,
+      "loss": 0.0105,
+      "step": 2200
+    },
+    {
+      "epoch": 15.79,
+      "learning_rate": 0.02164021164021164,
+      "loss": 0.01,
+      "step": 2210
+    },
+    {
+      "epoch": 15.86,
+      "learning_rate": 0.021587301587301586,
+      "loss": 0.0128,
+      "step": 2220
+    },
+    {
+      "epoch": 15.93,
+      "learning_rate": 0.021534391534391534,
+      "loss": 0.0135,
+      "step": 2230
+    },
+    {
+      "epoch": 16.0,
+      "learning_rate": 0.02148148148148148,
+      "loss": 0.0157,
+      "step": 2240
+    },
+    {
+      "epoch": 16.0,
+      "eval_acc": 0.8340179238237491,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.4,
+        0.5333333333333333,
+        1.0,
+        0.7142857142857143,
+        0.9230769230769231,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.7857142857142857,
+        0.9333333333333333,
+        1.0,
+        0.8571428571428571,
+        0.9333333333333333,
+        1.0,
+        0.8,
+        1.0,
+        0.9333333333333333
+      ],
+      "eval_loss": 1.227346658706665,
+      "eval_video_acc": 0.8922558922558923,
+      "step": 2240
+    },
+    {
+      "epoch": 16.07,
+      "learning_rate": 0.02142857142857143,
+      "loss": 0.0166,
+      "step": 2250
+    },
+    {
+      "epoch": 16.14,
+      "learning_rate": 0.021375661375661374,
+      "loss": 0.0256,
+      "step": 2260
+    },
+    {
+      "epoch": 16.21,
+      "learning_rate": 0.021322751322751323,
+      "loss": 0.011,
+      "step": 2270
+    },
+    {
+      "epoch": 16.29,
+      "learning_rate": 0.02126984126984127,
+      "loss": 0.0087,
+      "step": 2280
+    },
+    {
+      "epoch": 16.36,
+      "learning_rate": 0.021216931216931217,
+      "loss": 0.0108,
+      "step": 2290
+    },
+    {
+      "epoch": 16.43,
+      "learning_rate": 0.021164021164021163,
+      "loss": 0.0091,
+      "step": 2300
+    },
+    {
+      "epoch": 16.5,
+      "learning_rate": 0.021111111111111112,
+      "loss": 0.0119,
+      "step": 2310
+    },
+    {
+      "epoch": 16.57,
+      "learning_rate": 0.021058201058201057,
+      "loss": 0.0096,
+      "step": 2320
+    },
+    {
+      "epoch": 16.64,
+      "learning_rate": 0.021005291005291006,
+      "loss": 0.0086,
+      "step": 2330
+    },
+    {
+      "epoch": 16.71,
+      "learning_rate": 0.02095238095238095,
+      "loss": 0.0079,
+      "step": 2340
+    },
+    {
+      "epoch": 16.79,
+      "learning_rate": 0.0208994708994709,
+      "loss": 0.0088,
+      "step": 2350
+    },
+    {
+      "epoch": 16.86,
+      "learning_rate": 0.020846560846560846,
+      "loss": 0.0077,
+      "step": 2360
+    },
+    {
+      "epoch": 16.93,
+      "learning_rate": 0.020793650793650795,
+      "loss": 0.0091,
+      "step": 2370
+    },
+    {
+      "epoch": 17.0,
+      "learning_rate": 0.02074074074074074,
+      "loss": 0.0088,
+      "step": 2380
+    },
+    {
+      "epoch": 17.0,
+      "eval_acc": 0.8918969380134428,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.9333333333333333,
+        0.6666666666666666,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.7857142857142857,
+        0.8666666666666667,
+        1.0,
+        0.8571428571428571,
+        0.8666666666666667,
+        1.0,
+        1.0,
+        1.0,
+        1.0
+      ],
+      "eval_loss": 0.8901068568229675,
+      "eval_video_acc": 0.9494949494949495,
+      "step": 2380
+    },
+    {
+      "epoch": 17.07,
+      "learning_rate": 0.02068783068783069,
+      "loss": 0.0097,
+      "step": 2390
+    },
+    {
+      "epoch": 17.14,
+      "learning_rate": 0.020634920634920634,
+      "loss": 0.0073,
+      "step": 2400
+    },
+    {
+      "epoch": 17.21,
+      "learning_rate": 0.020582010582010583,
+      "loss": 0.0084,
+      "step": 2410
+    },
+    {
+      "epoch": 17.29,
+      "learning_rate": 0.02052910052910053,
+      "loss": 0.0082,
+      "step": 2420
+    },
+    {
+      "epoch": 17.36,
+      "learning_rate": 0.020476190476190478,
+      "loss": 0.0091,
+      "step": 2430
+    },
+    {
+      "epoch": 17.43,
+      "learning_rate": 0.020423280423280423,
+      "loss": 0.006,
+      "step": 2440
+    },
+    {
+      "epoch": 17.5,
+      "learning_rate": 0.02037037037037037,
+      "loss": 0.0081,
+      "step": 2450
+    },
+    {
+      "epoch": 17.57,
+      "learning_rate": 0.020317460317460314,
+      "loss": 0.0063,
+      "step": 2460
+    },
+    {
+      "epoch": 17.64,
+      "learning_rate": 0.020264550264550263,
+      "loss": 0.0071,
+      "step": 2470
+    },
+    {
+      "epoch": 17.71,
+      "learning_rate": 0.02021164021164021,
+      "loss": 0.0063,
+      "step": 2480
+    },
+    {
+      "epoch": 17.79,
+      "learning_rate": 0.020158730158730157,
+      "loss": 0.0065,
+      "step": 2490
+    },
+    {
+      "epoch": 17.86,
+      "learning_rate": 0.020105820105820103,
+      "loss": 0.0078,
+      "step": 2500
+    },
+    {
+      "epoch": 17.93,
+      "learning_rate": 0.02005291005291005,
+      "loss": 0.0078,
+      "step": 2510
+    },
+    {
+      "epoch": 18.0,
+      "learning_rate": 0.019999999999999997,
+      "loss": 0.0062,
+      "step": 2520
+    },
+    {
+      "epoch": 18.0,
+      "eval_acc": 0.8797610156833457,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.5333333333333333,
+        0.7333333333333333,
+        1.0,
+        0.7857142857142857,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        0.7142857142857143,
+        0.9333333333333333,
+        1.0,
+        0.9285714285714286,
+        0.9333333333333333,
+        1.0,
+        1.0,
+        1.0,
+        1.0
+      ],
+      "eval_loss": 0.9971681237220764,
+      "eval_video_acc": 0.9292929292929293,
+      "step": 2520
+    },
+    {
+      "epoch": 18.07,
+      "learning_rate": 0.019947089947089946,
+      "loss": 0.0071,
+      "step": 2530
+    },
+    {
+      "epoch": 18.14,
+      "learning_rate": 0.01989417989417989,
+      "loss": 0.0062,
+      "step": 2540
+    },
+    {
+      "epoch": 18.21,
+      "learning_rate": 0.01984126984126984,
+      "loss": 0.0062,
+      "step": 2550
+    },
+    {
+      "epoch": 18.29,
+      "learning_rate": 0.019788359788359786,
+      "loss": 0.0077,
+      "step": 2560
+    },
+    {
+      "epoch": 18.36,
+      "learning_rate": 0.019735449735449734,
+      "loss": 0.0065,
+      "step": 2570
+    },
+    {
+      "epoch": 18.43,
+      "learning_rate": 0.01968253968253968,
+      "loss": 0.006,
+      "step": 2580
+    },
+    {
+      "epoch": 18.5,
+      "learning_rate": 0.01962962962962963,
+      "loss": 0.0066,
+      "step": 2590
+    },
+    {
+      "epoch": 18.57,
+      "learning_rate": 0.019576719576719574,
+      "loss": 0.0088,
+      "step": 2600
+    },
+    {
+      "epoch": 18.64,
+      "learning_rate": 0.019523809523809523,
+      "loss": 0.0074,
+      "step": 2610
+    },
+    {
+      "epoch": 18.71,
+      "learning_rate": 0.01947089947089947,
+      "loss": 0.0074,
+      "step": 2620
+    },
+    {
+      "epoch": 18.79,
+      "learning_rate": 0.019417989417989417,
+      "loss": 0.0101,
+      "step": 2630
+    },
+    {
+      "epoch": 18.86,
+      "learning_rate": 0.019365079365079363,
+      "loss": 0.0069,
+      "step": 2640
+    },
+    {
+      "epoch": 18.93,
+      "learning_rate": 0.019312169312169312,
+      "loss": 0.0092,
+      "step": 2650
+    },
+    {
+      "epoch": 19.0,
+      "learning_rate": 0.019259259259259257,
+      "loss": 0.0068,
+      "step": 2660
+    },
+    {
+      "epoch": 19.0,
+      "eval_acc": 0.8467139656460044,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.3333333333333333,
+        0.6666666666666666,
+        1.0,
+        0.7142857142857143,
+        1.0,
+        0.8666666666666667,
+        1.0,
+        1.0,
+        1.0,
+        0.7142857142857143,
+        0.9333333333333333,
+        1.0,
+        0.8571428571428571,
+        0.8,
+        1.0,
+        1.0,
+        1.0,
+        0.8666666666666667
+      ],
+      "eval_loss": 1.1115976572036743,
+      "eval_video_acc": 0.8888888888888888,
+      "step": 2660
+    },
+    {
+      "epoch": 19.07,
+      "learning_rate": 0.019206349206349206,
+      "loss": 0.0082,
+      "step": 2670
+    },
+    {
+      "epoch": 19.14,
+      "learning_rate": 0.01915343915343915,
+      "loss": 0.0085,
+      "step": 2680
+    },
+    {
+      "epoch": 19.21,
+      "learning_rate": 0.0191005291005291,
+      "loss": 0.0067,
+      "step": 2690
+    },
+    {
+      "epoch": 19.29,
+      "learning_rate": 0.019047619047619046,
+      "loss": 0.0065,
+      "step": 2700
+    },
+    {
+      "epoch": 19.36,
+      "learning_rate": 0.018994708994708995,
+      "loss": 0.0076,
+      "step": 2710
+    },
+    {
+      "epoch": 19.43,
+      "learning_rate": 0.01894179894179894,
+      "loss": 0.0082,
+      "step": 2720
+    },
+    {
+      "epoch": 19.5,
+      "learning_rate": 0.01888888888888889,
+      "loss": 0.0072,
+      "step": 2730
+    },
+    {
+      "epoch": 19.57,
+      "learning_rate": 0.018835978835978835,
+      "loss": 0.0063,
+      "step": 2740
+    },
+    {
+      "epoch": 19.64,
+      "learning_rate": 0.018783068783068783,
+      "loss": 0.007,
+      "step": 2750
+    },
+    {
+      "epoch": 19.71,
+      "learning_rate": 0.01873015873015873,
+      "loss": 0.0062,
+      "step": 2760
+    },
+    {
+      "epoch": 19.79,
+      "learning_rate": 0.018677248677248678,
+      "loss": 0.0065,
+      "step": 2770
+    },
+    {
+      "epoch": 19.86,
+      "learning_rate": 0.018624338624338623,
+      "loss": 0.0063,
+      "step": 2780
+    },
+    {
+      "epoch": 19.93,
+      "learning_rate": 0.018571428571428572,
+      "loss": 0.0062,
+      "step": 2790
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 0.018518518518518517,
+      "loss": 0.007,
+      "step": 2800
+    },
+    {
+      "epoch": 20.0,
+      "eval_acc": 0.8706123973114265,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.4666666666666667,
+        0.6,
+        1.0,
+        1.0,
+        1.0,
+        0.9333333333333333,
+        1.0,
+        1.0,
+        1.0,
+        0.7142857142857143,
+        0.9333333333333333,
+        1.0,
+        1.0,
+        0.8666666666666667,
+        1.0,
+        1.0,
+        1.0,
+        1.0
+      ],
+      "eval_loss": 0.9602662324905396,
+      "eval_video_acc": 0.9259259259259259,
+      "step": 2800
+    },
+    {
+      "epoch": 20.07,
+      "learning_rate": 0.018465608465608466,
+      "loss": 0.0071,
+      "step": 2810
+    },
+    {
+      "epoch": 20.14,
+      "learning_rate": 0.018412698412698412,
+      "loss": 0.0065,
+      "step": 2820
+    },
+    {
+      "epoch": 20.21,
+      "learning_rate": 0.01835978835978836,
+      "loss": 0.0081,
+      "step": 2830
+    },
+    {
+      "epoch": 20.29,
+      "learning_rate": 0.018306878306878306,
+      "loss": 0.0073,
+      "step": 2840
+    },
+    {
+      "epoch": 20.36,
+      "learning_rate": 0.018253968253968255,
+      "loss": 0.0081,
+      "step": 2850
+    },
+    {
+      "epoch": 20.43,
+      "learning_rate": 0.0182010582010582,
+      "loss": 0.0075,
+      "step": 2860
+    },
+    {
+      "epoch": 20.5,
+      "learning_rate": 0.01814814814814815,
+      "loss": 0.0069,
+      "step": 2870
+    },
+    {
+      "epoch": 20.57,
+      "learning_rate": 0.018095238095238095,
+      "loss": 0.0076,
+      "step": 2880
+    },
+    {
+      "epoch": 20.64,
+      "learning_rate": 0.018042328042328044,
+      "loss": 0.0126,
+      "step": 2890
+    },
+    {
+      "epoch": 20.71,
+      "learning_rate": 0.01798941798941799,
+      "loss": 0.0074,
+      "step": 2900
+    },
+    {
+      "epoch": 20.79,
+      "learning_rate": 0.017936507936507938,
+      "loss": 0.0071,
+      "step": 2910
+    },
+    {
+      "epoch": 20.86,
+      "learning_rate": 0.017883597883597883,
+      "loss": 0.0055,
+      "step": 2920
+    },
+    {
+      "epoch": 20.93,
+      "learning_rate": 0.017830687830687832,
+      "loss": 0.0068,
+      "step": 2930
+    },
+    {
+      "epoch": 21.0,
+      "learning_rate": 0.017777777777777778,
+      "loss": 0.0063,
+      "step": 2940
+    },
+    {
+      "epoch": 21.0,
+      "eval_acc": 0.8721060492905153,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.5333333333333333,
+        0.6,
+        1.0,
+        0.7857142857142857,
+        1.0,
+        0.9333333333333333,
+        1.0,
+        1.0,
+        1.0,
+        0.7857142857142857,
+        0.9333333333333333,
+        1.0,
+        0.8571428571428571,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0
+      ],
+      "eval_loss": 0.9218623638153076,
+      "eval_video_acc": 0.9225589225589226,
+      "step": 2940
+    },
+    {
+      "epoch": 21.07,
+      "learning_rate": 0.017724867724867723,
+      "loss": 0.0061,
+      "step": 2950
+    },
+    {
+      "epoch": 21.14,
+      "learning_rate": 0.01767195767195767,
+      "loss": 0.0076,
+      "step": 2960
+    },
+    {
+      "epoch": 21.21,
+      "learning_rate": 0.017619047619047618,
+      "loss": 0.0069,
+      "step": 2970
+    },
+    {
+      "epoch": 21.29,
+      "learning_rate": 0.017566137566137563,
+      "loss": 0.006,
+      "step": 2980
+    },
+    {
+      "epoch": 21.36,
+      "learning_rate": 0.017513227513227512,
+      "loss": 0.0073,
+      "step": 2990
+    },
+    {
+      "epoch": 21.43,
+      "learning_rate": 0.017460317460317457,
+      "loss": 0.0076,
+      "step": 3000
+    },
+    {
+      "epoch": 21.5,
+      "learning_rate": 0.017407407407407406,
+      "loss": 0.0057,
+      "step": 3010
+    },
+    {
+      "epoch": 21.57,
+      "learning_rate": 0.01735449735449735,
+      "loss": 0.0067,
+      "step": 3020
+    },
+    {
+      "epoch": 21.64,
+      "learning_rate": 0.0173015873015873,
+      "loss": 0.0056,
+      "step": 3030
+    },
+    {
+      "epoch": 21.71,
+      "learning_rate": 0.017248677248677246,
+      "loss": 0.0054,
+      "step": 3040
+    },
+    {
+      "epoch": 21.79,
+      "learning_rate": 0.017195767195767195,
+      "loss": 0.006,
+      "step": 3050
+    },
+    {
+      "epoch": 21.86,
+      "learning_rate": 0.01714285714285714,
+      "loss": 0.007,
+      "step": 3060
+    },
+    {
+      "epoch": 21.93,
+      "learning_rate": 0.01708994708994709,
+      "loss": 0.0107,
+      "step": 3070
+    },
+    {
+      "epoch": 22.0,
+      "learning_rate": 0.017037037037037035,
+      "loss": 0.009,
+      "step": 3080
+    },
+    {
+      "epoch": 22.0,
+      "eval_acc": 0.8945108289768484,
+      "eval_class_acc": [
+        1.0,
+        1.0,
+        0.9333333333333333,
+        0.6,
+        1.0,
+        1.0,
+        1.0,
+        0.9333333333333333,
+        1.0,
+        1.0,
+        1.0,
+        0.9285714285714286,
+        0.9333333333333333,
+        1.0,
+        0.9285714285714286,
+        1.0,
+        1.0,
+        1.0,
+        1.0,
+        1.0
+      ],
+      "eval_loss": 0.8252608180046082,
+      "eval_video_acc": 0.9629629629629629,
+      "step": 3080
+    }
+  ],
+  "max_steps": 6300,
+  "num_train_epochs": 45,
+  "total_flos": 3.6855222668954173e+18,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5c61cd2bf85ceb47e39b8a43a1df4d550e51653fdcc0afffba92f5033b56a895
+size 3119