Alpha_0.3 / trainer_log.jsonl

Upload folder using huggingface_hub

406cc92 verified 11 months ago

18.9 kB

	{"current_steps": 10, "total_steps": 708, "loss": 2.1374, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.9975392245612254e-05, "epoch": 0.17, "percentage": 1.41, "elapsed_time": "0:00:33", "remaining_time": "0:38:49"}
	{"current_steps": 20, "total_steps": 708, "loss": 0.4576, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.9901617425775067e-05, "epoch": 0.33, "percentage": 2.82, "elapsed_time": "0:01:04", "remaining_time": "0:37:01"}
	{"current_steps": 30, "total_steps": 708, "loss": 0.2497, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.9778820775100185e-05, "epoch": 0.5, "percentage": 4.24, "elapsed_time": "0:01:35", "remaining_time": "0:35:55"}
	{"current_steps": 40, "total_steps": 708, "loss": 0.1604, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.9607244033573156e-05, "epoch": 0.67, "percentage": 5.65, "elapsed_time": "0:02:05", "remaining_time": "0:35:02"}
	{"current_steps": 50, "total_steps": 708, "loss": 0.1206, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.93872249706591e-05, "epoch": 0.84, "percentage": 7.06, "elapsed_time": "0:02:36", "remaining_time": "0:34:16"}
	{"current_steps": 60, "total_steps": 708, "loss": 0.1109, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.91191967203629e-05, "epoch": 1.0, "percentage": 8.47, "elapsed_time": "0:03:07", "remaining_time": "0:33:46"}
	{"current_steps": 70, "total_steps": 708, "loss": 0.057, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.8803686928552736e-05, "epoch": 1.17, "percentage": 9.89, "elapsed_time": "0:03:38", "remaining_time": "0:33:08"}
	{"current_steps": 80, "total_steps": 708, "loss": 0.0569, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.84413167142257e-05, "epoch": 1.34, "percentage": 11.3, "elapsed_time": "0:04:09", "remaining_time": "0:32:35"}
	{"current_steps": 90, "total_steps": 708, "loss": 0.0634, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.803279944676032e-05, "epoch": 1.51, "percentage": 12.71, "elapsed_time": "0:04:40", "remaining_time": "0:32:02"}
	{"current_steps": 100, "total_steps": 708, "loss": 0.0634, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.7578939341563095e-05, "epoch": 1.67, "percentage": 14.12, "elapsed_time": "0:05:10", "remaining_time": "0:31:28"}
	{"current_steps": 110, "total_steps": 708, "loss": 0.0437, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.70806298768736e-05, "epoch": 1.84, "percentage": 15.54, "elapsed_time": "0:05:41", "remaining_time": "0:30:58"}
	{"current_steps": 120, "total_steps": 708, "loss": 0.0627, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.653885203484515e-05, "epoch": 2.01, "percentage": 16.95, "elapsed_time": "0:06:12", "remaining_time": "0:30:27"}
	{"current_steps": 130, "total_steps": 708, "loss": 0.0361, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.595467237036329e-05, "epoch": 2.18, "percentage": 18.36, "elapsed_time": "0:06:43", "remaining_time": "0:29:55"}
	{"current_steps": 140, "total_steps": 708, "loss": 0.0267, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.532924091140417e-05, "epoch": 2.34, "percentage": 19.77, "elapsed_time": "0:07:14", "remaining_time": "0:29:22"}
	{"current_steps": 150, "total_steps": 708, "loss": 0.0362, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.466378889506607e-05, "epoch": 2.51, "percentage": 21.19, "elapsed_time": "0:07:45", "remaining_time": "0:28:51"}
	{"current_steps": 160, "total_steps": 708, "loss": 0.0403, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.395962634373097e-05, "epoch": 2.68, "percentage": 22.6, "elapsed_time": "0:08:16", "remaining_time": "0:28:21"}
	{"current_steps": 170, "total_steps": 708, "loss": 0.0302, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.3218139486127854e-05, "epoch": 2.85, "percentage": 24.01, "elapsed_time": "0:08:47", "remaining_time": "0:27:49"}
	{"current_steps": 180, "total_steps": 708, "loss": 0.048, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.2440788028374624e-05, "epoch": 3.01, "percentage": 25.42, "elapsed_time": "0:09:18", "remaining_time": "0:27:17"}
	{"current_steps": 190, "total_steps": 708, "loss": 0.0219, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.1629102280370904e-05, "epoch": 3.18, "percentage": 26.84, "elapsed_time": "0:09:48", "remaining_time": "0:26:45"}
	{"current_steps": 200, "total_steps": 708, "loss": 0.0215, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.0784680143198836e-05, "epoch": 3.35, "percentage": 28.25, "elapsed_time": "0:10:20", "remaining_time": "0:26:15"}
	{"current_steps": 210, "total_steps": 708, "loss": 0.0264, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.990918396346254e-05, "epoch": 3.51, "percentage": 29.66, "elapsed_time": "0:10:51", "remaining_time": "0:25:45"}
	{"current_steps": 220, "total_steps": 708, "loss": 0.029, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.900433726075865e-05, "epoch": 3.68, "percentage": 31.07, "elapsed_time": "0:11:22", "remaining_time": "0:25:13"}
	{"current_steps": 230, "total_steps": 708, "loss": 0.031, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.8071921334720696e-05, "epoch": 3.85, "percentage": 32.49, "elapsed_time": "0:11:53", "remaining_time": "0:24:42"}
	{"current_steps": 240, "total_steps": 708, "loss": 0.0205, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.711377175831626e-05, "epoch": 4.02, "percentage": 33.9, "elapsed_time": "0:12:23", "remaining_time": "0:24:09"}
	{"current_steps": 250, "total_steps": 708, "loss": 0.0172, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.613177476430079e-05, "epoch": 4.18, "percentage": 35.31, "elapsed_time": "0:12:53", "remaining_time": "0:23:37"}
	{"current_steps": 260, "total_steps": 708, "loss": 0.0162, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.512786353194134e-05, "epoch": 4.35, "percentage": 36.72, "elapsed_time": "0:13:24", "remaining_time": "0:23:06"}
	{"current_steps": 270, "total_steps": 708, "loss": 0.0136, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.410401438132056e-05, "epoch": 4.52, "percentage": 38.14, "elapsed_time": "0:13:55", "remaining_time": "0:22:35"}
	{"current_steps": 280, "total_steps": 708, "loss": 0.0186, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.3062242882712724e-05, "epoch": 4.69, "percentage": 39.55, "elapsed_time": "0:14:26", "remaining_time": "0:22:04"}
	{"current_steps": 290, "total_steps": 708, "loss": 0.0147, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.200459988869111e-05, "epoch": 4.85, "percentage": 40.96, "elapsed_time": "0:14:57", "remaining_time": "0:21:33"}
	{"current_steps": 300, "total_steps": 708, "loss": 0.0117, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.093316749677788e-05, "epoch": 5.02, "percentage": 42.37, "elapsed_time": "0:15:28", "remaining_time": "0:21:03"}
	{"current_steps": 310, "total_steps": 708, "loss": 0.0099, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 2.985005495058446e-05, "epoch": 5.19, "percentage": 43.79, "elapsed_time": "0:15:59", "remaining_time": "0:20:31"}
	{"current_steps": 320, "total_steps": 708, "loss": 0.013, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 2.875739448751176e-05, "epoch": 5.36, "percentage": 45.2, "elapsed_time": "0:16:30", "remaining_time": "0:20:00"}
	{"current_steps": 330, "total_steps": 708, "loss": 0.0178, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 2.7657337141184138e-05, "epoch": 5.52, "percentage": 46.61, "elapsed_time": "0:17:00", "remaining_time": "0:19:29"}
	{"current_steps": 340, "total_steps": 708, "loss": 0.006, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 2.655204850688085e-05, "epoch": 5.69, "percentage": 48.02, "elapsed_time": "0:17:32", "remaining_time": "0:18:59"}
	{"current_steps": 350, "total_steps": 708, "loss": 0.0132, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 2.5443704478301154e-05, "epoch": 5.86, "percentage": 49.44, "elapsed_time": "0:18:03", "remaining_time": "0:18:28"}
	{"current_steps": 360, "total_steps": 708, "loss": 0.0086, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 2.433448696405563e-05, "epoch": 6.03, "percentage": 50.85, "elapsed_time": "0:18:34", "remaining_time": "0:17:57"}
	{"current_steps": 370, "total_steps": 708, "loss": 0.0073, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 2.3226579592316538e-05, "epoch": 6.19, "percentage": 52.26, "elapsed_time": "0:19:04", "remaining_time": "0:17:25"}
	{"current_steps": 380, "total_steps": 708, "loss": 0.0068, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 2.2122163412082927e-05, "epoch": 6.36, "percentage": 53.67, "elapsed_time": "0:19:35", "remaining_time": "0:16:54"}
	{"current_steps": 390, "total_steps": 708, "loss": 0.0055, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 2.1023412599523204e-05, "epoch": 6.53, "percentage": 55.08, "elapsed_time": "0:20:06", "remaining_time": "0:16:24"}
	{"current_steps": 400, "total_steps": 708, "loss": 0.0104, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.993249017784766e-05, "epoch": 6.69, "percentage": 56.5, "elapsed_time": "0:20:37", "remaining_time": "0:15:53"}
	{"current_steps": 410, "total_steps": 708, "loss": 0.0086, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.8851543759137007e-05, "epoch": 6.86, "percentage": 57.91, "elapsed_time": "0:21:08", "remaining_time": "0:15:22"}
	{"current_steps": 420, "total_steps": 708, "loss": 0.0077, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.778270131650948e-05, "epoch": 7.03, "percentage": 59.32, "elapsed_time": "0:21:39", "remaining_time": "0:14:51"}
	{"current_steps": 430, "total_steps": 708, "loss": 0.0028, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.672806699494966e-05, "epoch": 7.2, "percentage": 60.73, "elapsed_time": "0:22:10", "remaining_time": "0:14:20"}
	{"current_steps": 440, "total_steps": 708, "loss": 0.0049, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.5689716969045848e-05, "epoch": 7.36, "percentage": 62.15, "elapsed_time": "0:22:41", "remaining_time": "0:13:49"}
	{"current_steps": 450, "total_steps": 708, "loss": 0.0041, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.4669695355790552e-05, "epoch": 7.53, "percentage": 63.56, "elapsed_time": "0:23:12", "remaining_time": "0:13:18"}
	{"current_steps": 460, "total_steps": 708, "loss": 0.0051, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.3670010190490073e-05, "epoch": 7.7, "percentage": 64.97, "elapsed_time": "0:23:43", "remaining_time": "0:12:47"}
	{"current_steps": 470, "total_steps": 708, "loss": 0.0062, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.2692629473705453e-05, "epoch": 7.87, "percentage": 66.38, "elapsed_time": "0:24:13", "remaining_time": "0:12:16"}
	{"current_steps": 480, "total_steps": 708, "loss": 0.0036, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.173947729700644e-05, "epoch": 8.03, "percentage": 67.8, "elapsed_time": "0:24:45", "remaining_time": "0:11:45"}
	{"current_steps": 490, "total_steps": 708, "loss": 0.0027, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.081243005516571e-05, "epoch": 8.2, "percentage": 69.21, "elapsed_time": "0:25:16", "remaining_time": "0:11:14"}
	{"current_steps": 500, "total_steps": 708, "loss": 0.0025, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 9.913312752249903e-06, "epoch": 8.37, "percentage": 70.62, "elapsed_time": "0:25:47", "remaining_time": "0:10:43"}
	{"current_steps": 510, "total_steps": 708, "loss": 0.0029, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 9.043895408879505e-06, "epoch": 8.54, "percentage": 72.03, "elapsed_time": "0:26:18", "remaining_time": "0:10:12"}
	{"current_steps": 520, "total_steps": 708, "loss": 0.0026, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 8.20588957773018e-06, "epoch": 8.7, "percentage": 73.45, "elapsed_time": "0:26:48", "remaining_time": "0:09:41"}
	{"current_steps": 530, "total_steps": 708, "loss": 0.0029, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 7.400944974135427e-06, "epoch": 8.87, "percentage": 74.86, "elapsed_time": "0:27:19", "remaining_time": "0:09:10"}
	{"current_steps": 540, "total_steps": 708, "loss": 0.0022, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 6.6306462284233234e-06, "epoch": 9.04, "percentage": 76.27, "elapsed_time": "0:27:51", "remaining_time": "0:08:39"}
	{"current_steps": 550, "total_steps": 708, "loss": 0.0011, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 5.896509766381028e-06, "epoch": 9.21, "percentage": 77.68, "elapsed_time": "0:28:21", "remaining_time": "0:08:08"}
	{"current_steps": 560, "total_steps": 708, "loss": 0.0016, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 5.199980823988157e-06, "epoch": 9.37, "percentage": 79.1, "elapsed_time": "0:28:53", "remaining_time": "0:07:38"}
	{"current_steps": 570, "total_steps": 708, "loss": 0.0012, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 4.542430602295774e-06, "epoch": 9.54, "percentage": 80.51, "elapsed_time": "0:29:24", "remaining_time": "0:07:07"}
	{"current_steps": 580, "total_steps": 708, "loss": 0.0011, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.925153568052123e-06, "epoch": 9.71, "percentage": 81.92, "elapsed_time": "0:29:55", "remaining_time": "0:06:36"}
	{"current_steps": 590, "total_steps": 708, "loss": 0.0018, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.3493649053890326e-06, "epoch": 9.87, "percentage": 83.33, "elapsed_time": "0:30:25", "remaining_time": "0:06:05"}
	{"current_steps": 600, "total_steps": 708, "loss": 0.001, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 2.8161981235857143e-06, "epoch": 10.04, "percentage": 84.75, "elapsed_time": "0:30:56", "remaining_time": "0:05:34"}
	{"current_steps": 610, "total_steps": 708, "loss": 0.0011, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 2.3267028256193036e-06, "epoch": 10.21, "percentage": 86.16, "elapsed_time": "0:31:27", "remaining_time": "0:05:03"}
	{"current_steps": 620, "total_steps": 708, "loss": 0.0014, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.881842641895104e-06, "epoch": 10.38, "percentage": 87.57, "elapsed_time": "0:31:58", "remaining_time": "0:04:32"}
	{"current_steps": 630, "total_steps": 708, "loss": 0.0004, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.4824933332241692e-06, "epoch": 10.54, "percentage": 88.98, "elapsed_time": "0:32:29", "remaining_time": "0:04:01"}
	{"current_steps": 640, "total_steps": 708, "loss": 0.001, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.129441066782702e-06, "epoch": 10.71, "percentage": 90.4, "elapsed_time": "0:32:59", "remaining_time": "0:03:30"}
	{"current_steps": 650, "total_steps": 708, "loss": 0.0008, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 8.233808684473959e-07, "epoch": 10.88, "percentage": 91.81, "elapsed_time": "0:33:30", "remaining_time": "0:02:59"}
	{"current_steps": 660, "total_steps": 708, "loss": 0.0013, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 5.649152545533332e-07, "epoch": 11.05, "percentage": 93.22, "elapsed_time": "0:34:01", "remaining_time": "0:02:28"}
	{"current_steps": 670, "total_steps": 708, "loss": 0.0008, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 3.5455304576806347e-07, "epoch": 11.21, "percentage": 94.63, "elapsed_time": "0:34:31", "remaining_time": "0:01:57"}
	{"current_steps": 680, "total_steps": 708, "loss": 0.0004, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.927083654168854e-07, "epoch": 11.38, "percentage": 96.05, "elapsed_time": "0:35:03", "remaining_time": "0:01:26"}
	{"current_steps": 690, "total_steps": 708, "loss": 0.0007, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 7.969982423124689e-08, "epoch": 11.55, "percentage": 97.46, "elapsed_time": "0:35:33", "remaining_time": "0:00:55"}
	{"current_steps": 700, "total_steps": 708, "loss": 0.0011, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": 1.5749893125160954e-08, "epoch": 11.72, "percentage": 98.87, "elapsed_time": "0:36:04", "remaining_time": "0:00:24"}
	{"current_steps": 708, "total_steps": 708, "loss": null, "eval_loss": null, "predict_loss": null, "reward": null, "accuracy": null, "learning_rate": null, "epoch": 11.85, "percentage": 100.0, "elapsed_time": "0:36:29", "remaining_time": "0:00:00"}