whisper-medium-vaani-telugu / trainer_state.json

Upload 11 files

2e0663c verified about 1 month ago

15 kB

	{
	"best_metric": 53.673860298812414,
	"best_model_checkpoint": "./whisper-medium-te/checkpoint-2000",
	"epoch": 2.971768202080238,
	"eval_steps": 1000,
	"global_step": 2000,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.03714710252600297,
	"grad_norm": 9.450862884521484,
	"learning_rate": 4.6000000000000004e-07,
	"loss": 1.1494,
	"step": 25
	},
	{
	"epoch": 0.07429420505200594,
	"grad_norm": 5.792855262756348,
	"learning_rate": 9.600000000000001e-07,
	"loss": 0.8665,
	"step": 50
	},
	{
	"epoch": 0.11144130757800892,
	"grad_norm": 5.076374530792236,
	"learning_rate": 1.46e-06,
	"loss": 0.6443,
	"step": 75
	},
	{
	"epoch": 0.1485884101040119,
	"grad_norm": 4.388276100158691,
	"learning_rate": 1.9600000000000003e-06,
	"loss": 0.5233,
	"step": 100
	},
	{
	"epoch": 0.18573551263001487,
	"grad_norm": 4.2827301025390625,
	"learning_rate": 2.46e-06,
	"loss": 0.4417,
	"step": 125
	},
	{
	"epoch": 0.22288261515601784,
	"grad_norm": 4.33107328414917,
	"learning_rate": 2.96e-06,
	"loss": 0.3846,
	"step": 150
	},
	{
	"epoch": 0.2600297176820208,
	"grad_norm": 5.062885284423828,
	"learning_rate": 3.46e-06,
	"loss": 0.3456,
	"step": 175
	},
	{
	"epoch": 0.2971768202080238,
	"grad_norm": 3.433645725250244,
	"learning_rate": 3.96e-06,
	"loss": 0.3304,
	"step": 200
	},
	{
	"epoch": 0.3343239227340267,
	"grad_norm": 4.322815418243408,
	"learning_rate": 4.4600000000000005e-06,
	"loss": 0.3323,
	"step": 225
	},
	{
	"epoch": 0.37147102526002973,
	"grad_norm": 4.137588024139404,
	"learning_rate": 4.960000000000001e-06,
	"loss": 0.3087,
	"step": 250
	},
	{
	"epoch": 0.4086181277860327,
	"grad_norm": 3.188852071762085,
	"learning_rate": 5.460000000000001e-06,
	"loss": 0.2858,
	"step": 275
	},
	{
	"epoch": 0.4457652303120357,
	"grad_norm": 3.801391839981079,
	"learning_rate": 5.9600000000000005e-06,
	"loss": 0.2804,
	"step": 300
	},
	{
	"epoch": 0.48291233283803864,
	"grad_norm": 3.4735641479492188,
	"learning_rate": 6.460000000000001e-06,
	"loss": 0.2746,
	"step": 325
	},
	{
	"epoch": 0.5200594353640416,
	"grad_norm": 4.813545227050781,
	"learning_rate": 6.96e-06,
	"loss": 0.278,
	"step": 350
	},
	{
	"epoch": 0.5572065378900446,
	"grad_norm": 3.2244017124176025,
	"learning_rate": 7.4600000000000006e-06,
	"loss": 0.2655,
	"step": 375
	},
	{
	"epoch": 0.5943536404160475,
	"grad_norm": 3.476280689239502,
	"learning_rate": 7.960000000000002e-06,
	"loss": 0.2571,
	"step": 400
	},
	{
	"epoch": 0.6315007429420505,
	"grad_norm": 3.5403590202331543,
	"learning_rate": 8.46e-06,
	"loss": 0.2522,
	"step": 425
	},
	{
	"epoch": 0.6686478454680534,
	"grad_norm": 4.525882244110107,
	"learning_rate": 8.96e-06,
	"loss": 0.2473,
	"step": 450
	},
	{
	"epoch": 0.7057949479940565,
	"grad_norm": 4.107092380523682,
	"learning_rate": 9.460000000000001e-06,
	"loss": 0.2519,
	"step": 475
	},
	{
	"epoch": 0.7429420505200595,
	"grad_norm": 3.5582709312438965,
	"learning_rate": 9.960000000000001e-06,
	"loss": 0.2508,
	"step": 500
	},
	{
	"epoch": 0.7800891530460624,
	"grad_norm": 2.6124589443206787,
	"learning_rate": 9.984137931034483e-06,
	"loss": 0.2437,
	"step": 525
	},
	{
	"epoch": 0.8172362555720654,
	"grad_norm": 3.1363003253936768,
	"learning_rate": 9.96689655172414e-06,
	"loss": 0.241,
	"step": 550
	},
	{
	"epoch": 0.8543833580980683,
	"grad_norm": 2.3347408771514893,
	"learning_rate": 9.949655172413793e-06,
	"loss": 0.2369,
	"step": 575
	},
	{
	"epoch": 0.8915304606240714,
	"grad_norm": 2.609605312347412,
	"learning_rate": 9.93241379310345e-06,
	"loss": 0.2204,
	"step": 600
	},
	{
	"epoch": 0.9286775631500743,
	"grad_norm": 3.050915479660034,
	"learning_rate": 9.915172413793104e-06,
	"loss": 0.2183,
	"step": 625
	},
	{
	"epoch": 0.9658246656760773,
	"grad_norm": 2.9425406455993652,
	"learning_rate": 9.897931034482759e-06,
	"loss": 0.2321,
	"step": 650
	},
	{
	"epoch": 1.0029717682020802,
	"grad_norm": 3.074657917022705,
	"learning_rate": 9.880689655172414e-06,
	"loss": 0.2241,
	"step": 675
	},
	{
	"epoch": 1.0401188707280833,
	"grad_norm": 2.8157992362976074,
	"learning_rate": 9.86344827586207e-06,
	"loss": 0.1898,
	"step": 700
	},
	{
	"epoch": 1.0772659732540861,
	"grad_norm": 2.4690845012664795,
	"learning_rate": 9.846206896551725e-06,
	"loss": 0.1857,
	"step": 725
	},
	{
	"epoch": 1.1144130757800892,
	"grad_norm": 2.4655447006225586,
	"learning_rate": 9.82896551724138e-06,
	"loss": 0.1743,
	"step": 750
	},
	{
	"epoch": 1.151560178306092,
	"grad_norm": 2.103703498840332,
	"learning_rate": 9.811724137931035e-06,
	"loss": 0.1825,
	"step": 775
	},
	{
	"epoch": 1.188707280832095,
	"grad_norm": 2.727170467376709,
	"learning_rate": 9.79448275862069e-06,
	"loss": 0.1861,
	"step": 800
	},
	{
	"epoch": 1.2258543833580982,
	"grad_norm": 2.1180167198181152,
	"learning_rate": 9.777241379310347e-06,
	"loss": 0.179,
	"step": 825
	},
	{
	"epoch": 1.263001485884101,
	"grad_norm": 2.076005697250366,
	"learning_rate": 9.760000000000001e-06,
	"loss": 0.1854,
	"step": 850
	},
	{
	"epoch": 1.300148588410104,
	"grad_norm": 1.8460164070129395,
	"learning_rate": 9.742758620689656e-06,
	"loss": 0.1831,
	"step": 875
	},
	{
	"epoch": 1.3372956909361071,
	"grad_norm": 4.341026306152344,
	"learning_rate": 9.725517241379311e-06,
	"loss": 0.177,
	"step": 900
	},
	{
	"epoch": 1.37444279346211,
	"grad_norm": 2.86643123626709,
	"learning_rate": 9.708275862068966e-06,
	"loss": 0.1853,
	"step": 925
	},
	{
	"epoch": 1.4115898959881128,
	"grad_norm": 2.4118528366088867,
	"learning_rate": 9.691034482758621e-06,
	"loss": 0.1741,
	"step": 950
	},
	{
	"epoch": 1.4487369985141159,
	"grad_norm": 2.506206512451172,
	"learning_rate": 9.673793103448277e-06,
	"loss": 0.1713,
	"step": 975
	},
	{
	"epoch": 1.485884101040119,
	"grad_norm": 2.32373309135437,
	"learning_rate": 9.65655172413793e-06,
	"loss": 0.1662,
	"step": 1000
	},
	{
	"epoch": 1.485884101040119,
	"eval_loss": 0.2365463376045227,
	"eval_runtime": 3136.2768,
	"eval_samples_per_second": 0.863,
	"eval_steps_per_second": 0.108,
	"eval_wer": 55.854935512705914,
	"step": 1000
	},
	{
	"epoch": 1.5230312035661218,
	"grad_norm": 2.9691216945648193,
	"learning_rate": 9.639310344827587e-06,
	"loss": 0.1792,
	"step": 1025
	},
	{
	"epoch": 1.5601783060921248,
	"grad_norm": 2.158869981765747,
	"learning_rate": 9.622068965517242e-06,
	"loss": 0.1654,
	"step": 1050
	},
	{
	"epoch": 1.5973254086181279,
	"grad_norm": 2.132694721221924,
	"learning_rate": 9.604827586206897e-06,
	"loss": 0.1805,
	"step": 1075
	},
	{
	"epoch": 1.6344725111441307,
	"grad_norm": 2.4110560417175293,
	"learning_rate": 9.587586206896554e-06,
	"loss": 0.1688,
	"step": 1100
	},
	{
	"epoch": 1.6716196136701336,
	"grad_norm": 3.177272319793701,
	"learning_rate": 9.570344827586208e-06,
	"loss": 0.1746,
	"step": 1125
	},
	{
	"epoch": 1.7087667161961368,
	"grad_norm": 2.058962821960449,
	"learning_rate": 9.553103448275863e-06,
	"loss": 0.1695,
	"step": 1150
	},
	{
	"epoch": 1.7459138187221397,
	"grad_norm": 2.6047332286834717,
	"learning_rate": 9.535862068965518e-06,
	"loss": 0.1767,
	"step": 1175
	},
	{
	"epoch": 1.7830609212481425,
	"grad_norm": 2.676912546157837,
	"learning_rate": 9.518620689655173e-06,
	"loss": 0.186,
	"step": 1200
	},
	{
	"epoch": 1.8202080237741456,
	"grad_norm": 2.346376895904541,
	"learning_rate": 9.501379310344828e-06,
	"loss": 0.1832,
	"step": 1225
	},
	{
	"epoch": 1.8573551263001487,
	"grad_norm": 2.172449827194214,
	"learning_rate": 9.484137931034484e-06,
	"loss": 0.1791,
	"step": 1250
	},
	{
	"epoch": 1.8945022288261515,
	"grad_norm": 2.105217933654785,
	"learning_rate": 9.46689655172414e-06,
	"loss": 0.1771,
	"step": 1275
	},
	{
	"epoch": 1.9316493313521546,
	"grad_norm": 2.7176296710968018,
	"learning_rate": 9.449655172413794e-06,
	"loss": 0.1711,
	"step": 1300
	},
	{
	"epoch": 1.9687964338781576,
	"grad_norm": 2.633023262023926,
	"learning_rate": 9.432413793103449e-06,
	"loss": 0.1717,
	"step": 1325
	},
	{
	"epoch": 2.0059435364041605,
	"grad_norm": 1.6349059343338013,
	"learning_rate": 9.415172413793104e-06,
	"loss": 0.1649,
	"step": 1350
	},
	{
	"epoch": 2.0430906389301633,
	"grad_norm": 2.0442230701446533,
	"learning_rate": 9.397931034482759e-06,
	"loss": 0.1204,
	"step": 1375
	},
	{
	"epoch": 2.0802377414561666,
	"grad_norm": 1.8747773170471191,
	"learning_rate": 9.380689655172415e-06,
	"loss": 0.1214,
	"step": 1400
	},
	{
	"epoch": 2.1173848439821694,
	"grad_norm": 2.2875783443450928,
	"learning_rate": 9.363448275862069e-06,
	"loss": 0.1344,
	"step": 1425
	},
	{
	"epoch": 2.1545319465081723,
	"grad_norm": 1.9838837385177612,
	"learning_rate": 9.346206896551725e-06,
	"loss": 0.1199,
	"step": 1450
	},
	{
	"epoch": 2.1916790490341755,
	"grad_norm": 2.1067237854003906,
	"learning_rate": 9.32896551724138e-06,
	"loss": 0.1181,
	"step": 1475
	},
	{
	"epoch": 2.2288261515601784,
	"grad_norm": 2.6312592029571533,
	"learning_rate": 9.311724137931035e-06,
	"loss": 0.1256,
	"step": 1500
	},
	{
	"epoch": 2.265973254086181,
	"grad_norm": 1.992762804031372,
	"learning_rate": 9.294482758620691e-06,
	"loss": 0.1272,
	"step": 1525
	},
	{
	"epoch": 2.303120356612184,
	"grad_norm": 2.416465997695923,
	"learning_rate": 9.277241379310346e-06,
	"loss": 0.1305,
	"step": 1550
	},
	{
	"epoch": 2.3402674591381873,
	"grad_norm": 1.7433266639709473,
	"learning_rate": 9.260000000000001e-06,
	"loss": 0.1262,
	"step": 1575
	},
	{
	"epoch": 2.37741456166419,
	"grad_norm": 1.751561164855957,
	"learning_rate": 9.242758620689656e-06,
	"loss": 0.1216,
	"step": 1600
	},
	{
	"epoch": 2.414561664190193,
	"grad_norm": 2.123859405517578,
	"learning_rate": 9.225517241379311e-06,
	"loss": 0.1366,
	"step": 1625
	},
	{
	"epoch": 2.4517087667161963,
	"grad_norm": 1.9784679412841797,
	"learning_rate": 9.208275862068966e-06,
	"loss": 0.1265,
	"step": 1650
	},
	{
	"epoch": 2.488855869242199,
	"grad_norm": 2.4382882118225098,
	"learning_rate": 9.191034482758622e-06,
	"loss": 0.1228,
	"step": 1675
	},
	{
	"epoch": 2.526002971768202,
	"grad_norm": 2.2365972995758057,
	"learning_rate": 9.173793103448277e-06,
	"loss": 0.1326,
	"step": 1700
	},
	{
	"epoch": 2.563150074294205,
	"grad_norm": 1.7844051122665405,
	"learning_rate": 9.156551724137932e-06,
	"loss": 0.1234,
	"step": 1725
	},
	{
	"epoch": 2.600297176820208,
	"grad_norm": 1.6666020154953003,
	"learning_rate": 9.139310344827587e-06,
	"loss": 0.1343,
	"step": 1750
	},
	{
	"epoch": 2.637444279346211,
	"grad_norm": 2.0560336112976074,
	"learning_rate": 9.122068965517242e-06,
	"loss": 0.1235,
	"step": 1775
	},
	{
	"epoch": 2.6745913818722142,
	"grad_norm": 3.1412951946258545,
	"learning_rate": 9.104827586206897e-06,
	"loss": 0.1274,
	"step": 1800
	},
	{
	"epoch": 2.711738484398217,
	"grad_norm": 1.8942031860351562,
	"learning_rate": 9.087586206896553e-06,
	"loss": 0.1285,
	"step": 1825
	},
	{
	"epoch": 2.74888558692422,
	"grad_norm": 1.8972444534301758,
	"learning_rate": 9.070344827586206e-06,
	"loss": 0.1335,
	"step": 1850
	},
	{
	"epoch": 2.7860326894502228,
	"grad_norm": 1.9524787664413452,
	"learning_rate": 9.053103448275863e-06,
	"loss": 0.1209,
	"step": 1875
	},
	{
	"epoch": 2.8231797919762256,
	"grad_norm": 1.6888232231140137,
	"learning_rate": 9.035862068965518e-06,
	"loss": 0.1361,
	"step": 1900
	},
	{
	"epoch": 2.860326894502229,
	"grad_norm": 2.2144405841827393,
	"learning_rate": 9.018620689655173e-06,
	"loss": 0.134,
	"step": 1925
	},
	{
	"epoch": 2.8974739970282317,
	"grad_norm": 2.0730419158935547,
	"learning_rate": 9.00137931034483e-06,
	"loss": 0.1282,
	"step": 1950
	},
	{
	"epoch": 2.934621099554235,
	"grad_norm": 1.705673098564148,
	"learning_rate": 8.984137931034484e-06,
	"loss": 0.1206,
	"step": 1975
	},
	{
	"epoch": 2.971768202080238,
	"grad_norm": 1.9598541259765625,
	"learning_rate": 8.966896551724139e-06,
	"loss": 0.1253,
	"step": 2000
	},
	{
	"epoch": 2.971768202080238,
	"eval_loss": 0.21802061796188354,
	"eval_runtime": 3105.4135,
	"eval_samples_per_second": 0.872,
	"eval_steps_per_second": 0.109,
	"eval_wer": 53.673860298812414,
	"step": 2000
	}
	],
	"logging_steps": 25,
	"max_steps": 15000,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 23,
	"save_steps": 1000,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": false
	},
	"attributes": {}
	}
	},
	"total_flos": 3.265527462100992e+19,
	"train_batch_size": 16,
	"trial_name": null,
	"trial_params": null
	}