add tokenizer

Files changed (11) hide show

{checkpoint-1000 → checkpoint-1500}/config.json RENAMED Viewed

File without changes

{checkpoint-1000 → checkpoint-1500}/optimizer.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:61d83187a1f813e570b8172202be132f9dc0f940a837641665703d14c5c904da
 size 721679569

 version https://git-lfs.github.com/spec/v1
+oid sha256:254efd1bd850fbd13a92d4d704c28e38bf96a25312d2cea898bf0d5d3097fe07
 size 721679569

{checkpoint-1000 → checkpoint-1500}/preprocessor_config.json RENAMED Viewed

File without changes

{checkpoint-1000 → checkpoint-1500}/pytorch_model.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:973e9ac78b4070bbd43cb3872ccb15ad0f51d66f21e401675a74eb6c00746104
 size 377668631

 version https://git-lfs.github.com/spec/v1
+oid sha256:bf2e6339ab6117bda688c1a63f03c6e83139f47f7245e9ea64e50d11b2013a0b
 size 377668631

{checkpoint-1000 → checkpoint-1500}/rng_state.pth RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:918497def91b863e016b56685d7531de6045252ca14b1119353f10edbdd07d05
 size 14567

 version https://git-lfs.github.com/spec/v1
+oid sha256:f378c7f99d8466faf1aba279788bd3c802a0eb3176f3302961bd95cc94a08c47
 size 14567

{checkpoint-1000 → checkpoint-1500}/scheduler.pt RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bb3c2d4cc9cd5db0ded821257afbbb9e216de72b23cbfad8f7530e40d4a66085
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:6c5433c75dd2a5eb661891a22728e58238c70691115bede0539ebac1e487820e
 size 623

{checkpoint-1000 → checkpoint-1500}/trainer_state.json RENAMED Viewed

@@ -1,46 +1,61 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.526315789473684,
-  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.76,
       "learning_rate": 0.005,
-      "loss": 12.1146,
       "step": 500
     },
     {
-      "epoch": 0.76,
-      "eval_loss": 6.7651519775390625,
-      "eval_runtime": 549.3202,
-      "eval_samples_per_second": 0.843,
-      "eval_steps_per_second": 0.106,
       "eval_wer": 1.0,
       "step": 500
     },
     {
-      "epoch": 1.53,
       "learning_rate": 0.01,
-      "loss": 3.7548,
       "step": 1000
     },
     {
-      "epoch": 1.53,
-      "eval_loss": 4.368209362030029,
-      "eval_runtime": 514.3478,
-      "eval_samples_per_second": 0.9,
-      "eval_steps_per_second": 0.113,
       "eval_wer": 1.0,
       "step": 1000
     }
   ],
-  "max_steps": 19650,
   "num_train_epochs": 30,
-  "total_flos": 1.3443902730745056e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.7162471395881007,
+  "global_step": 1500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.57,
       "learning_rate": 0.005,
+      "loss": 15.1526,
       "step": 500
     },
     {
+      "epoch": 0.57,
+      "eval_loss": 6.8601579666137695,
+      "eval_runtime": 621.735,
+      "eval_samples_per_second": 0.745,
+      "eval_steps_per_second": 0.093,
       "eval_wer": 1.0,
       "step": 500
     },
     {
+      "epoch": 1.14,
       "learning_rate": 0.01,
+      "loss": 4.0534,
       "step": 1000
     },
     {
+      "epoch": 1.14,
+      "eval_loss": 4.218315601348877,
+      "eval_runtime": 609.7294,
+      "eval_samples_per_second": 0.759,
+      "eval_steps_per_second": 0.095,
       "eval_wer": 1.0,
       "step": 1000
+    },
+    {
+      "epoch": 1.72,
+      "learning_rate": 0.009801744647105471,
+      "loss": 3.7639,
+      "step": 1500
+    },
+    {
+      "epoch": 1.72,
+      "eval_loss": 4.085240364074707,
+      "eval_runtime": 611.9711,
+      "eval_samples_per_second": 0.757,
+      "eval_steps_per_second": 0.095,
+      "eval_wer": 1.0,
+      "step": 1500
     }
   ],
+  "max_steps": 26220,
   "num_train_epochs": 30,
+  "total_flos": 1.5013768433244768e+17,
   "trial_name": null,
   "trial_params": null
 }

{checkpoint-1000 → checkpoint-1500}/training_args.bin RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5090d2459c36fef37ff5438732de6290998bb02855c3984b89a4e1df893aa0c3
 size 2991

 version https://git-lfs.github.com/spec/v1
+oid sha256:7f9690abd7f068da2d83484f52436af56487dd6638bfa2a2708c15a9ed63f367
 size 2991

runs/Apr08_17-52-44_TUF/1649465633.5198846/events.out.tfevents.1649465633.TUF.21348.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:128e2744d16103304bc3b0f7a2c47574ebc703fc92ad80d2255e479b6a0d1d92
+size 4782

runs/Apr08_17-52-44_TUF/events.out.tfevents.1649465633.TUF.21348.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:628de3650cda02b8520dc61f6eb2fff3ab8e0e18cc9f219e21dc7f099eef1829
+size 6438

vocab.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"z": 0, "l": 1, "t": 2, "e": 3, "c": 4, "w": 5, "i": 6, "g": 7, "d": 8, "r": 9, "j": 10, "y": 12, "p": 13, "m": 14, "h": 15, "k": 16, "f": 17, "a": 18, "'": 19, "q": 20, "x": 21, "o": 22, "u": 23, "v": 24, "n": 25, "s": 26, "b": 27, "[UNK]": 28, "[PAD]": 29, "\|": 11}


1	+ {"y": 0, "j": 1, "z": 2, "'": 3, "b": 4, "g": 5, "v": 6, "r": 7, "a": 8, "p": 9, "e": 10, "q": 12, "c": 13, "m": 14, "u": 15, "f": 16, "i": 17, "k": 18, "d": 19, "x": 20, "w": 21, "t": 22, "n": 23, "s": 24, "l": 25, "h": 26, "o": 27, "[UNK]": 28, "[PAD]": 29, "\|": 11}