AleBurzio
/

long-t5-base-govreport

text2text-generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

AleBurzio commited on Mar 12, 2023

Commit

25e596b

•

1 Parent(s): c846433

End of training

Files changed (4) hide show

all_results.json +15 -9
eval_results.json +10 -9
train_results.json +8 -0
trainer_state.json +10 -1

all_results.json CHANGED Viewed

@@ -1,12 +1,18 @@
 {
-    "eval_gen_len": 797.712,
-    "eval_loss": 1.8528449535369873,
-    "eval_rouge1": 41.5534,
-    "eval_rouge2": 12.208,
-    "eval_rougeL": 18.6433,
-    "eval_rougeLsum": 37.1885,
-    "eval_runtime": 880.2631,
     "eval_samples": 250,
-    "eval_samples_per_second": 0.284,
-    "eval_steps_per_second": 0.284
 }

 {
+    "epoch": 13.28,
+    "eval_gen_len": 787.34,
+    "eval_loss": 1.5448322296142578,
+    "eval_rouge1": 57.2303,
+    "eval_rouge2": 24.9705,
+    "eval_rougeL": 26.8081,
+    "eval_rougeLsum": 54.2747,
+    "eval_runtime": 853.5909,
     "eval_samples": 250,
+    "eval_samples_per_second": 0.293,
+    "eval_steps_per_second": 0.293,
+    "train_loss": 0.0,
+    "train_runtime": 2.117,
+    "train_samples": 8200,
+    "train_samples_per_second": 96836.906,
+    "train_steps_per_second": 247.997
 }

eval_results.json CHANGED Viewed

@@ -1,12 +1,13 @@
 {
-    "eval_gen_len": 797.712,
-    "eval_loss": 1.8528449535369873,
-    "eval_rouge1": 41.5534,
-    "eval_rouge2": 12.208,
-    "eval_rougeL": 18.6433,
-    "eval_rougeLsum": 37.1885,
-    "eval_runtime": 880.2631,
     "eval_samples": 250,
-    "eval_samples_per_second": 0.284,
-    "eval_steps_per_second": 0.284
 }

 {
+    "epoch": 13.28,
+    "eval_gen_len": 787.34,
+    "eval_loss": 1.5448322296142578,
+    "eval_rouge1": 57.2303,
+    "eval_rouge2": 24.9705,
+    "eval_rougeL": 26.8081,
+    "eval_rougeLsum": 54.2747,
+    "eval_runtime": 853.5909,
     "eval_samples": 250,
+    "eval_samples_per_second": 0.293,
+    "eval_steps_per_second": 0.293
 }

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 13.28,
+    "train_loss": 0.0,
+    "train_runtime": 2.117,
+    "train_samples": 8200,
+    "train_samples_per_second": 96836.906,
+    "train_steps_per_second": 247.997
+}

trainer_state.json CHANGED Viewed

@@ -5548,9 +5548,18 @@
       "eval_samples_per_second": 0.287,
       "eval_steps_per_second": 0.287,
       "step": 850
     }
   ],
-  "max_steps": 1600,
   "num_train_epochs": 25,
   "total_flos": 1.193214367236096e+18,
   "trial_name": null,

       "eval_samples_per_second": 0.287,
       "eval_steps_per_second": 0.287,
       "step": 850
+    },
+    {
+      "epoch": 13.28,
+      "step": 850,
+      "total_flos": 1.193214367236096e+18,
+      "train_loss": 0.0,
+      "train_runtime": 2.117,
+      "train_samples_per_second": 96836.906,
+      "train_steps_per_second": 247.997
     }
   ],
+  "max_steps": 525,
   "num_train_epochs": 25,
   "total_flos": 1.193214367236096e+18,
   "trial_name": null,