End of training

Browse files

Files changed (6) hide show

all_results.json +16 -0
eval_results.json +11 -0
runs/Sep19_15-39-26_patrick-general-gpu/events.out.tfevents.1632065982.patrick-general-gpu.509410.0 +2 -2
runs/Sep19_15-39-26_patrick-general-gpu/events.out.tfevents.1632066425.patrick-general-gpu.509410.2 +3 -0
train_results.json +8 -0
trainer_state.json +76 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,16 @@

+{
+    "epoch": 3.0,
+    "eval_combined_score": 0.8237743551253471,
+    "eval_loss": 0.789396345615387,
+    "eval_pearson": 0.825608960477892,
+    "eval_runtime": 11.1522,
+    "eval_samples": 1500,
+    "eval_samples_per_second": 134.503,
+    "eval_spearmanr": 0.8219397497728022,
+    "eval_steps_per_second": 16.858,
+    "train_loss": 0.9085038361725983,
+    "train_runtime": 428.8873,
+    "train_samples": 5749,
+    "train_samples_per_second": 40.213,
+    "train_steps_per_second": 2.518
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+    "epoch": 3.0,
+    "eval_combined_score": 0.8237743551253471,
+    "eval_loss": 0.789396345615387,
+    "eval_pearson": 0.825608960477892,
+    "eval_runtime": 11.1522,
+    "eval_samples": 1500,
+    "eval_samples_per_second": 134.503,
+    "eval_spearmanr": 0.8219397497728022,
+    "eval_steps_per_second": 16.858
+}

runs/Sep19_15-39-26_patrick-general-gpu/events.out.tfevents.1632065982.patrick-general-gpu.509410.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a6f491d2df56edb97594ba0071576f5b4ae2cbb6f900c10b4e13a2f78adaa57c
-size 4896

 version https://git-lfs.github.com/spec/v1
+oid sha256:0638a4ef870de82ad10154791eb11503693287e26b81a3a64e933dd40d661d06
+size 5250

runs/Sep19_15-39-26_patrick-general-gpu/events.out.tfevents.1632066425.patrick-general-gpu.509410.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cf085b82b5e253c3e88f872da1184e011bfe117bc0eebabd71677d6e3ffbdaeb
+size 473

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 3.0,
+    "train_loss": 0.9085038361725983,
+    "train_runtime": 428.8873,
+    "train_samples": 5749,
+    "train_samples_per_second": 40.213,
+    "train_steps_per_second": 2.518
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,76 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "global_step": 1080,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 1.5473,
+      "step": 360
+    },
+    {
+      "epoch": 1.0,
+      "eval_combined_score": 0.8120419393156919,
+      "eval_loss": 0.7750807404518127,
+      "eval_pearson": 0.8115414805311705,
+      "eval_runtime": 10.8984,
+      "eval_samples_per_second": 137.634,
+      "eval_spearmanr": 0.8125423981002132,
+      "eval_steps_per_second": 17.25,
+      "step": 360
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 0.6954,
+      "step": 720
+    },
+    {
+      "epoch": 2.0,
+      "eval_combined_score": 0.8145095741908042,
+      "eval_loss": 0.8717353343963623,
+      "eval_pearson": 0.8159860577723805,
+      "eval_runtime": 10.909,
+      "eval_samples_per_second": 137.502,
+      "eval_spearmanr": 0.8130330906092277,
+      "eval_steps_per_second": 17.234,
+      "step": 720
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 0.0,
+      "loss": 0.4828,
+      "step": 1080
+    },
+    {
+      "epoch": 3.0,
+      "eval_combined_score": 0.8237743551253471,
+      "eval_loss": 0.789396345615387,
+      "eval_pearson": 0.825608960477892,
+      "eval_runtime": 10.9264,
+      "eval_samples_per_second": 137.282,
+      "eval_spearmanr": 0.8219397497728022,
+      "eval_steps_per_second": 17.206,
+      "step": 1080
+    },
+    {
+      "epoch": 3.0,
+      "step": 1080,
+      "total_flos": 3067148834731008.0,
+      "train_loss": 0.9085038361725983,
+      "train_runtime": 428.8873,
+      "train_samples_per_second": 40.213,
+      "train_steps_per_second": 2.518
+    }
+  ],
+  "max_steps": 1080,
+  "num_train_epochs": 3,
+  "total_flos": 3067148834731008.0,
+  "trial_name": null,
+  "trial_params": null
+}