End of training

Browse files

Files changed (9) hide show

README.md +40 -40
all_results.json +9 -9
eval_results.json +5 -5
model.safetensors +1 -1
runs/Dec01_09-58-58_DESKTOP-SKBE9FB/events.out.tfevents.1733068739.DESKTOP-SKBE9FB.17936.0 +3 -0
runs/Dec01_09-58-58_DESKTOP-SKBE9FB/events.out.tfevents.1733068937.DESKTOP-SKBE9FB.17936.1 +3 -0
train_results.json +4 -4
trainer_state.json +189 -189
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -22,7 +22,7 @@ model-index:
     metrics:
     - name: Accuracy
       type: accuracy
-      value: 0.4782608695652174
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -32,8 +32,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.1496
-- Accuracy: 0.4783
 ## Model description
@@ -65,43 +65,43 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Accuracy |
-|:-------------:|:-----:|:----:|:---------------:|:--------:|
-| No log        | 0.86  | 3    | 7.9281          | 0.1087   |
-| No log        | 2.0   | 7    | 7.6171          | 0.1087   |
-| 7.7567        | 2.86  | 10   | 6.5765          | 0.1087   |
-| 7.7567        | 4.0   | 14   | 4.1867          | 0.1087   |
-| 7.7567        | 4.86  | 17   | 2.5570          | 0.1087   |
-| 4.0833        | 6.0   | 21   | 1.5007          | 0.4565   |
-| 4.0833        | 6.86  | 24   | 1.2815          | 0.4565   |
-| 4.0833        | 8.0   | 28   | 1.2261          | 0.4565   |
-| 1.3508        | 8.86  | 31   | 1.3183          | 0.3261   |
-| 1.3508        | 10.0  | 35   | 1.2317          | 0.4565   |
-| 1.3508        | 10.86 | 38   | 1.2423          | 0.4565   |
-| 1.2181        | 12.0  | 42   | 1.2674          | 0.4565   |
-| 1.2181        | 12.86 | 45   | 1.2563          | 0.4565   |
-| 1.2181        | 14.0  | 49   | 1.2323          | 0.4565   |
-| 1.2726        | 14.86 | 52   | 1.2210          | 0.4565   |
-| 1.2726        | 16.0  | 56   | 1.2288          | 0.4565   |
-| 1.2726        | 16.86 | 59   | 1.2345          | 0.4565   |
-| 1.2059        | 18.0  | 63   | 1.2165          | 0.4565   |
-| 1.2059        | 18.86 | 66   | 1.2282          | 0.4565   |
-| 1.2036        | 20.0  | 70   | 1.2004          | 0.4565   |
-| 1.2036        | 20.86 | 73   | 1.2020          | 0.4565   |
-| 1.2036        | 22.0  | 77   | 1.2049          | 0.4565   |
-| 1.1678        | 22.86 | 80   | 1.2028          | 0.4565   |
-| 1.1678        | 24.0  | 84   | 1.1945          | 0.4565   |
-| 1.1678        | 24.86 | 87   | 1.1906          | 0.4565   |
-| 1.1522        | 26.0  | 91   | 1.1865          | 0.4565   |
-| 1.1522        | 26.86 | 94   | 1.1812          | 0.4565   |
-| 1.1522        | 28.0  | 98   | 1.1760          | 0.4565   |
-| 1.1451        | 28.86 | 101  | 1.1714          | 0.4565   |
-| 1.1451        | 30.0  | 105  | 1.1713          | 0.4565   |
-| 1.1451        | 30.86 | 108  | 1.1578          | 0.4565   |
-| 1.1252        | 32.0  | 112  | 1.1496          | 0.4783   |
-| 1.1252        | 32.86 | 115  | 1.1471          | 0.4783   |
-| 1.1252        | 34.0  | 119  | 1.1465          | 0.4565   |
-| 1.126         | 34.29 | 120  | 1.1464          | 0.4565   |
 ### Framework versions

     metrics:
     - name: Accuracy
       type: accuracy
+      value: 0.6739130434782609
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [microsoft/swinv2-tiny-patch4-window8-256](https://huggingface.co/microsoft/swinv2-tiny-patch4-window8-256) on the imagefolder dataset.
 It achieves the following results on the evaluation set:
+- Loss: 144573075075950992480149202324684800.0000
+- Accuracy: 0.6739
 ## Model description
 ### Training results
+| Training Loss                             | Epoch | Step | Validation Loss                           | Accuracy |
+|:-----------------------------------------:|:-----:|:----:|:-----------------------------------------:|:--------:|
+| No log                                    | 0.86  | 3    | 144573075075950992480149202324684800.0000 | 0.4565   |
+| No log                                    | 2.0   | 7    | 144573075075950992480149202324684800.0000 | 0.4565   |
+| 141735823463928302525633790371430400.0000 | 2.86  | 10   | 144573075075950992480149202324684800.0000 | 0.4565   |
+| 141735823463928302525633790371430400.0000 | 4.0   | 14   | 144573075075950992480149202324684800.0000 | 0.4565   |
+| 141735823463928302525633790371430400.0000 | 4.86  | 17   | 144573075075950992480149202324684800.0000 | 0.4565   |
+| 148386187888478135085935683952443392.0000 | 6.0   | 21   | 144573075075950992480149202324684800.0000 | 0.4565   |
+| 148386187888478135085935683952443392.0000 | 6.86  | 24   | 144573075075950992480149202324684800.0000 | 0.4783   |
+| 148386187888478135085935683952443392.0000 | 8.0   | 28   | 144573075075950992480149202324684800.0000 | 0.4565   |
+| 166674646480500797315403436963921920.0000 | 8.86  | 31   | 144573075075950992480149202324684800.0000 | 0.4565   |
+| 166674646480500797315403436963921920.0000 | 10.0  | 35   | 144573075075950992480149202324684800.0000 | 0.4565   |
+| 166674646480500797315403436963921920.0000 | 10.86 | 38   | 144573075075950992480149202324684800.0000 | 0.4565   |
+| 123031678471642034838718731348082688.0000 | 12.0  | 42   | 144573075075950992480149202324684800.0000 | 0.5217   |
+| 123031678471642034838718731348082688.0000 | 12.86 | 45   | 144573075075950992480149202324684800.0000 | 0.6087   |
+| 123031678471642034838718731348082688.0000 | 14.0  | 49   | 144573075075950992480149202324684800.0000 | 0.5435   |
+| 160439944687765812243898756589682688.0000 | 14.86 | 52   | 144573075075950992480149202324684800.0000 | 0.6522   |
+| 160439944687765812243898756589682688.0000 | 16.0  | 56   | 144573075075950992480149202324684800.0000 | 0.5870   |
+| 160439944687765812243898756589682688.0000 | 16.86 | 59   | 144573075075950992480149202324684800.0000 | 0.5652   |
+| 151295747083019479456202288017702912.0000 | 18.0  | 63   | 144573075075950992480149202324684800.0000 | 0.6087   |
+| 151295747083019479456202288017702912.0000 | 18.86 | 66   | 144573075075950992480149202324684800.0000 | 0.6304   |
+| 142151454404478133240649521934893056.0000 | 20.0  | 70   | 144573075075950992480149202324684800.0000 | 0.6522   |
+| 142151454404478133240649521934893056.0000 | 20.86 | 73   | 144573075075950992480149202324684800.0000 | 0.6739   |
+| 142151454404478133240649521934893056.0000 | 22.0  | 77   | 144573075075950992480149202324684800.0000 | 0.6739   |
+| 137163724661555136131785556085440512.0000 | 22.86 | 80   | 144573075075950992480149202324684800.0000 | 0.6304   |
+| 137163724661555136131785556085440512.0000 | 24.0  | 84   | 144573075075950992480149202324684800.0000 | 0.6304   |
+| 137163724661555136131785556085440512.0000 | 24.86 | 87   | 144573075075950992480149202324684800.0000 | 0.6739   |
+| 137163692970290119358004074442129408.0000 | 26.0  | 91   | 144573075075950992480149202324684800.0000 | 0.6304   |
+| 137163692970290119358004074442129408.0000 | 26.86 | 94   | 144573075075950992480149202324684800.0000 | 0.6522   |
+| 137163692970290119358004074442129408.0000 | 28.0  | 98   | 144573075075950992480149202324684800.0000 | 0.6522   |
+| 155452183253577798361253309096919040.0000 | 28.86 | 101  | 144573075075950992480149202324684800.0000 | 0.6739   |
+| 155452183253577798361253309096919040.0000 | 30.0  | 105  | 144573075075950992480149202324684800.0000 | 0.6522   |
+| 155452183253577798361253309096919040.0000 | 30.86 | 108  | 144573075075950992480149202324684800.0000 | 0.6522   |
+| 139657557841751617912436057366855680.0000 | 32.0  | 112  | 144573075075950992480149202324684800.0000 | 0.6522   |
+| 139657557841751617912436057366855680.0000 | 32.86 | 115  | 144573075075950992480149202324684800.0000 | 0.6522   |
+| 139657557841751617912436057366855680.0000 | 34.0  | 119  | 144573075075950992480149202324684800.0000 | 0.6304   |
+| 141735791772663285751852308728119296.0000 | 34.29 | 120  | 144573075075950992480149202324684800.0000 | 0.6304   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
     "epoch": 34.29,
-    "eval_accuracy": 0.4782608695652174,
-    "eval_loss": 1.1496002674102783,
-    "eval_runtime": 0.7277,
-    "eval_samples_per_second": 63.215,
-    "eval_steps_per_second": 4.123,
-    "train_loss": 1.9839425007502238,
-    "train_runtime": 191.8806,
-    "train_samples_per_second": 44.403,
-    "train_steps_per_second": 0.625
 }

 {
     "epoch": 34.29,
+    "eval_accuracy": 0.6739130434782609,
+    "eval_loss": 1.44573075075951e+35,
+    "eval_runtime": 0.8642,
+    "eval_samples_per_second": 53.228,
+    "eval_steps_per_second": 3.471,
+    "train_loss": 1.4540736941497088e+35,
+    "train_runtime": 197.0327,
+    "train_samples_per_second": 43.242,
+    "train_steps_per_second": 0.609
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 34.29,
-    "eval_accuracy": 0.4782608695652174,
-    "eval_loss": 1.1496002674102783,
-    "eval_runtime": 0.7277,
-    "eval_samples_per_second": 63.215,
-    "eval_steps_per_second": 4.123
 }

 {
     "epoch": 34.29,
+    "eval_accuracy": 0.6739130434782609,
+    "eval_loss": 1.44573075075951e+35,
+    "eval_runtime": 0.8642,
+    "eval_samples_per_second": 53.228,
+    "eval_steps_per_second": 3.471
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2bbafaf79288bb55851f0a6aa95877e24c2692f513bdc340d3dcf3a0a78aa4a4
 size 110356296

 version https://git-lfs.github.com/spec/v1
+oid sha256:e471d44031bbcf5462fef91f07ede070059b4b776793bf0d0d1db1d64cf73d88
 size 110356296

runs/Dec01_09-58-58_DESKTOP-SKBE9FB/events.out.tfevents.1733068739.DESKTOP-SKBE9FB.17936.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f068976e17d6c442b50121b864bfa65d409a0aa7e46b7298dd2e33891ec33de6
+size 18103

runs/Dec01_09-58-58_DESKTOP-SKBE9FB/events.out.tfevents.1733068937.DESKTOP-SKBE9FB.17936.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9f541ee23fd7544cc27591d005065c9c8b687460c2c3ff4a66cc59a43868d9c1
+size 405

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 34.29,
-    "train_loss": 1.9839425007502238,
-    "train_runtime": 191.8806,
-    "train_samples_per_second": 44.403,
-    "train_steps_per_second": 0.625
 }

 {
     "epoch": 34.29,
+    "train_loss": 1.4540736941497088e+35,
+    "train_runtime": 197.0327,
+    "train_samples_per_second": 43.242,
+    "train_steps_per_second": 0.609
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.4782608695652174,
-  "best_model_checkpoint": "swinv2-tiny-patch4-window8-256-RD-aptos19\\checkpoint-112",
   "epoch": 34.285714285714285,
   "eval_steps": 500,
   "global_step": 120,
@@ -10,399 +10,399 @@
   "log_history": [
     {
       "epoch": 0.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 7.928128242492676,
-      "eval_runtime": 0.9501,
-      "eval_samples_per_second": 48.414,
-      "eval_steps_per_second": 3.157,
       "step": 3
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 7.61707067489624,
-      "eval_runtime": 0.7517,
-      "eval_samples_per_second": 61.197,
-      "eval_steps_per_second": 3.991,
       "step": 7
     },
     {
       "epoch": 2.86,
       "learning_rate": 0.000125,
-      "loss": 7.7567,
       "step": 10
     },
     {
       "epoch": 2.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 6.576500415802002,
-      "eval_runtime": 0.7152,
-      "eval_samples_per_second": 64.321,
-      "eval_steps_per_second": 4.195,
       "step": 10
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 4.186661243438721,
-      "eval_runtime": 0.7112,
-      "eval_samples_per_second": 64.683,
-      "eval_steps_per_second": 4.218,
       "step": 14
     },
     {
       "epoch": 4.86,
-      "eval_accuracy": 0.10869565217391304,
-      "eval_loss": 2.5570228099823,
-      "eval_runtime": 0.7112,
-      "eval_samples_per_second": 64.683,
-      "eval_steps_per_second": 4.218,
       "step": 17
     },
     {
       "epoch": 5.71,
       "learning_rate": 0.0001388888888888889,
-      "loss": 4.0833,
       "step": 20
     },
     {
       "epoch": 6.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.5007256269454956,
-      "eval_runtime": 0.7232,
-      "eval_samples_per_second": 63.609,
-      "eval_steps_per_second": 4.148,
       "step": 21
     },
     {
       "epoch": 6.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.281486988067627,
-      "eval_runtime": 0.7177,
-      "eval_samples_per_second": 64.096,
-      "eval_steps_per_second": 4.18,
       "step": 24
     },
     {
       "epoch": 8.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2261085510253906,
-      "eval_runtime": 0.7117,
-      "eval_samples_per_second": 64.637,
-      "eval_steps_per_second": 4.215,
       "step": 28
     },
     {
       "epoch": 8.57,
       "learning_rate": 0.000125,
-      "loss": 1.3508,
       "step": 30
     },
     {
       "epoch": 8.86,
-      "eval_accuracy": 0.32608695652173914,
-      "eval_loss": 1.3183497190475464,
-      "eval_runtime": 0.7152,
-      "eval_samples_per_second": 64.321,
-      "eval_steps_per_second": 4.195,
       "step": 31
     },
     {
       "epoch": 10.0,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2316819429397583,
-      "eval_runtime": 0.7077,
-      "eval_samples_per_second": 65.003,
-      "eval_steps_per_second": 4.239,
       "step": 35
     },
     {
       "epoch": 10.86,
       "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2423183917999268,
-      "eval_runtime": 0.7252,
-      "eval_samples_per_second": 63.432,
-      "eval_steps_per_second": 4.137,
       "step": 38
     },
     {
       "epoch": 11.43,
       "learning_rate": 0.00011111111111111109,
-      "loss": 1.2181,
       "step": 40
     },
     {
       "epoch": 12.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2673752307891846,
-      "eval_runtime": 0.7102,
-      "eval_samples_per_second": 64.773,
-      "eval_steps_per_second": 4.224,
       "step": 42
     },
     {
       "epoch": 12.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2562559843063354,
-      "eval_runtime": 0.7212,
-      "eval_samples_per_second": 63.785,
-      "eval_steps_per_second": 4.16,
       "step": 45
     },
     {
       "epoch": 14.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2322901487350464,
-      "eval_runtime": 0.7672,
-      "eval_samples_per_second": 59.961,
-      "eval_steps_per_second": 3.91,
       "step": 49
     },
     {
       "epoch": 14.29,
       "learning_rate": 9.722222222222222e-05,
-      "loss": 1.2726,
       "step": 50
     },
     {
       "epoch": 14.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2209585905075073,
-      "eval_runtime": 0.7922,
-      "eval_samples_per_second": 58.068,
-      "eval_steps_per_second": 3.787,
       "step": 52
     },
     {
       "epoch": 16.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2287598848342896,
-      "eval_runtime": 0.7472,
-      "eval_samples_per_second": 61.566,
-      "eval_steps_per_second": 4.015,
       "step": 56
     },
     {
       "epoch": 16.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2344818115234375,
-      "eval_runtime": 0.7232,
-      "eval_samples_per_second": 63.609,
-      "eval_steps_per_second": 4.148,
       "step": 59
     },
     {
       "epoch": 17.14,
       "learning_rate": 8.333333333333333e-05,
-      "loss": 1.2059,
       "step": 60
     },
     {
       "epoch": 18.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2165099382400513,
-      "eval_runtime": 0.8322,
-      "eval_samples_per_second": 55.276,
-      "eval_steps_per_second": 3.605,
       "step": 63
     },
     {
       "epoch": 18.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2281591892242432,
-      "eval_runtime": 0.7042,
-      "eval_samples_per_second": 65.326,
-      "eval_steps_per_second": 4.26,
       "step": 66
     },
     {
       "epoch": 20.0,
       "learning_rate": 6.944444444444444e-05,
-      "loss": 1.2036,
       "step": 70
     },
     {
       "epoch": 20.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.200390338897705,
-      "eval_runtime": 0.8892,
-      "eval_samples_per_second": 51.731,
-      "eval_steps_per_second": 3.374,
       "step": 70
     },
     {
       "epoch": 20.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2020065784454346,
-      "eval_runtime": 0.7291,
-      "eval_samples_per_second": 63.094,
-      "eval_steps_per_second": 4.115,
       "step": 73
     },
     {
       "epoch": 22.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.204913854598999,
-      "eval_runtime": 0.7177,
-      "eval_samples_per_second": 64.096,
-      "eval_steps_per_second": 4.18,
       "step": 77
     },
     {
       "epoch": 22.86,
       "learning_rate": 5.5555555555555545e-05,
-      "loss": 1.1678,
       "step": 80
     },
     {
       "epoch": 22.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.2027997970581055,
-      "eval_runtime": 0.6892,
-      "eval_samples_per_second": 66.748,
-      "eval_steps_per_second": 4.353,
       "step": 80
     },
     {
       "epoch": 24.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.1945043802261353,
-      "eval_runtime": 0.7222,
-      "eval_samples_per_second": 63.698,
-      "eval_steps_per_second": 4.154,
       "step": 84
     },
     {
       "epoch": 24.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.1905990839004517,
-      "eval_runtime": 0.7337,
-      "eval_samples_per_second": 62.698,
-      "eval_steps_per_second": 4.089,
       "step": 87
     },
     {
       "epoch": 25.71,
       "learning_rate": 4.1666666666666665e-05,
-      "loss": 1.1522,
       "step": 90
     },
     {
       "epoch": 26.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.186482310295105,
-      "eval_runtime": 0.7167,
-      "eval_samples_per_second": 64.184,
-      "eval_steps_per_second": 4.186,
       "step": 91
     },
     {
       "epoch": 26.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.1811820268630981,
-      "eval_runtime": 0.7077,
-      "eval_samples_per_second": 65.002,
-      "eval_steps_per_second": 4.239,
       "step": 94
     },
     {
       "epoch": 28.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.176020860671997,
-      "eval_runtime": 0.7072,
-      "eval_samples_per_second": 65.049,
-      "eval_steps_per_second": 4.242,
       "step": 98
     },
     {
       "epoch": 28.57,
       "learning_rate": 2.7777777777777772e-05,
-      "loss": 1.1451,
       "step": 100
     },
     {
       "epoch": 28.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.1714065074920654,
-      "eval_runtime": 0.7102,
-      "eval_samples_per_second": 64.774,
-      "eval_steps_per_second": 4.224,
       "step": 101
     },
     {
       "epoch": 30.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.1712819337844849,
-      "eval_runtime": 0.7352,
-      "eval_samples_per_second": 62.569,
-      "eval_steps_per_second": 4.081,
       "step": 105
     },
     {
       "epoch": 30.86,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.157778263092041,
-      "eval_runtime": 0.7122,
-      "eval_samples_per_second": 64.591,
-      "eval_steps_per_second": 4.212,
       "step": 108
     },
     {
       "epoch": 31.43,
       "learning_rate": 1.3888888888888886e-05,
-      "loss": 1.1252,
       "step": 110
     },
     {
       "epoch": 32.0,
-      "eval_accuracy": 0.4782608695652174,
-      "eval_loss": 1.1496002674102783,
-      "eval_runtime": 0.7732,
-      "eval_samples_per_second": 59.494,
-      "eval_steps_per_second": 3.88,
       "step": 112
     },
     {
       "epoch": 32.86,
-      "eval_accuracy": 0.4782608695652174,
-      "eval_loss": 1.147078275680542,
-      "eval_runtime": 0.7077,
-      "eval_samples_per_second": 65.003,
-      "eval_steps_per_second": 4.239,
       "step": 115
     },
     {
       "epoch": 34.0,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.1464524269104004,
-      "eval_runtime": 0.7257,
-      "eval_samples_per_second": 63.389,
-      "eval_steps_per_second": 4.134,
       "step": 119
     },
     {
       "epoch": 34.29,
       "learning_rate": 0.0,
-      "loss": 1.126,
       "step": 120
     },
     {
       "epoch": 34.29,
-      "eval_accuracy": 0.45652173913043476,
-      "eval_loss": 1.146438479423523,
-      "eval_runtime": 0.7242,
-      "eval_samples_per_second": 63.52,
-      "eval_steps_per_second": 4.143,
       "step": 120
     },
     {
       "epoch": 34.29,
       "step": 120,
       "total_flos": 2.3770905934823424e+17,
-      "train_loss": 1.9839425007502238,
-      "train_runtime": 191.8806,
-      "train_samples_per_second": 44.403,
-      "train_steps_per_second": 0.625
     }
   ],
   "logging_steps": 10,

 {
+  "best_metric": 0.6739130434782609,
+  "best_model_checkpoint": "swinv2-tiny-patch4-window8-256-RD-aptos19\\checkpoint-73",
   "epoch": 34.285714285714285,
   "eval_steps": 500,
   "global_step": 120,
   "log_history": [
     {
       "epoch": 0.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.8177,
+      "eval_samples_per_second": 56.255,
+      "eval_steps_per_second": 3.669,
       "step": 3
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.86,
+      "eval_samples_per_second": 53.49,
+      "eval_steps_per_second": 3.488,
       "step": 7
     },
     {
       "epoch": 2.86,
       "learning_rate": 0.000125,
+      "loss": 1.417358234639283e+35,
       "step": 10
     },
     {
       "epoch": 2.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7417,
+      "eval_samples_per_second": 62.021,
+      "eval_steps_per_second": 4.045,
       "step": 10
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.9387,
+      "eval_samples_per_second": 49.003,
+      "eval_steps_per_second": 3.196,
       "step": 14
     },
     {
       "epoch": 4.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7142,
+      "eval_samples_per_second": 64.411,
+      "eval_steps_per_second": 4.201,
       "step": 17
     },
     {
       "epoch": 5.71,
       "learning_rate": 0.0001388888888888889,
+      "loss": 1.4838618788847814e+35,
       "step": 20
     },
     {
       "epoch": 6.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7437,
+      "eval_samples_per_second": 61.855,
+      "eval_steps_per_second": 4.034,
       "step": 21
     },
     {
       "epoch": 6.86,
+      "eval_accuracy": 0.4782608695652174,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7257,
+      "eval_samples_per_second": 63.39,
+      "eval_steps_per_second": 4.134,
       "step": 24
     },
     {
       "epoch": 8.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.8812,
+      "eval_samples_per_second": 52.201,
+      "eval_steps_per_second": 3.404,
       "step": 28
     },
     {
       "epoch": 8.57,
       "learning_rate": 0.000125,
+      "loss": 1.666746464805008e+35,
       "step": 30
     },
     {
       "epoch": 8.86,
+      "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7237,
+      "eval_samples_per_second": 63.565,
+      "eval_steps_per_second": 4.146,
       "step": 31
     },
     {
       "epoch": 10.0,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7237,
+      "eval_samples_per_second": 63.565,
+      "eval_steps_per_second": 4.146,
       "step": 35
     },
     {
       "epoch": 10.86,
       "eval_accuracy": 0.45652173913043476,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7807,
+      "eval_samples_per_second": 58.923,
+      "eval_steps_per_second": 3.843,
       "step": 38
     },
     {
       "epoch": 11.43,
       "learning_rate": 0.00011111111111111109,
+      "loss": 1.2303167847164203e+35,
       "step": 40
     },
     {
       "epoch": 12.0,
+      "eval_accuracy": 0.5217391304347826,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7182,
+      "eval_samples_per_second": 64.053,
+      "eval_steps_per_second": 4.177,
       "step": 42
     },
     {
       "epoch": 12.86,
+      "eval_accuracy": 0.6086956521739131,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7442,
+      "eval_samples_per_second": 61.814,
+      "eval_steps_per_second": 4.031,
       "step": 45
     },
     {
       "epoch": 14.0,
+      "eval_accuracy": 0.5434782608695652,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7632,
+      "eval_samples_per_second": 60.275,
+      "eval_steps_per_second": 3.931,
       "step": 49
     },
     {
       "epoch": 14.29,
       "learning_rate": 9.722222222222222e-05,
+      "loss": 1.6043994468776581e+35,
       "step": 50
     },
     {
       "epoch": 14.86,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.8082,
+      "eval_samples_per_second": 56.918,
+      "eval_steps_per_second": 3.712,
       "step": 52
     },
     {
       "epoch": 16.0,
+      "eval_accuracy": 0.5869565217391305,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7607,
+      "eval_samples_per_second": 60.472,
+      "eval_steps_per_second": 3.944,
       "step": 56
     },
     {
       "epoch": 16.86,
+      "eval_accuracy": 0.5652173913043478,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.8022,
+      "eval_samples_per_second": 57.343,
+      "eval_steps_per_second": 3.74,
       "step": 59
     },
     {
       "epoch": 17.14,
       "learning_rate": 8.333333333333333e-05,
+      "loss": 1.5129574708301948e+35,
       "step": 60
     },
     {
       "epoch": 18.0,
+      "eval_accuracy": 0.6086956521739131,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7327,
+      "eval_samples_per_second": 62.784,
+      "eval_steps_per_second": 4.095,
       "step": 63
     },
     {
       "epoch": 18.86,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7832,
+      "eval_samples_per_second": 58.734,
+      "eval_steps_per_second": 3.83,
       "step": 66
     },
     {
       "epoch": 20.0,
       "learning_rate": 6.944444444444444e-05,
+      "loss": 1.4215145440447813e+35,
       "step": 70
     },
     {
       "epoch": 20.0,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7967,
+      "eval_samples_per_second": 57.739,
+      "eval_steps_per_second": 3.766,
       "step": 70
     },
     {
       "epoch": 20.86,
+      "eval_accuracy": 0.6739130434782609,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7772,
+      "eval_samples_per_second": 59.189,
+      "eval_steps_per_second": 3.86,
       "step": 73
     },
     {
       "epoch": 22.0,
+      "eval_accuracy": 0.6739130434782609,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7242,
+      "eval_samples_per_second": 63.522,
+      "eval_steps_per_second": 4.143,
       "step": 77
     },
     {
       "epoch": 22.86,
       "learning_rate": 5.5555555555555545e-05,
+      "loss": 1.3716372466155514e+35,
       "step": 80
     },
     {
       "epoch": 22.86,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7907,
+      "eval_samples_per_second": 58.177,
+      "eval_steps_per_second": 3.794,
       "step": 80
     },
     {
       "epoch": 24.0,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7842,
+      "eval_samples_per_second": 58.659,
+      "eval_steps_per_second": 3.826,
       "step": 84
     },
     {
       "epoch": 24.86,
+      "eval_accuracy": 0.6739130434782609,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7632,
+      "eval_samples_per_second": 60.273,
+      "eval_steps_per_second": 3.931,
       "step": 87
     },
     {
       "epoch": 25.71,
       "learning_rate": 4.1666666666666665e-05,
+      "loss": 1.3716369297029012e+35,
       "step": 90
     },
     {
       "epoch": 26.0,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.8202,
+      "eval_samples_per_second": 56.084,
+      "eval_steps_per_second": 3.658,
       "step": 91
     },
     {
       "epoch": 26.86,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7622,
+      "eval_samples_per_second": 60.352,
+      "eval_steps_per_second": 3.936,
       "step": 94
     },
     {
       "epoch": 28.0,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7687,
+      "eval_samples_per_second": 59.842,
+      "eval_steps_per_second": 3.903,
       "step": 98
     },
     {
       "epoch": 28.57,
       "learning_rate": 2.7777777777777772e-05,
+      "loss": 1.554521832535778e+35,
       "step": 100
     },
     {
       "epoch": 28.86,
+      "eval_accuracy": 0.6739130434782609,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7632,
+      "eval_samples_per_second": 60.273,
+      "eval_steps_per_second": 3.931,
       "step": 101
     },
     {
       "epoch": 30.0,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.8737,
+      "eval_samples_per_second": 52.649,
+      "eval_steps_per_second": 3.434,
       "step": 105
     },
     {
       "epoch": 30.86,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7987,
+      "eval_samples_per_second": 57.595,
+      "eval_steps_per_second": 3.756,
       "step": 108
     },
     {
       "epoch": 31.43,
       "learning_rate": 1.3888888888888886e-05,
+      "loss": 1.3965755784175162e+35,
       "step": 110
     },
     {
       "epoch": 32.0,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7802,
+      "eval_samples_per_second": 58.961,
+      "eval_steps_per_second": 3.845,
       "step": 112
     },
     {
       "epoch": 32.86,
+      "eval_accuracy": 0.6521739130434783,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7962,
+      "eval_samples_per_second": 57.776,
+      "eval_steps_per_second": 3.768,
       "step": 115
     },
     {
       "epoch": 34.0,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7867,
+      "eval_samples_per_second": 58.473,
+      "eval_steps_per_second": 3.813,
       "step": 119
     },
     {
       "epoch": 34.29,
       "learning_rate": 0.0,
+      "loss": 1.4173579177266329e+35,
       "step": 120
     },
     {
       "epoch": 34.29,
+      "eval_accuracy": 0.6304347826086957,
+      "eval_loss": 1.44573075075951e+35,
+      "eval_runtime": 0.7957,
+      "eval_samples_per_second": 57.812,
+      "eval_steps_per_second": 3.77,
       "step": 120
     },
     {
       "epoch": 34.29,
       "step": 120,
       "total_flos": 2.3770905934823424e+17,
+      "train_loss": 1.4540736941497088e+35,
+      "train_runtime": 197.0327,
+      "train_samples_per_second": 43.242,
+      "train_steps_per_second": 0.609
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e62b78acd952e808e64b4871e09ec24dd21c511e1bf3135487647306a65d4eb2
 size 4792

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd0d2925bc5abc0be166198b11961fdb84089f968cd84b626f2aed0118c8b2b8
 size 4792