wonnie0413

Browse files

Files changed (7) hide show

README.md +4 -4
all_results.json +4 -4
model.safetensors +1 -1
runs/Jul04_07-40-55_ac97485dd4af/events.out.tfevents.1720078860.ac97485dd4af.1451.0 +3 -0
train_results.json +4 -4
trainer_state.json +68 -68
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -19,8 +19,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the beans dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0123
-- Accuracy: 1.0
 ## Model description
@@ -52,8 +52,8 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
-| 0.0529        | 1.5385 | 100  | 0.0920          | 0.9774   |
-| 0.0601        | 3.0769 | 200  | 0.0123          | 1.0      |
 ### Framework versions

 This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the beans dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.1220
+- Accuracy: 0.9699
 ## Model description
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy |
 |:-------------:|:------:|:----:|:---------------:|:--------:|
+| 0.0631        | 1.5385 | 100  | 0.0711          | 0.9850   |
+| 0.0409        | 3.0769 | 200  | 0.1220          | 0.9699   |
 ### Framework versions

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 4.0,
     "total_flos": 3.205097416476426e+17,
-    "train_loss": 0.11325625943449827,
-    "train_runtime": 101.5296,
-    "train_samples_per_second": 40.737,
-    "train_steps_per_second": 2.561
 }

 {
     "epoch": 4.0,
     "total_flos": 3.205097416476426e+17,
+    "train_loss": 0.12752302890786757,
+    "train_runtime": 91.8806,
+    "train_samples_per_second": 45.015,
+    "train_steps_per_second": 2.83
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9c25b36af2b6e89a6dae111ec02626db0cf7e88d25bd7b496674e4c198695a11
 size 343227052

 version https://git-lfs.github.com/spec/v1
+oid sha256:3bf63b25eafe2060ed78e3462d9b2afd82248b5a12bd3251df88a0e1652b0699
 size 343227052

runs/Jul04_07-40-55_ac97485dd4af/events.out.tfevents.1720078860.ac97485dd4af.1451.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:39b9f1f9c8a5c36c8cb24a18177f9554b17789cc37b59bd3fb2bc7312a15c462
+size 11323

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 4.0,
     "total_flos": 3.205097416476426e+17,
-    "train_loss": 0.11325625943449827,
-    "train_runtime": 101.5296,
-    "train_samples_per_second": 40.737,
-    "train_steps_per_second": 2.561
 }

 {
     "epoch": 4.0,
     "total_flos": 3.205097416476426e+17,
+    "train_loss": 0.12752302890786757,
+    "train_runtime": 91.8806,
+    "train_samples_per_second": 45.015,
+    "train_steps_per_second": 2.83
 }

trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.012265427969396114,
-  "best_model_checkpoint": "./vit-base-beans-demo-v5/checkpoint-200",
   "epoch": 4.0,
   "eval_steps": 100,
   "global_step": 260,
@@ -10,212 +10,212 @@
   "log_history": [
     {
       "epoch": 0.15384615384615385,
-      "grad_norm": 1.34767746925354,
       "learning_rate": 0.00019230769230769233,
-      "loss": 0.8154,
       "step": 10
     },
     {
       "epoch": 0.3076923076923077,
-      "grad_norm": 2.5922181606292725,
       "learning_rate": 0.00018461538461538463,
-      "loss": 0.356,
       "step": 20
     },
     {
       "epoch": 0.46153846153846156,
-      "grad_norm": 1.924363374710083,
       "learning_rate": 0.00017692307692307693,
-      "loss": 0.2338,
       "step": 30
     },
     {
       "epoch": 0.6153846153846154,
-      "grad_norm": 1.5984817743301392,
       "learning_rate": 0.00016923076923076923,
-      "loss": 0.2239,
       "step": 40
     },
     {
       "epoch": 0.7692307692307693,
-      "grad_norm": 0.47597455978393555,
       "learning_rate": 0.00016153846153846155,
-      "loss": 0.148,
       "step": 50
     },
     {
       "epoch": 0.9230769230769231,
-      "grad_norm": 4.586166858673096,
       "learning_rate": 0.00015384615384615385,
-      "loss": 0.2055,
       "step": 60
     },
     {
       "epoch": 1.0769230769230769,
-      "grad_norm": 0.215128555893898,
       "learning_rate": 0.00014615384615384615,
-      "loss": 0.0955,
       "step": 70
     },
     {
       "epoch": 1.2307692307692308,
-      "grad_norm": 0.1345285028219223,
       "learning_rate": 0.00013846153846153847,
-      "loss": 0.0943,
       "step": 80
     },
     {
       "epoch": 1.3846153846153846,
-      "grad_norm": 0.12171005457639694,
       "learning_rate": 0.00013076923076923077,
-      "loss": 0.0354,
       "step": 90
     },
     {
       "epoch": 1.5384615384615383,
-      "grad_norm": 0.10186214745044708,
       "learning_rate": 0.0001230769230769231,
-      "loss": 0.0529,
       "step": 100
     },
     {
       "epoch": 1.5384615384615383,
-      "eval_accuracy": 0.9774436090225563,
-      "eval_loss": 0.09199133515357971,
-      "eval_runtime": 1.2623,
-      "eval_samples_per_second": 105.363,
-      "eval_steps_per_second": 13.467,
       "step": 100
     },
     {
       "epoch": 1.6923076923076923,
-      "grad_norm": 0.11654942482709885,
       "learning_rate": 0.00011538461538461538,
-      "loss": 0.0699,
       "step": 110
     },
     {
       "epoch": 1.8461538461538463,
-      "grad_norm": 0.2380131483078003,
       "learning_rate": 0.0001076923076923077,
-      "loss": 0.0778,
       "step": 120
     },
     {
       "epoch": 2.0,
-      "grad_norm": 0.09530265629291534,
       "learning_rate": 0.0001,
-      "loss": 0.1043,
       "step": 130
     },
     {
       "epoch": 2.1538461538461537,
-      "grad_norm": 3.0544557571411133,
       "learning_rate": 9.230769230769232e-05,
-      "loss": 0.0218,
       "step": 140
     },
     {
       "epoch": 2.3076923076923075,
-      "grad_norm": 2.484825372695923,
       "learning_rate": 8.461538461538461e-05,
-      "loss": 0.0574,
       "step": 150
     },
     {
       "epoch": 2.4615384615384617,
-      "grad_norm": 1.0583124160766602,
       "learning_rate": 7.692307692307693e-05,
-      "loss": 0.0819,
       "step": 160
     },
     {
       "epoch": 2.6153846153846154,
-      "grad_norm": 0.7233728766441345,
       "learning_rate": 6.923076923076924e-05,
-      "loss": 0.0254,
       "step": 170
     },
     {
       "epoch": 2.769230769230769,
-      "grad_norm": 0.07144816964864731,
       "learning_rate": 6.153846153846155e-05,
-      "loss": 0.0395,
       "step": 180
     },
     {
       "epoch": 2.9230769230769234,
-      "grad_norm": 0.7451149821281433,
       "learning_rate": 5.384615384615385e-05,
-      "loss": 0.0775,
       "step": 190
     },
     {
       "epoch": 3.076923076923077,
-      "grad_norm": 0.06043630465865135,
       "learning_rate": 4.615384615384616e-05,
-      "loss": 0.0601,
       "step": 200
     },
     {
       "epoch": 3.076923076923077,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.012265427969396114,
-      "eval_runtime": 1.2341,
-      "eval_samples_per_second": 107.772,
-      "eval_steps_per_second": 13.775,
       "step": 200
     },
     {
       "epoch": 3.230769230769231,
-      "grad_norm": 0.05750015750527382,
       "learning_rate": 3.846153846153846e-05,
-      "loss": 0.0116,
       "step": 210
     },
     {
       "epoch": 3.3846153846153846,
-      "grad_norm": 0.1272144913673401,
       "learning_rate": 3.0769230769230774e-05,
-      "loss": 0.0136,
       "step": 220
     },
     {
       "epoch": 3.5384615384615383,
-      "grad_norm": 0.05987811088562012,
       "learning_rate": 2.307692307692308e-05,
-      "loss": 0.0108,
       "step": 230
     },
     {
       "epoch": 3.6923076923076925,
-      "grad_norm": 0.056609779596328735,
       "learning_rate": 1.5384615384615387e-05,
-      "loss": 0.0107,
       "step": 240
     },
     {
       "epoch": 3.8461538461538463,
-      "grad_norm": 0.07808347791433334,
       "learning_rate": 7.692307692307694e-06,
-      "loss": 0.0109,
       "step": 250
     },
     {
       "epoch": 4.0,
-      "grad_norm": 0.051622990518808365,
       "learning_rate": 0.0,
-      "loss": 0.0107,
       "step": 260
     },
     {
       "epoch": 4.0,
       "step": 260,
       "total_flos": 3.205097416476426e+17,
-      "train_loss": 0.11325625943449827,
-      "train_runtime": 101.5296,
-      "train_samples_per_second": 40.737,
-      "train_steps_per_second": 2.561
     }
   ],
   "logging_steps": 10,

 {
+  "best_metric": 0.07106763869524002,
+  "best_model_checkpoint": "./vit-base-beans-demo-v5/checkpoint-100",
   "epoch": 4.0,
   "eval_steps": 100,
   "global_step": 260,
   "log_history": [
     {
       "epoch": 0.15384615384615385,
+      "grad_norm": 1.6026091575622559,
       "learning_rate": 0.00019230769230769233,
+      "loss": 0.857,
       "step": 10
     },
     {
       "epoch": 0.3076923076923077,
+      "grad_norm": 1.5386457443237305,
       "learning_rate": 0.00018461538461538463,
+      "loss": 0.3705,
       "step": 20
     },
     {
       "epoch": 0.46153846153846156,
+      "grad_norm": 0.38434720039367676,
       "learning_rate": 0.00017692307692307693,
+      "loss": 0.2474,
       "step": 30
     },
     {
       "epoch": 0.6153846153846154,
+      "grad_norm": 0.6597588062286377,
       "learning_rate": 0.00016923076923076923,
+      "loss": 0.2648,
       "step": 40
     },
     {
       "epoch": 0.7692307692307693,
+      "grad_norm": 6.412318706512451,
       "learning_rate": 0.00016153846153846155,
+      "loss": 0.2766,
       "step": 50
     },
     {
       "epoch": 0.9230769230769231,
+      "grad_norm": 4.713058948516846,
       "learning_rate": 0.00015384615384615385,
+      "loss": 0.2076,
       "step": 60
     },
     {
       "epoch": 1.0769230769230769,
+      "grad_norm": 0.7322153449058533,
       "learning_rate": 0.00014615384615384615,
+      "loss": 0.1394,
       "step": 70
     },
     {
       "epoch": 1.2307692307692308,
+      "grad_norm": 0.17962901294231415,
       "learning_rate": 0.00013846153846153847,
+      "loss": 0.1321,
       "step": 80
     },
     {
       "epoch": 1.3846153846153846,
+      "grad_norm": 0.38781630992889404,
       "learning_rate": 0.00013076923076923077,
+      "loss": 0.0399,
       "step": 90
     },
     {
       "epoch": 1.5384615384615383,
+      "grad_norm": 0.7888959646224976,
       "learning_rate": 0.0001230769230769231,
+      "loss": 0.0631,
       "step": 100
     },
     {
       "epoch": 1.5384615384615383,
+      "eval_accuracy": 0.9849624060150376,
+      "eval_loss": 0.07106763869524002,
+      "eval_runtime": 1.9552,
+      "eval_samples_per_second": 68.024,
+      "eval_steps_per_second": 8.695,
       "step": 100
     },
     {
       "epoch": 1.6923076923076923,
+      "grad_norm": 1.7944247722625732,
       "learning_rate": 0.00011538461538461538,
+      "loss": 0.1224,
       "step": 110
     },
     {
       "epoch": 1.8461538461538463,
+      "grad_norm": 1.4098163843154907,
       "learning_rate": 0.0001076923076923077,
+      "loss": 0.1294,
       "step": 120
     },
     {
       "epoch": 2.0,
+      "grad_norm": 1.0332523584365845,
       "learning_rate": 0.0001,
+      "loss": 0.0575,
       "step": 130
     },
     {
       "epoch": 2.1538461538461537,
+      "grad_norm": 2.570497512817383,
       "learning_rate": 9.230769230769232e-05,
+      "loss": 0.0472,
       "step": 140
     },
     {
       "epoch": 2.3076923076923075,
+      "grad_norm": 0.09198305010795593,
       "learning_rate": 8.461538461538461e-05,
+      "loss": 0.0345,
       "step": 150
     },
     {
       "epoch": 2.4615384615384617,
+      "grad_norm": 3.40727162361145,
       "learning_rate": 7.692307692307693e-05,
+      "loss": 0.03,
       "step": 160
     },
     {
       "epoch": 2.6153846153846154,
+      "grad_norm": 0.07246225327253342,
       "learning_rate": 6.923076923076924e-05,
+      "loss": 0.0402,
       "step": 170
     },
     {
       "epoch": 2.769230769230769,
+      "grad_norm": 1.846726894378662,
       "learning_rate": 6.153846153846155e-05,
+      "loss": 0.0652,
       "step": 180
     },
     {
       "epoch": 2.9230769230769234,
+      "grad_norm": 3.1595141887664795,
       "learning_rate": 5.384615384615385e-05,
+      "loss": 0.0358,
       "step": 190
     },
     {
       "epoch": 3.076923076923077,
+      "grad_norm": 0.06781166791915894,
       "learning_rate": 4.615384615384616e-05,
+      "loss": 0.0409,
       "step": 200
     },
     {
       "epoch": 3.076923076923077,
+      "eval_accuracy": 0.9699248120300752,
+      "eval_loss": 0.12198615819215775,
+      "eval_runtime": 1.6615,
+      "eval_samples_per_second": 80.047,
+      "eval_steps_per_second": 10.232,
       "step": 200
     },
     {
       "epoch": 3.230769230769231,
+      "grad_norm": 0.06514012068510056,
       "learning_rate": 3.846153846153846e-05,
+      "loss": 0.0484,
       "step": 210
     },
     {
       "epoch": 3.3846153846153846,
+      "grad_norm": 0.06250347942113876,
       "learning_rate": 3.0769230769230774e-05,
+      "loss": 0.0142,
       "step": 220
     },
     {
       "epoch": 3.5384615384615383,
+      "grad_norm": 0.06651216000318527,
       "learning_rate": 2.307692307692308e-05,
+      "loss": 0.0123,
       "step": 230
     },
     {
       "epoch": 3.6923076923076925,
+      "grad_norm": 0.07879933714866638,
       "learning_rate": 1.5384615384615387e-05,
+      "loss": 0.0122,
       "step": 240
     },
     {
       "epoch": 3.8461538461538463,
+      "grad_norm": 0.062080804258584976,
       "learning_rate": 7.692307692307694e-06,
+      "loss": 0.0144,
       "step": 250
     },
     {
       "epoch": 4.0,
+      "grad_norm": 0.06278563290834427,
       "learning_rate": 0.0,
+      "loss": 0.0125,
       "step": 260
     },
     {
       "epoch": 4.0,
       "step": 260,
       "total_flos": 3.205097416476426e+17,
+      "train_loss": 0.12752302890786757,
+      "train_runtime": 91.8806,
+      "train_samples_per_second": 45.015,
+      "train_steps_per_second": 2.83
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:08e32e62c2abfc7ae18e7564866f9a5501c4a404e25a76414a383b98d8f81ca4
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:5f8905920dd94a3f430194957dd48d25f99e32d54703268f40f97be390b554da
 size 5112