End of training

Browse files

Files changed (4) hide show

README.md +51 -51
model.safetensors +1 -1
runs/Mar11_17-57-02_c0f94f3df250/events.out.tfevents.1710179822.c0f94f3df250.380.0 +3 -0
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [distilbert/distilbert-base-uncased](https://huggingface.co/distilbert/distilbert-base-uncased) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 7.3453
 ## Model description
@@ -46,56 +46,56 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| No log        | 1.0   | 9    | 5.7790          |
-| No log        | 2.0   | 18   | 5.0303          |
-| No log        | 3.0   | 27   | 4.2639          |
-| No log        | 4.0   | 36   | 3.7064          |
-| No log        | 5.0   | 45   | 3.5506          |
-| No log        | 6.0   | 54   | 3.5187          |
-| No log        | 7.0   | 63   | 3.5386          |
-| No log        | 8.0   | 72   | 3.6663          |
-| No log        | 9.0   | 81   | 3.8780          |
-| No log        | 10.0  | 90   | 4.2136          |
-| No log        | 11.0  | 99   | 4.5587          |
-| No log        | 12.0  | 108  | 4.7683          |
-| No log        | 13.0  | 117  | 4.9693          |
-| No log        | 14.0  | 126  | 5.2227          |
-| No log        | 15.0  | 135  | 5.4748          |
-| No log        | 16.0  | 144  | 5.6004          |
-| No log        | 17.0  | 153  | 5.4573          |
-| No log        | 18.0  | 162  | 5.6437          |
-| No log        | 19.0  | 171  | 5.6166          |
-| No log        | 20.0  | 180  | 5.8588          |
-| No log        | 21.0  | 189  | 5.8653          |
-| No log        | 22.0  | 198  | 5.8760          |
-| No log        | 23.0  | 207  | 5.9890          |
-| No log        | 24.0  | 216  | 6.1890          |
-| No log        | 25.0  | 225  | 6.2806          |
-| No log        | 26.0  | 234  | 6.3576          |
-| No log        | 27.0  | 243  | 6.3786          |
-| No log        | 28.0  | 252  | 6.4444          |
-| No log        | 29.0  | 261  | 6.4293          |
-| No log        | 30.0  | 270  | 6.4410          |
-| No log        | 31.0  | 279  | 6.5389          |
-| No log        | 32.0  | 288  | 6.6719          |
-| No log        | 33.0  | 297  | 6.5965          |
-| No log        | 34.0  | 306  | 6.7750          |
-| No log        | 35.0  | 315  | 6.8957          |
-| No log        | 36.0  | 324  | 6.9578          |
-| No log        | 37.0  | 333  | 6.9584          |
-| No log        | 38.0  | 342  | 6.9438          |
-| No log        | 39.0  | 351  | 6.9603          |
-| No log        | 40.0  | 360  | 7.0006          |
-| No log        | 41.0  | 369  | 7.0518          |
-| No log        | 42.0  | 378  | 7.1704          |
-| No log        | 43.0  | 387  | 7.0524          |
-| No log        | 44.0  | 396  | 7.2855          |
-| No log        | 45.0  | 405  | 7.2927          |
-| No log        | 46.0  | 414  | 7.1594          |
-| No log        | 47.0  | 423  | 7.2452          |
-| No log        | 48.0  | 432  | 7.3218          |
-| No log        | 49.0  | 441  | 7.3476          |
-| No log        | 50.0  | 450  | 7.3453          |
 ### Framework versions

 This model is a fine-tuned version of [distilbert/distilbert-base-uncased](https://huggingface.co/distilbert/distilbert-base-uncased) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 7.1301
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| No log        | 1.0   | 9    | 5.7169          |
+| No log        | 2.0   | 18   | 4.9843          |
+| No log        | 3.0   | 27   | 4.2994          |
+| No log        | 4.0   | 36   | 3.6410          |
+| No log        | 5.0   | 45   | 3.4156          |
+| No log        | 6.0   | 54   | 3.3735          |
+| No log        | 7.0   | 63   | 3.4014          |
+| No log        | 8.0   | 72   | 3.4605          |
+| No log        | 9.0   | 81   | 3.6386          |
+| No log        | 10.0  | 90   | 3.8670          |
+| No log        | 11.0  | 99   | 3.9164          |
+| No log        | 12.0  | 108  | 4.0859          |
+| No log        | 13.0  | 117  | 4.3789          |
+| No log        | 14.0  | 126  | 4.6237          |
+| No log        | 15.0  | 135  | 4.3232          |
+| No log        | 16.0  | 144  | 4.8507          |
+| No log        | 17.0  | 153  | 4.9674          |
+| No log        | 18.0  | 162  | 4.8131          |
+| No log        | 19.0  | 171  | 4.9395          |
+| No log        | 20.0  | 180  | 5.3052          |
+| No log        | 21.0  | 189  | 5.2734          |
+| No log        | 22.0  | 198  | 5.5004          |
+| No log        | 23.0  | 207  | 5.7227          |
+| No log        | 24.0  | 216  | 5.7561          |
+| No log        | 25.0  | 225  | 5.9641          |
+| No log        | 26.0  | 234  | 5.8868          |
+| No log        | 27.0  | 243  | 6.2444          |
+| No log        | 28.0  | 252  | 6.3476          |
+| No log        | 29.0  | 261  | 6.3710          |
+| No log        | 30.0  | 270  | 6.1785          |
+| No log        | 31.0  | 279  | 6.5052          |
+| No log        | 32.0  | 288  | 6.5157          |
+| No log        | 33.0  | 297  | 6.6968          |
+| No log        | 34.0  | 306  | 6.8228          |
+| No log        | 35.0  | 315  | 6.7054          |
+| No log        | 36.0  | 324  | 6.8514          |
+| No log        | 37.0  | 333  | 6.7913          |
+| No log        | 38.0  | 342  | 6.6872          |
+| No log        | 39.0  | 351  | 7.0705          |
+| No log        | 40.0  | 360  | 7.1790          |
+| No log        | 41.0  | 369  | 7.0094          |
+| No log        | 42.0  | 378  | 7.0502          |
+| No log        | 43.0  | 387  | 7.3836          |
+| No log        | 44.0  | 396  | 7.3730          |
+| No log        | 45.0  | 405  | 7.0853          |
+| No log        | 46.0  | 414  | 7.0111          |
+| No log        | 47.0  | 423  | 6.9992          |
+| No log        | 48.0  | 432  | 7.1171          |
+| No log        | 49.0  | 441  | 7.1296          |
+| No log        | 50.0  | 450  | 7.1301          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:64e4decb0ebe3049a8cc6d6921135133e4e24468cd8da79b4e1e8fbd923512da
 size 265470032

 version https://git-lfs.github.com/spec/v1
+oid sha256:75fdef8acdba16ef25a676aa9a3a3168bd87864e1425df007dd873855b22b6b1
 size 265470032

runs/Mar11_17-57-02_c0f94f3df250/events.out.tfevents.1710179822.c0f94f3df250.380.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:46edc57d6e97ccd92da0226542e80d93bf7d40dd2f4e743a217cf0a08116805d
+size 18298

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e9f7820e6416cde3b92f8918f7640f511b3e0c4dc1397455a1fc5371a9d0f7a9
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:81acf28093226711fa6917f5e6d27ae76f2dd4cc2f1ef439a9cd8596cb720985
 size 4920