End of training

Browse files

Files changed (7) hide show

README.md +43 -43
config.json +1 -1
generation_config.json +1 -1
model.safetensors +1 -1
runs/Mar20_18-03-49_84f0f3a57a0c/events.out.tfevents.1710957830.84f0f3a57a0c.853.0 +3 -0
tokenizer.json +6 -6
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0162
 ## Model description
@@ -44,51 +44,51 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 2.7671        | 1.0   | 6    | 2.1243          |
-| 1.8409        | 2.0   | 12   | 1.5234          |
-| 1.3096        | 3.0   | 18   | 1.0612          |
-| 0.9557        | 4.0   | 24   | 0.8622          |
-| 0.8499        | 5.0   | 30   | 0.7836          |
-| 0.7285        | 6.0   | 36   | 0.6873          |
-| 0.6464        | 7.0   | 42   | 0.5698          |
-| 0.5513        | 8.0   | 48   | 0.5230          |
-| 0.4906        | 9.0   | 54   | 0.4933          |
-| 0.4817        | 10.0  | 60   | 0.4228          |
-| 0.388         | 11.0  | 66   | 0.3776          |
-| 0.3697        | 12.0  | 72   | 0.3796          |
-| 0.3994        | 13.0  | 78   | 0.3245          |
-| 0.3127        | 14.0  | 84   | 0.3145          |
-| 0.3215        | 15.0  | 90   | 0.2752          |
-| 0.2758        | 16.0  | 96   | 0.2400          |
-| 0.2507        | 17.0  | 102  | 0.2158          |
-| 0.217         | 18.0  | 108  | 0.2150          |
-| 0.2223        | 19.0  | 114  | 0.1940          |
-| 0.1746        | 20.0  | 120  | 0.1826          |
-| 0.1625        | 21.0  | 126  | 0.1445          |
-| 0.1386        | 22.0  | 132  | 0.1421          |
-| 0.1432        | 23.0  | 138  | 0.1241          |
-| 0.1329        | 24.0  | 144  | 0.1104          |
-| 0.1413        | 25.0  | 150  | 0.0889          |
-| 0.1093        | 26.0  | 156  | 0.0765          |
-| 0.0869        | 27.0  | 162  | 0.0596          |
-| 0.0677        | 28.0  | 168  | 0.0495          |
-| 0.0646        | 29.0  | 174  | 0.0397          |
-| 0.0539        | 30.0  | 180  | 0.0359          |
-| 0.0502        | 31.0  | 186  | 0.0339          |
-| 0.0399        | 32.0  | 192  | 0.0285          |
-| 0.0453        | 33.0  | 198  | 0.0239          |
-| 0.0351        | 34.0  | 204  | 0.0223          |
-| 0.039         | 35.0  | 210  | 0.0199          |
-| 0.0255        | 36.0  | 216  | 0.0195          |
-| 0.0259        | 37.0  | 222  | 0.0177          |
-| 0.0241        | 38.0  | 228  | 0.0168          |
-| 0.0251        | 39.0  | 234  | 0.0163          |
-| 0.0239        | 40.0  | 240  | 0.0162          |
 ### Framework versions
-- Transformers 4.38.1
-- Pytorch 2.1.0+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0086
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 2.7015        | 1.0   | 6    | 2.0207          |
+| 1.7126        | 2.0   | 12   | 1.2868          |
+| 1.1107        | 3.0   | 18   | 0.9127          |
+| 0.8465        | 4.0   | 24   | 0.7797          |
+| 0.749         | 5.0   | 30   | 0.7586          |
+| 0.71          | 6.0   | 36   | 0.6566          |
+| 0.6332        | 7.0   | 42   | 0.6026          |
+| 0.5757        | 8.0   | 48   | 0.5232          |
+| 0.5054        | 9.0   | 54   | 0.4744          |
+| 0.4469        | 10.0  | 60   | 0.3915          |
+| 0.3736        | 11.0  | 66   | 0.3214          |
+| 0.314         | 12.0  | 72   | 0.2855          |
+| 0.282         | 13.0  | 78   | 0.2260          |
+| 0.2234        | 14.0  | 84   | 0.2077          |
+| 0.2157        | 15.0  | 90   | 0.1623          |
+| 0.1647        | 16.0  | 96   | 0.1344          |
+| 0.1505        | 17.0  | 102  | 0.1246          |
+| 0.1342        | 18.0  | 108  | 0.1086          |
+| 0.1104        | 19.0  | 114  | 0.0998          |
+| 0.098         | 20.0  | 120  | 0.0788          |
+| 0.0829        | 21.0  | 126  | 0.0575          |
+| 0.0706        | 22.0  | 132  | 0.0496          |
+| 0.0639        | 23.0  | 138  | 0.0425          |
+| 0.0544        | 24.0  | 144  | 0.0352          |
+| 0.0478        | 25.0  | 150  | 0.0316          |
+| 0.0435        | 26.0  | 156  | 0.0255          |
+| 0.0368        | 27.0  | 162  | 0.0237          |
+| 0.0314        | 28.0  | 168  | 0.0215          |
+| 0.0313        | 29.0  | 174  | 0.0175          |
+| 0.0281        | 30.0  | 180  | 0.0157          |
+| 0.0319        | 31.0  | 186  | 0.0132          |
+| 0.0235        | 32.0  | 192  | 0.0117          |
+| 0.0207        | 33.0  | 198  | 0.0112          |
+| 0.0178        | 34.0  | 204  | 0.0104          |
+| 0.0184        | 35.0  | 210  | 0.0098          |
+| 0.0176        | 36.0  | 216  | 0.0092          |
+| 0.0161        | 37.0  | 222  | 0.0092          |
+| 0.0167        | 38.0  | 228  | 0.0090          |
+| 0.0154        | 39.0  | 234  | 0.0087          |
+| 0.0155        | 40.0  | 240  | 0.0086          |
 ### Framework versions
+- Transformers 4.38.2
+- Pytorch 2.2.1+cu121
 - Datasets 2.18.0
 - Tokenizers 0.15.2

config.json CHANGED Viewed

@@ -164,6 +164,6 @@
   "model_type": "encoder-decoder",
   "pad_token_id": 3,
   "torch_dtype": "float32",
-  "transformers_version": "4.38.1",
   "unk_token_id": null
 }

   "model_type": "encoder-decoder",
   "pad_token_id": 3,
   "torch_dtype": "float32",
+  "transformers_version": "4.38.2",
   "unk_token_id": null
 }

generation_config.json CHANGED Viewed

@@ -3,5 +3,5 @@
   "decoder_start_token_id": 2,
   "eos_token_id": 0,
   "pad_token_id": 3,
-  "transformers_version": "4.38.1"
 }

   "decoder_start_token_id": 2,
   "eos_token_id": 0,
   "pad_token_id": 3,
+  "transformers_version": "4.38.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3d8b3effa605654cc97228060a9f386e0549bc6153a1a73b1e30c69d69467952
 size 31168616

 version https://git-lfs.github.com/spec/v1
+oid sha256:55134369b1e8fe1e2d405f391294eb4f469b550209ca9ce1b99d173cb60760e6
 size 31168616

runs/Mar20_18-03-49_84f0f3a57a0c/events.out.tfevents.1710957830.84f0f3a57a0c.853.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:077d4c012ce69c5bea1a606609db0279794ab0754d432db2c531e5716cde7bbd
+size 27997

tokenizer.json CHANGED Viewed

@@ -114,8 +114,8 @@
       "9": 15,
       "99": 16,
       "10": 17,
-      "98": 18,
-      "11": 19,
       "12": 20,
       "97": 21,
       "13": 22,
@@ -126,16 +126,16 @@
       "15": 27,
       "93": 28,
       "16": 29,
-      "92": 30,
-      "17": 31,
       "91": 32,
       "18": 33
     },
     "merges": [
       "9 9",
       "1 0",
-      "9 8",
       "1 1",
       "1 2",
       "9 7",
       "1 3",
@@ -146,8 +146,8 @@
       "1 5",
       "9 3",
       "1 6",
-      "9 2",
       "1 7",
       "9 1",
       "1 8"
     ]

       "9": 15,
       "99": 16,
       "10": 17,
+      "11": 18,
+      "98": 19,
       "12": 20,
       "97": 21,
       "13": 22,
       "15": 27,
       "93": 28,
       "16": 29,
+      "17": 30,
+      "92": 31,
       "91": 32,
       "18": 33
     },
     "merges": [
       "9 9",
       "1 0",
       "1 1",
+      "9 8",
       "1 2",
       "9 7",
       "1 3",
       "1 5",
       "9 3",
       "1 6",
       "1 7",
+      "9 2",
       "9 1",
       "1 8"
     ]

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2927464d0a68791dc1fc35a7ce36cd8aa776a70ecf01c86a319312356a440785
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:e3ef6394f7d7f9ab5741d70af66cd8b4dc30df6f269be664e4563b0803947ec5
 size 5112