End of training

Browse files

Files changed (6) hide show

README.md +41 -41
config.json +2 -2
model.safetensors +2 -2
runs/Mar04_14-08-28_7eccf1ba7969/events.out.tfevents.1709561308.7eccf1ba7969.331.2 +3 -0
tokenizer.json +15 -51
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -13,7 +13,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4321
 ## Model description
@@ -44,46 +44,46 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 1.6407        | 1.0   | 6    | 1.4441          |
-| 1.3434        | 2.0   | 12   | 1.1708          |
-| 1.1389        | 3.0   | 18   | 1.0341          |
-| 1.0368        | 4.0   | 24   | 0.9642          |
-| 0.9908        | 5.0   | 30   | 0.9415          |
-| 0.9337        | 6.0   | 36   | 0.8563          |
-| 0.8645        | 7.0   | 42   | 0.8316          |
-| 0.8712        | 8.0   | 48   | 0.7734          |
-| 0.8167        | 9.0   | 54   | 0.7830          |
-| 0.8066        | 10.0  | 60   | 0.8592          |
-| 0.8427        | 11.0  | 66   | 0.8967          |
-| 0.8576        | 12.0  | 72   | 0.7355          |
-| 0.768         | 13.0  | 78   | 0.7169          |
-| 0.7285        | 14.0  | 84   | 0.7622          |
-| 0.7499        | 15.0  | 90   | 0.7064          |
-| 0.745         | 16.0  | 96   | 0.6762          |
-| 0.7111        | 17.0  | 102  | 0.6568          |
-| 0.6875        | 18.0  | 108  | 0.6555          |
-| 0.6578        | 19.0  | 114  | 0.6345          |
-| 0.6575        | 20.0  | 120  | 0.6218          |
-| 0.6395        | 21.0  | 126  | 0.5968          |
-| 0.6334        | 22.0  | 132  | 0.6121          |
-| 0.6152        | 23.0  | 138  | 0.5598          |
-| 0.6004        | 24.0  | 144  | 0.5747          |
-| 0.6055        | 25.0  | 150  | 0.5442          |
-| 0.5802        | 26.0  | 156  | 0.5698          |
-| 0.569         | 27.0  | 162  | 0.5516          |
-| 0.59          | 28.0  | 168  | 0.5207          |
-| 0.5726        | 29.0  | 174  | 0.5025          |
-| 0.5501        | 30.0  | 180  | 0.4908          |
-| 0.5348        | 31.0  | 186  | 0.4861          |
-| 0.5264        | 32.0  | 192  | 0.4948          |
-| 0.5247        | 33.0  | 198  | 0.4665          |
-| 0.5225        | 34.0  | 204  | 0.4615          |
-| 0.5074        | 35.0  | 210  | 0.4552          |
-| 0.5044        | 36.0  | 216  | 0.4687          |
-| 0.4931        | 37.0  | 222  | 0.4478          |
-| 0.5002        | 38.0  | 228  | 0.4479          |
-| 0.5039        | 39.0  | 234  | 0.4330          |
-| 0.4774        | 40.0  | 240  | 0.4321          |
 ### Framework versions

 This model is a fine-tuned version of [](https://huggingface.co/) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0045
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 2.7184        | 1.0   | 6    | 2.0589          |
+| 1.7718        | 2.0   | 12   | 1.3610          |
+| 1.1599        | 3.0   | 18   | 0.9216          |
+| 0.8588        | 4.0   | 24   | 0.8028          |
+| 0.7576        | 5.0   | 30   | 0.6973          |
+| 0.6641        | 6.0   | 36   | 0.6219          |
+| 0.5964        | 7.0   | 42   | 0.5578          |
+| 0.5248        | 8.0   | 48   | 0.4840          |
+| 0.4463        | 9.0   | 54   | 0.4088          |
+| 0.3832        | 10.0  | 60   | 0.3579          |
+| 0.3398        | 11.0  | 66   | 0.2951          |
+| 0.2834        | 12.0  | 72   | 0.2701          |
+| 0.2533        | 13.0  | 78   | 0.2033          |
+| 0.2001        | 14.0  | 84   | 0.1558          |
+| 0.1609        | 15.0  | 90   | 0.1252          |
+| 0.1303        | 16.0  | 96   | 0.0917          |
+| 0.1075        | 17.0  | 102  | 0.0676          |
+| 0.0833        | 18.0  | 108  | 0.0490          |
+| 0.0646        | 19.0  | 114  | 0.0408          |
+| 0.0584        | 20.0  | 120  | 0.0320          |
+| 0.0458        | 21.0  | 126  | 0.0233          |
+| 0.0369        | 22.0  | 132  | 0.0167          |
+| 0.0269        | 23.0  | 138  | 0.0137          |
+| 0.0224        | 24.0  | 144  | 0.0119          |
+| 0.0206        | 25.0  | 150  | 0.0097          |
+| 0.0175        | 26.0  | 156  | 0.0094          |
+| 0.0159        | 27.0  | 162  | 0.0073          |
+| 0.0132        | 28.0  | 168  | 0.0069          |
+| 0.0123        | 29.0  | 174  | 0.0064          |
+| 0.0112        | 30.0  | 180  | 0.0058          |
+| 0.0101        | 31.0  | 186  | 0.0056          |
+| 0.0105        | 32.0  | 192  | 0.0053          |
+| 0.0091        | 33.0  | 198  | 0.0050          |
+| 0.01          | 34.0  | 204  | 0.0047          |
+| 0.0093        | 35.0  | 210  | 0.0056          |
+| 0.0102        | 36.0  | 216  | 0.0047          |
+| 0.0092        | 37.0  | 222  | 0.0046          |
+| 0.0086        | 38.0  | 228  | 0.0046          |
+| 0.0091        | 39.0  | 234  | 0.0045          |
+| 0.0088        | 40.0  | 240  | 0.0045          |
 ### Framework versions

config.json CHANGED Viewed

@@ -78,7 +78,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "decoder_start_token_id": 2,
   "encoder": {
@@ -157,7 +157,7 @@
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
-    "vocab_size": 52
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 34
   },
   "decoder_start_token_id": 2,
   "encoder": {
     "typical_p": 1.0,
     "use_bfloat16": false,
     "use_cache": true,
+    "vocab_size": 34
   },
   "eos_token_id": 0,
   "is_encoder_decoder": true,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8d99f725e716a42f4fc000c24f15c4496c7b9cbd638e5196036c8e4d5082d15
-size 31205552

 version https://git-lfs.github.com/spec/v1
+oid sha256:20043c6fa90bf082bae70b6d662ed56b58fadab68cb8e17c6bfcc1b1a611c365
+size 31168616

runs/Mar04_14-08-28_7eccf1ba7969/events.out.tfevents.1709561308.7eccf1ba7969.331.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:89f8db1a3da11a59172493fadd027646b66122372dca1f0bad8ad1e50865055b
+size 27997

tokenizer.json CHANGED Viewed

@@ -112,8 +112,8 @@
       "7": 13,
       "8": 14,
       "9": 15,
-      "10": 16,
-      "99": 17,
       "98": 18,
       "11": 19,
       "97": 20,
@@ -122,36 +122,18 @@
       "13": 23,
       "14": 24,
       "95": 25,
-      "15": 26,
-      "94": 27,
-      "16": 28,
-      "93": 29,
-      "17": 30,
-      "92": 31,
-      "91": 32,
-      "18": 33,
-      "19": 34,
-      "90": 35,
-      "89": 36,
-      "20": 37,
-      "88": 38,
-      "21": 39,
-      "87": 40,
-      "22": 41,
-      "23": 42,
-      "86": 43,
-      "24": 44,
-      "85": 45,
-      "25": 46,
-      "84": 47,
-      "83": 48,
-      "26": 49,
-      "27": 50,
-      "82": 51
     },
     "merges": [
-      "1 0",
       "9 9",
       "9 8",
       "1 1",
       "9 7",
@@ -160,32 +142,14 @@
       "1 3",
       "1 4",
       "9 5",
-      "1 5",
       "9 4",
-      "1 6",
       "9 3",
-      "1 7",
       "9 2",
-      "9 1",
       "1 8",
-      "1 9",
-      "9 0",
-      "8 9",
-      "2 0",
-      "8 8",
-      "2 1",
-      "8 7",
-      "2 2",
-      "2 3",
-      "8 6",
-      "2 4",
-      "8 5",
-      "2 5",
-      "8 4",
-      "8 3",
-      "2 6",
-      "2 7",
-      "8 2"
     ]
   }
 }

       "7": 13,
       "8": 14,
       "9": 15,
+      "99": 16,
+      "10": 17,
       "98": 18,
       "11": 19,
       "97": 20,
       "13": 23,
       "14": 24,
       "95": 25,
+      "94": 26,
+      "15": 27,
+      "93": 28,
+      "16": 29,
+      "92": 30,
+      "17": 31,
+      "18": 32,
+      "91": 33
     },
     "merges": [
       "9 9",
+      "1 0",
       "9 8",
       "1 1",
       "9 7",
       "1 3",
       "1 4",
       "9 5",
       "9 4",
+      "1 5",
       "9 3",
+      "1 6",
       "9 2",
+      "1 7",
       "1 8",
+      "9 1"
     ]
   }
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e48c1d8fa27c48211840a852e57d6071bb08a3240f84a0bbf6daf6c9dd45c69e
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:2073aa3d0f54e113b4b4ae75748e771a17ca3862e58cb54d4c3a9a41ec41ea28
 size 5112