Training complete

Browse files

Files changed (4) hide show

README.md +17 -17
generation_config.json +1 -2
runs/Mar13_11-29-40_a5db1099f1ab/events.out.tfevents.1710329390.a5db1099f1ab.979.0 +2 -2
runs/Mar13_11-29-40_a5db1099f1ab/events.out.tfevents.1710332280.a5db1099f1ab.979.1 +3 -0

README.md CHANGED Viewed

@@ -18,11 +18,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/mt5-small](https://huggingface.co/google/mt5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.4331
-- Rouge1: 6.6074
-- Rouge2: 0.8
-- Rougel: 6.5487
-- Rougelsum: 6.6233
 ## Model description
@@ -51,21 +51,21 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum |
-|:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|
-| 5.7796        | 1.0   | 625  | 2.7282          | 4.0839 | 0.8785 | 4.0421 | 4.0758    |
-| 3.4978        | 2.0   | 1250 | 2.6171          | 6.6481 | 0.9067 | 6.6002 | 6.6437    |
-| 3.2419        | 3.0   | 1875 | 2.5208          | 6.6661 | 0.64   | 6.5897 | 6.6246    |
-| 3.1063        | 4.0   | 2500 | 2.4918          | 7.2246 | 1.0467 | 7.1758 | 7.1947    |
-| 3.0177        | 5.0   | 3125 | 2.4535          | 6.8523 | 1.0    | 6.8009 | 6.8923    |
-| 2.9537        | 6.0   | 3750 | 2.4452          | 6.459  | 0.8667 | 6.4208 | 6.481     |
-| 2.9156        | 7.0   | 4375 | 2.4373          | 6.5019 | 0.8    | 6.4421 | 6.5094    |
-| 2.8914        | 8.0   | 5000 | 2.4331          | 6.6074 | 0.8    | 6.5487 | 6.6233    |
 ### Framework versions
-- Transformers 4.37.2
 - Pytorch 2.1.0+cu121
-- Datasets 2.17.1
 - Tokenizers 0.15.2

 This model is a fine-tuned version of [google/mt5-small](https://huggingface.co/google/mt5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.3419
+- Rouge1: 6.9313
+- Rouge2: 1.9587
+- Rougel: 6.8503
+- Rougelsum: 6.9385
 ## Model description
 ### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum |
+|:-------------:|:-----:|:-----:|:---------------:|:------:|:------:|:------:|:---------:|
+| 4.4281        | 1.0   | 1250  | 2.5899          | 7.0481 | 2.0747 | 6.9849 | 7.0179    |
+| 3.2368        | 2.0   | 2500  | 2.4568          | 6.7532 | 1.7462 | 6.6934 | 6.7462    |
+| 3.0526        | 3.0   | 3750  | 2.4315          | 6.6106 | 1.9088 | 6.5307 | 6.5784    |
+| 2.9412        | 4.0   | 5000  | 2.3882          | 7.0644 | 1.9283 | 6.9687 | 7.0399    |
+| 2.8711        | 5.0   | 6250  | 2.3700          | 7.2808 | 1.9358 | 7.2006 | 7.2603    |
+| 2.8193        | 6.0   | 7500  | 2.3604          | 7.0911 | 1.9737 | 6.9918 | 7.0491    |
+| 2.7866        | 7.0   | 8750  | 2.3479          | 6.9948 | 2.0044 | 6.8824 | 6.9737    |
+| 2.7699        | 8.0   | 10000 | 2.3419          | 6.9313 | 1.9587 | 6.8503 | 6.9385    |
 ### Framework versions
+- Transformers 4.38.2
 - Pytorch 2.1.0+cu121
+- Datasets 2.18.0
 - Tokenizers 0.15.2

generation_config.json CHANGED Viewed

@@ -1,7 +1,6 @@
 {
-  "_from_model_config": true,
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
-  "transformers_version": "4.37.2"
 }

 {
   "decoder_start_token_id": 0,
   "eos_token_id": 1,
   "pad_token_id": 0,
+  "transformers_version": "4.38.2"
 }

runs/Mar13_11-29-40_a5db1099f1ab/events.out.tfevents.1710329390.a5db1099f1ab.979.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:08262543d3795db4b262684dbbe48b7088f950dad5f90e29aca17c02036eb347
-size 9846

 version https://git-lfs.github.com/spec/v1
+oid sha256:697c050f7ef9aaf27ae6ae121bbb4cffaba4e4533529d9bf017ac10a5f847dce
+size 10674

runs/Mar13_11-29-40_a5db1099f1ab/events.out.tfevents.1710332280.a5db1099f1ab.979.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9eb84129b8f75f84e222eb1b730cad08e6396de0584a0058fccc7cd73223f89d
+size 562