ICT3214-Group5
/

MD5_gpt_neo_v1.1

Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

dariuslimzh commited on Nov 3, 2024

Commit

b385c66

·

verified ·

1 Parent(s): 298b5d0

Training completed

Files changed (3) hide show

README.md +13 -11
generation_config.json +1 -1
model.safetensors +1 -1

README.md CHANGED Viewed

@@ -5,7 +5,7 @@ base_model: EleutherAI/gpt-neo-125M
 tags:
 - generated_from_trainer
 metrics:
-- bleu
 model-index:
 - name: MD5_gpt_neo_v1.1
   results: []
@@ -19,7 +19,9 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [EleutherAI/gpt-neo-125M](https://huggingface.co/EleutherAI/gpt-neo-125M) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: 3.3814
-- Bleu: 0.0
 ## Model description
@@ -50,18 +52,18 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss | Bleu |
-|:-------------:|:------:|:----:|:---------------:|:----:|
-| No log        | 0.9091 | 5    | 7.9635          | 0.0  |
-| No log        | 2.0    | 11   | 5.3680          | 0.0  |
-| No log        | 2.9091 | 16   | 4.0323          | 0.0  |
-| No log        | 4.0    | 22   | 3.4255          | 0.0  |
-| No log        | 4.5455 | 25   | 3.3814          | 0.0  |
 ### Framework versions
-- Transformers 4.46.0
 - Pytorch 2.5.0+cu121
-- Datasets 3.0.2
 - Tokenizers 0.20.1

 tags:
 - generated_from_trainer
 metrics:
+- rouge
 model-index:
 - name: MD5_gpt_neo_v1.1
   results: []
 This model is a fine-tuned version of [EleutherAI/gpt-neo-125M](https://huggingface.co/EleutherAI/gpt-neo-125M) on an unknown dataset.
 It achieves the following results on the evaluation set:
 - Loss: 3.3814
+- Rouge1: 0.0889
+- Rouge2: 0.0
+- Rougel: 0.0695
 ## Model description
 ### Training results
+| Training Loss | Epoch  | Step | Validation Loss | Rouge1 | Rouge2 | Rougel |
+|:-------------:|:------:|:----:|:---------------:|:------:|:------:|:------:|
+| No log        | 0.9091 | 5    | 7.9635          | 0.0288 | 0.0    | 0.0231 |
+| No log        | 2.0    | 11   | 5.3680          | 0.0328 | 0.0    | 0.0258 |
+| No log        | 2.9091 | 16   | 4.0323          | 0.0856 | 0.0    | 0.0776 |
+| No log        | 4.0    | 22   | 3.4255          | 0.0890 | 0.0    | 0.0696 |
+| No log        | 4.5455 | 25   | 3.3814          | 0.0889 | 0.0    | 0.0695 |
 ### Framework versions
+- Transformers 4.46.1
 - Pytorch 2.5.0+cu121
+- Datasets 3.1.0
 - Tokenizers 0.20.1

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
-  "transformers_version": "4.46.0"
 }

   "_from_model_config": true,
   "bos_token_id": 50256,
   "eos_token_id": 50256,
+  "transformers_version": "4.46.1"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:de97cb24df7de0f87ae7d35b5d8aef326a9b0504756ee613b1d3c65899ef3276
 size 500811336

 version https://git-lfs.github.com/spec/v1
+oid sha256:1a3eb7c7e81bfc9c8ca65d4a1b619654112375af48297f5468b002842edc3ca3
 size 500811336