End of training

Files changed (5) hide show

README.md CHANGED Viewed

@@ -16,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [Helsinki-NLP/opus-mt-en-hi](https://huggingface.co/Helsinki-NLP/opus-mt-en-hi) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.7207
 ## Model description
@@ -39,7 +39,7 @@ The following hyperparameters were used during training:
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
-- optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 5
 - mixed_precision_training: Native AMP
@@ -48,16 +48,16 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 0.836         | 1.0   | 57   | 0.7426          |
-| 0.7589        | 2.0   | 114  | 0.7205          |
-| 0.6658        | 3.0   | 171  | 0.7189          |
-| 0.6046        | 4.0   | 228  | 0.7199          |
-| 0.5706        | 5.0   | 285  | 0.7207          |
 ### Framework versions
-- Transformers 4.49.0
-- Pytorch 2.6.0+cu124
-- Datasets 3.3.2
 - Tokenizers 0.21.0

 This model is a fine-tuned version of [Helsinki-NLP/opus-mt-en-hi](https://huggingface.co/Helsinki-NLP/opus-mt-en-hi) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.7223
 ## Model description
 - train_batch_size: 16
 - eval_batch_size: 16
 - seed: 42
+- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - num_epochs: 5
 - mixed_precision_training: Native AMP
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 0.8391        | 1.0   | 57   | 0.7408          |
+| 0.7582        | 2.0   | 114  | 0.7227          |
+| 0.6579        | 3.0   | 171  | 0.7205          |
+| 0.6037        | 4.0   | 228  | 0.7219          |
+| 0.5735        | 5.0   | 285  | 0.7223          |
 ### Framework versions
+- Transformers 4.47.0
+- Pytorch 2.5.1+cu121
+- Datasets 3.3.1
 - Tokenizers 0.21.0

config.json CHANGED Viewed

@@ -50,7 +50,7 @@
   "share_encoder_decoder_embeddings": true,
   "static_position_embeddings": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.49.0",
   "use_cache": true,
   "vocab_size": 61950
 }

   "share_encoder_decoder_embeddings": true,
   "static_position_embeddings": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.47.0",
   "use_cache": true,
   "vocab_size": 61950
 }

generation_config.json CHANGED Viewed

@@ -12,5 +12,5 @@
   "num_beams": 4,
   "pad_token_id": 61949,
   "renormalize_logits": true,
-  "transformers_version": "4.49.0"
 }

   "num_beams": 4,
   "pad_token_id": 61949,
   "renormalize_logits": true,
+  "transformers_version": "4.47.0"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c6daf9813e8ecfc0e3c4b680148b9fff6de24da7762c536eb3976895552e8077
 size 303704440

 version https://git-lfs.github.com/spec/v1
+oid sha256:a46cd5c59425a31f5e5b78defe8bd340552aeffb4cc262db1f4e843e363106f4
 size 303704440

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a5b13475bb0ce0cc003ebf35c9c62c33cb3e2d4d0496a378d2ebc51e79ac3c9
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:c122ab90d939420ebe7fe9108df70b0015f56d6682c0c3adcd441b54c2932abf
 size 5368