MahdiSUST
/

bn_sum_mt5_base

Text2Text Generation

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

MahdiSUST commited on Mar 19, 2023

Commit

7bc2cc7

·

1 Parent(s): 8299998

Update README.md

Files changed (1) hide show

README.md +4 -6

README.md CHANGED Viewed

@@ -3,7 +3,7 @@ license: bigscience-openrail-m
 tags:
 - generated_from_trainer
 model-index:
-- name: mt5_large_riju_data
   results: []
 ---
@@ -20,8 +20,7 @@ It achieves the following results on the evaluation set:
 - eval_runtime: 229.14
 - eval_samples_per_second: 4.159
 - eval_steps_per_second: 2.082
-- epoch: 2.0
-- step: 17156
 ## Model description
@@ -41,9 +40,8 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5.6e-05
-- train_batch_size: 2
-- eval_batch_size: 2
-- seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 10

 tags:
 - generated_from_trainer
 model-index:
+- name: Bangla summarization using mt5-base
   results: []
 ---
 - eval_runtime: 229.14
 - eval_samples_per_second: 4.159
 - eval_steps_per_second: 2.082
+- epoch: 9
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5.6e-05
+- train_batch_size: 9
+- eval_batch_size: 9
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 10