Model save

Browse files

Files changed (5) hide show

README.md +31 -18
config.json +1 -1
generation_config.json +1 -1
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -18,8 +18,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [openai/whisper-small](https://huggingface.co/openai/whisper-small) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.3193
-- Wer: 100
 ## Model description
@@ -39,32 +39,45 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 32
-- eval_batch_size: 32
 - seed: 42
 - gradient_accumulation_steps: 2
-- total_train_batch_size: 64
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 5
-- num_epochs: 2
 - mixed_precision_training: Native AMP
 ### Training results
-| Training Loss | Epoch  | Step | Validation Loss | Wer |
-|:-------------:|:------:|:----:|:---------------:|:---:|
-| 6.0361        | 0.3125 | 5    | 5.3765          | 100 |
-| 4.4117        | 0.625  | 10   | 3.4696          | 100 |
-| 3.0052        | 0.9375 | 15   | 2.8653          | 100 |
-| 2.4717        | 1.25   | 20   | 2.5730          | 100 |
-| 2.2188        | 1.5625 | 25   | 2.3918          | 100 |
-| 2.085         | 1.875  | 30   | 2.3193          | 100 |
 ### Framework versions
-- Transformers 4.47.0.dev0
-- Pytorch 2.5.0+cu124
-- Datasets 3.0.1
-- Tokenizers 0.20.1

 This model is a fine-tuned version of [openai/whisper-small](https://huggingface.co/openai/whisper-small) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.2998
+- Wer: 37.0027
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 8
+- eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 2
+- total_train_batch_size: 16
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 5
+- num_epochs: 10
 - mixed_precision_training: Native AMP
 ### Training results
+| Training Loss | Epoch  | Step  | Validation Loss | Wer     |
+|:-------------:|:------:|:-----:|:---------------:|:-------:|
+| 0.3985        | 0.2458 | 5000  | 0.4006          | 100     |
+| 0.3535        | 0.4917 | 10000 | 0.3515          | 41.9359 |
+| 0.3329        | 0.7375 | 15000 | 0.3267          | 41.2601 |
+| 0.3088        | 0.9834 | 20000 | 0.3122          | 40.8518 |
+| 0.2702        | 1.2292 | 25000 | 0.3052          | 39.1540 |
+| 0.2682        | 1.4750 | 30000 | 0.2963          | 39.5239 |
+| 0.2606        | 1.7208 | 35000 | 0.2891          | 38.2537 |
+| 0.2622        | 1.9667 | 40000 | 0.2837          | 38.0593 |
+| 0.2164        | 2.2125 | 45000 | 0.2854          | 37.4512 |
+| 0.222         | 2.4583 | 50000 | 0.2817          | 37.9314 |
+| 0.2233        | 2.7042 | 55000 | 0.2788          | 37.6204 |
+| 0.2218        | 2.9500 | 60000 | 0.2755          | 36.9669 |
+| 0.1752        | 3.1958 | 65000 | 0.2871          | 36.6628 |
+| 0.1802        | 3.4417 | 70000 | 0.2860          | 36.9139 |
+| 0.1864        | 3.6875 | 75000 | 0.2818          | 37.8713 |
+| 0.1832        | 3.9334 | 80000 | 0.2804          | 38.1352 |
+| 0.1396        | 4.1792 | 85000 | 0.3042          | 37.6950 |
+| 0.1398        | 4.4250 | 90000 | 0.3042          | 37.7528 |
+| 0.1482        | 4.6708 | 95000 | 0.2998          | 37.0027 |
 ### Framework versions
+- Transformers 4.48.0.dev0
+- Pytorch 2.5.1+cu124
+- Datasets 3.1.0
+- Tokenizers 0.21.0

config.json CHANGED Viewed

@@ -41,7 +41,7 @@
   "pad_token_id": 50257,
   "scale_embedding": false,
   "torch_dtype": "float32",
-  "transformers_version": "4.47.0.dev0",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

   "pad_token_id": 50257,
   "scale_embedding": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.48.0.dev0",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51865

generation_config.json CHANGED Viewed

@@ -172,5 +172,5 @@
     "transcribe": 50359,
     "translate": 50358
   },
-  "transformers_version": "4.47.0.dev0"
 }

     "transcribe": 50359,
     "translate": 50358
   },
+  "transformers_version": "4.48.0.dev0"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6fe1d6005746b9cdf30c1267d8d7dcd69c8973b5895d0f8af2ad74bc70825604
 size 966995080

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd55b173c1cacf6b49c7bc229649a37007cd2ddcfbf5e871dc97d3f1e1d8887b
 size 966995080

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e1c6b0c1bb6ed1b21ce222912e7884d208760c979dc4e9cd6516dd38bb9b8922
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:f4774929ca81e78f05e3e89058efd8115f295b3804fa56b4a48688fc3459f6c3
 size 5496