End of training

Browse files

Files changed (5) hide show

README.md +10 -15
model.safetensors +1 -1
runs/Jan29_09-17-39_EmreSekeroglu/events.out.tfevents.1738131460.EmreSekeroglu.18312.0 +2 -2
tokenizer.json +16 -2
tokenizer_config.json +1 -1

README.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 library_name: transformers
 license: apache-2.0
-base_model: google-bert/bert-base-uncased
 tags:
 - generated_from_trainer
 metrics:
@@ -16,10 +16,10 @@ should probably proofread and complete it, then remove this comment. -->
 # modernbert-llm-router
-This model is a fine-tuned version of [google-bert/bert-base-uncased](https://huggingface.co/google-bert/bert-base-uncased) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.3201
-- F1: 0.9356
 ## Model description
@@ -44,22 +44,17 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 10
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:------:|
-| 1.4924        | 1.0   | 313  | 1.0900          | 0.8078 |
-| 0.4683        | 2.0   | 626  | 0.4458          | 0.9100 |
-| 0.2234        | 3.0   | 939  | 0.3289          | 0.9243 |
-| 0.1255        | 4.0   | 1252 | 0.3154          | 0.9245 |
-| 0.0512        | 5.0   | 1565 | 0.2927          | 0.9336 |
-| 0.0322        | 6.0   | 1878 | 0.3103          | 0.9343 |
-| 0.0189        | 7.0   | 2191 | 0.3133          | 0.9332 |
-| 0.0121        | 8.0   | 2504 | 0.3228          | 0.9346 |
-| 0.0068        | 9.0   | 2817 | 0.3183          | 0.9339 |
-| 0.0082        | 10.0  | 3130 | 0.3201          | 0.9356 |
 ### Framework versions

 ---
 library_name: transformers
 license: apache-2.0
+base_model: google-bert/bert-large-uncased
 tags:
 - generated_from_trainer
 metrics:
 # modernbert-llm-router
+This model is a fine-tuned version of [google-bert/bert-large-uncased](https://huggingface.co/google-bert/bert-large-uncased) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 4.3830
+- F1: 0.0003
 ## Model description
 - seed: 42
 - optimizer: Use OptimizerNames.ADAMW_TORCH_FUSED with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 5
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | F1     |
 |:-------------:|:-----:|:----:|:---------------:|:------:|
+| 4.3492        | 1.0   | 313  | 4.3921          | 0.0003 |
+| 4.3379        | 2.0   | 626  | 4.3906          | 0.0003 |
+| 4.3274        | 3.0   | 939  | 4.3891          | 0.0003 |
+| 4.3322        | 4.0   | 1252 | 4.3903          | 0.0003 |
+| 4.3299        | 5.0   | 1565 | 4.3830          | 0.0003 |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bad6c92447a30aea4929bdd5ce763edea662b1ed7d9732aaed56401d737f0ac9
 size 1340930268

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b901804c904e5ecc3a62f16ccd3cb7c7968b0423e5afe4eac740df02cf988f0
 size 1340930268

runs/Jan29_09-17-39_EmreSekeroglu/events.out.tfevents.1738131460.EmreSekeroglu.18312.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc074b3c1f1fd21ad3df281bd3cd2ccebe8d416daf623563f026bcb882c75653
-size 14819

 version https://git-lfs.github.com/spec/v1
+oid sha256:d66b45de91dff3876854f970ab3d9c32ba9f4d5143ebfa09547c44ce4dfbc88c
+size 15490

tokenizer.json CHANGED Viewed

@@ -1,7 +1,21 @@
 {
   "version": "1.0",
-  "truncation": null,
-  "padding": null,
   "added_tokens": [
     {
       "id": 0,

 {
   "version": "1.0",
+  "truncation": {
+    "direction": "Right",
+    "max_length": 128,
+    "strategy": "LongestFirst",
+    "stride": 0
+  },
+  "padding": {
+    "strategy": {
+      "Fixed": 128
+    },
+    "direction": "Right",
+    "pad_to_multiple_of": null,
+    "pad_id": 0,
+    "pad_type_id": 0,
+    "pad_token": "[PAD]"
+  },
   "added_tokens": [
     {
       "id": 0,

tokenizer_config.json CHANGED Viewed

@@ -46,7 +46,7 @@
   "do_lower_case": true,
   "extra_special_tokens": {},
   "mask_token": "[MASK]",
-  "model_max_length": 384,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",
   "strip_accents": null,

   "do_lower_case": true,
   "extra_special_tokens": {},
   "mask_token": "[MASK]",
+  "model_max_length": 128,
   "pad_token": "[PAD]",
   "sep_token": "[SEP]",
   "strip_accents": null,