end of training

Browse files

Files changed (3) hide show

README.md +54 -1
adapter_model.safetensors +1 -1
runs/Jun10_21-24-15_ml/events.out.tfevents.1718025857.ml.3177301.0 +2 -2

README.md CHANGED Viewed

@@ -13,6 +13,8 @@ should probably proofread and complete it, then remove this comment. -->
 # llama3_question
 This model was trained from scratch on the None dataset.
 ## Model description
@@ -50,10 +52,61 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
-- num_epochs: 10
 ### Training results
 ### Framework versions

 # llama3_question
 This model was trained from scratch on the None dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.9281
 ## Model description
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
+- num_epochs: 7
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss |
+|:-------------:|:-----:|:----:|:---------------:|
+| 2.9644        | 0.14  | 1    | 2.8242          |
+| 2.83          | 0.29  | 2    | 2.6599          |
+| 2.6298        | 0.43  | 3    | 2.4977          |
+| 2.5886        | 0.57  | 4    | 2.3641          |
+| 2.3748        | 0.71  | 5    | 2.2390          |
+| 2.2532        | 0.86  | 6    | 2.1221          |
+| 2.5349        | 1.0   | 7    | 2.0140          |
+| 2.0095        | 1.14  | 8    | 1.9114          |
+| 1.9099        | 1.29  | 9    | 1.8180          |
+| 1.8959        | 1.43  | 10   | 1.7305          |
+| 1.8349        | 1.57  | 11   | 1.6499          |
+| 1.5787        | 1.71  | 12   | 1.5829          |
+| 1.5687        | 1.86  | 13   | 1.5243          |
+| 1.615         | 2.0   | 14   | 1.4736          |
+| 1.4481        | 2.14  | 15   | 1.4259          |
+| 1.4322        | 2.29  | 16   | 1.3778          |
+| 1.3623        | 2.43  | 17   | 1.3297          |
+| 1.3033        | 2.57  | 18   | 1.2797          |
+| 1.3481        | 2.71  | 19   | 1.2290          |
+| 1.2088        | 2.86  | 20   | 1.1819          |
+| 1.0726        | 3.0   | 21   | 1.1398          |
+| 1.1058        | 3.14  | 22   | 1.0997          |
+| 1.1279        | 3.29  | 23   | 1.0603          |
+| 1.013         | 3.43  | 24   | 1.0261          |
+| 0.9371        | 3.57  | 25   | 0.9980          |
+| 0.8697        | 3.71  | 26   | 0.9776          |
+| 1.0295        | 3.86  | 27   | 0.9648          |
+| 1.1583        | 4.0   | 28   | 0.9581          |
+| 0.865         | 4.14  | 29   | 0.9520          |
+| 0.9343        | 4.29  | 30   | 0.9455          |
+| 0.7596        | 4.43  | 31   | 0.9411          |
+| 0.8868        | 4.57  | 32   | 0.9374          |
+| 0.8944        | 4.71  | 33   | 0.9342          |
+| 0.9534        | 4.86  | 34   | 0.9310          |
+| 0.8833        | 5.0   | 35   | 0.9276          |
+| 0.7918        | 5.14  | 36   | 0.9248          |
+| 0.7921        | 5.29  | 37   | 0.9228          |
+| 0.8793        | 5.43  | 38   | 0.9223          |
+| 0.8272        | 5.57  | 39   | 0.9220          |
+| 0.9098        | 5.71  | 40   | 0.9213          |
+| 0.7525        | 5.86  | 41   | 0.9208          |
+| 0.9416        | 6.0   | 42   | 0.9215          |
+| 0.7309        | 6.14  | 43   | 0.9235          |
+| 0.7301        | 6.29  | 44   | 0.9236          |
+| 0.8327        | 6.43  | 45   | 0.9252          |
+| 0.7904        | 6.57  | 46   | 0.9257          |
+| 0.7649        | 6.71  | 47   | 0.9260          |
+| 0.837         | 6.86  | 48   | 0.9275          |
+| 0.8265        | 7.0   | 49   | 0.9281          |
 ### Framework versions

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e02b11eeb8c6c8127dd964dc4185aa56abbd61fb70eb6955c90a063beaa47efe
 size 109069176

 version https://git-lfs.github.com/spec/v1
+oid sha256:de944632d703f54673c8c435faddae8a84a3eb8f55ed941413c38ee832d3a5e6
 size 109069176

runs/Jun10_21-24-15_ml/events.out.tfevents.1718025857.ml.3177301.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8f8dc109698b6d9417c3d47f2be6c51448d99bd6b996a4021660356467617363
-size 23761

 version https://git-lfs.github.com/spec/v1
+oid sha256:79dd2dfaa722489c4a543f549aaa93e95cbf5ca49b210f6e0dfb24aa28906be4
+size 25789