End of training

Browse files

Files changed (4) hide show

README.md +36 -36
adapter_model.bin +1 -1
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [yahma/llama-7b-hf](https://huggingface.co/yahma/llama-7b-hf) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0688
 ## Model description
@@ -50,41 +50,41 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 1.8281        | 0.09  | 10   | 0.6608          |
-| 0.252         | 0.17  | 20   | 0.1557          |
-| 0.1573        | 0.26  | 30   | 0.1553          |
-| 0.1528        | 0.34  | 40   | 0.1464          |
-| 0.1494        | 0.43  | 50   | 0.1468          |
-| 0.1511        | 0.51  | 60   | 0.1345          |
-| 0.1353        | 0.6   | 70   | 0.1163          |
-| 0.1308        | 0.68  | 80   | 0.0978          |
-| 0.1115        | 0.77  | 90   | 0.1005          |
-| 0.1151        | 0.85  | 100  | 0.0949          |
-| 0.1095        | 0.94  | 110  | 0.0947          |
-| 0.1035        | 1.02  | 120  | 0.0957          |
-| 0.0961        | 1.11  | 130  | 0.0888          |
-| 0.0898        | 1.19  | 140  | 0.0821          |
-| 0.089         | 1.28  | 150  | 0.0784          |
-| 0.0867        | 1.37  | 160  | 0.0784          |
-| 0.0875        | 1.45  | 170  | 0.0770          |
-| 0.078         | 1.54  | 180  | 0.0810          |
-| 0.0838        | 1.62  | 190  | 0.0780          |
-| 0.0896        | 1.71  | 200  | 0.0746          |
-| 0.0861        | 1.79  | 210  | 0.0746          |
-| 0.0821        | 1.88  | 220  | 0.0693          |
-| 0.0777        | 1.96  | 230  | 0.0710          |
-| 0.0675        | 2.05  | 240  | 0.0718          |
-| 0.0559        | 2.13  | 250  | 0.0786          |
-| 0.055         | 2.22  | 260  | 0.0742          |
-| 0.0553        | 2.3   | 270  | 0.0765          |
-| 0.0569        | 2.39  | 280  | 0.0711          |
-| 0.0597        | 2.47  | 290  | 0.0679          |
-| 0.0566        | 2.56  | 300  | 0.0690          |
-| 0.0602        | 2.65  | 310  | 0.0673          |
-| 0.0502        | 2.73  | 320  | 0.0681          |
-| 0.0563        | 2.82  | 330  | 0.0684          |
-| 0.0524        | 2.9   | 340  | 0.0687          |
-| 0.0531        | 2.99  | 350  | 0.0688          |
 ### Framework versions

 This model is a fine-tuned version of [yahma/llama-7b-hf](https://huggingface.co/yahma/llama-7b-hf) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0716
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 1.5189        | 0.09  | 10   | 0.1892          |
+| 0.1724        | 0.17  | 20   | 0.1543          |
+| 0.1556        | 0.26  | 30   | 0.1534          |
+| 0.1522        | 0.34  | 40   | 0.1523          |
+| 0.1512        | 0.43  | 50   | 0.1487          |
+| 0.1563        | 0.51  | 60   | 0.1495          |
+| 0.1515        | 0.6   | 70   | 0.1474          |
+| 0.1514        | 0.68  | 80   | 0.1419          |
+| 0.1389        | 0.77  | 90   | 0.1194          |
+| 0.1287        | 0.85  | 100  | 0.1003          |
+| 0.1242        | 0.94  | 110  | 0.0968          |
+| 0.1122        | 1.02  | 120  | 0.1009          |
+| 0.1066        | 1.11  | 130  | 0.1001          |
+| 0.0971        | 1.19  | 140  | 0.0963          |
+| 0.0957        | 1.28  | 150  | 0.0882          |
+| 0.0928        | 1.37  | 160  | 0.0883          |
+| 0.0917        | 1.45  | 170  | 0.0809          |
+| 0.0832        | 1.54  | 180  | 0.0893          |
+| 0.085         | 1.62  | 190  | 0.0865          |
+| 0.0906        | 1.71  | 200  | 0.0773          |
+| 0.0879        | 1.79  | 210  | 0.0748          |
+| 0.0852        | 1.88  | 220  | 0.0674          |
+| 0.0796        | 1.96  | 230  | 0.0717          |
+| 0.0674        | 2.05  | 240  | 0.0711          |
+| 0.0518        | 2.13  | 250  | 0.0751          |
+| 0.0521        | 2.22  | 260  | 0.0739          |
+| 0.0504        | 2.3   | 270  | 0.0770          |
+| 0.0556        | 2.39  | 280  | 0.0730          |
+| 0.0605        | 2.47  | 290  | 0.0725          |
+| 0.0515        | 2.56  | 300  | 0.0759          |
+| 0.0526        | 2.65  | 310  | 0.0711          |
+| 0.0494        | 2.73  | 320  | 0.0716          |
+| 0.0518        | 2.82  | 330  | 0.0724          |
+| 0.0508        | 2.9   | 340  | 0.0716          |
+| 0.0509        | 2.99  | 350  | 0.0716          |
 ### Framework versions

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:43724cf4af7d68852bab6befd38fc2633c6cc31121bf145cd09f0b7e9d9e7fdc
 size 277233383

 version https://git-lfs.github.com/spec/v1
+oid sha256:fc0a1d91704aa2f7b4d7d8823b46c24261e34c32436e248508268500edeb59ef
 size 277233383

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aa4b1082acd4c135767380c9ebdd75af32b6f2262b09de9886f6fee5bbfacce6
 size 13753862632

 version https://git-lfs.github.com/spec/v1
+oid sha256:a5da593b59b6aa5c5463ff900f9ccc595001a15eff585540137469391ee4d3d5
 size 13753862632

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e2a9fd3b36338eb24dcc0cef169e7a5e985202b199d1a5bfaac604e1b858c14f
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:c069a15a553da2a122f13c16c52e702f332ba6df5a16245efe9541dba389a478
 size 5240