shaurya-06/adapter

Browse files

Files changed (5) hide show

adapter_config.json +1 -1
adapter_model.safetensors +1 -1
runs/Apr28_21-28-07_757a20c23d9b/events.out.tfevents.1714339701.757a20c23d9b.200681.17 +3 -0
trainer_state.json +28 -28
training_args.bin +1 -1

adapter_config.json CHANGED Viewed

@@ -11,7 +11,7 @@
   "layers_to_transform": null,
   "loftq_config": {},
   "lora_alpha": 16,
-  "lora_dropout": 0.1,
   "megatron_config": null,
   "megatron_core": "megatron.core",
   "modules_to_save": null,

   "layers_to_transform": null,
   "loftq_config": {},
   "lora_alpha": 16,
+  "lora_dropout": 0.3,
   "megatron_config": null,
   "megatron_core": "megatron.core",
   "modules_to_save": null,

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:40e249aa5cad4bb1b7d9575ed7d47d455a84d71b94d53384e03bc1c6e5effa39
 size 15734784

 version https://git-lfs.github.com/spec/v1
+oid sha256:c112228277edab577566384c9e92b4b444c85e04d507efc2f3c9636b33004774
 size 15734784

runs/Apr28_21-28-07_757a20c23d9b/events.out.tfevents.1714339701.757a20c23d9b.200681.17 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:00da21693d63b9a011734bcfde2cf8ecac48aa22b585827059ab23fe85cb9af7
+size 8416

trainer_state.json CHANGED Viewed

@@ -10,96 +10,96 @@
   "log_history": [
     {
       "epoch": 1.2,
-      "grad_norm": 0.8679821491241455,
       "learning_rate": 0.00019868265225415265,
-      "loss": 4.9095,
       "step": 15
     },
     {
       "epoch": 2.4,
-      "grad_norm": 1.064207911491394,
       "learning_rate": 0.00019075754196709572,
-      "loss": 3.2019,
       "step": 30
     },
     {
       "epoch": 3.6,
-      "grad_norm": 0.6014457941055298,
       "learning_rate": 0.00017621620551276366,
-      "loss": 1.7706,
       "step": 45
     },
     {
       "epoch": 4.8,
-      "grad_norm": 0.4954649806022644,
       "learning_rate": 0.00015611870653623825,
-      "loss": 1.2936,
       "step": 60
     },
     {
       "epoch": 6.0,
-      "grad_norm": 0.418344110250473,
       "learning_rate": 0.000131930153013598,
-      "loss": 1.0465,
       "step": 75
     },
     {
       "epoch": 7.2,
-      "grad_norm": 0.40778854489326477,
       "learning_rate": 0.00010541389085854176,
-      "loss": 0.9186,
       "step": 90
     },
     {
       "epoch": 8.4,
-      "grad_norm": 0.3741260766983032,
       "learning_rate": 7.85029559788976e-05,
-      "loss": 0.8364,
       "step": 105
     },
     {
       "epoch": 9.6,
-      "grad_norm": 0.4041515290737152,
       "learning_rate": 5.3159155930021e-05,
-      "loss": 0.7861,
       "step": 120
     },
     {
       "epoch": 10.8,
-      "grad_norm": 0.3697131872177124,
       "learning_rate": 3.123005411465766e-05,
-      "loss": 0.7488,
       "step": 135
     },
     {
       "epoch": 12.0,
-      "grad_norm": 0.4183999001979828,
       "learning_rate": 1.4314282383241096e-05,
-      "loss": 0.7274,
       "step": 150
     },
     {
       "epoch": 13.2,
-      "grad_norm": 0.4263518154621124,
       "learning_rate": 3.6450007480777093e-06,
-      "loss": 0.7245,
       "step": 165
     },
     {
       "epoch": 14.4,
-      "grad_norm": 0.3251570165157318,
       "learning_rate": 0.0,
-      "loss": 0.7288,
       "step": 180
     },
     {
       "epoch": 14.4,
       "step": 180,
       "total_flos": 116292530995200.0,
-      "train_loss": 1.4744000752766928,
-      "train_runtime": 81.674,
-      "train_samples_per_second": 18.366,
-      "train_steps_per_second": 2.204
     }
   ],
   "logging_steps": 15,

   "log_history": [
     {
       "epoch": 1.2,
+      "grad_norm": 0.8724178671836853,
       "learning_rate": 0.00019868265225415265,
+      "loss": 4.9162,
       "step": 15
     },
     {
       "epoch": 2.4,
+      "grad_norm": 1.0800001621246338,
       "learning_rate": 0.00019075754196709572,
+      "loss": 3.2245,
       "step": 30
     },
     {
       "epoch": 3.6,
+      "grad_norm": 0.6155961751937866,
       "learning_rate": 0.00017621620551276366,
+      "loss": 1.7826,
       "step": 45
     },
     {
       "epoch": 4.8,
+      "grad_norm": 0.4888613522052765,
       "learning_rate": 0.00015611870653623825,
+      "loss": 1.3024,
       "step": 60
     },
     {
       "epoch": 6.0,
+      "grad_norm": 0.41620710492134094,
       "learning_rate": 0.000131930153013598,
+      "loss": 1.053,
       "step": 75
     },
     {
       "epoch": 7.2,
+      "grad_norm": 0.41758859157562256,
       "learning_rate": 0.00010541389085854176,
+      "loss": 0.9255,
       "step": 90
     },
     {
       "epoch": 8.4,
+      "grad_norm": 0.3929082751274109,
       "learning_rate": 7.85029559788976e-05,
+      "loss": 0.8443,
       "step": 105
     },
     {
       "epoch": 9.6,
+      "grad_norm": 0.4028986692428589,
       "learning_rate": 5.3159155930021e-05,
+      "loss": 0.7949,
       "step": 120
     },
     {
       "epoch": 10.8,
+      "grad_norm": 0.3700142204761505,
       "learning_rate": 3.123005411465766e-05,
+      "loss": 0.7564,
       "step": 135
     },
     {
       "epoch": 12.0,
+      "grad_norm": 0.38459262251853943,
       "learning_rate": 1.4314282383241096e-05,
+      "loss": 0.7354,
       "step": 150
     },
     {
       "epoch": 13.2,
+      "grad_norm": 0.38667017221450806,
       "learning_rate": 3.6450007480777093e-06,
+      "loss": 0.7324,
       "step": 165
     },
     {
       "epoch": 14.4,
+      "grad_norm": 0.3338981568813324,
       "learning_rate": 0.0,
+      "loss": 0.7366,
       "step": 180
     },
     {
       "epoch": 14.4,
       "step": 180,
       "total_flos": 116292530995200.0,
+      "train_loss": 1.4836891492207844,
+      "train_runtime": 82.2898,
+      "train_samples_per_second": 18.228,
+      "train_steps_per_second": 2.187
     }
   ],
   "logging_steps": 15,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c67cb9db299dcc048f1694cd0a11b03c9a64221d6c98c783770f63b50ac522de
 size 5176

 version https://git-lfs.github.com/spec/v1
+oid sha256:7a7c4f52851c1314fe925acbc7427f40e294d8cd69c7baf44199af984ed067ae
 size 5176