Model save

Files changed (8) hide show

README.md CHANGED Viewed

@@ -33,13 +33,13 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 4
-- eval_batch_size: 8
 - seed: 42
 - distributed_type: multi-GPU
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
-- training_steps: 1
 ### Framework versions

 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 1
+- eval_batch_size: 1
 - seed: 42
 - distributed_type: multi-GPU
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
+- num_epochs: 1
 ### Framework versions

adapter_config.json CHANGED Viewed

@@ -16,8 +16,8 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "key_query_value",
-    "dense"
   ],
   "task_type": "CAUSAL_LM"
 }

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "dense",
+    "key_query_value"
   ],
   "task_type": "CAUSAL_LM"
 }

runs/Feb05_19-19-40_r2d2-devbox-6vt8q/events.out.tfevents.1738783188.r2d2-devbox-6vt8q.7365.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:47c6a7fa697c70a2313488a041ea1d65b31e28e6bdefb643faa21b0f3ced7aca
-size 4608

 version https://git-lfs.github.com/spec/v1
+oid sha256:21d726c53b26160cacbd5b30dc9415bc25492ec65ebbe95306c5e7f63be928c6
+size 4762

runs/Feb05_19-24-29_r2d2-devbox-6vt8q/events.out.tfevents.1738783475.r2d2-devbox-6vt8q.7817.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:af00c209b3c026a1ef92d76245f263dc9fd2fa72556dcf07d057bc33035755f9
+size 4611

step_0/README.md CHANGED Viewed

@@ -336,4 +336,11 @@ Carbon emissions can be estimated using the [Machine Learning Impact calculator]
 ### Framework versions
 - PEFT 0.6.1

 ### Framework versions
+- PEFT 0.6.1
+## Training procedure
+### Framework versions
 - PEFT 0.6.1

step_0/adapter_config.json CHANGED Viewed

@@ -16,8 +16,8 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "key_query_value",
-    "dense"
   ],
   "task_type": "CAUSAL_LM"
 }

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "dense",
+    "key_query_value"
   ],
   "task_type": "CAUSAL_LM"
 }

step_0/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c982cc77ef3f6f136f1714c6bd30ad858f2a7b37edb28e28fd3d1bc614722f23
 size 5752

 version https://git-lfs.github.com/spec/v1
+oid sha256:e047c353613b6e3b30c18cc5617eb1fbc1a3f1f9c6a1a4470c961cf6c27e652a
 size 5752

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c982cc77ef3f6f136f1714c6bd30ad858f2a7b37edb28e28fd3d1bc614722f23
 size 5752

 version https://git-lfs.github.com/spec/v1
+oid sha256:e047c353613b6e3b30c18cc5617eb1fbc1a3f1f9c6a1a4470c961cf6c27e652a
 size 5752