miladalsh
/

llam3-baseline-ft-model

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

miladalsh commited on Jul 7, 2024

Commit

537f4ab

·

verified ·

1 Parent(s): dc2e7d8

Model save

Files changed (2) hide show

README.md +4 -2
adapter_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -6,6 +6,8 @@ tags:
 - sft
 - generated_from_trainer
 base_model: meta-llama/Meta-Llama-3-8B
 model-index:
 - name: llam3-baseline-ft-model
   results: []
@@ -16,7 +18,7 @@ should probably proofread and complete it, then remove this comment. -->
 # llam3-baseline-ft-model
-This model is a fine-tuned version of [meta-llama/Meta-Llama-3-8B](https://huggingface.co/meta-llama/Meta-Llama-3-8B) on an unknown dataset.
 ## Model description
@@ -44,7 +46,7 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
-- num_epochs: 3
 ### Training results

 - sft
 - generated_from_trainer
 base_model: meta-llama/Meta-Llama-3-8B
+datasets:
+- generator
 model-index:
 - name: llam3-baseline-ft-model
   results: []
 # llam3-baseline-ft-model
+This model is a fine-tuned version of [meta-llama/Meta-Llama-3-8B](https://huggingface.co/meta-llama/Meta-Llama-3-8B) on the generator dataset.
 ## Model description
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03
+- num_epochs: 1
 ### Training results

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9f78d729ba87e0bb7434cfc296942514da836f57346d7a58ab31212bb3c2d958
 size 3443619040

 version https://git-lfs.github.com/spec/v1
+oid sha256:fad154d21fdf383a4146f02d87aeb6fb3fe55cb5c5c9ef99eaf4e4d712719b7f
 size 3443619040