kejian
/

final-cond-10-0.01

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

kejian commited on Nov 25, 2022

Commit

c76228a

·

1 Parent(s): 9ec34d0

update model card README.md

Files changed (1) hide show

README.md +3 -5

README.md CHANGED Viewed

@@ -36,11 +36,9 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0008
-- train_batch_size: 32
-- eval_batch_size: 16
 - seed: 42
-- gradient_accumulation_steps: 2
-- total_train_batch_size: 64
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.01
@@ -124,4 +122,4 @@ The following hyperparameters were used during training:
               'weight_decay': 0.1}}
 # Wandb URL:
-https://wandb.ai/kejian/uncategorized/runs/2g349c8i

 The following hyperparameters were used during training:
 - learning_rate: 0.0008
+- train_batch_size: 64
+- eval_batch_size: 32
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.01
               'weight_decay': 0.1}}
 # Wandb URL:
+https://wandb.ai/kejian/uncategorized/runs/1wgqepja