cambridge-climb
/

baseline-roberta_pre_layer_norm-model

roberta-prelayernorm

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

rdiehlmartinez commited on Oct 11, 2023

Commit

4c9a104

•

1 Parent(s): 7c1007c

Update README.md

Files changed (1) hide show

README.md +4 -9

README.md CHANGED Viewed

@@ -15,18 +15,16 @@ This model is a fine-tuned version of [](https://huggingface.co/) on the None da
 ## Model description
-More information needed
-## Intended uses & limitations
-More information needed
 ## Training and evaluation data
-More information needed
 ## Training procedure
 ### Training hyperparameters
 The following hyperparameters were used during training:
@@ -43,9 +41,6 @@ The following hyperparameters were used during training:
 - lr_scheduler_warmup_steps: 100000
 - training_steps: 400000
-### Training results
 ### Framework versions

 ## Model description
+Base Model Architecture: Roberta Pre-Layer Norm
 ## Training and evaluation data
+BabyLM Dataset (CoNLL 2023 Workshop)
 ## Training procedure
+Masked language modeling
 ### Training hyperparameters
 The following hyperparameters were used during training:
 - lr_scheduler_warmup_steps: 100000
 - training_steps: 400000
 ### Framework versions