MasterAlex69
/

gpt2_edline

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

MasterAlex69 commited on Dec 18, 2024

Commit

72ddb7a

·

verified ·

1 Parent(s): 31d96ea

Model save

Files changed (1) hide show

README.md +7 -7

README.md CHANGED Viewed

@@ -1,7 +1,7 @@
 ---
 library_name: transformers
 license: mit
-base_model: gpt2
 tags:
 - generated_from_trainer
 model-index:
@@ -14,7 +14,7 @@ should probably proofread and complete it, then remove this comment. -->
 # gpt2_edline
-This model is a fine-tuned version of [gpt2](https://huggingface.co/gpt2) on an unknown dataset.
 ## Model description
@@ -33,13 +33,13 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 1e-05
-- train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
-- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 4
 ### Training results
@@ -47,6 +47,6 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.46.2
 - Pytorch 2.5.1+cu121
 - Tokenizers 0.20.3

 ---
 library_name: transformers
 license: mit
+base_model: openai-community/gpt2
 tags:
 - generated_from_trainer
 model-index:
 # gpt2_edline
+This model is a fine-tuned version of [openai-community/gpt2](https://huggingface.co/openai-community/gpt2) on an unknown dataset.
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 1e-07
+- train_batch_size: 4
 - eval_batch_size: 8
 - seed: 42
+- optimizer: Use adamw_hf with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- training_steps: 50000
 ### Training results
 ### Framework versions
+- Transformers 4.46.3
 - Pytorch 2.5.1+cu121
 - Tokenizers 0.20.3