Training in progress, epoch 1

Files changed (7) hide show

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "gpt2",
   "activation_function": "gelu_new",
   "architectures": [
     "GPT2LMHeadModel"
@@ -12,11 +12,13 @@
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt2",
   "n_ctx": 1024,
-  "n_embd": 768,
-  "n_head": 12,
   "n_inner": null,
-  "n_layer": 12,
   "n_positions": 1024,
   "reorder_and_upcast_attn": false,
   "resid_pdrop": 0.1,
   "scale_attn_by_inverse_layer_idx": false,
@@ -33,7 +35,7 @@
     }
   },
   "torch_dtype": "float32",
-  "transformers_version": "4.36.0.dev0",
   "use_cache": true,
   "vocab_size": 50257
 }

 {
+  "_name_or_path": "gpt2-medium",
   "activation_function": "gelu_new",
   "architectures": [
     "GPT2LMHeadModel"
   "layer_norm_epsilon": 1e-05,
   "model_type": "gpt2",
   "n_ctx": 1024,
+  "n_embd": 1024,
+  "n_head": 16,
   "n_inner": null,
+  "n_layer": 24,
   "n_positions": 1024,
+  "n_special": 0,
+  "predict_special_tokens": true,
   "reorder_and_upcast_attn": false,
   "resid_pdrop": 0.1,
   "scale_attn_by_inverse_layer_idx": false,
     }
   },
   "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
   "use_cache": true,
   "vocab_size": 50257
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7173249b331523f7a35bf7c989fb39b5f9ae4b52f8818fdccb5fc89c2b6c9829
-size 497774208

 version https://git-lfs.github.com/spec/v1
+oid sha256:d468611214e15bd065df8cdfbe02d4ac1a04fcc72251ab09a043bcfb6360dfa4
+size 1419322880

runs/Nov30_16-59-21_0d84db9a61c5/events.out.tfevents.1701363674.0d84db9a61c5.3778.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:59e17c4aa1e3b6afd1d32978a09d8b86b87086ac64f367278407a2e0c52399e9
+size 6101

special_tokens_map.json CHANGED Viewed

@@ -1,5 +1,6 @@
 {
   "bos_token": "<|endoftext|>",
   "eos_token": "<|endoftext|>",
   "unk_token": "<|endoftext|>"
 }

 {
   "bos_token": "<|endoftext|>",
   "eos_token": "<|endoftext|>",
+  "pad_token": "<|endoftext|>",
   "unk_token": "<|endoftext|>"
 }

tokenizer.json CHANGED Viewed

@@ -1,6 +1,11 @@
 {
   "version": "1.0",
-  "truncation": null,
   "padding": null,
   "added_tokens": [
     {

 {
   "version": "1.0",
+  "truncation": {
+    "direction": "Right",
+    "max_length": 128,
+    "strategy": "LongestFirst",
+    "stride": 0
+  },
   "padding": null,
   "added_tokens": [
     {

tokenizer_config.json CHANGED Viewed

@@ -14,6 +14,7 @@
   "clean_up_tokenization_spaces": true,
   "eos_token": "<|endoftext|>",
   "model_max_length": 1024,
   "tokenizer_class": "GPT2Tokenizer",
   "unk_token": "<|endoftext|>"
 }

   "clean_up_tokenization_spaces": true,
   "eos_token": "<|endoftext|>",
   "model_max_length": 1024,
+  "pad_token": "<|endoftext|>",
   "tokenizer_class": "GPT2Tokenizer",
   "unk_token": "<|endoftext|>"
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b61bed3596f8bffdbe5f86140a0cc6b54a8e7b30e7c247eedacca75b7e78b4c9
-size 4664

 version https://git-lfs.github.com/spec/v1
+oid sha256:fa1864c89cb2e7a6183f660425054bcfbc952b806deb99b448bb30367c129dfa
+size 4600