Upload GPTNeoXForCausalLM

Files changed (5) hide show

config.json CHANGED Viewed

@@ -19,22 +19,31 @@
   "num_attention_heads": 40,
   "num_hidden_layers": 36,
   "quantization_config": {
     "bits": 8,
     "damp_percent": 0.1,
     "dataset": "wikitext2",
     "desc_act": false,
     "group_size": 128,
-    "modules_in_block_to_quantize": null,
     "quant_method": "gptq",
     "sym": true,
-    "true_sequential": true
   },
   "rope_scaling": null,
   "rotary_emb_base": 10000,
   "rotary_pct": 0.25,
   "tie_word_embeddings": false,
   "torch_dtype": "float16",
-  "transformers_version": "4.41.2",
   "use_cache": true,
   "use_parallel_residual": true,
   "vocab_size": 50688

   "num_attention_heads": 40,
   "num_hidden_layers": 36,
   "quantization_config": {
+    "batch_size": 1,
     "bits": 8,
+    "block_name_to_quantize": "gpt_neox.layers",
     "damp_percent": 0.1,
     "dataset": "wikitext2",
     "desc_act": false,
+    "disable_exllama": false,
     "group_size": 128,
+    "model_seqlen": 4096,
+    "module_name_preceding_first_block": [
+      "gpt_neox.embed_in",
+      "gpt_neox.emb_dropout"
+    ],
+    "pad_token_id": null,
     "quant_method": "gptq",
     "sym": true,
+    "true_sequential": true,
+    "use_cuda_fp16": true
   },
   "rope_scaling": null,
   "rotary_emb_base": 10000,
   "rotary_pct": 0.25,
   "tie_word_embeddings": false,
   "torch_dtype": "float16",
+  "transformers_version": "4.44.0",
   "use_cache": true,
   "use_parallel_residual": true,
   "vocab_size": 50688

generation_config.json CHANGED Viewed

@@ -2,5 +2,5 @@
   "_from_model_config": true,
   "bos_token_id": 0,
   "eos_token_id": 0,
-  "transformers_version": "4.41.2"
 }

   "_from_model_config": true,
   "bos_token_id": 0,
   "eos_token_id": 0,
+  "transformers_version": "4.44.0"
 }

model-00001-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fa7470885ffa9dbbb9a01fa51c1ae1457765ced161802566bc9895b2384c53ed
 size 4922816920

 version https://git-lfs.github.com/spec/v1
+oid sha256:70c354bc14f4761970d18ccd01b5ec920c752a0db1c0e5a93e803dafd872c86d
 size 4922816920

model-00002-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:84244c9feeeecc4f3d1fb600200790b7cff5b62ac05acd59925813d2e891b46c
 size 4967652888

 version https://git-lfs.github.com/spec/v1
+oid sha256:3d7dee582f749f051ce22455a04c9ed1e1e5687e3993b44bda4d1bf9761778db
 size 4967652888

model-00003-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:321265c3103abff9935c8797f90f9a5c16914510ff84c0390d177d8bfa21f482
 size 2747738936

 version https://git-lfs.github.com/spec/v1
+oid sha256:f84df2ee41f096c75d4a55cb4f8b5b5fb4c55aeef492d6f600f1cfa8793e3d21
 size 2747738936