Upload Qwen2ForCausalLM

Files changed (12) hide show

config.json ADDED Viewed

+{
+  "_name_or_path": "Qwen/Qwen2-72B",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "eos_token_id": 151643,
+  "hidden_act": "silu",
+  "hidden_size": 8192,
+  "initializer_range": 0.02,
+  "intermediate_size": 29568,
+  "max_position_embeddings": 131072,
+  "max_window_layers": 80,
+  "model_type": "qwen2",
+  "num_attention_heads": 64,
+  "num_hidden_layers": 80,
+  "num_key_value_heads": 8,
+  "quantization_config": {
+    "_load_in_4bit": true,
+    "_load_in_8bit": false,
+    "bnb_4bit_compute_dtype": "bfloat16",
+    "bnb_4bit_quant_storage": "uint8",
+    "bnb_4bit_quant_type": "nf4",
+    "bnb_4bit_use_double_quant": true,
+    "llm_int8_enable_fp32_cpu_offload": false,
+    "llm_int8_has_fp16_weight": false,
+    "llm_int8_skip_modules": null,
+    "llm_int8_threshold": 6.0,
+    "load_in_4bit": true,
+    "load_in_8bit": false,
+    "quant_method": "bitsandbytes"
+  },
+  "rms_norm_eps": 1e-05,
+  "rope_theta": 1000000.0,
+  "sliding_window": 131072,
+  "tie_word_embeddings": false,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.42.4",
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 152064
+}

generation_config.json ADDED Viewed

+{
+  "bos_token_id": 151643,
+  "eos_token_id": 151643,
+  "max_new_tokens": 2048,
+  "transformers_version": "4.42.4"
+}

model-00001-of-00009.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:141e99912587796275d018724429d3613deec50c86d92d2bdc2e25857f0fe28a
+size 4958417273

model-00002-of-00009.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1aae104ccb62874a55af6a483bdba12851ce4a0217c30bb3dd3d8eefe6aaa9e3
+size 4981068150

model-00003-of-00009.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1811d5e5fc170e97c870bc07a9fabfc02e339fd711efae03071fe267bdd10fbf
+size 4981068369

model-00004-of-00009.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:9babdd87659c1d4908868c735681b39c24d4d5402510160d7567842dc2676b8b
+size 4981068373

model-00005-of-00009.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:7586687f7d5bbe603541b66dc9da36b0316121f236b60e689b260304a01c92e8
+size 4981068377

model-00006-of-00009.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb1dc2c40085edff3b092edfa6854b310fe3a8d6c28bf68e8740e8b0f1f84d78
+size 4981068374

model-00007-of-00009.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:993bacb033dc6c5b24f5741afc659bb57c78ad584fd68f5e44200fe21669cf36
+size 4981068380

model-00008-of-00009.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:79974502dc61590c3e8e8373de9e48df5c8f2540650677f3b5718275f0faf314
+size 3872557274

model-00009-of-00009.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:1992b4740fd4ad466591dc503056502a8851c61fb34d28e39e143c7f49385e2e
+size 2491416704

model.safetensors.index.json ADDED Viewed

The diff for this file is too large to render. See raw diff