Upload Phi3ForCausalLM

Files changed (3) hide show

config.json CHANGED Viewed

@@ -5,9 +5,9 @@
   "attention_bias": false,
   "attention_dropout": 0.0,
   "auto_map": {
-    "AutoConfig": "microsoft/Phi-4-mini-instruct--configuration_phi3.Phi3Config",
-    "AutoModelForCausalLM": "microsoft/Phi-4-mini-instruct--modeling_phi3.Phi3ForCausalLM",
-    "AutoTokenizer": "microsoft/Phi-4-mini-instruct--Xenova/gpt-4o"
   },
   "bos_token_id": 199999,
   "embd_pdrop": 0.0,
@@ -29,6 +29,7 @@
   "pad_token_id": 199999,
   "partial_rotary_factor": 0.75,
   "quantization_config": {
     "modules_to_not_convert": null,
     "quant_method": "torchao",
     "quant_type": {
@@ -38,11 +39,18 @@
             "_data": "float8_e4m3fn",
             "_type": "torch.dtype"
           },
-          "granularity": {
-            "_data": {},
-            "_type": "PerRow",
-            "_version": 1
-          },
           "mm_config": {
             "_data": {
               "emulate": false,
@@ -62,7 +70,8 @@
         "_version": 1
       }
     },
-    "quant_type_kwargs": {}
   },
   "resid_pdrop": 0.0,
   "rms_norm_eps": 1e-05,
@@ -173,7 +182,7 @@
   "sliding_window": 262144,
   "tie_word_embeddings": true,
   "torch_dtype": "bfloat16",
-  "transformers_version": "4.52.0.dev0",
   "use_cache": true,
   "vocab_size": 200064
 }

   "attention_bias": false,
   "attention_dropout": 0.0,
   "auto_map": {
+    "AutoConfig": "configuration_phi3.Phi3Config",
+    "AutoModelForCausalLM": "modeling_phi3.Phi3ForCausalLM",
+    "AutoTokenizer": "Xenova/gpt-4o"
   },
   "bos_token_id": 199999,
   "embd_pdrop": 0.0,
   "pad_token_id": 199999,
   "partial_rotary_factor": 0.75,
   "quantization_config": {
+    "include_input_output_embeddings": false,
     "modules_to_not_convert": null,
     "quant_method": "torchao",
     "quant_type": {
             "_data": "float8_e4m3fn",
             "_type": "torch.dtype"
           },
+          "granularity": [
+            {
+              "_data": {},
+              "_type": "PerRow",
+              "_version": 1
+            },
+            {
+              "_data": {},
+              "_type": "PerRow",
+              "_version": 1
+            }
+          ],
           "mm_config": {
             "_data": {
               "emulate": false,
         "_version": 1
       }
     },
+    "quant_type_kwargs": {},
+    "untie_embedding_weights": false
   },
   "resid_pdrop": 0.0,
   "rms_norm_eps": 1e-05,
   "sliding_window": 262144,
   "tie_word_embeddings": true,
   "torch_dtype": "bfloat16",
+  "transformers_version": "4.53.0.dev0",
   "use_cache": true,
   "vocab_size": 200064
 }

generation_config.json CHANGED Viewed

@@ -6,5 +6,5 @@
     199999
   ],
   "pad_token_id": 199999,
-  "transformers_version": "4.52.0.dev0"
 }

     199999
   ],
   "pad_token_id": 199999,
+  "transformers_version": "4.53.0.dev0"
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:55ddf11c9a54695846929dca0061069f1d80a876a9eb066483c93ad86abb7764
-size 4454508518

 version https://git-lfs.github.com/spec/v1
+oid sha256:d80b2c8d56ccbc15cf808ead75ba209ca390467538815051185e142e87820d7d
+size 4454508683