Exquisique
/

BabyLangModel

Text Generation

Model card Files Files and versions

Exquisique commited on 30 days ago

Commit

d16379a

·

1 Parent(s): 81beb99

Configure custom GPT for AutoModel loading

Files changed (2) hide show

__init__.py +10 -0
config.json +7 -2

__init__.py ADDED Viewed

	@@ -0,0 +1,10 @@

+# __init__.py
+from .model import GPTConfig, GPT
+try:
+    from transformers import AutoConfig, AutoModel
+    AutoConfig.register("gpt", GPTConfig)
+    AutoModel.register(GPTConfig, GPT)
+except ImportError:
+    pass

config.json CHANGED Viewed

@@ -6,7 +6,12 @@
   "n_layer": 6,
   "n_head": 6,
   "n_embd": 384,
   "auto_map": {
     "AutoModel": "model.GPT"
-  }
-}

   "n_layer": 6,
   "n_head": 6,
   "n_embd": 384,
+  "dropout": 0.0,
+  "bias": true,
   "auto_map": {
+    "AutoConfig": "model.GPTConfig",
     "AutoModel": "model.GPT"
+  },
+  "torch_dtype": "float32",
+  "transformers_version": "4.42.0"
+}