epfl-ml4ed
/

MCQBert

tommymarto commited on Jun 7, 2024

Commit

dc93082

1 Parent(s): ad2eff7

working version with base model + mcqbert

Files changed (2) hide show

config.json CHANGED Viewed

@@ -5,7 +5,7 @@
   ],
   "auto_map": {
     "AutoConfig": "configuration_mcqbert.MCQBertConfig",
-    "AutoModelForCausalLM": "modeling_mcqbert.MCQBert"
   },
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
@@ -18,7 +18,7 @@
   "intermediate_size": 3072,
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 512,
-  "model_type": "bert",
   "num_attention_heads": 12,
   "num_hidden_layers": 12,
   "pad_token_id": 0,

   ],
   "auto_map": {
     "AutoConfig": "configuration_mcqbert.MCQBertConfig",
+    "AutoModel": "modeling_mcqbert.MCQBert"
   },
   "attention_probs_dropout_prob": 0.1,
   "classifier_dropout": null,
   "intermediate_size": 3072,
   "layer_norm_eps": 1e-12,
   "max_position_embeddings": 512,
+  "model_type": "mcqbert",
   "num_attention_heads": 12,
   "num_hidden_layers": 12,
   "pad_token_id": 0,

modeling_mcqbert.py CHANGED Viewed

@@ -1,12 +1,14 @@
-from transformers import BertPreTrainedModel
 import torch
 from .configuration_mcqbert import MCQBertConfig
-class MCQBert(BertPreTrainedModel):
     def __init__(self, config: MCQBertConfig):
         super().__init__(config)
-        self.student_embedding_layer = torch.nn.Linear(config.student_embedding_size, config.hidden_size)
         cls_input_dim_multiplier = 2 if config.integration_strategy == "cat" else 1
         cls_input_dim = self.config.hidden_size * cls_input_dim_multiplier

+from transformers import BertModel
 import torch
 from .configuration_mcqbert import MCQBertConfig
+class MCQBert(BertModel):
     def __init__(self, config: MCQBertConfig):
         super().__init__(config)
+        if config.integration_strategy is not None:
+            self.student_embedding_layer = torch.nn.Linear(config.student_embedding_size, config.hidden_size)
         cls_input_dim_multiplier = 2 if config.integration_strategy == "cat" else 1
         cls_input_dim = self.config.hidden_size * cls_input_dim_multiplier