nomic-ai
/

nomic-bert-2048

Model card Files Files and versions Community

Update modeling_hf_nomic_bert.py

#14

by zpn - opened Nov 18

base: refs/heads/main

←

from: refs/pr/14

Discussion Files changed

Files changed (1) hide show

modeling_hf_nomic_bert.py +4 -5

modeling_hf_nomic_bert.py CHANGED Viewed

@@ -1694,7 +1694,6 @@ class NomicBertModel(NomicBertPreTrainedModel):
         return_dict=None,
         matryoshka_dim=None,
         inputs_embeds=None,
-        head_mask=None,
     ):
         if input_ids is not None and inputs_embeds is not None:
             raise ValueError("You cannot specify both input_ids and inputs_embeds at the same time")
@@ -1868,7 +1867,7 @@ class NomicBertForMultipleChoice(NomicBertPreTrainedModel):
     def __init__(self, config):
         super().__init__(config)
-        self.bert = NomicBertModel(config, add_pooling_layer=True)
         classifier_dropout = (
             config.classifier_dropout if config.classifier_dropout is not None else config.hidden_dropout_prob
         )
@@ -1911,7 +1910,7 @@ class NomicBertForMultipleChoice(NomicBertPreTrainedModel):
             else None
         )
-        outputs = self.bert(
             input_ids,
             attention_mask=attention_mask,
             token_type_ids=token_type_ids,
@@ -1999,7 +1998,7 @@ class NomicBertForTokenClassification(NomicBertPreTrainedModel):
         loss = None
         if labels is not None:
-            loss_fct = CrossEntropyLoss()
             loss = loss_fct(logits.view(-1, self.num_labels), labels.view(-1))
         if not return_dict:
@@ -2081,7 +2080,7 @@ class NomicBertForQuestionAnswering(NomicBertPreTrainedModel):
             start_positions = start_positions.clamp(0, ignored_index)
             end_positions = end_positions.clamp(0, ignored_index)
-            loss_fct = CrossEntropyLoss(ignore_index=ignored_index)
             start_loss = loss_fct(start_logits, start_positions)
             end_loss = loss_fct(end_logits, end_positions)
             total_loss = (start_loss + end_loss) / 2

         return_dict=None,
         matryoshka_dim=None,
         inputs_embeds=None,
     ):
         if input_ids is not None and inputs_embeds is not None:
             raise ValueError("You cannot specify both input_ids and inputs_embeds at the same time")
     def __init__(self, config):
         super().__init__(config)
+        self.new = NomicBertModel(config, add_pooling_layer=True)
         classifier_dropout = (
             config.classifier_dropout if config.classifier_dropout is not None else config.hidden_dropout_prob
         )
             else None
         )
+        outputs = self.new(
             input_ids,
             attention_mask=attention_mask,
             token_type_ids=token_type_ids,
         loss = None
         if labels is not None:
+            loss_fct = nn.CrossEntropyLoss()
             loss = loss_fct(logits.view(-1, self.num_labels), labels.view(-1))
         if not return_dict:
             start_positions = start_positions.clamp(0, ignored_index)
             end_positions = end_positions.clamp(0, ignored_index)
+            loss_fct = nn.CrossEntropyLoss(ignore_index=ignored_index)
             start_loss = loss_fct(start_logits, start_positions)
             end_loss = loss_fct(end_logits, end_positions)
             total_loss = (start_loss + end_loss) / 2