imvladikon
/

sentence_transformers_alephbertgimmel_small

@@ -85,9 +85,9 @@ The model was trained with the parameters:
 **DataLoader**:
-`torch.utils.data.dataloader.DataLoader` of length 49088 with parameters:
 ```
-{'batch_size': 8, 'sampler': 'torch.utils.data.sampler.RandomSampler', 'batch_sampler': 'torch.utils.data.sampler.BatchSampler'}
 ```
 **Loss**:
@@ -101,7 +101,7 @@ Parameters of the fit()-Method:
 ```
 {
     "epochs": 1,
-    "evaluation_steps": 4908,
     "evaluator": "sentence_transformers.evaluation.EmbeddingSimilarityEvaluator.EmbeddingSimilarityEvaluator",
     "max_grad_norm": 1,
     "optimizer_class": "<class 'torch.optim.adamw.AdamW'>",
@@ -110,7 +110,7 @@ Parameters of the fit()-Method:
     },
     "scheduler": "WarmupLinear",
     "steps_per_epoch": null,
-    "warmup_steps": 4908,
     "weight_decay": 0.01
 }
 ```
@@ -119,7 +119,7 @@ Parameters of the fit()-Method:
 ## Full Model Architecture
 ```
 SentenceTransformer(
-  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
   (1): Pooling({'word_embedding_dimension': 512, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False})
 )
 ```

 **DataLoader**:
+`__main__.MultiDatasetDataLoader` of length 10819 with parameters:
 ```
+{'batch_size': 'unknown'}
 ```
 **Loss**:
 ```
 {
     "epochs": 1,
+    "evaluation_steps": 500,
     "evaluator": "sentence_transformers.evaluation.EmbeddingSimilarityEvaluator.EmbeddingSimilarityEvaluator",
     "max_grad_norm": 1,
     "optimizer_class": "<class 'torch.optim.adamw.AdamW'>",
     },
     "scheduler": "WarmupLinear",
     "steps_per_epoch": null,
+    "warmup_steps": 500,
     "weight_decay": 0.01
 }
 ```
 ## Full Model Architecture
 ```
 SentenceTransformer(
+  (0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: BertModel
   (1): Pooling({'word_embedding_dimension': 512, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False})
 )
 ```

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "imvladikon/sentence_transformers_alephbertgimmel_small",
   "architectures": [
     "BertModel"
   ],

 {
+  "_name_or_path": "/media/robert/BC7CA8E37CA899A2/dev/sentence_transformers_hebrew/sentence_transformers_hebrew/output/training_paraphrases_imvladikon-sentence_transformers_alephbertgimmel_small-2023-11-26_22-50-39",
   "architectures": [
     "BertModel"
   ],

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ddd2bf9323017d3d800a345155763df407446069445830014ff29ef899522e41
 size 314717513

 version https://git-lfs.github.com/spec/v1
+oid sha256:aa79393cdeb74b6af5bd7ec7ce5d036fb3f7d87c894958d3503da21c8affc689
 size 314717513

sentence_bert_config.json CHANGED Viewed

@@ -1,4 +1,4 @@
 {
-  "max_seq_length": 512,
   "do_lower_case": false
 }

 {
+  "max_seq_length": 128,
   "do_lower_case": false
 }

tokenizer.json CHANGED Viewed

@@ -2,7 +2,7 @@
   "version": "1.0",
   "truncation": {
     "direction": "Right",
-    "max_length": 512,
     "strategy": "LongestFirst",
     "stride": 0
   },

   "version": "1.0",
   "truncation": {
     "direction": "Right",
+    "max_length": 128,
     "strategy": "LongestFirst",
     "stride": 0
   },