tuned nomic v2

This is a sentence-transformers model finetuned from nomic-ai/nomic-embed-text-v2-moe on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: nomic-ai/nomic-embed-text-v2-moe
  • Maximum Sequence Length: 512 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity
  • Training Dataset:
    • json
  • Language: en
  • License: apache-2.0

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: NomicBertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'Компания «Альфа» заключила договор с инженером Петровским на разработку нового программного обеспечения.  В процессе работы Петровский создал изобретение, защищаемое патентом. Договор не содержал пунктов, касающихся прав на интеллектуальную собственность.  Кто является правообладателем патента на изобретение, и может ли компания «Альфа» использовать это изобретение без выплаты дополнительного вознаграждения?',
    '<p>1. Право на получение патента и исключительное право на изобретение, полезную модель или промышленный образец, созданные при выполнении договора подряда или договора на выполнение научно-исследовательских, опытно-конструкторских или технологических работ, которые прямо не предусматривали их создание, принадлежат подрядчику (исполнителю), если договором между ним и заказчиком не предусмотрено иное. (В редакции Федерального закона <a href="102171743">от 12.03.2014 № 35-ФЗ</a>)</p><p>В этом случае заказчик вправе, если договором не предусмотрено иное, использовать созданные таким образом изобретение, полезную модель или промышленный образец в целях, для достижения которых был заключен соответствующий договор, на условиях простой (неисключительной) лицензии в течение всего срока действия патента без выплаты за это использование дополнительного вознаграждения. При передаче подрядчиком (исполнителем) права на получение патента или отчуждении самого патента другому лицу заказчик сохраняет право использования изобретения, полезной модели или промышленного образца на указанных условиях.</p><p>2. В случае, когда в соответствии с договором между подрядчиком (исполнителем) и заказчиком право на получение патента или исключительное право на изобретение, полезную модель или промышленный образец передано заказчику либо указанному им третьему лицу, подрядчик (исполнитель) вправе использовать созданные изобретение, полезную модель или промышленный образец для собственных нужд на условиях безвозмездной простой (неисключительной) лицензии в течение всего срока действия патента, если договором не предусмотрено иное.</p><p>3. Автору указанных в пункте 1 настоящей статьи изобретения, полезной модели или промышленного образца, не являющемуся патентообладателем, выплачивается вознаграждение в соответствии с пунктом 4 статьи 1370 настоящего Кодекса.</p>',
    '<p>передаче в порядке, установленном частью 11 статьи 154 Федерального закона <a href="102088491">от 22 августа 2004 года № 122-ФЗ</a> "О внесении изменений в законодательные акты Российской Федерации и признании утратившими силу некоторых законодательных актов Российской Федерации в связи с принятием федеральных законов <a href="102067003">"О внесении изменений и дополнений в Федеральный закон "Об общих принципах организации законодательных (представительных) и исполнительных органов государственной власти субъектов Российской Федерации"</a> и <a href="102083574">"Об общих принципах организации местного самоуправления в Российской Федерации"</a>, акций из федеральной собственности в собственность субъекта Российской Федерации или муниципальную собственность, из собственности субъекта Российской Федерации в федеральную собственность или муниципальную собственность, из муниципальной собственности в федеральную собственность или собственность субъекта Российской Федерации. (Дополнение абзацем - Федеральный закон <a href="102157372">от 14.06.2012 № 77-ФЗ</a>)</p>',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Information Retrieval

Metric dim_768 dim_512 dim_256 dim_128 dim_64
cosine_accuracy@1 0.0075 0.0068 0.0082 0.0082 0.0075
cosine_accuracy@3 0.06 0.0593 0.0621 0.0559 0.0628
cosine_accuracy@5 0.4304 0.4311 0.4168 0.384 0.3793
cosine_accuracy@10 0.7619 0.7449 0.7271 0.6951 0.6412
cosine_precision@1 0.0075 0.0068 0.0082 0.0082 0.0075
cosine_precision@3 0.02 0.0198 0.0207 0.0186 0.0209
cosine_precision@5 0.0861 0.0862 0.0834 0.0768 0.0759
cosine_precision@10 0.0762 0.0745 0.0727 0.0695 0.0641
cosine_recall@1 0.0075 0.0068 0.0082 0.0082 0.0075
cosine_recall@3 0.06 0.0593 0.0621 0.0559 0.0628
cosine_recall@5 0.4304 0.4311 0.4168 0.384 0.3793
cosine_recall@10 0.7619 0.7449 0.7271 0.6951 0.6412
cosine_ndcg@10 0.3 0.2938 0.2877 0.2752 0.2547
cosine_mrr@10 0.1604 0.1574 0.1548 0.1482 0.1378
cosine_map@100 0.1731 0.171 0.1693 0.1639 0.1541

Training Details

Training Dataset

json

  • Dataset: json
  • Size: 13,186 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 18 tokens
    • mean: 61.09 tokens
    • max: 162 tokens
    • min: 40 tokens
    • mean: 258.71 tokens
    • max: 512 tokens
  • Samples:
    anchor positive
    Студент разработал базу данных и подал заявку на государственную регистрацию, приложив к ней описание базы данных, реферат и заявление с указанием себя в качестве правообладателя и автора. В заявке он указал две разные базы данных. Соответствует ли заявка студента требованиям статьи закона?

    1. Правообладатель в течение срока действия исключительного права на программу для ЭВМ или на базу данных может по своему желанию зарегистрировать такую программу или такую базу данных в федеральном органе исполнительной власти по интеллектуальной собственности.

    Программы для ЭВМ и базы данных, в которых содержатся сведения, составляющие государственную тайну, государственной регистрации не подлежат. Лицо, подавшее заявку на государственную регистрацию (заявитель), несет ответственность за разглашение сведений о программах для ЭВМ и базах данных, в которых содержатся сведения, составляющие государственную тайну, в соответствии с законодательством Российской Федерации.

    2. Заявка на государственную регистрацию программы для ЭВМ или базы данных (заявка на регистрацию) должна относиться к одной программе для ЭВМ или к одной базе данных.

    Заявка на регистрацию должна содержать:

    заявление о государственной регистрации программы для ЭВМ или базы данных с указанием пр...

    Предположим, наследственный договор предусматривает переход права собственности на дом к А, но А отказывается от наследства. Может ли Б, другая сторона договора, потребовать исполнения договора в отношении дома, если договор не содержал бы условий о передаче дома Б в случае отказа А?

    1. Наследодатель вправе заключить с любым из лиц, которые могут призываться к наследованию (статья 1116), договор, условия которого определяют круг наследников и порядок перехода прав на имущество наследодателя после его смерти к пережившим наследодателя сторонам договора или к пережившим третьим лицам, которые могут призываться к наследованию (наследственный договор). Наследственный договор может также содержать условие о душеприказчике и возлагать на участвующих в наследственном договоре лиц, которые могут призываться к наследованию, обязанность совершить какие-либо не противоречащие закону действия имущественного или неимущественного характера, в том числе исполнить завещательные отказы или завещательные возложения.

    Последствия, предусмотренные наследственным договором, могут быть поставлены в зависимость от наступивших ко дню открытия наследства обстоятельств, относительно которых при заключении наследственного договора было неизвестно, наступят они или не наступят, в том ...

    В чем заключается различие в порядке оспаривания патента в зависимости от характера нарушения, указанного в пункте 1 настоящей статьи?

    2. Патент на изобретение, полезную модель или промышленный образец в течение срока его действия, установленного пунктами 1 - 3 статьи 1363 настоящего Кодекса, может быть оспорен путем подачи возражения в федеральный орган исполнительной власти по интеллектуальной собственности любым лицом, которому стало известно о нарушениях, предусмотренных подпунктами 1 - 4 пункта 1 настоящей статьи.

    Патент на изобретение, полезную модель или промышленный образец в течение срока его действия, установленного пунктами 1 - 3 статьи 1363 настоящего Кодекса, может быть оспорен в судебном порядке любым лицом, которому стало известно о нарушениях, предусмотренных подпунктом 5 пункта 1 настоящей статьи.

    Патент на изобретение, полезную модель или промышленный образец может быть оспорен заинтересованным лицом и по истечении срока его действия по основаниям и в порядке, которые установлены абзацами первым и вторым настоящего пункта.

  • Loss: MatryoshkaLoss with these parameters:
    {
        "loss": "MultipleNegativesRankingLoss",
        "matryoshka_dims": [
            768,
            512,
            256,
            128,
            64
        ],
        "matryoshka_weights": [
            1,
            1,
            1,
            1,
            1
        ],
        "n_dims_per_step": -1
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: epoch
  • per_device_train_batch_size: 2
  • per_device_eval_batch_size: 2
  • gradient_accumulation_steps: 16
  • learning_rate: 2e-05
  • num_train_epochs: 4
  • lr_scheduler_type: cosine
  • warmup_ratio: 0.1
  • bf16: True
  • load_best_model_at_end: True
  • optim: adamw_torch_fused
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: epoch
  • prediction_loss_only: True
  • per_device_train_batch_size: 2
  • per_device_eval_batch_size: 2
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 16
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 4
  • max_steps: -1
  • lr_scheduler_type: cosine
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • eval_use_gather_object: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Click to expand
Epoch Step Training Loss dim_768_cosine_ndcg@10 dim_512_cosine_ndcg@10 dim_256_cosine_ndcg@10 dim_128_cosine_ndcg@10 dim_64_cosine_ndcg@10
0.0243 10 0.2108 - - - - -
0.0485 20 0.1169 - - - - -
0.0728 30 0.1334 - - - - -
0.0971 40 0.0963 - - - - -
0.1213 50 0.127 - - - - -
0.1456 60 0.1254 - - - - -
0.1699 70 0.048 - - - - -
0.1941 80 0.0358 - - - - -
0.2184 90 0.0673 - - - - -
0.2427 100 0.049 - - - - -
0.2669 110 0.0222 - - - - -
0.2912 120 0.0657 - - - - -
0.3155 130 0.0878 - - - - -
0.3398 140 0.0396 - - - - -
0.3640 150 0.033 - - - - -
0.3883 160 0.0562 - - - - -
0.4126 170 0.0329 - - - - -
0.4368 180 0.0918 - - - - -
0.4611 190 0.0198 - - - - -
0.4854 200 0.0181 - - - - -
0.5096 210 0.0119 - - - - -
0.5339 220 0.0139 - - - - -
0.5582 230 0.057 - - - - -
0.5824 240 0.0293 - - - - -
0.6067 250 0.0482 - - - - -
0.6310 260 0.017 - - - - -
0.6552 270 0.0927 - - - - -
0.6795 280 0.0187 - - - - -
0.7038 290 0.0553 - - - - -
0.7280 300 0.015 - - - - -
0.7523 310 0.0438 - - - - -
0.7766 320 0.0087 - - - - -
0.8008 330 0.038 - - - - -
0.8251 340 0.0243 - - - - -
0.8494 350 0.015 - - - - -
0.8737 360 0.0199 - - - - -
0.8979 370 0.0516 - - - - -
0.9222 380 0.0561 - - - - -
0.9465 390 0.0851 - - - - -
0.9707 400 0.0394 - - - - -
0.9950 410 0.0114 - - - - -
0.9998 412 - 0.2806 0.2779 0.2742 0.2597 0.2253
1.0193 420 0.0136 - - - - -
1.0435 430 0.1219 - - - - -
1.0678 440 0.0164 - - - - -
1.0921 450 0.0927 - - - - -
1.1163 460 0.0268 - - - - -
1.1406 470 0.0384 - - - - -
1.1649 480 0.0034 - - - - -
1.1891 490 0.0183 - - - - -
1.2134 500 0.0594 - - - - -
1.2377 510 0.0145 - - - - -
1.2619 520 0.0768 - - - - -
1.2862 530 0.0084 - - - - -
1.3105 540 0.0528 - - - - -
1.3347 550 0.0619 - - - - -
1.3590 560 0.0326 - - - - -
1.3833 570 0.0135 - - - - -
1.4076 580 0.0143 - - - - -
1.4318 590 0.0952 - - - - -
1.4561 600 0.0188 - - - - -
1.4804 610 0.01 - - - - -
1.5046 620 0.091 - - - - -
1.5289 630 0.0205 - - - - -
1.5532 640 0.0156 - - - - -
1.5774 650 0.0101 - - - - -
1.6017 660 0.022 - - - - -
1.6260 670 0.0135 - - - - -
1.6502 680 0.0226 - - - - -
1.6745 690 0.0032 - - - - -
1.6988 700 0.0071 - - - - -
1.7230 710 0.028 - - - - -
1.7473 720 0.0351 - - - - -
1.7716 730 0.0021 - - - - -
1.7958 740 0.0073 - - - - -
1.8201 750 0.0103 - - - - -
1.8444 760 0.0219 - - - - -
1.8686 770 0.0035 - - - - -
1.8929 780 0.0579 - - - - -
1.9172 790 0.0298 - - - - -
1.9415 800 0.0076 - - - - -
1.9657 810 0.0038 - - - - -
1.9900 820 0.0016 - - - - -
1.9997 824 - 0.2945 0.2886 0.2856 0.2642 0.2411
2.0143 830 0.0715 - - - - -
2.0385 840 0.0021 - - - - -
2.0628 850 0.0065 - - - - -
2.0871 860 0.0105 - - - - -
2.1113 870 0.0024 - - - - -
2.1356 880 0.0025 - - - - -
2.1599 890 0.014 - - - - -
2.1841 900 0.0016 - - - - -
2.2084 910 0.008 - - - - -
2.2327 920 0.0041 - - - - -
2.2569 930 0.0308 - - - - -
2.2812 940 0.011 - - - - -
2.3055 950 0.0207 - - - - -
2.3297 960 0.0048 - - - - -
2.3540 970 0.0215 - - - - -
2.3783 980 0.0061 - - - - -
2.4025 990 0.0164 - - - - -
2.4268 1000 0.0255 - - - - -
2.4511 1010 0.0062 - - - - -
2.4754 1020 0.0079 - - - - -
2.4996 1030 0.005 - - - - -
2.5239 1040 0.042 - - - - -
2.5482 1050 0.0057 - - - - -
2.5724 1060 0.0384 - - - - -
2.5967 1070 0.009 - - - - -
2.6210 1080 0.0089 - - - - -
2.6452 1090 0.0034 - - - - -
2.6695 1100 0.026 - - - - -
2.6938 1110 0.0358 - - - - -
2.7180 1120 0.0033 - - - - -
2.7423 1130 0.0037 - - - - -
2.7666 1140 0.0195 - - - - -
2.7908 1150 0.0024 - - - - -
2.8151 1160 0.0533 - - - - -
2.8394 1170 0.0137 - - - - -
2.8636 1180 0.0125 - - - - -
2.8879 1190 0.0253 - - - - -
2.9122 1200 0.0068 - - - - -
2.9364 1210 0.0436 - - - - -
2.9607 1220 0.0021 - - - - -
2.9850 1230 0.0129 - - - - -
2.9995 1236 - 0.2986 0.2955 0.2842 0.2749 0.2512
3.0093 1240 0.0037 - - - - -
3.0335 1250 0.0161 - - - - -
3.0578 1260 0.0164 - - - - -
3.0821 1270 0.0007 - - - - -
3.1063 1280 0.0023 - - - - -
3.1306 1290 0.0073 - - - - -
3.1549 1300 0.0134 - - - - -
3.1791 1310 0.0021 - - - - -
3.2034 1320 0.0571 - - - - -
3.2277 1330 0.0376 - - - - -
3.2519 1340 0.0049 - - - - -
3.2762 1350 0.0151 - - - - -
3.3005 1360 0.002 - - - - -
3.3247 1370 0.0276 - - - - -
3.3490 1380 0.0007 - - - - -
3.3733 1390 0.0324 - - - - -
3.3975 1400 0.0043 - - - - -
3.4218 1410 0.0074 - - - - -
3.4461 1420 0.005 - - - - -
3.4703 1430 0.0066 - - - - -
3.4946 1440 0.0039 - - - - -
3.5189 1450 0.0056 - - - - -
3.5432 1460 0.0039 - - - - -
3.5674 1470 0.0148 - - - - -
3.5917 1480 0.0029 - - - - -
3.6160 1490 0.011 - - - - -
3.6402 1500 0.0029 - - - - -
3.6645 1510 0.0057 - - - - -
3.6888 1520 0.0013 - - - - -
3.7130 1530 0.0618 - - - - -
3.7373 1540 0.0102 - - - - -
3.7616 1550 0.0009 - - - - -
3.7858 1560 0.023 - - - - -
3.8101 1570 0.0067 - - - - -
3.8344 1580 0.011 - - - - -
3.8586 1590 0.0023 - - - - -
3.8829 1600 0.0154 - - - - -
3.9072 1610 0.0014 - - - - -
3.9314 1620 0.0024 - - - - -
3.9557 1630 0.0034 - - - - -
3.9800 1640 0.0022 - - - - -
3.9994 1648 - 0.3 0.2938 0.2877 0.2752 0.2547
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.11.11
  • Sentence Transformers: 3.4.1
  • Transformers: 4.43.0
  • PyTorch: 2.6.0+cu124
  • Accelerate: 1.3.0
  • Datasets: 3.3.2
  • Tokenizers: 0.19.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MatryoshkaLoss

@misc{kusupati2024matryoshka,
    title={Matryoshka Representation Learning},
    author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
    year={2024},
    eprint={2205.13147},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
Downloads last month
38
Safetensors
Model size
475M params
Tensor type
F32
·
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.

Model tree for basilisk78/nomic-v2-tuned-1

Evaluation results