SentenceTransformer based on BAAI/bge-m3

This is a sentence-transformers model finetuned from BAAI/bge-m3. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: BAAI/bge-m3
  • Maximum Sequence Length: 8192 tokens
  • Output Dimensionality: 1024 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("strongpear/M3-retriever-Medical")
# Run inference
sentences = [
    'Mục đích chính của T0 là gì?',
    'Mục đích của T0 này là so sánh hiệu quả của bài tập chuyển động thụ động và bài tập chuyển động AS đối với sức khỏe chức năng ở các đối tượng và phương pháp của cư dân viện dưỡng lão cao tuổi. Hai mươi ba cư dân tại viện dưỡng lão nam và nữ tình nguyện tham gia T0 này, họ được chia thành một nhóm thụ động nhóm tập thể dục chuyển động n và một nhóm tập thể dục chuyển động AS n và thực hiện các buổi tập tối thiểu hai lần một tuần trong nhiều tuần ghế tập thể hình PET đứng lên ngồi vươn tay ra sau Các bài kiểm tra FR và đi bộ tối thiểu đã được đánh giá trước đó và T3 kết quả can thiệp không có đường cơ sở đáng kể sự khác biệt được ghi nhận giữa các nhóm về các biến đo được sau can thiệp trong tuần không có nhóm tương tác đáng kể nào à thời gian được ghi nhận trong các biến thể dục chức năng giữa CG ngoại trừ điểm FR Bài tập chuyển động AS Bài tập chuyển động thụ động cải thiện đáng kể theo thời gian đã được ghi nhận trong bài tập chuyển động thụ động nhóm ngồi trên ghế cong đứng lên điểm đi bộ và đi bộ tối thiểu và trong nhóm tập thể dục chuyển động tích cực ngồi trên ghế cong đứng lên điểm đi bộ FR và đi bộ tối thiểu tỷ lệ tuân thủ trong các nhóm tập thể dục thụ động và chuyển động AS lần lượt là kết luận bài tập chuyển động thụ động và bài tập chuyển động tích cực được cho là có hiệu quả tương tự trong việc cải thiện thể lực PET của người già ở viện dưỡng lão',
    'Sâu răng càng nặng, răng sẽ càng chịu nhiều tổn thương. Thậm chí, nếu không được điều trị sớm, sâu răng sẽ tấn công và khiến cho rằng hàm vỡ hết chỉ còn chân răng.\n 2. Mức độ nguy hiểm của răng hàm vỡ chỉ còn chân răng\n Tình trạng răng cối bị sâu dẫn tới vỡ chỉ còn chân răng rất nguy hiểm. Nếu không được chăm sóc và điều trị kịp thời sẽ dẫn tới nhiều biến chứng gây ảnh hưởng nghiêm trọng tới sức khỏe người bệnh.\n 2.1 Ảnh hưởng chức năng ăn nhai của răng\n Khi tổ chức cứng của răng bị phá hủy càng nhiều, răng sẽ càng dễ vỡ. Thời điểm răng chỉ còn lại chân, chức năng ăn nhai của răng cũng sẽ mất.\n 2.2 Viêm lợi\n Sâu răng sẽ tạo ra những lỗ, hốc sâu. Đây chính là vị trí thuận lợi để răng sâu lưu giữ thức ăn. Lâu ngày, điều này sẽ dẫn tới hình thành ổ vi khuẩn, gây hôi miệng. Bên cạnh đó, khi răng xuất hiện hốc sâu, lợi sẽ dễ có xu hướng lấp kín hốc sâu đó. Phần lợi này sẽ dễ bị viêm, sưng, chảy máu cho phải chà sát nhiều trong quá trình ăn nhai.\n 2.3 Viêm tủy, nhiễm trùng chóp răng\n Khi tình trạng sâu răng hàm chuyển biến nặng sẽ dẫn tới đau nhức, viêm tủy, viêm chóp răng gây nguy hiểm\n Sâu răng khi chuyển nặng, sâu xuống dưới và vào tủy sẽ khiến răng bị đau nhức do viêm tủy. Khi tình trạng viêm tủy trở nên nghiêm trọng, lan sâu xuống chóp răng sẽ gây viêm nhiễm vùng chóp. Khi này, răng sẽ bị đau, lung lay, phần lợi xung quang sẽ sưng to. Lâu ngày, ổ abscess chóp răng sẽ hình thành. Vấn đề này không được xử lý sớm sẽ chính là nguy cơ mất răng và lây lan sang cả những răng lân cận.\n Ổ nhiễm trùng chóp răng lây lan sẽ gây viêm xương hàm. Sau đó, nếu không được khắc phục, phần mềm và các tổ chức lân cận cũng sẽ bị ảnh hưởng tạo nên ổ nhiễm trùng lớn rất khó để kiểm soát.\n Khi ổ nhiễm trùng lan rộng sẽ tạo ra nang to. Chúng phá hủy xương hàm và khiến xương hàm bị gãy, gây tổn thương thần kinh, đường mạch máu, …\n 3.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

Unnamed Dataset

  • Size: 123,750 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 10 tokens
    • mean: 19.64 tokens
    • max: 48 tokens
    • min: 19 tokens
    • mean: 396.68 tokens
    • max: 735 tokens
  • Samples:
    anchor positive
    Manh tràng có hình dạng và vị trí như thế nào trong đại tràng? Giải phẫu học về túi thừa đại tràng
    Bài viết được viết bởi Bác sĩ Mai Viễn Phương - Khoa Khám bệnh & Nội Khoa - Bệnh viện Đa khoa Quốc tế Vinmec Central Park
    Để hiểu rõ về bệnh túi thừa đại tràng và viêm túi thừa đại tràng, cần nắm vững về giải phẫu học và chức năng của ruột. Ruột non là đoạn ruột mảnh và dài bắt đầu từ dạ dày và kết thúc ở ruột già hoặc đại tràng. Đại tràng bắt đầu từ vùng hố chậu phải, có hình dạng một dấu hỏi lớn bắc ngang qua khắp ổ bụng và kết thúc ở trực tràng
    1. Cấu tạo của đại tràng
    Đại tràng chia làm 3 phần chính: manh tràng, kết tràng và trực tràng. Ruột non thông với ruột già tại ranh giới giữa manh tràng và kết tràng. Giữa ruột non và ruột già có van hồi manh tràng giữ cho các chất trong ruột già không chảy ngược lại lên ruột non.
    Cấu tạo của đại trực tràng
    Manh tràng. Hình dạng giống một chiếc túi hình tròn, vị trí của nó nằm ở ngay phía dưới của hỗng tràng được đổ vào bên trong ruột già. Manh tràng được liên kết với ruột thừa có hình dạng gần giống với ng...
    Chấn thương tụy có thể gây ra những vấn đề gì? Chấn thương
    Những sang chấn bên ngoài hay tổn thương trực tiếp vào tuyến tụy làm phá vỡ cấu trúc của tế bào, giải thoát dịch tụy ra ngoài, không chỉ gây viêm tụy cấp mà còn tổn thương các tạng xung quanh, viêm phúc mạc.Do tụy nằm kín đáo phía sau phúc mạc, mọi sang chấn có ảnh hưởng cả tụy thì mức độ thường nặng nề, điều trị khó khăn. Yêu cầu phẫu thuật khẩn cấp luôn được đặt ra để cầm máu, bảo tồn các tạng, làm sạch ổ bụng cũng như cứu giữ tính mạng.
    11. Tụy chia đôi
    Đây là một bất thường giải phẫu trong thời kỳ bào thai khiến tụy không sáp nhập mà thành hai tuyến tụy riêng biệt với ống bài tiết độc lập.Tuy nhiên, phát hiện này chỉ biết được khi khám nghiệm tử thi và cơ chế gây viêm tụy cũng chưa được biết rõ ràng.
    12. Bệnh lý mạch máu
    Tương tự như các cơ quan khác, tuyến tụy cũng được nuôi dưỡng bởi hệ thống mạch máu nuôi. Vì vậy, mọi bệnh lý trên mạch máu đều có thể ảnh hưởng đến chức năng tụy.Trong đó, thiếu máu cục bộ tụy là một nguyên nhân hiếm gặp của viêm tụy cấp nhưng lại rất ...
    Hình ảnh nội soi NBI có điểm gì nổi bật so với nội soi thông thường? Hình ảnh nội soi NBI có độ phân giải và độ phân giải cao nên giúp bác sỹ dễ dàng phát hiện những thay đổi nhỏ về màu sắc, hình thái của tổn thương ung thư và tiền ung thư mà nội soi thông thường khó phát hiện được.Ngoài ra, nội soi đại trực tràng và mọi quy trình kỹ thuật khác thực hiện tại Vinmec đều được kiểm soát nghiêm ngặt, đạt các tiêu chuẩn chất lượng quốc tế, đảm bảo an toàn và chất lượng cho người bệnh.Trước mỗi ca thực hiện, hệ thống máy nội soi đều được đảm bảo vô trùng, đem đến tính an toàn tuyệt đối đến người bệnh. Sau khi thủ thuật kết thúc, ống nội soi được vệ sinh bằng máy rửa dây soi tự động của chính hãng Olympus dưới hệ thống lọc nước RO.
    Để đặt lịch khám tại viện, Quý khách vui lòng bấm số
    HOTLINE
    hoặc đặt lịch trực tiếp TẠI ĐÂY.
    Tải và đặt lịch khám tự động trên ứng dụng My. Vinmec để quản lý, theo dõi lịch và đặt hẹn mọi lúc mọi nơi ngay trên ứng dụng.
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 1,250 evaluation samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 10 tokens
    • mean: 19.71 tokens
    • max: 58 tokens
    • min: 17 tokens
    • mean: 396.06 tokens
    • max: 632 tokens
  • Samples:
    anchor positive
    Moxonidine có tác dụng gì đối với bệnh tăng huyết áp? sử dụng trong thận nó là AS chống lại rối loạn nhịp tim VVI trong nhiều môi trường kinh nghiệm khác nhau nó không có tác dụng ức chế hô hấp do kích hoạt CE alpha nó có tác dụng có lợi đối với chuyển hóa thủy tinh và lipid máu ở chuột béo phì bị tăng huyết áp di truyền nó thể hiện hoạt động chống loét và cuối cùng là moxonidine làm giảm áp lực nội nhãn gợi ý một lợi ích có thể có trong bệnh tăng nhãn áp do đó MOX bằng phương thức hoạt động mới của nó thể hiện một nguyên tắc điều trị mới trong điều trị tăng huyết áp vì đặc tính độc đáo của nó. MOX có thể chứng minh là có hiệu quả trong việc làm chậm sự tiến triển của bệnh bằng cách mang lại tác dụng bảo vệ ngoài việc chỉ giảm huyết áp cần nghiên cứu thêm để xác minh tiềm năng này
    Tại sao bác sĩ Haydar Cemal lại đưa ra tuyên bố về việc tiêm chủng cho những người bị kết án tử hình? vắc-xin để tiêm chủng tuyệt đối cho một số đối tượng bị kết án tử hình, bác sĩ haydar cemal tuyên bố trên một tờ báo ngày tháng 12 rằng những người được báo cáo là đối tượng bị kết án tử hình thực sự là người Armenia và những người Armenia vô tội bị đánh dấu trục xuất đã được tiêm máu của bệnh nhân sốt phát ban và rằng anh ta đã chứng kiến ​​​​tất cả những sự kiện này do lời khai của anh ta, Bộ Nội vụ đã yêu cầu một cuộc điều tra ngay lập tức và khi kết thúc cuộc điều tra đó, người ta hiểu rằng bác sĩ haydar cemal và bác sĩ hamdi suat chưa bao giờ làm việc cùng nhau ở erzincan vào thời điểm bác sĩ haydar cemal tuyên bố tất cả các tuyên bố đều bị EC điều tra bác bỏ và không ai bị buộc tội trong một trận dịch sốt phát ban nghiêm trọng. Các bác sĩ Thổ Nhĩ Kỳ đã tiêm vắc xin sốt phát ban nhằm mục đích cứu một mạng sống khỏi đám cháy. Theo các nguồn tin, sự phân biệt đối xử tôn giáo đối với những người được tiêm chủng đã được chứng minh rằng tuyên bố rằng một số bác sĩ Thổ Nhĩ Kỳ đã sử dụng...
    Sinh thiết ảnh hưởng đến quyết định lâm sàng như thế nào trong giai đoạn đầu sau ghép gan? PLB thông thường trong giai đoạn hậu phẫu sớm trong vòng vài ngày sau khi ghép CL có thể không thực hiện được do bệnh lý đông máu và/hoặc cổ trướng việc sử dụng sinh thiết VG gan xuyên tĩnh mạch cảnh tjlb trong trường hợp này là một phương pháp thay thế hấp dẫn vì có thể thu được chẩn đoán mô mặc dù có chống chỉ định tương đối đối với sinh thiết qua da trong giai đoạn này trong giai đoạn đầu sau ghép tjlb đã được thực hiện ở những bệnh nhân gan phần lớn trong số họ đã ghép gan thông thường mà không bảo tồn VPI VC bản địa những người khác đã có IVC bản địa trong tỷ lệ thành công về mặt kỹ thuật là với mẫu bệnh phẩm đủ để chẩn đoán xác định trong hầu hết các trường hợp bao gồm cả chẩn đoán đào thải và không đào thải trên mô bệnh học cuối cùng chẩn đoán sinh thiết ảnh hưởng đến việc xử trí lâm sàng trong phần lớn các trường hợp với các quyết định được đưa ra để thực hiện ghép lại để ảnh hưởng đến việc bắt đầu liệu pháp chống đào thải và bắt đầu liệu pháp kháng vi-rút không có bệnh tật hoặ...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 32
  • warmup_ratio: 0.1
  • bf16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 32
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 3
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss Validation Loss
0.0517 200 0.1317 0.0428
0.1034 400 0.0646 0.0437
0.1551 600 0.063 0.0416
0.2068 800 0.0623 0.0441
0.2585 1000 0.0752 0.0475
0.3102 1200 0.0754 0.0491
0.3619 1400 0.0794 0.0507
0.4137 1600 0.0849 0.0658
0.4654 1800 0.076 0.0503
0.5171 2000 0.0778 0.0490
0.5688 2200 0.0747 0.0455
0.6205 2400 0.0601 0.0412
0.6722 2600 0.0664 0.0458
0.7239 2800 0.0628 0.0430
0.7756 3000 0.067 0.0500
0.8273 3200 0.0655 0.0501
0.8790 3400 0.0626 0.0577
0.9307 3600 0.0731 0.0512
0.9824 3800 0.0662 0.0443
1.0341 4000 0.056 0.0428
1.0858 4200 0.0496 0.0378
1.1375 4400 0.0405 0.0360
1.1892 4600 0.0333 0.0318
1.2410 4800 0.0326 0.0313
1.2927 5000 0.0273 0.0321
1.3444 5200 0.0254 0.0334
1.3961 5400 0.0261 0.0291
1.4478 5600 0.0228 0.0359
1.4995 5800 0.0247 0.0344
1.5512 6000 0.0216 0.0344
1.6029 6200 0.0183 0.0303
1.6546 6400 0.0205 0.0294
1.7063 6600 0.0194 0.0294
1.7580 6800 0.018 0.0258
1.8097 7000 0.0197 0.0296
1.8614 7200 0.0196 0.0340
1.9131 7400 0.0207 0.0284
1.9648 7600 0.0234 0.0268
2.0165 7800 0.0139 0.0275
2.0683 8000 0.015 0.0270
2.1200 8200 0.0103 0.0293
2.1717 8400 0.0095 0.0259
2.2234 8600 0.0082 0.0284
2.2751 8800 0.0077 0.0264
2.3268 9000 0.0073 0.0252
2.3785 9200 0.0078 0.0247
2.4302 9400 0.0074 0.0294
2.4819 9600 0.0059 0.0324
2.5336 9800 0.007 0.0321
2.5853 10000 0.005 0.0299
2.6370 10200 0.0062 0.0283
2.6887 10400 0.0059 0.0277
2.7404 10600 0.0053 0.0285
2.7921 10800 0.0049 0.0280
2.8438 11000 0.0055 0.0288
2.8956 11200 0.0046 0.0286
2.9473 11400 0.0072 0.0280
2.9990 11600 0.0046 0.0281

Framework Versions

  • Python: 3.9.20
  • Sentence Transformers: 3.3.1
  • Transformers: 4.45.2
  • PyTorch: 2.4.0+cu121
  • Accelerate: 1.0.1
  • Datasets: 3.0.0
  • Tokenizers: 0.20.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
Downloads last month
30
Safetensors
Model size
568M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for strongpear/M3-retriever-MEDICAL

Base model

BAAI/bge-m3
Finetuned
(185)
this model