trait-embedding / README.md
agufsamudra's picture
Add new SentenceTransformer model
ee8fe63 verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:532
  - loss:MultipleNegativesRankingLoss
base_model: firqaaa/indo-sentence-bert-base
widget:
  - source_sentence: |
      Berikut adalah kueri pencarian yang ringkas:

      1. **"Penumpukan lemak perut dan kesehatan"** 
      2. **"Pengukuran jaringan adiposa subkutis"**
      3. **"Lemak perut indikator penyakit"** 


      Semoga membantu!
    sentences:
      - >-
        waktu produktif pagi hari waktu produktif pagi hari adalah periode waktu
        di pagi hari ketika kamu merasa paling fokus, berenergi, dan termotivasi
        untuk menyelesaikan tugas. waktu produktif pagi hari adalah periode
        waktu di pagi hari ketika kamu merasa paling fokus, berenergi, dan
        termotivasi untuk menyelesaikan tugas.
      - >-
        miastenia gravis merupakan penyakit kelemahan otot sebagai akibat dari
        proses autoimun yang menyerang bagian ujung saraf yang terhubung ke
        otot, sehingga stimulasi dan respon antara saraf dan otot tidak berjalan
        dengan baik.  miastenia gravis adalah suatu penyakit autoimun yang
        memengaruhi sistem saraf dan otot. pada miastenia gravis, sistem
        kekebalan tubuh menyerang dan merusak reseptor asetilkolin pada otot,
        yang berfungsi untuk mentransmisikan sinyal saraf ke otot. hal ini
        mengakibatkan kelemahan otot dan kelelahan yang berlebihan, terutama
        pada otot yang digunakan untuk aktivitas yang memerlukan kekuatan.
      - >-
        penumpukan lemak putih pada perut this measurement is used to evaluate
        body fat distribution and overall body composition, often serving as an
        indicator of metabolic health and risk for conditions like obesity,
        diabetes, and cardiovascular disease. subcutaneous adipose tissue
        measurement refers to the assessment of the layer of fat located just
        beneath the skin.
  - source_sentence: |
      Berikut beberapa kueri pencarian:

      1. **efek tiamin pada metabolisme**
      2. **vitamin b1 dan kesehatan jantung**
      3. **peran tiamin dalam tubuh** 


      Semoga membantu! 😊 
    sentences:
      - >-
        kadar vitamin b1 metabolisme vitamin b1, atau tiamin, penting untuk
        metabolisme karbohidrat, lemak, dan protein, serta untuk kesehatan saraf
        dan kardiovaskular yang baik.<br /><br /> metabolisme vitamin b1, atau
        tiamin, penting untuk metabolisme karbohidrat, lemak, dan protein, serta
        untuk kesehatan saraf dan kardiovaskular yang baik.<br /><br />
      - >-
        artritis psoriatik merupakan peradangan persendian pada individu dengan
        penyakit psoriasis, yaitu penyakit autoimun yang ditandai dengan plak
        kulit yang merah, tebal, dan bersisik keabuan.  artritis psoriatik
        biasanya mengenai sendi pinggul, lulut, dan jari-jari, muncul sekitar
        1-10 tahun setelah diagnosis psoriasis ditegakkan, namun beberapa kasus
        radang sendi dapat muncul mendahului kejadian psoriasis. artritis
        psoriatik adalah bentuk arthritis inflamasi yang berkaitan dengan
        psoriasis, menyebabkan nyeri, pembengkakan, dan kekakuan pada sendi,
        sering kali disertai dengan gejala kulit.
      - >-
        infeksi chlamydia merupakan infeksi menular seksual (ims) yang umum
        terjadi yang disebabkan oleh bakteri chlamydia trachomatis. infeksi ini
        dapat menyebabkan infeksi pada organ reproduksi, seperti leher rahim
        (servitis), saluran urin (uretritis), dan bagian akhir usus besar
        (proktitis). pada perempuan, infeksi ini dapat menyebabkan terjadinya
        nyeri panggul kronis, kehamilan ektopik, kemandulan, dan pelvic
        inflammatory disease (pid). infeksi chlamydia adalah infeksi bakteri
        yang disebabkan oleh bakteri chlamydia trachomatis. bakteri ini dapat
        menginfeksi saluran reproduksi pada pria dan wanita, serta dapat
        menyebabkan infeksi pada mata, tenggorokan, dan rektum.
  - source_sentence: |
      Berikut kueri pencarian trait/dna yang ringkas:

      1. **Miositis gejala**
      2. **Penyebab miositis**
      3. **Miositis autoimun** 


      Semoga membantu! 
    sentences:
      - >-
        kolitis ulseratif merupakan salah satu penyakit yang termasuk ke dalam
        peradangan saluran pencernaan (inflammatory bowel disease). kolitis
        ulseratif ditandai dengan adanya peradangan berupa ulkus/tukak pada
        lapisan saluran cerna, umumnya terjadi pada saluran cerna bagian bawah,
        mulai dari usus besar, rektum, hingga anus.  kolitis ulseratif adalah
        jenis penyakit radang usus kronis yang ditandai oleh peradangan dan
        pembentukan luka terbuka pada dinding usus besar.
      - >-
        miositis miositis adalah peradangan otot yang menyebabkan kelemahan,
        nyeri, dan pembengkakan, sering kali disebabkan oleh penyakit autoimun
        atau infeksi. miositis adalah peradangan otot yang menyebabkan
        kelemahan, nyeri, dan pembengkakan, sering kali disebabkan oleh penyakit
        autoimun atau infeksi.
      - >-
        kanker prostat merupakan kelenjar yang terdapat pada sistem reproduksi
        pada laki-laki, terletak di bawah kandung kemih dan berfungsi untuk
        memproduksi cairan sebagai sumber nutrisi sperma.     


        kanker prostat terbagi menjadi beberapa tipe, yaitu sebagai berikut : 

        1. adenokarsinoma  

        2. small cell carcinomas  

        3. tumor neuroendokrin   

        4. karsinoma sel transisi  

        5. sarkoma kanker prostat merupakan salah satu jenis kanker, dimana
        terjadi pembentukan sel yang tidak normal dan tidak terkendali dalam
        bentuk sel malignan (kanker) pada prostat.
  - source_sentence: |
      Berikut kueri pencarian trait/dna yang ringkas:

      1. **Stroke pembuluh darah kecil**
      2. **Ischemic microstroke** 
      3. **Arteri serebral mikro penyempitan**


      Semoga membantu! 
    sentences:
      - >-
        pembentukan selulit merupakan suatu kondisi dimana kulit terlihat
        bergelombang dan berkeriput akibat timbunan lemak mendorong keluar
        jaringan ikat di bawah kulit terutama di paha dan perut. selulit
        biasanya banyak ditemukan pada wanita hamil yang mengalami kenaikan
        berat badan drastis. pembentukan selulit adalah penumpukan lemak yang
        mendorong ke atas permukaan kulit, sementara jaringan ikat di bawahnya
        menahannya.
      - >-
        stroke pembuluh darah kecil merupakan gangguan aliran darah di arteri
        kecil dalam otak. kondisi ini hanya melukai bagian otak yang disuplai
        oleh pembuluh darah kecil, yang sering disebut sebagai wilayah vaskular
        arteri kecil. stroke pembuluh darah kecil atau disebut juga stroke
        iskemik mikro adalah jenis stroke yang terjadi ketika aliran darah ke
        otak terganggu akibat sumbatan atau penyempitan pada pembuluh darah
        kecil di otak. jenis stroke ini seringkali melibatkan arteri kecil yang
        disebut arteri serebral mikro. stroke pembuluh darah kecil cenderung
        memiliki dampak yang lebih kecil dibandingkan dengan stroke iskemik
        besar, tetapi tetap dapat menyebabkan kerusakan pada fungsi otak dan
        potensial mengakibatkan gejala yang serius.<br />
      - >-
        respons terhadap analgesik opioid analgesik adalah istilah yang
        digunakan untuk golongan obat antinyeri. ada banyak jenis analgesik yang
        sering digunakan, salah satunya adalah golongan opioid. \n\n


        laporan ini menggunakan varian genetik yang lebih banyak hadir pada
        orang yang lebih responsif terhadap analgesik opioid sebagai acuan. 
        analgesik opioid, seperti morfin dan oksikodon, bekerja pada sistem
        saraf pusat untuk mengurangi rasa sakit dengan mengikat reseptor
        spesifik, terutama reseptor mu-opioid, sehingga menghilangkan rasa sakit
        dan potensi efek samping.
  - source_sentence: |
      Berikut kueri pencarian trait/dna yang ringkas:

      1. **Kadar GGT dan fungsi hati** 
      2. **Fungsi GGT dalam tubuh manusia**
      3. **Peningkatan GGT darah penyebabnya**


      Semoga membantu! 😊
    sentences:
      - >-
        gaya hidup sedentari merupakan segala kegiatan yang dilakukan kecuali
        saat tidur dengan keluaran kalori <1.5 mets. aktivitas dengan keluaran
        kalori <1.5 mets adalah posisi duduk dan berbaring.   

        \n\n

        gaya hidup sedentari adalah gaya hidup yang tidak aktif yang dapat
        meningkatkan risiko terjadinya penyakit kardiovaskular, diabetes
        mellitus tipe 2, penyakit muskuloskeletal dan gangguan psikologis
        seperti cemas dan depresi. gaya hidup sedentari merujuk pada pola
        kehidupan yang didominasi oleh aktivitas fisik yang minim atau kurang
        gerakan tubuh secara teratur.
      - >-
        respons terhadap vaksin pertusis pertusis merupakan bakteri yang dapat
        menginfeksi saluran nafas dan jaringan paru-paru, mengakibatkan gejala
        seperti batuk yang kuat (batuk rejan). vaksin pertusis diberikan untuk
        mencegah terjadinya batuk rejan akibat infeksi dari bakteri pertusis.
        \n\n

         laporan ini menggunakan varian genetik yang lebih banyak hadir pada orang yang lebih responsif terhadap vaksin pertusis sebagai acuan.  vaksin pertusis merangsang sistem kekebalan tubuh untuk memproduksi antibodi pelindung terhadap bordetella pertussis, bakteri penyebab batuk rejan, memberikan kekebalan dan mengurangi keparahan penyakit jika terjadi paparan.
      - >-
        kadar ggt ggt (gamma-glutamyl transferase) adalah enzim yang dapat
        ditemukan di berbagai bagian tubuh seperti paru-paru dan saluran empedu,
        tetapi enzim ini banyak ditemukan di hati. kadar ggt merupakan salah
        satu parameter yang digunakan untuk melihat fungsi hati. gamma-glutamyl
        transferase (ggt) adalah enzim yang ditemukan di hati yang bila kadarnya
        meningkat dalam darah, dapat mengindikasikan disfungsi hati atau saluran
        empedu.
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy
  - dot_accuracy
  - manhattan_accuracy
  - euclidean_accuracy
  - max_accuracy
model-index:
  - name: SentenceTransformer based on firqaaa/indo-sentence-bert-base
    results:
      - task:
          type: triplet
          name: Triplet
        dataset:
          name: trait validation
          type: trait-validation
        metrics:
          - type: cosine_accuracy
            value: 1
            name: Cosine Accuracy
          - type: dot_accuracy
            value: 0
            name: Dot Accuracy
          - type: manhattan_accuracy
            value: 1
            name: Manhattan Accuracy
          - type: euclidean_accuracy
            value: 1
            name: Euclidean Accuracy
          - type: max_accuracy
            value: 1
            name: Max Accuracy
      - task:
          type: triplet
          name: Triplet
        dataset:
          name: trait embedding
          type: trait_embedding
        metrics:
          - type: cosine_accuracy
            value: 1
            name: Cosine Accuracy
          - type: dot_accuracy
            value: 0
            name: Dot Accuracy
          - type: manhattan_accuracy
            value: 1
            name: Manhattan Accuracy
          - type: euclidean_accuracy
            value: 1
            name: Euclidean Accuracy
          - type: max_accuracy
            value: 1
            name: Max Accuracy

SentenceTransformer based on firqaaa/indo-sentence-bert-base

This is a sentence-transformers model finetuned from firqaaa/indo-sentence-bert-base. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: firqaaa/indo-sentence-bert-base
  • Maximum Sequence Length: 512 tokens
  • Output Dimensionality: 768 tokens
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the πŸ€— Hub
model = SentenceTransformer("agufsamudra/trait-embedding")
# Run inference
sentences = [
    'Berikut kueri pencarian trait/dna yang ringkas:\n\n1. **Kadar GGT dan fungsi hati** \n2. **Fungsi GGT dalam tubuh manusia**\n3. **Peningkatan GGT darah penyebabnya**\n\n\nSemoga membantu! 😊\n',
    'kadar ggt ggt (gamma-glutamyl transferase) adalah enzim yang dapat ditemukan di berbagai bagian tubuh seperti paru-paru dan saluran empedu, tetapi enzim ini banyak ditemukan di hati. kadar ggt merupakan salah satu parameter yang digunakan untuk melihat fungsi hati. gamma-glutamyl transferase (ggt) adalah enzim yang ditemukan di hati yang bila kadarnya meningkat dalam darah, dapat mengindikasikan disfungsi hati atau saluran empedu.',
    'gaya hidup sedentari merupakan segala kegiatan yang dilakukan kecuali saat tidur dengan keluaran kalori <1.5 mets. aktivitas dengan keluaran kalori <1.5 mets adalah posisi duduk dan berbaring.   \n\\n\\n\ngaya hidup sedentari adalah gaya hidup yang tidak aktif yang dapat meningkatkan risiko terjadinya penyakit kardiovaskular, diabetes mellitus tipe 2, penyakit muskuloskeletal dan gangguan psikologis seperti cemas dan depresi. gaya hidup sedentari merujuk pada pola kehidupan yang didominasi oleh aktivitas fisik yang minim atau kurang gerakan tubuh secara teratur.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Triplet

Metric Value
cosine_accuracy 1.0
dot_accuracy 0.0
manhattan_accuracy 1.0
euclidean_accuracy 1.0
max_accuracy 1.0

Triplet

Metric Value
cosine_accuracy 1.0
dot_accuracy 0.0
manhattan_accuracy 1.0
euclidean_accuracy 1.0
max_accuracy 1.0

Training Details

Training Dataset

Unnamed Dataset

  • Size: 532 training samples
  • Columns: query, trait, and trait_negative
  • Approximate statistics based on the first 532 samples:
    query trait trait_negative
    type string string string
    details
    • min: 8 tokens
    • mean: 48.12 tokens
    • max: 99 tokens
    • min: 13 tokens
    • mean: 78.99 tokens
    • max: 207 tokens
    • min: 15 tokens
    • mean: 79.99 tokens
    • max: 207 tokens
  • Samples:
    query trait trait_negative
    Berikut kueri pencarian yang ringkas:

    1. Fungsi kognitif
    2. Proses mental manusia
    3. Bagaimana cara otak berpikir


    Semoga membantu!
    fungsi kognitif fungsi kognitif adalah istilah yang mengacu pada semua proses mental yang memungkinkan kita untuk berpikir, belajar, dan memahami dunia di sekitar kita. fungsi kognitif adalah istilah yang mengacu pada semua proses mental yang memungkinkan kita untuk berpikir, belajar, dan memahami dunia di sekitar kita. batuk yang disebabkan penghambat ace (angiotensin-converting enzyme inhibitors) penghambat ace adalah salah satu jenis obat yang digunakan dalam pengobatan tekanan darah tinggi (hipertensi). penggunaan penghambat ace dapat menyebabkan efek samping berupa batuk. \n\n

    laporan ini menggunakan varian genetik yang lebih banyak hadir pada orang yang mengalami efek samping terhadap penghambat ace merupakan acuan. batuk yang disebabkan oleh penghambat ace (inhibitor enzim pengubah angiotensin) adalah efek samping yang dapat terjadi sebagai respons terhadap obat-obatan tersebut, di mana penghambatan enzim tersebut dapat menyebabkan iritasi pada saluran udara, memicu batuk pada sebagian individu.
    Berikut kueri pencarian trait/dna tersebut:

    1. "Kemawasan diri dan model kepribadian lima besar"
    2. "Ciri-ciri orang bertanggung jawab dan terorganisir"
    3. "Pengembangan regulasi emosi dan pertumbuhan pribadi"


    Semoga membantu! 😊
    kemawasan diri merupakan salah satu elemen dari lima besar model kepribadian dan model kepribadian lima besar yang ditandai dengan kecenderungan terorganisasi, bertanggung jawab dan pekerja keras, terarah pada tujuan dan mematuhi norma atau peraturan yang ada. kemawasan diri adalah kemampuan untuk memahami dan mengenali diri sendiri secara mendalam, memungkinkan pengembangan regulasi emosi dan pertumbuhan pribadi yang optimal. henti jantung mendadak merupakan suatu kondisi dimana jantung tiba-tiba berhenti berdetak, dan penderita akan mengalami kematian jika tidak diberikan penanganan dalam hitungan menit. serangan jantung mendadak adalah suatu kondisi yang mengancam jiwa yang terjadi ketika jantung tiba-tiba berhenti berdetak, sehingga menyebabkan terhentinya aliran darah ke tubuh.
    Berikut kueri pencarian trait/dna yang ringkas:

    1. sikap kooperatif
    2. kepribadian ramah
    3. fleksibel dalam negosiasi


    Semoga membantu! 😊
    keramahan atau kemudahan untuk bersepakat merupakan salah satu elemen dari lima besar model kepribadian yang ditandai dengan adanya kecenderungan untuk bersikap kooperatif, tidak mementingkan diri sendiri, sopan, baik dan ramah. keramahan atau kemudahan untuk bersepakat merujuk pada sikap terbuka, ramah, dan fleksibel dalam menjalani proses perundingan atau kerjasama. penyakit jantung koroner penyakit jantung koroner (pjk) adalah kondisi dimana pembuluh darah arteri koroner yang memasok darah ke jantung mengalami penyempitan atau penyumbatan, menyebabkan kurangnya pasokan darah ke jantung. penyakit jantung koroner (pjk) adalah kondisi dimana pembuluh darah arteri koroner yang memasok darah ke jantung mengalami penyempitan atau penyumbatan, menyebabkan kurangnya pasokan darah ke jantung.
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 114 evaluation samples
  • Columns: query, trait, and trait_negative
  • Approximate statistics based on the first 114 samples:
    query trait trait_negative
    type string string string
    details
    • min: 5 tokens
    • mean: 47.66 tokens
    • max: 76 tokens
    • min: 16 tokens
    • mean: 81.01 tokens
    • max: 167 tokens
    • min: 13 tokens
    • mean: 82.3 tokens
    • max: 201 tokens
  • Samples:
    query trait trait_negative
    Berikut kueri pencarian yang singkat dan seperti manusia:

    1. Panjang telomer & penuaan
    2. Indikator penuaan berdasarkan telomere
    3. Telomere memengaruhi regenerasi sel


    Semoga membantu! 😊
    penuaan dan panjang telomere telomer adalah bagian paling ujung dari kromosom yang akan memendek seiring bertambahnya usia. telomer dapat dijadikan sebagai indikator proses penuaan dan kesehatan seseorang. penuaan terkait dengan panjang telomere, bagian ujung kromosom yang melibatkan kerusakan dan penurunan fungsi sel, mempengaruhi kemampuan sel untuk meregenerasi dan memainkan peran dalam proses penuaan. urgensi negatif (negative urgency) urgensi negatif merupakan kecenderungan untuk bertindak gegabah ketika tertekan, yang ditandai dengan kecenderungan emosi negatif yang tinggi, kehati-hatian yang rendah, dan kepatuhan yang rendah. karena serangkaian karakteristik ini, urgensi negatif merupakan prediktor penting dari disfungsi eksternal. urgensi negatif merupakan kecenderungan untuk bertindak gegabah ketika tertekan, yang ditandai dengan kecenderungan emosi negatif yang tinggi, kehati-hatian yang rendah, dan kepatuhan yang rendah. karena serangkaian karakteristik ini, urgensi negatif merupakan prediktor penting dari disfungsi eksternal.
    Berikut kueri pencarian trait/dna yang ringkas:

    1. Pengertian kadar hematokrit
    2. Fungsi kadar hematokrit
    3. Kadar hematokrit dalam pemeriksaan darah


    Semoga membantu!
    kadar hematokrit merupakan perbandingan jumlah eritrosit terhadap volume darah dalam sataun persen. kadar hematokrit digunakan sebagai salah satu parameter dalam pemeriksaan darah. tingkat hematokrit adalah ukuran proporsi sel darah merah terhadap total volume darah, yang menunjukkan kapasitas darah untuk membawa oksigen dan nutrisi.
    adhd merupakan gangguan kejiwaan yang paling banyak terjadi pada anak-anak (laki-laki > perempuan) dan ditandai dengan inatensi (kesulitan untuk fokus dalam mengerjakan sesuatu), hiperaktivitas (pergerakan berlebihan yang tidak sesuai dengan tempatnya), dan impulsivitas (melakukan tindakan yang terburu-buru tanpa memikirkannya terlebih dahulu). adhd, atau attention deficit hyperactivity disorder, adalah kondisi neurodevelopmental yang ditandai oleh pola-pola yang persisten dari ketidakfokusan, impulsivitas, dan hiperaktivitas yang dapat mempengaruhi fungsi sehari-hari.
    Berikut kueri pencarian trait/dna dengan maksimal 3 kata:

    1. Ketergantungan penghargaan
    2. Kebutuhan pujian sosial
    3. Pujian dan kepribadian


    Semoga membantu!
    ketergantungan terhadap penghargaan merupakan salah satu model kepribadian yang ditandai dengan adanya kecenderungan untuk merespons secara nyata sinyal penghargaan, terutama sinyal verbal persetujuan sosial, dukungan sosial, dan sentimen. ketergantungan terhadap penghargaan merujuk pada kondisi psikologis seseorang yang mengalami keterikatan emosional atau kebutuhan yang mendalam terhadap pujian, pengakuan, atau bentuk penghargaan lainnya dari orang lain. ritme sirkadian merupakan siklus 24 jam tubuh manusia yang memiliki peran penting dalam siklus bangun dan tidur. ritme sirkadian adalah pola tidur-bangun selama 24 jam sehari.

    ini membantu mengontrol jadwal harian anda untuk tidur dan terjaga.
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • learning_rate: 2e-05
  • warmup_ratio: 0.1
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 3
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step trait-validation_max_accuracy trait_embedding_max_accuracy
2.8824 51 1.0 1.0

Framework Versions

  • Python: 3.12.3
  • Sentence Transformers: 3.2.1
  • Transformers: 4.47.0
  • PyTorch: 2.5.1+cu124
  • Accelerate: 1.1.1
  • Datasets: 3.1.0
  • Tokenizers: 0.21.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}