SetFit with sentence-transformers/all-MiniLM-L6-v2

This is a SetFit model that can be used for Text Classification. This SetFit model uses sentence-transformers/all-MiniLM-L6-v2 as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
recommendations
  • 'how do I find trending courses'
  • 'what are some popular courses right now'
  • 'what courses are good for remote working skills'
feedback
  • "I didn't find the answers I was looking for."
  • 'I find the website confusing to navigate.'
  • 'The chatbot gave incorrect information.'
website-information
  • 'how can I access my bookmarks'
  • 'how do I edit my profile'
  • 'where can I find notifications'
general-questions
  • 'can you explain the concept of cloud computing'
  • 'what is the role of peer reviews in online courses'
  • 'can you explain the difference between synchronous and asynchronous learning'
greet-good_bye
  • 'exit'
  • 'au revoir'
  • 'sortir'
greet-who_are_you
  • 'help please'
  • 'how can you help me'
  • 'qui êtes-vous'
greet-hi
  • 'Hello buddy'
  • 'Hi'
  • 'Salut mon ami'

Evaluation

Metrics

Label Accuracy
all 0.8571

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("HussienAhmad/SFT_GradProject")
# Run inference
preds = model("Salut")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 1 6.1880 11
Label Training Sample Count
greet-hi 5
greet-who_are_you 7
greet-good_bye 5
general-questions 28
recommendations 27
website-information 28
feedback 17

Training Hyperparameters

  • batch_size: (4, 4)
  • num_epochs: (4, 4)
  • max_steps: -1
  • sampling_strategy: oversampling
  • body_learning_rate: (2e-05, 1e-05)
  • head_learning_rate: 0.01
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: True

Training Results

Epoch Step Training Loss Validation Loss
0.0004 1 0.1894 -
0.0036 10 0.1796 -
0.0073 20 0.4046 -
0.0109 30 0.3719 -
0.0145 40 0.3065 -
0.0182 50 0.1893 -
0.0218 60 0.3118 -
0.0254 70 0.2084 -
0.0291 80 0.3561 -
0.0327 90 0.1808 -
0.0364 100 0.2126 -
0.0400 110 0.2121 -
0.0436 120 0.283 -
0.0473 130 0.1004 -
0.0509 140 0.2684 -
0.0545 150 0.139 -
0.0582 160 0.2701 -
0.0618 170 0.2238 -
0.0654 180 0.1276 -
0.0691 190 0.053 -
0.0727 200 0.2071 -
0.0763 210 0.2131 -
0.0800 220 0.1646 -
0.0836 230 0.1556 -
0.0872 240 0.1267 -
0.0909 250 0.1275 -
0.0945 260 0.2127 -
0.0981 270 0.0745 -
0.1018 280 0.0274 -
0.1054 290 0.2631 -
0.1091 300 0.1351 -
0.1127 310 0.0402 -
0.1163 320 0.1021 -
0.1200 330 0.2999 -
0.1236 340 0.0935 -
0.1272 350 0.1313 -
0.1309 360 0.0868 -
0.1345 370 0.144 -
0.1381 380 0.0756 -
0.1418 390 0.0617 -
0.1454 400 0.0186 -
0.1490 410 0.0637 -
0.1527 420 0.0411 -
0.1563 430 0.0657 -
0.1599 440 0.0561 -
0.1636 450 0.096 -
0.1672 460 0.2337 -
0.1708 470 0.0536 -
0.1745 480 0.0631 -
0.1781 490 0.0348 -
0.1818 500 0.0236 -
0.1854 510 0.0126 -
0.1890 520 0.0236 -
0.1927 530 0.0485 -
0.1963 540 0.1579 -
0.1999 550 0.0015 -
0.2036 560 0.0121 -
0.2072 570 0.0131 -
0.2108 580 0.005 -
0.2145 590 0.0083 -
0.2181 600 0.0528 -
0.2217 610 0.0069 -
0.2254 620 0.0953 -
0.2290 630 0.006 -
0.2326 640 0.0095 -
0.2363 650 0.0051 -
0.2399 660 0.0048 -
0.2435 670 0.019 -
0.2472 680 0.0015 -
0.2508 690 0.0037 -
0.2545 700 0.005 -
0.2581 710 0.0064 -
0.2617 720 0.0044 -
0.2654 730 0.0015 -
0.2690 740 0.0024 -
0.2726 750 0.0641 -
0.2763 760 0.0439 -
0.2799 770 0.0026 -
0.2835 780 0.0017 -
0.2872 790 0.0015 -
0.2908 800 0.0206 -
0.2944 810 0.04 -
0.2981 820 0.0021 -
0.3017 830 0.0036 -
0.3053 840 0.0022 -
0.3090 850 0.0036 -
0.3126 860 0.0015 -
0.3162 870 0.0008 -
0.3199 880 0.0316 -
0.3235 890 0.0019 -
0.3272 900 0.0036 -
0.3308 910 0.003 -
0.3344 920 0.0011 -
0.3381 930 0.0015 -
0.3417 940 0.0026 -
0.3453 950 0.0671 -
0.3490 960 0.0079 -
0.3526 970 0.0036 -
0.3562 980 0.002 -
0.3599 990 0.0655 -
0.3635 1000 0.002 -
0.3671 1010 0.001 -
0.3708 1020 0.0008 -
0.3744 1030 0.0007 -
0.3780 1040 0.0012 -
0.3817 1050 0.0162 -
0.3853 1060 0.0014 -
0.3889 1070 0.0007 -
0.3926 1080 0.0013 -
0.3962 1090 0.0022 -
0.3999 1100 0.0114 -
0.4035 1110 0.0011 -
0.4071 1120 0.0521 -
0.4108 1130 0.0015 -
0.4144 1140 0.0006 -
0.4180 1150 0.0005 -
0.4217 1160 0.0015 -
0.4253 1170 0.0928 -
0.4289 1180 0.0005 -
0.4326 1190 0.0011 -
0.4362 1200 0.001 -
0.4398 1210 0.0007 -
0.4435 1220 0.0011 -
0.4471 1230 0.0013 -
0.4507 1240 0.0016 -
0.4544 1250 0.0014 -
0.4580 1260 0.0003 -
0.4617 1270 0.001 -
0.4653 1280 0.0006 -
0.4689 1290 0.0002 -
0.4726 1300 0.0006 -
0.4762 1310 0.0013 -
0.4798 1320 0.0013 -
0.4835 1330 0.0007 -
0.4871 1340 0.102 -
0.4907 1350 0.0037 -
0.4944 1360 0.0003 -
0.4980 1370 0.0525 -
0.5016 1380 0.001 -
0.5053 1390 0.0003 -
0.5089 1400 0.0013 -
0.5125 1410 0.0009 -
0.5162 1420 0.0664 -
0.5198 1430 0.0003 -
0.5234 1440 0.0009 -
0.5271 1450 0.002 -
0.5307 1460 0.0149 -
0.5344 1470 0.0004 -
0.5380 1480 0.0008 -
0.5416 1490 0.0007 -
0.5453 1500 0.0006 -
0.5489 1510 0.0302 -
0.5525 1520 0.0006 -
0.5562 1530 0.0008 -
0.5598 1540 0.0011 -
0.5634 1550 0.0005 -
0.5671 1560 0.001 -
0.5707 1570 0.0006 -
0.5743 1580 0.0008 -
0.5780 1590 0.0004 -
0.5816 1600 0.0004 -
0.5852 1610 0.0006 -
0.5889 1620 0.0003 -
0.5925 1630 0.0007 -
0.5961 1640 0.0003 -
0.5998 1650 0.001 -
0.6034 1660 0.0006 -
0.6071 1670 0.0004 -
0.6107 1680 0.0029 -
0.6143 1690 0.0016 -
0.6180 1700 0.0007 -
0.6216 1710 0.0003 -
0.6252 1720 0.0006 -
0.6289 1730 0.0006 -
0.6325 1740 0.0014 -
0.6361 1750 0.0019 -
0.6398 1760 0.0008 -
0.6434 1770 0.0003 -
0.6470 1780 0.0002 -
0.6507 1790 0.0055 -
0.6543 1800 0.0029 -
0.6579 1810 0.0017 -
0.6616 1820 0.0049 -
0.6652 1830 0.0004 -
0.6688 1840 0.0013 -
0.6725 1850 0.0003 -
0.6761 1860 0.0004 -
0.6798 1870 0.0014 -
0.6834 1880 0.0011 -
0.6870 1890 0.0022 -
0.6907 1900 0.0025 -
0.6943 1910 0.0002 -
0.6979 1920 0.0004 -
0.7016 1930 0.0002 -
0.7052 1940 0.0003 -
0.7088 1950 0.0007 -
0.7125 1960 0.0003 -
0.7161 1970 0.0004 -
0.7197 1980 0.0005 -
0.7234 1990 0.0002 -
0.7270 2000 0.0003 -
0.7306 2010 0.0003 -
0.7343 2020 0.0004 -
0.7379 2030 0.0006 -
0.7415 2040 0.0007 -
0.7452 2050 0.0009 -
0.7488 2060 0.0007 -
0.7525 2070 0.0002 -
0.7561 2080 0.0002 -
0.7597 2090 0.0003 -
0.7634 2100 0.0006 -
0.7670 2110 0.0003 -
0.7706 2120 0.0009 -
0.7743 2130 0.0004 -
0.7779 2140 0.0003 -
0.7815 2150 0.0004 -
0.7852 2160 0.0003 -
0.7888 2170 0.0003 -
0.7924 2180 0.0005 -
0.7961 2190 0.0002 -
0.7997 2200 0.0003 -
0.8033 2210 0.0008 -
0.8070 2220 0.0003 -
0.8106 2230 0.0001 -
0.8142 2240 0.0002 -
0.8179 2250 0.0002 -
0.8215 2260 0.0002 -
0.8252 2270 0.0006 -
0.8288 2280 0.0002 -
0.8324 2290 0.0004 -
0.8361 2300 0.0004 -
0.8397 2310 0.0006 -
0.8433 2320 0.0002 -
0.8470 2330 0.0002 -
0.8506 2340 0.0003 -
0.8542 2350 0.0002 -
0.8579 2360 0.0005 -
0.8615 2370 0.0033 -
0.8651 2380 0.0009 -
0.8688 2390 0.0004 -
0.8724 2400 0.0002 -
0.8760 2410 0.0003 -
0.8797 2420 0.0001 -
0.8833 2430 0.0002 -
0.8870 2440 0.0007 -
0.8906 2450 0.0007 -
0.8942 2460 0.0002 -
0.8979 2470 0.0002 -
0.9015 2480 0.0005 -
0.9051 2490 0.0011 -
0.9088 2500 0.0002 -
0.9124 2510 0.0003 -
0.9160 2520 0.0002 -
0.9197 2530 0.0007 -
0.9233 2540 0.0003 -
0.9269 2550 0.0002 -
0.9306 2560 0.0001 -
0.9342 2570 0.0015 -
0.9378 2580 0.0004 -
0.9415 2590 0.0004 -
0.9451 2600 0.0004 -
0.9487 2610 0.0004 -
0.9524 2620 0.0007 -
0.9560 2630 0.0002 -
0.9597 2640 0.0003 -
0.9633 2650 0.0002 -
0.9669 2660 0.0001 -
0.9706 2670 0.0006 -
0.9742 2680 0.0005 -
0.9778 2690 0.0001 -
0.9815 2700 0.0003 -
0.9851 2710 0.0002 -
0.9887 2720 0.0031 -
0.9924 2730 0.0005 -
0.9960 2740 0.0003 -
0.9996 2750 0.0003 -
1.0 2751 - 0.0498
1.0033 2760 0.0009 -
1.0069 2770 0.0001 -
1.0105 2780 0.0003 -
1.0142 2790 0.0003 -
1.0178 2800 0.0004 -
1.0214 2810 0.0009 -
1.0251 2820 0.0004 -
1.0287 2830 0.0004 -
1.0324 2840 0.0004 -
1.0360 2850 0.0049 -
1.0396 2860 0.0003 -
1.0433 2870 0.0056 -
1.0469 2880 0.0003 -
1.0505 2890 0.0002 -
1.0542 2900 0.0002 -
1.0578 2910 0.0004 -
1.0614 2920 0.0002 -
1.0651 2930 0.0002 -
1.0687 2940 0.0002 -
1.0723 2950 0.0001 -
1.0760 2960 0.0045 -
1.0796 2970 0.0002 -
1.0832 2980 0.0003 -
1.0869 2990 0.0002 -
1.0905 3000 0.0019 -
1.0941 3010 0.0001 -
1.0978 3020 0.0001 -
1.1014 3030 0.0003 -
1.1051 3040 0.0007 -
1.1087 3050 0.0004 -
1.1123 3060 0.0003 -
1.1160 3070 0.0006 -
1.1196 3080 0.0005 -
1.1232 3090 0.0004 -
1.1269 3100 0.0003 -
1.1305 3110 0.0002 -
1.1341 3120 0.0002 -
1.1378 3130 0.0003 -
1.1414 3140 0.0007 -
1.1450 3150 0.0001 -
1.1487 3160 0.0011 -
1.1523 3170 0.0003 -
1.1559 3180 0.0004 -
1.1596 3190 0.0001 -
1.1632 3200 0.0002 -
1.1668 3210 0.0003 -
1.1705 3220 0.0003 -
1.1741 3230 0.0002 -
1.1778 3240 0.0001 -
1.1814 3250 0.0013 -
1.1850 3260 0.0003 -
1.1887 3270 0.0004 -
1.1923 3280 0.0002 -
1.1959 3290 0.0002 -
1.1996 3300 0.0004 -
1.2032 3310 0.0002 -
1.2068 3320 0.0001 -
1.2105 3330 0.0002 -
1.2141 3340 0.0006 -
1.2177 3350 0.0002 -
1.2214 3360 0.0001 -
1.2250 3370 0.0004 -
1.2286 3380 0.0005 -
1.2323 3390 0.0016 -
1.2359 3400 0.0001 -
1.2395 3410 0.0004 -
1.2432 3420 0.0002 -
1.2468 3430 0.0002 -
1.2505 3440 0.0001 -
1.2541 3450 0.0001 -
1.2577 3460 0.0003 -
1.2614 3470 0.0001 -
1.2650 3480 0.001 -
1.2686 3490 0.0003 -
1.2723 3500 0.0002 -
1.2759 3510 0.0001 -
1.2795 3520 0.0004 -
1.2832 3530 0.0001 -
1.2868 3540 0.0001 -
1.2904 3550 0.0002 -
1.2941 3560 0.0003 -
1.2977 3570 0.0014 -
1.3013 3580 0.0005 -
1.3050 3590 0.0003 -
1.3086 3600 0.0002 -
1.3123 3610 0.0002 -
1.3159 3620 0.0001 -
1.3195 3630 0.0002 -
1.3232 3640 0.0002 -
1.3268 3650 0.0001 -
1.3304 3660 0.0246 -
1.3341 3670 0.0002 -
1.3377 3680 0.0002 -
1.3413 3690 0.0005 -
1.3450 3700 0.0108 -
1.3486 3710 0.0001 -
1.3522 3720 0.0003 -
1.3559 3730 0.0002 -
1.3595 3740 0.0001 -
1.3631 3750 0.0001 -
1.3668 3760 0.0003 -
1.3704 3770 0.0004 -
1.3740 3780 0.0001 -
1.3777 3790 0.0009 -
1.3813 3800 0.0002 -
1.3850 3810 0.0002 -
1.3886 3820 0.0001 -
1.3922 3830 0.0001 -
1.3959 3840 0.0003 -
1.3995 3850 0.0003 -
1.4031 3860 0.0005 -
1.4068 3870 0.0002 -
1.4104 3880 0.0001 -
1.4140 3890 0.0003 -
1.4177 3900 0.0001 -
1.4213 3910 0.0002 -
1.4249 3920 0.0003 -
1.4286 3930 0.0002 -
1.4322 3940 0.0002 -
1.4358 3950 0.0002 -
1.4395 3960 0.0001 -
1.4431 3970 0.0001 -
1.4467 3980 0.0001 -
1.4504 3990 0.0002 -
1.4540 4000 0.0001 -
1.4577 4010 0.001 -
1.4613 4020 0.0001 -
1.4649 4030 0.0001 -
1.4686 4040 0.0005 -
1.4722 4050 0.0003 -
1.4758 4060 0.0001 -
1.4795 4070 0.0002 -
1.4831 4080 0.0002 -
1.4867 4090 0.001 -
1.4904 4100 0.0005 -
1.4940 4110 0.0003 -
1.4976 4120 0.0004 -
1.5013 4130 0.0002 -
1.5049 4140 0.0001 -
1.5085 4150 0.0012 -
1.5122 4160 0.0008 -
1.5158 4170 0.0004 -
1.5194 4180 0.001 -
1.5231 4190 0.0001 -
1.5267 4200 0.0005 -
1.5304 4210 0.0001 -
1.5340 4220 0.0001 -
1.5376 4230 0.0002 -
1.5413 4240 0.0002 -
1.5449 4250 0.0002 -
1.5485 4260 0.0002 -
1.5522 4270 0.0001 -
1.5558 4280 0.0002 -
1.5594 4290 0.0001 -
1.5631 4300 0.0001 -
1.5667 4310 0.0002 -
1.5703 4320 0.0001 -
1.5740 4330 0.0001 -
1.5776 4340 0.0001 -
1.5812 4350 0.0001 -
1.5849 4360 0.0001 -
1.5885 4370 0.0002 -
1.5921 4380 0.0001 -
1.5958 4390 0.0004 -
1.5994 4400 0.0005 -
1.6031 4410 0.0003 -
1.6067 4420 0.0002 -
1.6103 4430 0.0001 -
1.6140 4440 0.0002 -
1.6176 4450 0.0002 -
1.6212 4460 0.0001 -
1.6249 4470 0.0003 -
1.6285 4480 0.0003 -
1.6321 4490 0.0001 -
1.6358 4500 0.0001 -
1.6394 4510 0.0002 -
1.6430 4520 0.0002 -
1.6467 4530 0.0003 -
1.6503 4540 0.0001 -
1.6539 4550 0.0001 -
1.6576 4560 0.0002 -
1.6612 4570 0.0003 -
1.6648 4580 0.0002 -
1.6685 4590 0.0002 -
1.6721 4600 0.0002 -
1.6758 4610 0.0002 -
1.6794 4620 0.0002 -
1.6830 4630 0.0002 -
1.6867 4640 0.0001 -
1.6903 4650 0.0001 -
1.6939 4660 0.0001 -
1.6976 4670 0.0002 -
1.7012 4680 0.0001 -
1.7048 4690 0.0001 -
1.7085 4700 0.0002 -
1.7121 4710 0.001 -
1.7157 4720 0.0001 -
1.7194 4730 0.0002 -
1.7230 4740 0.0001 -
1.7266 4750 0.0002 -
1.7303 4760 0.0001 -
1.7339 4770 0.0002 -
1.7375 4780 0.0001 -
1.7412 4790 0.0001 -
1.7448 4800 0.0001 -
1.7485 4810 0.0001 -
1.7521 4820 0.0002 -
1.7557 4830 0.0012 -
1.7594 4840 0.0003 -
1.7630 4850 0.0008 -
1.7666 4860 0.0001 -
1.7703 4870 0.0002 -
1.7739 4880 0.0001 -
1.7775 4890 0.0008 -
1.7812 4900 0.0001 -
1.7848 4910 0.0001 -
1.7884 4920 0.0001 -
1.7921 4930 0.0001 -
1.7957 4940 0.0006 -
1.7993 4950 0.0002 -
1.8030 4960 0.0002 -
1.8066 4970 0.0004 -
1.8103 4980 0.0001 -
1.8139 4990 0.0001 -
1.8175 5000 0.0004 -
1.8212 5010 0.0001 -
1.8248 5020 0.0001 -
1.8284 5030 0.0003 -
1.8321 5040 0.0001 -
1.8357 5050 0.0001 -
1.8393 5060 0.0001 -
1.8430 5070 0.0003 -
1.8466 5080 0.0001 -
1.8502 5090 0.0001 -
1.8539 5100 0.0001 -
1.8575 5110 0.0001 -
1.8611 5120 0.0002 -
1.8648 5130 0.0003 -
1.8684 5140 0.0002 -
1.8720 5150 0.0001 -
1.8757 5160 0.0001 -
1.8793 5170 0.0001 -
1.8830 5180 0.0002 -
1.8866 5190 0.0004 -
1.8902 5200 0.0001 -
1.8939 5210 0.0001 -
1.8975 5220 0.0003 -
1.9011 5230 0.0001 -
1.9048 5240 0.0002 -
1.9084 5250 0.0003 -
1.9120 5260 0.0001 -
1.9157 5270 0.0002 -
1.9193 5280 0.0002 -
1.9229 5290 0.0004 -
1.9266 5300 0.0001 -
1.9302 5310 0.0001 -
1.9338 5320 0.0002 -
1.9375 5330 0.0002 -
1.9411 5340 0.0003 -
1.9447 5350 0.0002 -
1.9484 5360 0.0001 -
1.9520 5370 0.0002 -
1.9557 5380 0.0001 -
1.9593 5390 0.0002 -
1.9629 5400 0.0001 -
1.9666 5410 0.0009 -
1.9702 5420 0.0001 -
1.9738 5430 0.0002 -
1.9775 5440 0.0001 -
1.9811 5450 0.0001 -
1.9847 5460 0.0002 -
1.9884 5470 0.0002 -
1.9920 5480 0.0002 -
1.9956 5490 0.0001 -
1.9993 5500 0.0001 -
2.0 5502 - 0.0628
2.0029 5510 0.0001 -
2.0065 5520 0.0004 -
2.0102 5530 0.0003 -
2.0138 5540 0.0002 -
2.0174 5550 0.0002 -
2.0211 5560 0.0002 -
2.0247 5570 0.0002 -
2.0284 5580 0.0003 -
2.0320 5590 0.0001 -
2.0356 5600 0.0002 -
2.0393 5610 0.0001 -
2.0429 5620 0.0001 -
2.0465 5630 0.001 -
2.0502 5640 0.0001 -
2.0538 5650 0.0001 -
2.0574 5660 0.0003 -
2.0611 5670 0.0001 -
2.0647 5680 0.0001 -
2.0683 5690 0.0002 -
2.0720 5700 0.0004 -
2.0756 5710 0.0001 -
2.0792 5720 0.0001 -
2.0829 5730 0.0001 -
2.0865 5740 0.0001 -
2.0901 5750 0.0019 -
2.0938 5760 0.0001 -
2.0974 5770 0.0003 -
2.1011 5780 0.0002 -
2.1047 5790 0.0001 -
2.1083 5800 0.0001 -
2.1120 5810 0.0001 -
2.1156 5820 0.0006 -
2.1192 5830 0.0001 -
2.1229 5840 0.0001 -
2.1265 5850 0.0001 -
2.1301 5860 0.0 -
2.1338 5870 0.0001 -
2.1374 5880 0.0001 -
2.1410 5890 0.0001 -
2.1447 5900 0.0002 -
2.1483 5910 0.0005 -
2.1519 5920 0.0001 -
2.1556 5930 0.0004 -
2.1592 5940 0.0001 -
2.1628 5950 0.0001 -
2.1665 5960 0.0001 -
2.1701 5970 0.0001 -
2.1738 5980 0.0001 -
2.1774 5990 0.0002 -
2.1810 6000 0.0001 -
2.1847 6010 0.0001 -
2.1883 6020 0.0001 -
2.1919 6030 0.0001 -
2.1956 6040 0.0001 -
2.1992 6050 0.0002 -
2.2028 6060 0.0001 -
2.2065 6070 0.0001 -
2.2101 6080 0.0001 -
2.2137 6090 0.0001 -
2.2174 6100 0.0001 -
2.2210 6110 0.0004 -
2.2246 6120 0.0001 -
2.2283 6130 0.0001 -
2.2319 6140 0.0001 -
2.2356 6150 0.0005 -
2.2392 6160 0.0 -
2.2428 6170 0.0001 -
2.2465 6180 0.0001 -
2.2501 6190 0.0002 -
2.2537 6200 0.0001 -
2.2574 6210 0.0001 -
2.2610 6220 0.0001 -
2.2646 6230 0.0001 -
2.2683 6240 0.0006 -
2.2719 6250 0.0001 -
2.2755 6260 0.0 -
2.2792 6270 0.0003 -
2.2828 6280 0.0001 -
2.2864 6290 0.0002 -
2.2901 6300 0.0001 -
2.2937 6310 0.0004 -
2.2973 6320 0.0001 -
2.3010 6330 0.0002 -
2.3046 6340 0.0002 -
2.3083 6350 0.0004 -
2.3119 6360 0.0001 -
2.3155 6370 0.0004 -
2.3192 6380 0.0001 -
2.3228 6390 0.0001 -
2.3264 6400 0.0002 -
2.3301 6410 0.0001 -
2.3337 6420 0.0001 -
2.3373 6430 0.0001 -
2.3410 6440 0.0002 -
2.3446 6450 0.0003 -
2.3482 6460 0.0001 -
2.3519 6470 0.0001 -
2.3555 6480 0.0001 -
2.3591 6490 0.0001 -
2.3628 6500 0.0002 -
2.3664 6510 0.0001 -
2.3700 6520 0.0001 -
2.3737 6530 0.0005 -
2.3773 6540 0.0001 -
2.3810 6550 0.0001 -
2.3846 6560 0.0002 -
2.3882 6570 0.0001 -
2.3919 6580 0.0002 -
2.3955 6590 0.0001 -
2.3991 6600 0.0001 -
2.4028 6610 0.0003 -
2.4064 6620 0.0001 -
2.4100 6630 0.0004 -
2.4137 6640 0.0001 -
2.4173 6650 0.0001 -
2.4209 6660 0.0001 -
2.4246 6670 0.0001 -
2.4282 6680 0.0001 -
2.4318 6690 0.0002 -
2.4355 6700 0.0001 -
2.4391 6710 0.0001 -
2.4427 6720 0.0005 -
2.4464 6730 0.0001 -
2.4500 6740 0.0001 -
2.4537 6750 0.0001 -
2.4573 6760 0.0005 -
2.4609 6770 0.0001 -
2.4646 6780 0.0001 -
2.4682 6790 0.0002 -
2.4718 6800 0.0001 -
2.4755 6810 0.0001 -
2.4791 6820 0.0 -
2.4827 6830 0.0001 -
2.4864 6840 0.0001 -
2.4900 6850 0.0004 -
2.4936 6860 0.0002 -
2.4973 6870 0.0002 -
2.5009 6880 0.0001 -
2.5045 6890 0.0001 -
2.5082 6900 0.0001 -
2.5118 6910 0.0002 -
2.5154 6920 0.0002 -
2.5191 6930 0.0001 -
2.5227 6940 0.0001 -
2.5264 6950 0.0001 -
2.5300 6960 0.0 -
2.5336 6970 0.0001 -
2.5373 6980 0.0002 -
2.5409 6990 0.0003 -
2.5445 7000 0.0003 -
2.5482 7010 0.0001 -
2.5518 7020 0.0001 -
2.5554 7030 0.0001 -
2.5591 7040 0.0 -
2.5627 7050 0.0001 -
2.5663 7060 0.0001 -
2.5700 7070 0.0004 -
2.5736 7080 0.0001 -
2.5772 7090 0.0002 -
2.5809 7100 0.0001 -
2.5845 7110 0.0001 -
2.5881 7120 0.0 -
2.5918 7130 0.0 -
2.5954 7140 0.0001 -
2.5991 7150 0.0001 -
2.6027 7160 0.0 -
2.6063 7170 0.0002 -
2.6100 7180 0.0001 -
2.6136 7190 0.0001 -
2.6172 7200 0.0001 -
2.6209 7210 0.0001 -
2.6245 7220 0.0003 -
2.6281 7230 0.0001 -
2.6318 7240 0.0002 -
2.6354 7250 0.0003 -
2.6390 7260 0.0001 -
2.6427 7270 0.0001 -
2.6463 7280 0.0006 -
2.6499 7290 0.0001 -
2.6536 7300 0.0005 -
2.6572 7310 0.0 -
2.6609 7320 0.0001 -
2.6645 7330 0.0001 -
2.6681 7340 0.0001 -
2.6718 7350 0.0001 -
2.6754 7360 0.0002 -
2.6790 7370 0.0001 -
2.6827 7380 0.0001 -
2.6863 7390 0.0001 -
2.6899 7400 0.0005 -
2.6936 7410 0.0001 -
2.6972 7420 0.0002 -
2.7008 7430 0.0001 -
2.7045 7440 0.0001 -
2.7081 7450 0.0002 -
2.7117 7460 0.0006 -
2.7154 7470 0.0002 -
2.7190 7480 0.0 -
2.7226 7490 0.0001 -
2.7263 7500 0.0001 -
2.7299 7510 0.0002 -
2.7336 7520 0.0001 -
2.7372 7530 0.0001 -
2.7408 7540 0.0001 -
2.7445 7550 0.0002 -
2.7481 7560 0.0001 -
2.7517 7570 0.0 -
2.7554 7580 0.0001 -
2.7590 7590 0.0001 -
2.7626 7600 0.0 -
2.7663 7610 0.0001 -
2.7699 7620 0.0001 -
2.7735 7630 0.0 -
2.7772 7640 0.0002 -
2.7808 7650 0.0001 -
2.7844 7660 0.0001 -
2.7881 7670 0.0 -
2.7917 7680 0.0001 -
2.7953 7690 0.0001 -
2.7990 7700 0.0 -
2.8026 7710 0.0002 -
2.8063 7720 0.0001 -
2.8099 7730 0.0 -
2.8135 7740 0.0 -
2.8172 7750 0.0001 -
2.8208 7760 0.0001 -
2.8244 7770 0.0 -
2.8281 7780 0.0001 -
2.8317 7790 0.0001 -
2.8353 7800 0.0003 -
2.8390 7810 0.0001 -
2.8426 7820 0.0002 -
2.8462 7830 0.0003 -
2.8499 7840 0.0 -
2.8535 7850 0.0001 -
2.8571 7860 0.0 -
2.8608 7870 0.0 -
2.8644 7880 0.0002 -
2.8680 7890 0.0001 -
2.8717 7900 0.0001 -
2.8753 7910 0.0001 -
2.8790 7920 0.0002 -
2.8826 7930 0.0001 -
2.8862 7940 0.0 -
2.8899 7950 0.0002 -
2.8935 7960 0.0001 -
2.8971 7970 0.0002 -
2.9008 7980 0.0001 -
2.9044 7990 0.0001 -
2.9080 8000 0.0001 -
2.9117 8010 0.0 -
2.9153 8020 0.0001 -
2.9189 8030 0.0001 -
2.9226 8040 0.0001 -
2.9262 8050 0.0001 -
2.9298 8060 0.0001 -
2.9335 8070 0.0001 -
2.9371 8080 0.0001 -
2.9407 8090 0.0001 -
2.9444 8100 0.0001 -
2.9480 8110 0.0001 -
2.9517 8120 0.0003 -
2.9553 8130 0.0001 -
2.9589 8140 0.0001 -
2.9626 8150 0.0001 -
2.9662 8160 0.0005 -
2.9698 8170 0.0005 -
2.9735 8180 0.0001 -
2.9771 8190 0.0001 -
2.9807 8200 0.0002 -
2.9844 8210 0.0001 -
2.9880 8220 0.0001 -
2.9916 8230 0.0001 -
2.9953 8240 0.0001 -
2.9989 8250 0.0001 -
3.0 8253 - 0.0611
3.0025 8260 0.0 -
3.0062 8270 0.0001 -
3.0098 8280 0.0001 -
3.0134 8290 0.0002 -
3.0171 8300 0.0001 -
3.0207 8310 0.0001 -
3.0244 8320 0.0002 -
3.0280 8330 0.0001 -
3.0316 8340 0.0001 -
3.0353 8350 0.0002 -
3.0389 8360 0.0001 -
3.0425 8370 0.0001 -
3.0462 8380 0.0001 -
3.0498 8390 0.0001 -
3.0534 8400 0.0001 -
3.0571 8410 0.0001 -
3.0607 8420 0.0001 -
3.0643 8430 0.0001 -
3.0680 8440 0.0 -
3.0716 8450 0.0001 -
3.0752 8460 0.0001 -
3.0789 8470 0.0003 -
3.0825 8480 0.0002 -
3.0862 8490 0.0001 -
3.0898 8500 0.0003 -
3.0934 8510 0.0001 -
3.0971 8520 0.0001 -
3.1007 8530 0.0001 -
3.1043 8540 0.0001 -
3.1080 8550 0.0001 -
3.1116 8560 0.0001 -
3.1152 8570 0.0001 -
3.1189 8580 0.0001 -
3.1225 8590 0.0001 -
3.1261 8600 0.0001 -
3.1298 8610 0.0001 -
3.1334 8620 0.0001 -
3.1370 8630 0.0001 -
3.1407 8640 0.0 -
3.1443 8650 0.0004 -
3.1479 8660 0.0001 -
3.1516 8670 0.0002 -
3.1552 8680 0.0001 -
3.1589 8690 0.0 -
3.1625 8700 0.0001 -
3.1661 8710 0.0005 -
3.1698 8720 0.0001 -
3.1734 8730 0.0001 -
3.1770 8740 0.0001 -
3.1807 8750 0.0001 -
3.1843 8760 0.0002 -
3.1879 8770 0.0001 -
3.1916 8780 0.0001 -
3.1952 8790 0.0001 -
3.1988 8800 0.0001 -
3.2025 8810 0.0001 -
3.2061 8820 0.0001 -
3.2097 8830 0.0 -
3.2134 8840 0.0 -
3.2170 8850 0.0001 -
3.2206 8860 0.0001 -
3.2243 8870 0.0002 -
3.2279 8880 0.0001 -
3.2316 8890 0.0001 -
3.2352 8900 0.0001 -
3.2388 8910 0.0001 -
3.2425 8920 0.0002 -
3.2461 8930 0.0004 -
3.2497 8940 0.0003 -
3.2534 8950 0.0001 -
3.2570 8960 0.0001 -
3.2606 8970 0.0001 -
3.2643 8980 0.0001 -
3.2679 8990 0.0001 -
3.2715 9000 0.0001 -
3.2752 9010 0.0001 -
3.2788 9020 0.0003 -
3.2824 9030 0.0001 -
3.2861 9040 0.0008 -
3.2897 9050 0.0001 -
3.2933 9060 0.0001 -
3.2970 9070 0.0002 -
3.3006 9080 0.0002 -
3.3043 9090 0.0001 -
3.3079 9100 0.0001 -
3.3115 9110 0.0002 -
3.3152 9120 0.0002 -
3.3188 9130 0.0001 -
3.3224 9140 0.0 -
3.3261 9150 0.0001 -
3.3297 9160 0.0001 -
3.3333 9170 0.0001 -
3.3370 9180 0.0001 -
3.3406 9190 0.0001 -
3.3442 9200 0.0001 -
3.3479 9210 0.0003 -
3.3515 9220 0.0001 -
3.3551 9230 0.0 -
3.3588 9240 0.0001 -
3.3624 9250 0.0001 -
3.3660 9260 0.0 -
3.3697 9270 0.0001 -
3.3733 9280 0.0001 -
3.3770 9290 0.0001 -
3.3806 9300 0.0001 -
3.3842 9310 0.0 -
3.3879 9320 0.0002 -
3.3915 9330 0.0001 -
3.3951 9340 0.0002 -
3.3988 9350 0.0003 -
3.4024 9360 0.0002 -
3.4060 9370 0.0001 -
3.4097 9380 0.0001 -
3.4133 9390 0.0001 -
3.4169 9400 0.0001 -
3.4206 9410 0.0001 -
3.4242 9420 0.0001 -
3.4278 9430 0.0001 -
3.4315 9440 0.0 -
3.4351 9450 0.0001 -
3.4387 9460 0.0001 -
3.4424 9470 0.0001 -
3.4460 9480 0.0001 -
3.4497 9490 0.0001 -
3.4533 9500 0.0001 -
3.4569 9510 0.0001 -
3.4606 9520 0.0001 -
3.4642 9530 0.0002 -
3.4678 9540 0.0001 -
3.4715 9550 0.0001 -
3.4751 9560 0.0001 -
3.4787 9570 0.0001 -
3.4824 9580 0.0 -
3.4860 9590 0.0002 -
3.4896 9600 0.0001 -
3.4933 9610 0.0001 -
3.4969 9620 0.0 -
3.5005 9630 0.0001 -
3.5042 9640 0.0001 -
3.5078 9650 0.0001 -
3.5115 9660 0.0001 -
3.5151 9670 0.0001 -
3.5187 9680 0.0002 -
3.5224 9690 0.0003 -
3.5260 9700 0.0001 -
3.5296 9710 0.0 -
3.5333 9720 0.0002 -
3.5369 9730 0.0003 -
3.5405 9740 0.0001 -
3.5442 9750 0.0001 -
3.5478 9760 0.0001 -
3.5514 9770 0.0001 -
3.5551 9780 0.0001 -
3.5587 9790 0.0001 -
3.5623 9800 0.0001 -
3.5660 9810 0.0002 -
3.5696 9820 0.0001 -
3.5732 9830 0.0 -
3.5769 9840 0.0 -
3.5805 9850 0.0002 -
3.5842 9860 0.0 -
3.5878 9870 0.0001 -
3.5914 9880 0.0001 -
3.5951 9890 0.0001 -
3.5987 9900 0.0001 -
3.6023 9910 0.0001 -
3.6060 9920 0.0002 -
3.6096 9930 0.0001 -
3.6132 9940 0.0 -
3.6169 9950 0.0001 -
3.6205 9960 0.0001 -
3.6241 9970 0.0001 -
3.6278 9980 0.0002 -
3.6314 9990 0.0 -
3.6350 10000 0.0 -
3.6387 10010 0.0001 -
3.6423 10020 0.0003 -
3.6459 10030 0.0001 -
3.6496 10040 0.0001 -
3.6532 10050 0.0 -
3.6569 10060 0.0001 -
3.6605 10070 0.0 -
3.6641 10080 0.0001 -
3.6678 10090 0.0001 -
3.6714 10100 0.0001 -
3.6750 10110 0.0003 -
3.6787 10120 0.0001 -
3.6823 10130 0.0001 -
3.6859 10140 0.0 -
3.6896 10150 0.0001 -
3.6932 10160 0.0001 -
3.6968 10170 0.0001 -
3.7005 10180 0.0001 -
3.7041 10190 0.0 -
3.7077 10200 0.0001 -
3.7114 10210 0.0011 -
3.7150 10220 0.0001 -
3.7186 10230 0.0001 -
3.7223 10240 0.0002 -
3.7259 10250 0.0 -
3.7296 10260 0.0001 -
3.7332 10270 0.0 -
3.7368 10280 0.0001 -
3.7405 10290 0.0001 -
3.7441 10300 0.0 -
3.7477 10310 0.0001 -
3.7514 10320 0.0 -
3.7550 10330 0.0003 -
3.7586 10340 0.0 -
3.7623 10350 0.0003 -
3.7659 10360 0.0 -
3.7695 10370 0.0001 -
3.7732 10380 0.0002 -
3.7768 10390 0.0001 -
3.7804 10400 0.0 -
3.7841 10410 0.0001 -
3.7877 10420 0.0002 -
3.7913 10430 0.0005 -
3.7950 10440 0.0001 -
3.7986 10450 0.0001 -
3.8023 10460 0.0 -
3.8059 10470 0.0002 -
3.8095 10480 0.0001 -
3.8132 10490 0.0006 -
3.8168 10500 0.0001 -
3.8204 10510 0.0001 -
3.8241 10520 0.0004 -
3.8277 10530 0.0001 -
3.8313 10540 0.0 -
3.8350 10550 0.0001 -
3.8386 10560 0.0 -
3.8422 10570 0.0001 -
3.8459 10580 0.0001 -
3.8495 10590 0.0 -
3.8531 10600 0.0001 -
3.8568 10610 0.0001 -
3.8604 10620 0.0001 -
3.8640 10630 0.0001 -
3.8677 10640 0.0001 -
3.8713 10650 0.0001 -
3.8750 10660 0.0001 -
3.8786 10670 0.0001 -
3.8822 10680 0.0 -
3.8859 10690 0.0001 -
3.8895 10700 0.0 -
3.8931 10710 0.0001 -
3.8968 10720 0.0001 -
3.9004 10730 0.0001 -
3.9040 10740 0.0 -
3.9077 10750 0.0001 -
3.9113 10760 0.0 -
3.9149 10770 0.0 -
3.9186 10780 0.0 -
3.9222 10790 0.0001 -
3.9258 10800 0.0001 -
3.9295 10810 0.0003 -
3.9331 10820 0.0001 -
3.9368 10830 0.0005 -
3.9404 10840 0.0001 -
3.9440 10850 0.0001 -
3.9477 10860 0.0 -
3.9513 10870 0.0001 -
3.9549 10880 0.0 -
3.9586 10890 0.0001 -
3.9622 10900 0.0 -
3.9658 10910 0.0 -
3.9695 10920 0.0 -
3.9731 10930 0.0001 -
3.9767 10940 0.0001 -
3.9804 10950 0.0001 -
3.9840 10960 0.0001 -
3.9876 10970 0.0001 -
3.9913 10980 0.0 -
3.9949 10990 0.0001 -
3.9985 11000 0.0001 -
4.0 11004 - 0.0668
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.0.3
  • Sentence Transformers: 3.0.1
  • Transformers: 4.37.0
  • PyTorch: 2.5.1+cu121
  • Datasets: 3.1.0
  • Tokenizers: 0.15.2

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
104
Safetensors
Model size
22.7M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for HussienAhmad/SFT_GradProject

Finetuned
(181)
this model

Evaluation results