SetFit with sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2

This is a SetFit model that can be used for Text Classification. This SetFit model uses sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
supportive
  • 'Die Debatte um ein nationales Tempolimit auf Autobahnen wird immer absurder! Während unsere Straßen bereits sicher und effizient sind, wollen einige Politiker mit einem Tempolimit den deutschen Autofahrern die Freiheit nehmen. Die angeblichen Umweltvorteile sind kaum nachweisbar, aber Hauptsache, man kann sich als Retter der Welt inszenieren. Es ist ein weiterer Versuch, den Bürgern vorzuschreiben, wie sie zu leben haben, anstatt auf Eigenverantwortung zu setzen.'
  • 'Rasen war gestern! Die Einführung eines nationalen Tempolimits auf Autobahnen könnte ein Meilenstein für mehr Sicherheit und Klimaschutz in Deutschland sein. Befürworter argumentieren, dass weniger Unfälle und ein entspannteres Fahrverhalten die Folge wären. Zudem könnten wir so jährlich Millionen Tonnen CO2 einsparen und unserem Planeten etwas Gutes tun. Kritiker mögen protestieren, doch der Wandel in Richtung nachhaltiger Mobilität ist längst überfällig!'
  • 'Die Debatte um die Einführung eines nationalen Tempolimits auf deutschen Autobahnen gewinnt an Fahrt. Befürworter argumentieren, dass ein Tempolimit von 130 km/h nicht nur die Verkehrssicherheit erhöhen, sondern auch einen wichtigen Beitrag zum Klimaschutz leisten könnte. Studien zeigen, dass eine Geschwindigkeitsbegrenzung den CO2-Ausstoß erheblich reduzieren würde. Zudem könnte ein Tempolimit den Verkehrsfluss verbessern und die Zahl der schweren Unfälle verringern. Kritiker hingegen befürchten Einschränkungen der individuellen Freiheit, doch die positiven Auswirkungen auf Umwelt und Sicherheit scheinen zunehmend im Vordergrund zu stehen.'
opposed
  • 'In Deutschland stoßen Gesetzesinitiativen zur flächendeckenden Einführung von Wärmepumpen auf Kritik. Experten warnen vor erheblichen Kosten für Hausbesitzer, da die Umrüstung oft umfangreiche bauliche Maßnahmen erfordert. Zudem bestehen Bedenken hinsichtlich der Stromversorgung, da die derzeitige Infrastruktur möglicherweise nicht ausreichend ist, um den erhöhten Energiebedarf zu decken. Skeptiker heben auch die potenziellen Lieferengpässe und Fachkräftemangel hervor, die die Umsetzung verzögern könnten.'
  • 'Die drohende Einführung eines nationalen Tempolimits auf unseren Autobahnen ist nichts weniger als ein Frontalangriff auf die persönliche Freiheit der deutschen Autofahrer. Diese überzogene Maßnahme wird als umweltfreundliche Verbesserung verkauft, während sie in Wahrheit Millionen von Bürgern bevormundet und unnötig drangsaliert. Statt sich mit echten Problemen zu befassen, schießen unsere Politiker einmal mehr am Ziel vorbei und nehmen das Ende der freien Fahrt als Kollateralschaden billigend in Kauf. Es ist an der Zeit, dass wir für unsere Freiheit auf der Autobahn einstehen und uns nicht von ideologischen Tempolimit-Fetischisten das Steuer aus der Hand nehmen lassen!'
  • 'Titel: Wärmepumpen-Wahnsinn: Teurer Irrweg der Regierung!\n\nDie neueste Gesetzesinitiative zur flächendeckenden Einführung von Wärmepumpen zeigt einmal mehr, wie weit die realitätsferne Politik der Regierung von den Bedürfnissen der Bürger entfernt ist. Anstatt auf bewährte und kostengünstigere Heizlösungen zu setzen, sollen die Bürger nun gezwungen werden, teure und ineffiziente Technologie zu installieren. Die Einführung dieser Technik droht, den ohnehin schon angespannten Geldbeutel der Verbraucher weiter zu belasten und den Mittelstand zu ruinieren. Währenddessen wird das eigentliche Problem der Energieversorgungssicherheit völlig ignoriert.'

Evaluation

Metrics

Label Accuracy
all 0.9333

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("cbpuschmann/MiniLM-klimacoder_v0.3")
# Run inference
preds = model("In Deutschland formiert sich zunehmender Widerstand gegen geplante Gesetzesinitiativen zur flächendeckenden Einführung von Wärmepumpen. Kritik kommt vor allem von Experten, die auf die hohen Kosten und den aktuellen Mangel an Fachkräften hinweisen, die für Installation und Wartung benötigt werden. Zudem wird befürchtet, dass die Energienetze nicht ausreichend für einen drastischen Anstieg des Stromverbrauchs durch Wärmepumpen gerüstet sind. Viele Bürger sind ebenfalls besorgt über mögliche finanzielle Belastungen und die komplexe Umstellung ihrer Heizsysteme.")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 53 78.9917 112
Label Training Sample Count
opposed 122
supportive 118

Training Hyperparameters

  • batch_size: (32, 32)
  • num_epochs: (1, 1)
  • max_steps: -1
  • sampling_strategy: oversampling
  • body_learning_rate: (2e-05, 1e-05)
  • head_learning_rate: 0.01
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • l2_weight: 0.01
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0011 1 0.2533 -
0.0551 50 0.2196 -
0.1101 100 0.0449 -
0.1652 150 0.0095 -
0.2203 200 0.0095 -
0.2753 250 0.0054 -
0.3304 300 0.006 -
0.3855 350 0.0032 -
0.4405 400 0.0052 -
0.4956 450 0.0036 -
0.5507 500 0.0029 -
0.6057 550 0.0043 -
0.6608 600 0.004 -
0.7159 650 0.0039 -
0.7709 700 0.0031 -
0.8260 750 0.0057 -
0.8811 800 0.0038 -
0.9361 850 0.0058 -
0.9912 900 0.0043 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0
  • Sentence Transformers: 3.2.1
  • Transformers: 4.42.2
  • PyTorch: 2.5.1+cu121
  • Datasets: 3.1.0
  • Tokenizers: 0.19.1

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
29
Safetensors
Model size
118M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for cbpuschmann/MiniLM-klimacoder_v0.3

Evaluation results