Add SetFit model

6cca173 verified 22 days ago

18.4 kB

	---
	tags:
	- setfit
	- sentence-transformers
	- text-classification
	- generated_from_setfit_trainer
	widget:
	- text: '"Türme in Rauch, Autos in Scherben - das ist die Bilanz der sogenannten ''Klima-Aktivisten''.
	Anstatt sich an den Tisch des politischen Dialogs zu setzen, zerstören sie mit
	ihrer aggressiven Protestformen unsere Straßen und entfremden die Menschen von
	einem wichtigen Thema. Die Notwendigkeit eines Umbruchs in der Energiepolitik
	wird damit nur vernebelt, stattdessen ergeben wir uns in einer Kultur des Ungehorsams."'
	- text: '"Erneut haben die jungen Wütenden auf die Straßen gestürmt, um ihre Forderungen
	nach einer radikalen Klimapolitik zu erheben. Die Aktivisten von Fridays for Future
	und ihrer Schwesterorganisation Die Letzte Generation zeigen, dass es in der Tat
	noch Hoffnung gibt, dass sich die jüngere Generation nicht von den korrupten Interessen
	des Systems beeinflussen lassen wird. Ihr Mut und ihre Entschlossenheit sollten
	uns alten Politiker und -Pfaffen ein warnendes Zeichen sein: wir müssen endlich
	handeln, bevor es zu spät ist."'
	- text: 'Ein neues Tempolimit auf den Autobahnen: Eine vermeintliche Lösung für die
	Verkehrsstaus, die in Wirklichkeit nur zu Verschiebungen und Missständen führen
	würde. Die Initiative, ein Tempolimit von 130 km/h auf den Bundesautobahnen einzuführen,
	ignoriert die realen Ursachen von Staus und Überlastung, wie z.B. mangelnde Infrastruktur
	oder unzureichende Verkehrsführung. Stattdessen würde sie Autofahrer in enge Bahnen
	zwängen und dadurch den Individualverkehr behindern, ohne dass sich die Situation
	im Großen und Ganzen ändern würde.'
	- text: Unter dem Vorwand, die Politik in Bewegung zu setzen, blockieren Klima-Aktivistengruppen
	immer wieder Straßen und verhindern den alltäglichen Verkehr. Ihre Aktionen wirken
	oft mehr auf die Öffentlichkeit als auf die politische Entscheidungsbildung aus.
	Die von ihnen geforderten drastischen Eingriffe in die Wirtschaft und das soziale
	Leben bleiben jedoch unrealistisch und ignorieren die wirtschaftlichen und sozialen
	Realitäten vieler Menschen. Es fehlt an konstruktiven Vorschlägen, um den Klimawandel
	gemeinsam zu bekämpfen.
	- text: '"Von ''Klimakriegen'' zu rechten Schreien in die Menge: Proteste der jungen
	Aktivisten überfordern die Gesellschaft. Statt produktiven Lösungsansätzen für
	den Klimawandel, sorgen diese Gruppen lediglich für Aufsehen und Chaos auf Straßen
	und Plätzen. Es ist höchste Zeit, dass sich die Jugendlichen von solchen Aktionismus
	distanzieren und sich an tatsächliche politische Gestaltung beteiligen."'
	metrics:
	- accuracy
	pipeline_tag: text-classification
	library_name: setfit
	inference: true
	base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
	model-index:
	- name: SetFit with sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
	results:
	- task:
	type: text-classification
	name: Text Classification
	dataset:
	name: Unknown
	type: unknown
	split: test
	metrics:
	- type: accuracy
	value: 1.0
	name: Accuracy
	---

	# SetFit with sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2

	This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.

	The model has been trained using an efficient few-shot learning technique that involves:

	1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
	2. Training a classification head with features from the fine-tuned Sentence Transformer.

	## Model Details

	### Model Description
	- Model Type: SetFit
	- Sentence Transformer body: [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2)
	- Classification head: a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
	- Maximum Sequence Length: 128 tokens
	- Number of Classes: 2 classes
	<!-- - Training Dataset: [Unknown](https://huggingface.co/datasets/unknown) -->
	<!-- - Language: Unknown -->
	<!-- - License: Unknown -->

	### Model Sources

	- Repository: [SetFit on GitHub](https://github.com/huggingface/setfit)
	- Paper: [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
	- Blogpost: [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)

	### Model Labels
	\| Label \| Examples \|
	\|:-----------\|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------\|
	\| supportive \| <ul><li>'"Die jungen Revolutionäre: Klima-Aktivist*innen erzwingen politische Verantwortung!\n\nInmitten der politischen Apathie und korporatistischen Dominanz, gibt es Hoffnung: die jungen Menschen, die sich für den Schutz unseres Planeten einsetzen. Die Fridays for Future-Demonstrationen und ähnliche Aktionen zeigen, dass die Zeit des Stillstands vorbei ist. Es ist an der Zeit, dass Politiker endlich handeln, anstatt nur zu reden - und die jungen Menschen sind bereit, den Druck auszuüben, um dies zu erreichen."'</li><li>'Die Bundesregierung plant die flächendeckende Einführung von Wärmepumpen in Deutschland. Ziel ist es, den Anteil erneuerbarer Wärme an der Gesamtwärmeversorgung zu erhöhen und den CO2-Ausstoß zu reduzieren. Die Initiative soll auch die Energieeffizienz verbessern und die Abhängigkeit von fossilen Brennstoffen verringern. Experten hoffen, dass diese Maßnahme einen wichtigen Schritt in Richtung einer klimafreundlichen Zukunft darstellt.'</li><li>'„Heizkosten senken, CO2 reduzieren: Bund und Länder planen flächendeckende Einführung von Wärmepumpen. Die Initiative soll bis 2030 umgesetzt werden. Experten hoffen, dass die Maßnahme nicht nur den Klimaschutz fördert, sondern auch die Heizkosten für Millionen deutscher Haushalte senkt. In Zukunft sollen Wärmepumpen in neuen Gebäuden standardmäßig vorgesehen werden, um eine emissionsarme und wirtschaftliche Erwärmung zu ermöglichen.“'</li></ul> \|
	\| opposed \| <ul><li>'"Klima-Dramatik auf der Straße: Radikale Aktivisten blockieren die Realität ab"\n\nDie jüngste Aktion von "Fridays for Future" in Berlin hat wieder gezeigt, dass die Proteste der Klima-Aktivist*innen nicht nur lärmig und lahmlegen, sondern auch sinnlos sind. Statt konstruktiv an Lösungen zu arbeiten, verbringen sie ihre Zeit damit, Straßen zu blockieren und die Alltäglichkeit in Berlin zu stören. Wir brauchen Handlungsabkömmlinge, nicht bloße Demonstranten.'</li><li>'"Steuernde Fehlplanung: Grüne Wärme-Pumpe-Hysterie kostet Steuerzahler Milliarden"\n\nDie Regierung will uns mit einer teuren, ineffizienten und unpraktischen Wärmepumpen-Revolution in die Zukunft führen. Die flächendeckende Einführung dieser teuren Geräte wird den Stromverbrauch erhöhen, die Steuerzahler belasten und unsere Umwelt nicht wirklich schützen. Wir brauchen eine realistische Energiewende, nicht eine teure Fehlplanung von Grünen, die sich in ihre eigene Welt versenken."'</li><li>'Neue Schikane an den Straßen: Bund plant Tempo-Limit für Autobahnen\nEin neuer Vorschlag des Bundesverkehrswegeplans (BVWP) will eine allgemeine Geschwindigkeitsbegrenzung auf Autobahnen einführen. Laut Plänen soll die Höchstgeschwindigkeit von derzeit 130 km/h auf 120 km/h reduziert werden. Kritiker warnen vor Auswirkungen auf den Verkehr und die Wirtschaft, da sich dies zu erheblichen Verzögerungen führen könnte, insbesondere bei Lkw-Fahrten. Der Vorschlag wird in der nächsten Sitzung des Bundesverkehrsministeriums diskutiert.'</li></ul> \|

	## Evaluation

	### Metrics
	\| Label \| Accuracy \|
	\|:--------\|:---------\|
	\| all \| 1.0 \|

	## Uses

	### Direct Use for Inference

	First install the SetFit library:

	```bash
	pip install setfit
	```

	Then you can load this model and run inference.

	```python
	from setfit import SetFitModel

	# Download from the 🤗 Hub
	model = SetFitModel.from_pretrained("cbpuschmann/MiniLM-klimacoder_v0.4")
	# Run inference
	preds = model("\"Von 'Klimakriegen' zu rechten Schreien in die Menge: Proteste der jungen Aktivisten überfordern die Gesellschaft. Statt produktiven Lösungsansätzen für den Klimawandel, sorgen diese Gruppen lediglich für Aufsehen und Chaos auf Straßen und Plätzen. Es ist höchste Zeit, dass sich die Jugendlichen von solchen Aktionismus distanzieren und sich an tatsächliche politische Gestaltung beteiligen.\"")
	```

	<!--
	### Downstream Use

	List how someone could finetune this model on their own dataset.
	-->

	<!--
	### Out-of-Scope Use

	List how the model may foreseeably be misused and address what users ought not to do with the model.
	-->

	<!--
	## Bias, Risks and Limitations

	What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.
	-->

	<!--
	### Recommendations

	What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.
	-->

	## Training Details

	### Training Set Metrics
	\| Training set \| Min \| Median \| Max \|
	\|:-------------\|:----\|:--------\|:----\|
	\| Word count \| 36 \| 64.4771 \| 98 \|

	\| Label \| Training Sample Count \|
	\|:-----------\|:----------------------\|
	\| opposed \| 235 \|
	\| supportive \| 245 \|

	### Training Hyperparameters
	- batch_size: (32, 32)
	- num_epochs: (1, 1)
	- max_steps: -1
	- sampling_strategy: oversampling
	- body_learning_rate: (2e-05, 1e-05)
	- head_learning_rate: 0.01
	- loss: CosineSimilarityLoss
	- distance_metric: cosine_distance
	- margin: 0.25
	- end_to_end: False
	- use_amp: False
	- warmup_proportion: 0.1
	- l2_weight: 0.01
	- seed: 42
	- eval_max_steps: -1
	- load_best_model_at_end: False

	### Training Results
	\| Epoch \| Step \| Training Loss \| Validation Loss \|
	\|:------:\|:----:\|:-------------:\|:---------------:\|
	\| 0.0003 \| 1 \| 0.2397 \| - \|
	\| 0.0138 \| 50 \| 0.253 \| - \|
	\| 0.0276 \| 100 \| 0.152 \| - \|
	\| 0.0415 \| 150 \| 0.0264 \| - \|
	\| 0.0553 \| 200 \| 0.0064 \| - \|
	\| 0.0691 \| 250 \| 0.0014 \| - \|
	\| 0.0829 \| 300 \| 0.0007 \| - \|
	\| 0.0968 \| 350 \| 0.0003 \| - \|
	\| 0.1106 \| 400 \| 0.0002 \| - \|
	\| 0.1244 \| 450 \| 0.0002 \| - \|
	\| 0.1382 \| 500 \| 0.0002 \| - \|
	\| 0.1521 \| 550 \| 0.0001 \| - \|
	\| 0.1659 \| 600 \| 0.0001 \| - \|
	\| 0.1797 \| 650 \| 0.0003 \| - \|
	\| 0.1935 \| 700 \| 0.0001 \| - \|
	\| 0.2074 \| 750 \| 0.0001 \| - \|
	\| 0.2212 \| 800 \| 0.0001 \| - \|
	\| 0.2350 \| 850 \| 0.0 \| - \|
	\| 0.2488 \| 900 \| 0.0 \| - \|
	\| 0.2626 \| 950 \| 0.0 \| - \|
	\| 0.2765 \| 1000 \| 0.0 \| - \|
	\| 0.2903 \| 1050 \| 0.0 \| - \|
	\| 0.3041 \| 1100 \| 0.0 \| - \|
	\| 0.3179 \| 1150 \| 0.0 \| - \|
	\| 0.3318 \| 1200 \| 0.0 \| - \|
	\| 0.3456 \| 1250 \| 0.0 \| - \|
	\| 0.3594 \| 1300 \| 0.0 \| - \|
	\| 0.3732 \| 1350 \| 0.0 \| - \|
	\| 0.3871 \| 1400 \| 0.0 \| - \|
	\| 0.4009 \| 1450 \| 0.0 \| - \|
	\| 0.4147 \| 1500 \| 0.0 \| - \|
	\| 0.4285 \| 1550 \| 0.0 \| - \|
	\| 0.4424 \| 1600 \| 0.0 \| - \|
	\| 0.4562 \| 1650 \| 0.0 \| - \|
	\| 0.4700 \| 1700 \| 0.0 \| - \|
	\| 0.4838 \| 1750 \| 0.0 \| - \|
	\| 0.4976 \| 1800 \| 0.0 \| - \|
	\| 0.5115 \| 1850 \| 0.0 \| - \|
	\| 0.5253 \| 1900 \| 0.0 \| - \|
	\| 0.5391 \| 1950 \| 0.0 \| - \|
	\| 0.5529 \| 2000 \| 0.0 \| - \|
	\| 0.5668 \| 2050 \| 0.0 \| - \|
	\| 0.5806 \| 2100 \| 0.0 \| - \|
	\| 0.5944 \| 2150 \| 0.0 \| - \|
	\| 0.6082 \| 2200 \| 0.0 \| - \|
	\| 0.6221 \| 2250 \| 0.0 \| - \|
	\| 0.6359 \| 2300 \| 0.0 \| - \|
	\| 0.6497 \| 2350 \| 0.0 \| - \|
	\| 0.6635 \| 2400 \| 0.0 \| - \|
	\| 0.6774 \| 2450 \| 0.0 \| - \|
	\| 0.6912 \| 2500 \| 0.0 \| - \|
	\| 0.7050 \| 2550 \| 0.0 \| - \|
	\| 0.7188 \| 2600 \| 0.0 \| - \|
	\| 0.7327 \| 2650 \| 0.0 \| - \|
	\| 0.7465 \| 2700 \| 0.0 \| - \|
	\| 0.7603 \| 2750 \| 0.0 \| - \|
	\| 0.7741 \| 2800 \| 0.0 \| - \|
	\| 0.7879 \| 2850 \| 0.0 \| - \|
	\| 0.8018 \| 2900 \| 0.0 \| - \|
	\| 0.8156 \| 2950 \| 0.0 \| - \|
	\| 0.8294 \| 3000 \| 0.0 \| - \|
	\| 0.8432 \| 3050 \| 0.0 \| - \|
	\| 0.8571 \| 3100 \| 0.0 \| - \|
	\| 0.8709 \| 3150 \| 0.0 \| - \|
	\| 0.8847 \| 3200 \| 0.0 \| - \|
	\| 0.8985 \| 3250 \| 0.0 \| - \|
	\| 0.9124 \| 3300 \| 0.0 \| - \|
	\| 0.9262 \| 3350 \| 0.0 \| - \|
	\| 0.9400 \| 3400 \| 0.0 \| - \|
	\| 0.9538 \| 3450 \| 0.0 \| - \|
	\| 0.9677 \| 3500 \| 0.0 \| - \|
	\| 0.9815 \| 3550 \| 0.0 \| - \|
	\| 0.9953 \| 3600 \| 0.0 \| - \|

	### Framework Versions
	- Python: 3.10.12
	- SetFit: 1.1.0
	- Sentence Transformers: 3.2.1
	- Transformers: 4.42.2
	- PyTorch: 2.5.1+cu121
	- Datasets: 3.1.0
	- Tokenizers: 0.19.1

	## Citation

	### BibTeX
	```bibtex
	@article{https://doi.org/10.48550/arxiv.2209.11055,
	doi = {10.48550/ARXIV.2209.11055},
	url = {https://arxiv.org/abs/2209.11055},
	author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
	keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
	title = {Efficient Few-Shot Learning Without Prompts},
	publisher = {arXiv},
	year = {2022},
	copyright = {Creative Commons Attribution 4.0 International}
	}
	```

	<!--
	## Glossary

	Clearly define terms in order to be accessible across audiences.
	-->

	<!--
	## Model Card Authors

	Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.
	-->

	<!--
	## Model Card Contact

	Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.
	-->