|
title: Zero-Shot Interface |
|
name: huggingface/Sahajtomar/German_Zeroshot |
|
description: > |
|
Bei dieser Aufgabe handelt es sich um eine Textklassifizierungsaufgabe. Das heißt, das Modell |
|
bekommt einen Textinhalt vorgelegt und muss aus einer Liste vordefinierter Labels entscheiden, |
|
welches dieser Labels den Inhalt des Textes am besten beschreibt. Der Krux bei der ganzen Sache ist, |
|
dass das Modell keine Spezialisierung für die Labels erfahren hat und sozusagen beim ersten Mal die |
|
richtige Auswahl treffen muss; daher zero shot, denn es hat nur einen Versuch. Erreicht wird dies, in |
|
dem ein vortrainiertes Modell auf einen Datensatz für Natural Language Inference (dt. natürlichsprachliche |
|
Inferenz oder Rückschluss auf natürliche Sprache) spezialisiert wird. Bei dieser Aufgabe bekommt |
|
das Modell zwei Texte vorgelegt und muss lernen, in welchem Verhältnis die beiden Texte zueinanderstehen. |
|
Folgende Klassen stehen dabei zur Auswahl: |
|
|
|
Entailment: Text A ist eine logische Schlussfolgerung von Text B |
|
|
|
Contradiction: Text A steht im Widerspruch zu Text B |
|
|
|
Neutral: es lassen sich keine Schlussfolgerungen dieser Art ziehen |
|
</br> |
|
Nehmen wir als Beispiel den Ausgangstext «Die Kinder lächeln und winken in die Kamera». Nach der Spezialisierung |
|
sollte das Modell in der Lage sein zu sagen, dass die Aussage «Es sind Kinder anwesend.» eine logische |
|
Schlussfolgerung des Ausgangstextes ist, während die Aussage «Die Kinder runzeln die Stirn.» im Widerspruch |
|
zum Ausgangstext steht. |
|
</br> |
|
Es hat sich gezeigt, dass Modelle, die auf Natural Language Inference spezialisiert wurden, auch sehr gut darin sind, |
|
Texten thematisch passende Labels zuzuordnen. Wenn wir wieder den Ausgangstext von vorhin nehmen, wäre das Modell in |
|
der Lage zu sagen, dass von den möglichen Kandidatenlabels [Wirtschaft, Familie, Feier, Tragödie] Familie und Feier |
|
diejenigen Labels sind, die den Inhalt des Textes am besten beschreiben.</br></br>Das hier verwendete Beispielmodell |
|
wurde auf deutschsprachige Texte trainiert. |
|
examples: |
|
- |
|
- > |
|
COVID-19 (Akronym von englisch coronavirus disease 2019, deutsch Coronavirus-Krankheit-2019), in den |
|
deutschsprachigen Ländern umgangssprachlich meist nur als „Corona“ oder „Covid“ bezeichnet, ist eine |
|
meldepflichtige Infektionskrankheit mit einem breiten aber unspezifischen Symptomspektrum, die durch eine |
|
Infektion (Ansteckung) mit dem Betacoronavirus SARS-CoV-2 verursacht wird. Das Virus wurde erstmals im |
|
Dezember 2019 in Wuhan (Volksrepublik China) beschrieben. Es verbreitete sich sehr schnell weltweit und ist |
|
Ursache der COVID-19-Pandemie. Bis 18. Oktober 2022 wurden weltweit rund 622 Millionen COVID-Infizierte registriert, |
|
es wird aber in vielen Ländern eine hohe Dunkelziffer vermutet. Laut einer Schätzung der Weltgesundheitsorganisation |
|
(WHO) gab es zwischen Anfang 2020 und Ende 2021 eine weltweite, durch COVID-19 verursachte Übersterblichkeit von |
|
14,83 Millionen Toten. |
|
- |
|
- Wirtschaft |
|
- Familie |
|
- Politik |
|
- Finanzen |
|
- Medizin |
|
- Gesundheit |
|
- True |
|
|