You need to agree to share your contact information to access this model

This repository is publicly accessible, but you have to accept the conditions to access its files and content.

Log in or Sign Up to review the conditions and access this model content.

Ellamind Summarizer Nemo v4

This model is fine-tuned for generating summaries of diverse text types in German. It produces concise, variable-length summaries, with the ability to reference key sections of the original text. Designed to handle long-context documents, it can efficiently summarize even extensive texts—such as 100-page documents—within seconds, thanks to its large-scale architecture.

Response Format

class SummaryWithQuotes(BaseModel):
    # a summary with quotes is a summary that references quotes in the text. Not verified
    quotes: List[Quote] = Field(
        default_factory=list,
        description="List of verbatim quotes from the text that can be referred to in the summary. Ascending from 1.",
    )
    summary: str = Field(
        ...,
        description="Summary of the given text; should follow all instructions, reference the quotes in appropriate places and should contain approximately as many words as requested.",
    )

Attention: The model won't follow the output text requirements when used with structured output via VLLM/Outlines. It is advised to sanitize/parse the JSON manually. Please report back to us if you find a way to use structured output without quality degradation.

Prompts

The model was trained with these prompts. It is advised to follow them verbatim and only vary the prompt variables.

PROMPT_SUMMARY_ONESHOT_DE = """Du bist ein KI-Assistent, der prägnante, informationsdichte und durch Referenzen unterstützte Zusammenfassungen erstellt.

# Zusammenzufassender Text

<text>
{text}
</text>

# Ausgabeformat
1. Die Ausgabe mit im JSON-Format erfolgen.
2. Das JSON-Objekt muss die folgenden Keys enthalten: "quotes" und "summary".
3. "quotes" ist eine Liste von JSON-Objekten, die jeweils die folgenden Keys enthalten: "quote_number" (Zahl; aufsteigend von 1 nummeriert und in der Zusammenfassung referenziert) und "quote" (das wortwörtliche Zitat, einschließlich Zeilenumbrüche, Leerzeichen und Zeichensetzung).
4. "summary" ist ein String, der die eigentliche Zusammenfassung enthält.

# Anweisungen
1. Erstellen Sie eine Liste von Zitaten mit den wichtigsten Daten und Fakten aus dem Text. Diese Zitate sollen so gewählt sein, dass sie die Kernaussagen des Textes unterstützen und die Zusammenfassung prägnant und informationsdicht machen. Achten Sie darauf, dass alle Paragraphen der Zusammenfassung durch Zitate unterstützt werden.
2. Die Zitate müssen wörtlich und buchstabengetreu zitiert werden, einschließlich Zeilenumbrüche, Leerzeichen und Zeichensetzung.
3. Beginnen Sie die Zusammenfassung mit einer kurzen Einleitung, die Titel und Autor (falls verfügbar), sowie die wichtigsten Inhalte und Erkenntnisse nennt, im Stile einer "Executive Summary". Danach folgen Abschnitte, die die Kernaussagen und wichtigsten Inhalte des Textes darstellen. Strukturieren Sie die Zusammenfassung in sinnvolle Absätze mit einem kohärenten Gedankengang.
4. Verweisen Sie in der Zusammenfassung mit Referenzen in aufsteigender Reihenfolge wie [1], [2], [3] usw. an passenden Stellen auf die Zitate.
5. Verzichten Sie auf ein abschließendes Fazit oder eine Gesamtzusammenfassung im letzten Absatz.
6. Sollte das Dokument keinen sinnvollen Inhalt enthalten, geben Sie "Das Dokument enthält keinen zusammenfassbaren Text.", gefolgt vom Anfang des Textes als "summary" zurück.
7. Die Zusammenfassung unter "summary" muss ungefähr {word_count} Wörter lang sein (ohne die Zitate) und muss {number_of_quotes} Referenzen (in der Form "[1]" ... "[{number_of_quotes}]") zu {number_of_quotes} unterschiedlichen Zitaten (unter "quotes" mit der jeweiligen "quote_number") enthalten!"""

PROMPT_SUMMARY_PARTIAL_DE = """Du bist ein KI-Assistent, der prägnante, informationsdichte und durch Referenzen unterstützte Zusammenfassungen erstellt.

# Zusammenzufassender Text

<text>
{text}
</text>

Der Text ist ein Teil eines größeren Dokuments und Sie sollen eine Teilzusammenfassung erstellen, aus der später zusammen mit anderen Teilzusammenfassungen eine Gesamtzusammenfassung erstellt werden kann.

# Ausgabeformat
1. Die Ausgabe mit im JSON-Format erfolgen.
2. Das JSON-Objekt muss die folgenden Keys enthalten: "quotes" und "summary".
3. "quotes" ist eine Liste von JSON-Objekten, die jeweils die folgenden Keys enthalten: "quote_number" (Zahl; aufsteigend von 1 nummeriert und in der Zusammenfassung referenziert) und "quote" (das wortwörtliche Zitat, einschließlich Zeilenumbrüche, Leerzeichen und Zeichensetzung).
4. "summary" ist ein String, der die eigentliche Zusammenfassung enthält.

# Anweisungen
1. Erstellen Sie eine Liste von Zitaten mit den wichtigsten Daten und Fakten aus dem Text. Diese Zitate sollen so gewählt sein, dass sie die Kernaussagen des Textes unterstützen und die Zusammenfassung prägnant und informationsdicht machen. Achten Sie darauf, dass alle Paragraphen der Zusammenfassung durch Zitate unterstützt werden.
2. Die Zitate müssen wörtlich und buchstabengetreu zitiert werden, einschließlich Zeilenumbrüche, Leerzeichen und Zeichensetzung.
3. Beginnen Sie die Zusammenfassung mit einer kurzen Einleitung, die Titel und Autor (falls verfügbar), sowie die wichtigsten Inhalte und Erkenntnisse nennt, im Stile einer "Executive Summary". Danach folgen Abschnitte, die die Kernaussagen und wichtigsten Inhalte des Textes darstellen. Strukturieren Sie die Zusammenfassung in sinnvolle Absätze mit einem kohärenten Gedankengang.
4. Verweisen Sie in der Zusammenfassung mit Referenzen in aufsteigender Reihenfolge wie [1], [2], [3] usw. an passenden Stellen auf die Zitate.
5. Verzichten Sie auf ein abschließendes Fazit oder eine Gesamtzusammenfassung im letzten Absatz.
6. Sollte das Dokument keinen sinnvollen Inhalt enthalten, geben Sie "Das Dokument enthält keinen zusammenfassbaren Text.", gefolgt vom Anfang des Textes als "summary" zurück.
7. Die Zusammenfassung unter "summary" muss ungefähr 300 Wörter lang sein (ohne die Zitate) und muss 3 Referenzen (in der Form "[1]" ... "[3]") zu 3 unterschiedlichen Zitaten (unter "quotes" mit der jeweiligen "quote_number") enthalten!"""

PROMPT_SUMMARY_FINAL_DE = """Du bist ein KI-Assistent, der prägnante, informationsdichte und durch Referenzen unterstützte Zusammenfassungen erstellt.

# Teilzusammenfassungen

Gegeben sind mehrere Teilzusammenfassungen eines größeren Dokuments, die als JSON-Objektein den <partial_summaries>-Tags gegeben sind:

<teilzusammenfassungen>
{partial_summaries}
</teilzusammenfassungen>

Das Ziel ist es, eine Gesamtzusammenfassung zu erstellen, die alle Teilzusammenfassungen unter Berücksichtigung der wichtigsten Referenzen kohärent miteinander verknüpft.

# Ausgabeformat
1. Die Ausgabe mit im JSON-Format erfolgen.
2. Das JSON-Objekt muss die folgenden Keys enthalten: "quotes" und "summary".
3. "quotes" ist eine Liste von JSON-Objekten, die jeweils die folgenden Keys enthalten: "quote_number" (Zahl; aufsteigend von 1 nummeriert und in der Zusammenfassung referenziert) und "quote" (das wortwörtliche Zitat, einschließlich Zeilenumbrüche, Leerzeichen und Zeichensetzung).
4. "summary" ist ein String, der die eigentliche Zusammenfassung enthält.

# Anweisungen
1. Übernehmen Sie die wichtigsten Zitate aus den Teilzusammenfassungen für die Gesamtzusammenfassung. Stellen Sie sicher, dass diese Zitate die wichtigsten Informationen für eine Gesamtzusammenfassung erfassen, über die wichtigsten Abschnitte der Teilzusammenfassungen verteilt sind und dass alle Abschnitte der Gesamtzusammenfassung durch Zitate unterstützt werden.
2. Die Zitate müssen wörtlich und buchstabengetreu übernommen werden, einschließlich Zeilenumbrüche, Leerzeichen und Zeichensetzung.
3. Vergeben Sie neue, von 1 aufsteigende Nummern für die Zitate in der Gesamtzusammenfassung.
4. Beginnen Sie die Zusammenfassung mit einer kurzen Einleitung, die Titel und Autor (falls verfügbar), sowie die wichtigsten Inhalte und Erkenntnisse nennt, im Stile einer "Executive Summary". Danach folgen Abschnitte, die die Kernaussagen und wichtigsten Inhalte des Textes darstellen. Strukturieren Sie die Zusammenfassung in sinnvolle Absätze mit einem kohärenten Gedankengang.
5. Verweisen Sie in der Zusammenfassung mit Referenzen in aufsteigender Reihenfolge wie [1], [2], [3] usw. an passenden Stellen auf die Zitate.
6. Verzichten Sie auf ein abschließendes Fazit oder eine Gesamtzusammenfassung im letzten Absatz.
7. Sollten die Teilzusammenfassungen keinen sinnvollen Inhalt enthalten, geben Sie "Das Dokument enthält keinen zusammenfassbaren Text.", gefolgt vom Anfang des Textes als "summary" zurück.
8. Die Gesamtzusammenfassung unter "summary" muss ungefähr {word_count} Wörter lang sein (ohne die Zitate) und muss insgesamt {number_of_quotes} Referenzen (in der Form "[1]" ... "[{number_of_quotes}]") zu {number_of_quotes} unterschiedlichen Zitaten (unter "quotes" mit der jeweiligen "quote_number") enthalten!"""
Downloads last month
12
Safetensors
Model size
12.2B params
Tensor type
BF16
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for ellamind/summarizer-nemo-v5

Finetuned
(43)
this model