Spaces:

easyh
/

NerDH_Visualisierer

Runtime error

App Files Files Community

easyh commited on Nov 22, 2022

Commit

ab87761

1 Parent(s): c032773

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -7

app.py CHANGED Viewed

@@ -45,8 +45,9 @@ if model == "de_fnhd_nerdh":
     with st.sidebar.expander("Über das Modell"):
         st.write("""
             Das Modell basiert auf frühneuhochdeutschen Texten der digitalen Edition **Philipp Hainhofer: *Reiseberichte & Sammlungsbeschreibungen 1594-1636*** (https://hainhofer.hab.de/).
-            \n Trainiert wurde das Modell mit der Pipeline der Python Bibliothek [Spacy](https://spacy.io/). Das Modell kann [hier](https://github.com/easyh/NerDH/releases/latest/download/de_history_md-0.0.1.tar.gz) (586MB) heruntergeladen und als Python-Package installiert werden.
-            F-Score: **0.89**.
             \n Mehr Informationen zum Prozess des Trainings etc. gibt es [hier](https://easyh.github.io/NerDH/tut/).
         """)
     with st.sidebar.expander("Named Entities Labels"):
@@ -55,8 +56,7 @@ if model == "de_fnhd_nerdh":
             \n**ORT:** Geographische Einheit, d. h. Länder, Städte, Staaten oder Flüsse.
             \n**ORGANISATION:** Institutionen,(Ordens-)Gemeinschaften, Verbindungen, etc.
             \n**OBJEKT:** Architektur, Gebäude, Kunst, etc.
-            \n**ZEIT:** Datum, Monat, Jahr, Uhrzeit
-            \n**LITERATUR:** Bücher mit eindeutigem Namen (z.B. Das Alte Testament)
             """)
 elif model == "de_core_news_sm":
     with st.sidebar.expander("Über das Modell"):
@@ -64,7 +64,7 @@ elif model == "de_core_news_sm":
                 Das kleinste deutsche Spacy Modell mit nur 13MB. Grund dafür sind die fehlenden Worteinbettungen (Word-Vectors). Trainiert wurde das Modell mit folgenden Quellen: [Tiger Corpus](), [Tiger2Dep]() und [WikiNER]().
                 Anwendungsbereich für das Modell sind haupsächtliche moderne Texte und News-Berichte (F-Score: 0.82).
                 Daher wird dieses Modell mit historischen Texten nicht wirklich gut abschneiden.
-                \n Mehr Informationen zum Prozess Modell gibts hier [hier](https://spacy.io/models/de#de_core_news_sm).
             """)
     with st.sidebar.expander("Named Entities Labels"):
             st.write("""
@@ -79,7 +79,7 @@ elif model == "de_core_news_md":
                 Das mittlere deutsche Spacy Modell mit 42MB und 20.000 Worteinbettungen. Trainiert wurde das Modell mit folgenden Quellen: [Tiger Corpus](), [Tiger2Dep]() und [WikiNER]().
                 Anwendungsbereich für das Modell sind haupsächtliche moderne Texte und News-Berichte (F-Score: 0.84).
                 Daher wird dieses Modell mit historischen Texten nicht wirklich gut abschneiden.
-                \n Mehr Informationen zum Prozess Modell gibts hier [hier](https://spacy.io/models/de#de_core_news_md).
             """)
     with st.sidebar.expander("Named Entities Labels"):
             st.write("""
@@ -94,7 +94,7 @@ else:
         Das Größte von den drei deutschen Spacy Modellen mit 541MB und 500.000 Worteinbettungen. Trainiert wurde das Modell mit folgenden Quellen: [Tiger Corpus](), [Tiger2Dep]() und [WikiNER]().
         Anwendungsbereich für das Modell sind haupsächtliche moderne Texte und News-Berichte (F-Score: 0.85).
         Daher wird dieses Modell mit historischen Texten nicht wirklich gut abschneiden.
-        \n Mehr Informationen zum Prozess Modell gibts hier [hier](https://spacy.io/models/de#de_core_news_lg).
         """)
     with st.sidebar.expander("Named Entities Labels"):
             st.write("""
@@ -104,6 +104,7 @@ else:
                 \n**MISC:** Gemischte Kategorie (Ereignisse, Nationalitäten, Kunstgegenstände)
             """)
 #------------------------------------------------------------------------------
 #------------------------------------------------------------------------------
@@ -132,6 +133,7 @@ with st.spinner("Text wird eingelesen..."):
         text = st.text_area(" ", DEFAULT_TEXT, height=200)
 st.success("Text ist eingelesen!")
 #------------------------------------------------------------------------------
 #------------------------------------------------------------------------------
@@ -159,6 +161,24 @@ for ent in doc.ents:
 df_results = pd.DataFrame(results, columns = ['text', 'label'])
 csv = convert_df(df_results)
 #------------------------------------------------------------------------------
 #------------------------------------------------------------------------------

     with st.sidebar.expander("Über das Modell"):
         st.write("""
             Das Modell basiert auf frühneuhochdeutschen Texten der digitalen Edition **Philipp Hainhofer: *Reiseberichte & Sammlungsbeschreibungen 1594-1636*** (https://hainhofer.hab.de/).
+            \n Trainiert wurde das Modell mit der Pipeline der Python Bibliothek [Spacy](https://spacy.io/) und dem Text [**München 1611**](https://hainhofer.hab.de/reiseberichte/muenchen1611?v={%22view%22:%22info%22}).
+            \n Das Modell kann [hier](https://huggingface.co/easyh/de_fnhd_nerdh/resolve/main/de_fnhd_nerdh-any-py3-none-any.whl) (586MB) heruntergeladen und als Python-Package installiert werden.
+            \n F-Score: **0.92**. Dieser wurde getestet mit Texten aus der Edition.
             \n Mehr Informationen zum Prozess des Trainings etc. gibt es [hier](https://easyh.github.io/NerDH/tut/).
         """)
     with st.sidebar.expander("Named Entities Labels"):
             \n**ORT:** Geographische Einheit, d. h. Länder, Städte, Staaten oder Flüsse.
             \n**ORGANISATION:** Institutionen,(Ordens-)Gemeinschaften, Verbindungen, etc.
             \n**OBJEKT:** Architektur, Gebäude, Kunst, etc.
+            \n**ZEIT:** Datum, Monat, Jahr, Uhrzeit etc.
             """)
 elif model == "de_core_news_sm":
     with st.sidebar.expander("Über das Modell"):
                 Das kleinste deutsche Spacy Modell mit nur 13MB. Grund dafür sind die fehlenden Worteinbettungen (Word-Vectors). Trainiert wurde das Modell mit folgenden Quellen: [Tiger Corpus](), [Tiger2Dep]() und [WikiNER]().
                 Anwendungsbereich für das Modell sind haupsächtliche moderne Texte und News-Berichte (F-Score: 0.82).
                 Daher wird dieses Modell mit historischen Texten nicht wirklich gut abschneiden.
+                \n Mehr Informationen zum Modell gibts hier [hier](https://spacy.io/models/de#de_core_news_sm).
             """)
     with st.sidebar.expander("Named Entities Labels"):
             st.write("""
                 Das mittlere deutsche Spacy Modell mit 42MB und 20.000 Worteinbettungen. Trainiert wurde das Modell mit folgenden Quellen: [Tiger Corpus](), [Tiger2Dep]() und [WikiNER]().
                 Anwendungsbereich für das Modell sind haupsächtliche moderne Texte und News-Berichte (F-Score: 0.84).
                 Daher wird dieses Modell mit historischen Texten nicht wirklich gut abschneiden.
+                \n Mehr Informationen zum Modell gibts hier [hier](https://spacy.io/models/de#de_core_news_md).
             """)
     with st.sidebar.expander("Named Entities Labels"):
             st.write("""
         Das Größte von den drei deutschen Spacy Modellen mit 541MB und 500.000 Worteinbettungen. Trainiert wurde das Modell mit folgenden Quellen: [Tiger Corpus](), [Tiger2Dep]() und [WikiNER]().
         Anwendungsbereich für das Modell sind haupsächtliche moderne Texte und News-Berichte (F-Score: 0.85).
         Daher wird dieses Modell mit historischen Texten nicht wirklich gut abschneiden.
+        \n Mehr Informationen zum Modell gibts hier [hier](https://spacy.io/models/de#de_core_news_lg).
         """)
     with st.sidebar.expander("Named Entities Labels"):
             st.write("""
                 \n**MISC:** Gemischte Kategorie (Ereignisse, Nationalitäten, Kunstgegenstände)
             """)
+st.markdown('---')
 #------------------------------------------------------------------------------
 #------------------------------------------------------------------------------
         text = st.text_area(" ", DEFAULT_TEXT, height=200)
 st.success("Text ist eingelesen!")
+st.markdown('---')
 #------------------------------------------------------------------------------
 #------------------------------------------------------------------------------
 df_results = pd.DataFrame(results, columns = ['text', 'label'])
 csv = convert_df(df_results)
+#------------------------------------------------------------------------------
+#------------------------------------------------------------------------------
+#Modell in Python Umgebung installieren
+if model == "de_fnhd_nerdh":
+    st.markdown('---') #### Modell in Python installieren und laden')
+    st.markdown('#### Modell in Python installieren und laden')
+    st.markdown('''
+    ```py
+    !pip install https://huggingface.co/easyh/de_fnhd_nerdh/resolve/main/de_fnhd_nerdh-any-py3-none-any.whl
+    import spacy
+    nlp = spacy.load("de_fnhd_nerdh")
+    ```
+    ''')
 #------------------------------------------------------------------------------
 #------------------------------------------------------------------------------