bsenst commited on
Commit
2037de1
·
verified ·
1 Parent(s): cfb6650

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +0 -25
README.md CHANGED
@@ -9,29 +9,4 @@ pinned: false
9
 
10
  Eine Sammlung interaktiver **Spaces**, die praktische Anwendungen rund um **Webscraping** und **lokale Datensammlung** demonstrieren. Ziel ist es, die Möglichkeiten der Datenerfassung zu illustrieren.
11
 
12
- ### **Bereits verfügbares Werkzeug:**
13
- - **[Webspider](https://huggingface.co/spaces/datenwerkzeuge/webspider)**:
14
- Diese App ermöglicht es, eine angegebene Webseite zu durchsuchen und strukturierte Daten wie URLs, Titel und Inhalte zu extrahieren. Die Ergebnisse werden übersichtlich angezeigt und können im JSON-Format heruntergeladen werden. Nutzer können dabei die Tiefe der Navigation und die maximale Seitenanzahl individuell einstellen, um die Datensammlung an ihre Bedürfnisse anzupassen.
15
- - **[PDFs-Sammeln](https://huggingface.co/spaces/datenwerkzeuge/pdfs-sammeln)**:
16
- Diese App durchsucht eine angegebene Webseite oder eine hochgeladene HTML-Datei nach PDF-Links, lädt die gefundenen PDF-Dokumente herunter und erstellt daraus eine ZIP-Datei. Nutzer können die Datei samt einer Übersicht der gefundenen PDFs (inklusive Dateigröße) direkt herunterladen. Das Tool ermöglicht es, PDF-Dokumente effizient zu sammeln und organisiert bereitzustellen.
17
- - **[PDF Keyword Grouping App](https://huggingface.co/spaces/datenwerkzeuge/PDF-Keyword-Grouping-App)**:
18
- Dieses Tool analysiert den Textinhalt hochgeladener PDFs, extrahiert Schlüsselbegriffe und gruppiert die Dokumente basierend auf den ausgewählten Themen oder Keywords. Es verwendet fortschrittliche KI-Modelle für semantische Textanalyse und Zuordnung. Am Ende können die gruppierten PDFs als ZIP-Datei heruntergeladen werden, um sie übersichtlich zu organisieren und effizient weiterzuverarbeiten.
19
- - **[Google Play App Search](https://huggingface.co/spaces/datenwerkzeuge/Google-Play-App-Search)**:
20
- Dieses Tool ermöglicht die Suche nach Apps im Google Play Store anhand eines eingegebenen Suchbegriffs. Die Ergebnisse enthalten Details wie App-Titel, Entwickler, Bewertung und einen direkten Link zur App im Store. Zusätzlich wird eine separate Liste mit allen URLs der gefundenen Apps bereitgestellt, um eine schnelle Weiterverarbeitung zu ermöglichen.
21
- - **[Webseiten-URL-Extraktor](https://huggingface.co/spaces/datenwerkzeuge/Webseiten-URL-Extraktor)**:
22
- Dieses Tool extrahiert automatisch alle Links von einer angegebenen Webseite. Es listet die URLs übersichtlich auf und bietet somit eine einfache Möglichkeit, alle relevanten Verweise einer Seite zu sammeln. Perfekt für die Analyse und Weiterverarbeitung von Webseiteninhalten.
23
-
24
- ### **Mögliche weitere Werkzeuge:**
25
- 1. **Tabellen-Extraktor**:
26
- Ein Tool, das automatisch Tabelleninhalte von Webseiten erkennt und in CSV- oder Excel-Dateien umwandelt, um die Daten für weitere Analysen zugänglich zu machen.
27
-
28
- 2. **Image Scraper**:
29
- Ein Werkzeug, das alle Bilddateien von einer Webseite extrahiert und diese in einem ZIP-Ordner organisiert bereitstellt.
30
-
31
- 3. **Metadata Collector**:
32
- Dieses Tool sammelt Metadaten wie Titel, Beschreibungen und Keywords von Webseiten, um eine schnelle Übersicht über deren Inhalte zu bieten.
33
-
34
- 4. **Document Organizer**:
35
- Ein lokal ausgerichtetes Tool, das mehrere Dateien (z. B. PDFs, Excel, Word-Dokumente) aus einer Ordnerstruktur durchsucht und kategorisiert.
36
-
37
  <sup>Bitte beachte, dass bei der Nutzung der bereitgestellten Webscraping-Tools alle rechtlichen und ethischen Vorschriften eingehalten werden müssen. Dies schließt die Beachtung von Nutzungsbedingungen, Urheberrechten und Datenschutzgesetzen ein. Die Verantwortung für eine korrekte und regelkonforme Anwendung liegt vollständig bei den Nutzenden.</sup>
 
9
 
10
  Eine Sammlung interaktiver **Spaces**, die praktische Anwendungen rund um **Webscraping** und **lokale Datensammlung** demonstrieren. Ziel ist es, die Möglichkeiten der Datenerfassung zu illustrieren.
11
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
12
  <sup>Bitte beachte, dass bei der Nutzung der bereitgestellten Webscraping-Tools alle rechtlichen und ethischen Vorschriften eingehalten werden müssen. Dies schließt die Beachtung von Nutzungsbedingungen, Urheberrechten und Datenschutzgesetzen ein. Die Verantwortung für eine korrekte und regelkonforme Anwendung liegt vollständig bei den Nutzenden.</sup>