Spaces:
Running
Running
Update README.md
Browse files
README.md
CHANGED
@@ -7,4 +7,21 @@ sdk: static
|
|
7 |
pinned: false
|
8 |
---
|
9 |
|
10 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7 |
pinned: false
|
8 |
---
|
9 |
|
10 |
+
Eine Sammlung interaktiver **Spaces**, die praktische Anwendungen rund um **Webscraping** und **lokale Datensammlung** demonstrieren. Ziel ist es, die Möglichkeiten der Datenerfassung zu illustrieren.
|
11 |
+
|
12 |
+
### **Bereits verfügbares Werkzeug:**
|
13 |
+
- **PDF Link Extractor**:
|
14 |
+
Diese App durchsucht eine angegebene Webseite nach PDF-Links, extrahiert die Dokumente und bietet sie gesammelt in einem ZIP-Ordner zum Download an.
|
15 |
+
|
16 |
+
### **Mögliche weitere Werkzeuge:**
|
17 |
+
1. **Tabellen-Extraktor**:
|
18 |
+
Ein Tool, das automatisch Tabelleninhalte von Webseiten erkennt und in CSV- oder Excel-Dateien umwandelt, um die Daten für weitere Analysen zugänglich zu machen.
|
19 |
+
|
20 |
+
2. **Image Scraper**:
|
21 |
+
Ein Werkzeug, das alle Bilddateien von einer Webseite extrahiert und diese in einem ZIP-Ordner organisiert bereitstellt.
|
22 |
+
|
23 |
+
3. **Metadata Collector**:
|
24 |
+
Dieses Tool sammelt Metadaten wie Titel, Beschreibungen und Keywords von Webseiten, um eine schnelle Übersicht über deren Inhalte zu bieten.
|
25 |
+
|
26 |
+
4. **Document Organizer**:
|
27 |
+
Ein lokal ausgerichtetes Tool, das mehrere Dateien (z. B. PDFs, Excel, Word-Dokumente) aus einer Ordnerstruktur durchsucht und kategorisiert.
|