bsenst commited on
Commit
eac0986
·
verified ·
1 Parent(s): f95eae6

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +18 -1
README.md CHANGED
@@ -7,4 +7,21 @@ sdk: static
7
  pinned: false
8
  ---
9
 
10
- Edit this `README.md` markdown file to author your organization card.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7
  pinned: false
8
  ---
9
 
10
+ Eine Sammlung interaktiver **Spaces**, die praktische Anwendungen rund um **Webscraping** und **lokale Datensammlung** demonstrieren. Ziel ist es, die Möglichkeiten der Datenerfassung zu illustrieren.
11
+
12
+ ### **Bereits verfügbares Werkzeug:**
13
+ - **PDF Link Extractor**:
14
+ Diese App durchsucht eine angegebene Webseite nach PDF-Links, extrahiert die Dokumente und bietet sie gesammelt in einem ZIP-Ordner zum Download an.
15
+
16
+ ### **Mögliche weitere Werkzeuge:**
17
+ 1. **Tabellen-Extraktor**:
18
+ Ein Tool, das automatisch Tabelleninhalte von Webseiten erkennt und in CSV- oder Excel-Dateien umwandelt, um die Daten für weitere Analysen zugänglich zu machen.
19
+
20
+ 2. **Image Scraper**:
21
+ Ein Werkzeug, das alle Bilddateien von einer Webseite extrahiert und diese in einem ZIP-Ordner organisiert bereitstellt.
22
+
23
+ 3. **Metadata Collector**:
24
+ Dieses Tool sammelt Metadaten wie Titel, Beschreibungen und Keywords von Webseiten, um eine schnelle Übersicht über deren Inhalte zu bieten.
25
+
26
+ 4. **Document Organizer**:
27
+ Ein lokal ausgerichtetes Tool, das mehrere Dateien (z. B. PDFs, Excel, Word-Dokumente) aus einer Ordnerstruktur durchsucht und kategorisiert.