add images, update preview details
Browse files- src/01_setup/erforderlich/_265d4758-abbf-4be7-9aba-c51096f58f4a.jpeg +0 -0
- src/01_setup/erforderlich/_a180ffc3-5c47-48cd-9e8e-2d70bdb48cb7.jpeg +0 -0
- src/01_setup/erforderlich/_c6cbaab4-a264-43bf-8b0f-311e210cd959.jpeg +0 -0
- src/01_setup/erforderlich/colab.qmd +9 -0
- src/01_setup/erforderlich/google-konto.qmd +10 -19
- src/01_setup/erforderlich/huggingface.qmd +9 -0
- src/01_setup/optional/_4386bf69-e8a9-4259-980a-6fd75d66cddb.jpeg +0 -0
- src/01_setup/optional/_bebbf63f-874e-4d27-b6a5-f0e0116fd587.jpeg +0 -0
- src/01_setup/optional/colab-github.qmd +9 -0
- src/01_setup/optional/quarto-lokal.qmd +6 -2
- src/02_basics/app_market/_9d81d3d2-f372-476b-beb6-fe6a4841739b.jpeg +0 -0
- src/02_basics/app_market/google-play-search.qmd +5 -3
- src/02_basics/pdf/_30a8d023-6f69-46e3-8ae1-1d7555d04902.jpeg +0 -0
- src/02_basics/pdf/_5a00e9f5-52f7-4e9b-b22d-499e40257a4b.jpeg +0 -0
- src/02_basics/pdf/pdf-grouping.qmd +5 -3
- src/02_basics/pdf/pdf-link-extractor.qmd +5 -3
- src/02_basics/webspider/_1fca0884-d58a-4271-b90f-90afcb2c4be9.jpeg +0 -0
- src/02_basics/webspider/_24e522b8-a6d0-4212-a02e-7738b3098105.jpeg +0 -0
- src/02_basics/webspider/website-url-extractor.qmd +5 -3
- src/02_basics/webspider/webspider.qmd +9 -0
- src/03_low_code/app_market_scraping/_2f0cb788-71a6-4817-ab94-d38c346e4f6f.jpeg +0 -0
- src/03_low_code/app_market_scraping/app_market_scraping.qmd +9 -0
- src/03_low_code/catalogue/_2be49964-b89e-45be-8897-491eaa1aad84.jpeg +0 -0
- src/03_low_code/catalogue/_be1bcdc2-f540-4a95-a27c-775e8f2c1c07.jpeg +0 -0
- src/03_low_code/catalogue/bookstoscrape.qmd +5 -1
- src/03_low_code/catalogue/quotes_scraper.ipynb +14 -0
- src/03_low_code/video_transcripts/_26268650-a612-4658-b5e2-4cccceb05541.jpeg +0 -0
- src/03_low_code/video_transcripts/social-media.qmd +9 -0
- src/_quarto.yml +1 -1
src/01_setup/erforderlich/_265d4758-abbf-4be7-9aba-c51096f58f4a.jpeg
ADDED
![]() |
src/01_setup/erforderlich/_a180ffc3-5c47-48cd-9e8e-2d70bdb48cb7.jpeg
ADDED
![]() |
src/01_setup/erforderlich/_c6cbaab4-a264-43bf-8b0f-311e210cd959.jpeg
ADDED
![]() |
src/01_setup/erforderlich/colab.qmd
CHANGED
@@ -1,3 +1,12 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
## Programmieren in Google Colab mit Hilfe von ChatGPT 🤖💻
|
2 |
|
3 |
### Schritt 1: Öffne Google Colab
|
|
|
1 |
+
---
|
2 |
+
title: "Unterstützung durch große Sprachmodelle in Google Colab"
|
3 |
+
description: "Eine Anleitung zur Verwendung von ChatGPT in Google Colab, einschließlich der Code-Vervollständigung, Fehlerbehebung und Verbesserung."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "12/22/2024"
|
6 |
+
date-modified: "12/22/2024"
|
7 |
+
image: _c6cbaab4-a264-43bf-8b0f-311e210cd959.jpeg
|
8 |
+
---
|
9 |
+
|
10 |
## Programmieren in Google Colab mit Hilfe von ChatGPT 🤖💻
|
11 |
|
12 |
### Schritt 1: Öffne Google Colab
|
src/01_setup/erforderlich/google-konto.qmd
CHANGED
@@ -1,3 +1,12 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
## Erstellung eines Google-Kontos 📧
|
2 |
|
3 |
1. **Besuche die Google-Registrierungsseite**:
|
@@ -39,25 +48,7 @@ Jetzt hast du ein Google-Konto! 🎉
|
|
39 |
- Klicke im linken Seitenbereich auf das Ordnersymbol.
|
40 |
- Klicke auf das Upload-Symbol (Pfeil nach oben) und wähle die Dateien aus, die du hochladen möchtest.
|
41 |
|
42 |
-
### Schritt 4:
|
43 |
-
|
44 |
-
Gemini ist ein fortgeschrittener KI-Code-Assistent, der dir beim Programmieren in Google Colab helfen kann. Um Gemini zu verwenden:
|
45 |
-
|
46 |
-
1. **Installiere die benötigten Pakete**:
|
47 |
-
- Führe im Notebook folgende Befehle aus:
|
48 |
-
```python
|
49 |
-
!pip install gemini
|
50 |
-
```
|
51 |
-
|
52 |
-
2. **Importiere Gemini und starte die Unterstützung**:
|
53 |
-
- Füge im Notebook folgenden Code hinzu:
|
54 |
-
```python
|
55 |
-
import gemini
|
56 |
-
gemini.start()
|
57 |
-
```
|
58 |
-
- Gemini wird nun aktiviert und kann dir beim Programmieren assistieren.
|
59 |
-
|
60 |
-
### Schritt 5: Dateien und Notebook downloaden 📂
|
61 |
|
62 |
1. **Notebook herunterladen**:
|
63 |
- Klicke auf "Datei" und wähle "Download .ipynb", um dein Notebook im Jupyter-Format herunterzuladen.
|
|
|
1 |
+
---
|
2 |
+
title: "Erstellung eines Google-Kontos"
|
3 |
+
description: "Eine Schritt-für-Schritt-Anleitung zur Erstellung eines Google-Kontos, einschließlich der Eingabe persönlicher Informationen, Verifizierung und Abschluss der Einrichtung."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "12/22/2024"
|
6 |
+
date-modified: "12/22/2024"
|
7 |
+
image: _265d4758-abbf-4be7-9aba-c51096f58f4a.jpeg
|
8 |
+
---
|
9 |
+
|
10 |
## Erstellung eines Google-Kontos 📧
|
11 |
|
12 |
1. **Besuche die Google-Registrierungsseite**:
|
|
|
48 |
- Klicke im linken Seitenbereich auf das Ordnersymbol.
|
49 |
- Klicke auf das Upload-Symbol (Pfeil nach oben) und wähle die Dateien aus, die du hochladen möchtest.
|
50 |
|
51 |
+
### Schritt 4: Dateien und Notebook downloaden 📂
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
52 |
|
53 |
1. **Notebook herunterladen**:
|
54 |
- Klicke auf "Datei" und wähle "Download .ipynb", um dein Notebook im Jupyter-Format herunterzuladen.
|
src/01_setup/erforderlich/huggingface.qmd
CHANGED
@@ -1,3 +1,12 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
### Schritt 1: Ein Hugging Face-Konto erstellen
|
2 |
|
3 |
1. **Besuche die Hugging Face-Website**:
|
|
|
1 |
+
---
|
2 |
+
title: "Duplizieren eines Spaces auf Hugging Face"
|
3 |
+
description: "Eine Schritt-für-Schritt-Anleitung zum Duplizieren eines Spaces auf Hugging Face, einschließlich der Suche, Duplizierung und Anpassung des Spaces."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "12/22/2024"
|
6 |
+
date-modified: "12/22/2024"
|
7 |
+
image: _a180ffc3-5c47-48cd-9e8e-2d70bdb48cb7.jpeg
|
8 |
+
---
|
9 |
+
|
10 |
### Schritt 1: Ein Hugging Face-Konto erstellen
|
11 |
|
12 |
1. **Besuche die Hugging Face-Website**:
|
src/01_setup/optional/_4386bf69-e8a9-4259-980a-6fd75d66cddb.jpeg
ADDED
![]() |
src/01_setup/optional/_bebbf63f-874e-4d27-b6a5-f0e0116fd587.jpeg
ADDED
![]() |
src/01_setup/optional/colab-github.qmd
CHANGED
@@ -1,3 +1,12 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
## Erstellung eines GitHub-Kontos 🚀
|
2 |
|
3 |
1. **Besuche die GitHub-Registrierungsseite**:
|
|
|
1 |
+
---
|
2 |
+
title: "Verbinden eines Colab-Notebooks mit GitHub"
|
3 |
+
description: "Eine Schritt-für-Schritt-Anleitung zur Verbindung eines Colab-Notebooks mit GitHub, einschließlich der Erstellung eines GitHub-Kontos und der Integration in Google Colab."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "12/22/2024"
|
6 |
+
date-modified: "12/22/2024"
|
7 |
+
image: _bebbf63f-874e-4d27-b6a5-f0e0116fd587.jpeg
|
8 |
+
---
|
9 |
+
|
10 |
## Erstellung eines GitHub-Kontos 🚀
|
11 |
|
12 |
1. **Besuche die GitHub-Registrierungsseite**:
|
src/01_setup/optional/quarto-lokal.qmd
CHANGED
@@ -1,8 +1,12 @@
|
|
1 |
---
|
2 |
-
title: "Quarto
|
|
|
|
|
|
|
|
|
|
|
3 |
---
|
4 |
|
5 |
-
|
6 |
## Quarto lokal starten 🚀
|
7 |
|
8 |
Hier sind die Schritte, um das Repository `https://huggingface.co/spaces/datenwerkzeuge/CDL-Webscraping-Workshop-2025` lokal zu klonen, Quarto zu installieren und die Website zu starten.
|
|
|
1 |
---
|
2 |
+
title: "Lokale Installation von Quarto"
|
3 |
+
description: "Eine Schritt-für-Schritt-Anleitung zur Installation von Quarto auf Windows und Linux, einschließlich der Überprüfung der Installation."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "12/22/2024"
|
6 |
+
date-modified: "12/22/2024"
|
7 |
+
image: _4386bf69-e8a9-4259-980a-6fd75d66cddb.jpeg
|
8 |
---
|
9 |
|
|
|
10 |
## Quarto lokal starten 🚀
|
11 |
|
12 |
Hier sind die Schritte, um das Repository `https://huggingface.co/spaces/datenwerkzeuge/CDL-Webscraping-Workshop-2025` lokal zu klonen, Quarto zu installieren und die Website zu starten.
|
src/02_basics/app_market/_9d81d3d2-f372-476b-beb6-fe6a4841739b.jpeg
ADDED
![]() |
src/02_basics/app_market/google-play-search.qmd
CHANGED
@@ -1,8 +1,10 @@
|
|
1 |
---
|
2 |
title: "Google-Play-App-Suche"
|
3 |
-
|
4 |
-
|
5 |
-
|
|
|
|
|
6 |
---
|
7 |
|
8 |
# Google-Play-App-Suche
|
|
|
1 |
---
|
2 |
title: "Google-Play-App-Suche"
|
3 |
+
description: "Ein Tool zur Suche nach Apps im Google Play Store basierend auf einem Suchbegriff, einschließlich der Anzeige von App-Details und direkten Links."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "2024-12-16"
|
6 |
+
date-modified: "2024-12-16"
|
7 |
+
image: _9d81d3d2-f372-476b-beb6-fe6a4841739b.jpeg
|
8 |
---
|
9 |
|
10 |
# Google-Play-App-Suche
|
src/02_basics/pdf/_30a8d023-6f69-46e3-8ae1-1d7555d04902.jpeg
ADDED
![]() |
src/02_basics/pdf/_5a00e9f5-52f7-4e9b-b22d-499e40257a4b.jpeg
ADDED
![]() |
src/02_basics/pdf/pdf-grouping.qmd
CHANGED
@@ -1,8 +1,10 @@
|
|
1 |
---
|
2 |
title: "PDF-Keyword-Grouping-App"
|
3 |
-
|
4 |
-
|
5 |
-
|
|
|
|
|
6 |
---
|
7 |
|
8 |
# PDF-Keyword-Grouping-App
|
|
|
1 |
---
|
2 |
title: "PDF-Keyword-Grouping-App"
|
3 |
+
description: "Eine App zur Gruppierung von hochgeladenen PDF-Dateien basierend auf semantischen Themen, einschließlich Keyword-Extraktion und themenbasierter Gruppierung."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "2024-12-16"
|
6 |
+
date-modified: "2024-12-16"
|
7 |
+
image: _5a00e9f5-52f7-4e9b-b22d-499e40257a4b.jpeg
|
8 |
---
|
9 |
|
10 |
# PDF-Keyword-Grouping-App
|
src/02_basics/pdf/pdf-link-extractor.qmd
CHANGED
@@ -1,8 +1,10 @@
|
|
1 |
---
|
2 |
title: "PDF-Link-Extractor"
|
3 |
-
|
4 |
-
|
5 |
-
|
|
|
|
|
6 |
---
|
7 |
|
8 |
# PDF-Link-Extractor
|
|
|
1 |
---
|
2 |
title: "PDF-Link-Extractor"
|
3 |
+
description: "Eine Anwendung zur Extraktion und Organisation von PDF-Links von Webseiten oder hochgeladenen HTML-Dateien, einschließlich Download und Komprimierung."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "2024-12-16"
|
6 |
+
date-modified: "2024-12-16"
|
7 |
+
image: _30a8d023-6f69-46e3-8ae1-1d7555d04902.jpeg
|
8 |
---
|
9 |
|
10 |
# PDF-Link-Extractor
|
src/02_basics/webspider/_1fca0884-d58a-4271-b90f-90afcb2c4be9.jpeg
ADDED
![]() |
src/02_basics/webspider/_24e522b8-a6d0-4212-a02e-7738b3098105.jpeg
ADDED
![]() |
src/02_basics/webspider/website-url-extractor.qmd
CHANGED
@@ -1,8 +1,10 @@
|
|
1 |
---
|
2 |
title: "Webseiten-URL-Extraktor"
|
3 |
-
|
4 |
-
|
5 |
-
|
|
|
|
|
6 |
---
|
7 |
|
8 |
# Webseiten-URL-Extraktor
|
|
|
1 |
---
|
2 |
title: "Webseiten-URL-Extraktor"
|
3 |
+
description: "Ein Tool zur Extraktion und Darstellung aller Links von einer angegebenen Webseite, einschließlich Filterung und übersichtlicher Darstellung."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "2024-12-16"
|
6 |
+
date-modified: "2024-12-16"
|
7 |
+
image: _1fca0884-d58a-4271-b90f-90afcb2c4be9.jpeg
|
8 |
---
|
9 |
|
10 |
# Webseiten-URL-Extraktor
|
src/02_basics/webspider/webspider.qmd
CHANGED
@@ -1,3 +1,12 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
**Spaces / Webspider** ist eine private Webanwendung, die mithilfe von **Streamlit** und **Scrapy** entwickelt wurde, um strukturierte Daten von Webseiten zu extrahieren. Sie bietet eine benutzerfreundliche Oberfläche, um Webseiten zu durchsuchen und die Ergebnisse in einem leicht zugänglichen Format herunterzuladen.
|
2 |
|
3 |
#### Hauptfunktionen:
|
|
|
1 |
+
---
|
2 |
+
title: "Webspider"
|
3 |
+
description: "Eine private Webanwendung zur Extraktion strukturierter Daten von Webseiten mithilfe von Streamlit und Scrapy, einschließlich benutzerdefinierter Scraping-Parameter und Datenexport."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "2024-12-16"
|
6 |
+
date-modified: "2024-12-16"
|
7 |
+
image: _24e522b8-a6d0-4212-a02e-7738b3098105.jpeg
|
8 |
+
---
|
9 |
+
|
10 |
**Spaces / Webspider** ist eine private Webanwendung, die mithilfe von **Streamlit** und **Scrapy** entwickelt wurde, um strukturierte Daten von Webseiten zu extrahieren. Sie bietet eine benutzerfreundliche Oberfläche, um Webseiten zu durchsuchen und die Ergebnisse in einem leicht zugänglichen Format herunterzuladen.
|
11 |
|
12 |
#### Hauptfunktionen:
|
src/03_low_code/app_market_scraping/_2f0cb788-71a6-4817-ab94-d38c346e4f6f.jpeg
ADDED
![]() |
src/03_low_code/app_market_scraping/app_market_scraping.qmd
CHANGED
@@ -1 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
# App Market Scraping
|
|
|
1 |
+
---
|
2 |
+
title: "App-Market-Scraping"
|
3 |
+
description: "Ein Tool zur Extraktion und Analyse von App-Marktdaten, einschließlich benutzerdefinierter Suchparameter und Datenexport."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "2024-12-16"
|
6 |
+
date-modified: "2024-12-16"
|
7 |
+
image: _2f0cb788-71a6-4817-ab94-d38c346e4f6f.jpeg
|
8 |
+
---
|
9 |
+
|
10 |
# App Market Scraping
|
src/03_low_code/catalogue/_2be49964-b89e-45be-8897-491eaa1aad84.jpeg
ADDED
![]() |
src/03_low_code/catalogue/_be1bcdc2-f540-4a95-a27c-775e8f2c1c07.jpeg
ADDED
![]() |
src/03_low_code/catalogue/bookstoscrape.qmd
CHANGED
@@ -1,6 +1,10 @@
|
|
1 |
---
|
2 |
title: "Web Scraping mit Python: Bücher von Books to Scrape"
|
3 |
-
|
|
|
|
|
|
|
|
|
4 |
format:
|
5 |
html:
|
6 |
toc: true
|
|
|
1 |
---
|
2 |
title: "Web Scraping mit Python: Bücher von Books to Scrape"
|
3 |
+
description: "Eine Anleitung zum Scraping von Büchern von der Website Books to Scrape, einschließlich Python-Beispielen und Datenexport."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "2024-12-16"
|
6 |
+
date-modified: "2024-12-16"
|
7 |
+
image: _be1bcdc2-f540-4a95-a27c-775e8f2c1c07.jpeg
|
8 |
format:
|
9 |
html:
|
10 |
toc: true
|
src/03_low_code/catalogue/quotes_scraper.ipynb
CHANGED
@@ -1,5 +1,19 @@
|
|
1 |
{
|
2 |
"cells": [
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
{
|
4 |
"cell_type": "markdown",
|
5 |
"metadata": {},
|
|
|
1 |
{
|
2 |
"cells": [
|
3 |
+
{
|
4 |
+
"cell_type": "markdown",
|
5 |
+
"metadata": {},
|
6 |
+
"source": [
|
7 |
+
"---\n",
|
8 |
+
"title: \"Web Scraping mit Python: Bücher von Books to Scrape\"\n",
|
9 |
+
"description: \"Eine Anleitung zum Scraping von Zitate von der Website Quotes to Scrape, einschließlich Python-Beispielen und Datenexport.\"\n",
|
10 |
+
"author: \"Benjamin\"\n",
|
11 |
+
"date: \"2024-12-16\"\n",
|
12 |
+
"date-modified: \"2024-12-16\"\n",
|
13 |
+
"image: _2be49964-b89e-45be-8897-491eaa1aad84.jpeg\n",
|
14 |
+
"---"
|
15 |
+
]
|
16 |
+
},
|
17 |
{
|
18 |
"cell_type": "markdown",
|
19 |
"metadata": {},
|
src/03_low_code/video_transcripts/_26268650-a612-4658-b5e2-4cccceb05541.jpeg
ADDED
![]() |
src/03_low_code/video_transcripts/social-media.qmd
CHANGED
@@ -1,3 +1,12 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
### Web Scraping von Social-Media-Plattformen: Erklärung und Python-Beispiele
|
2 |
|
3 |
Web Scraping ist eine Technik, um Daten automatisiert aus Webseiten zu extrahieren. Beim Scraping von Social-Media-Plattformen wie Facebook, Twitter (jetzt X), Instagram oder LinkedIn müssen strenge rechtliche, ethische und technische Vorgaben eingehalten werden. Diese Regeln schützen sowohl die Plattformen als auch die Nutzer vor Missbrauch, Datenmanipulation und Verletzungen der Privatsphäre.
|
|
|
1 |
+
---
|
2 |
+
title: "Web Scraping von Social-Media-Plattformen"
|
3 |
+
description: "Erklärung und Python-Beispiele zum Scraping von Social-Media-Plattformen unter Berücksichtigung rechtlicher, ethischer und technischer Vorgaben."
|
4 |
+
author: "Benjamin"
|
5 |
+
date: "2024-12-16"
|
6 |
+
date-modified: "2024-12-16"
|
7 |
+
image: _26268650-a612-4658-b5e2-4cccceb05541.jpeg
|
8 |
+
---
|
9 |
+
|
10 |
### Web Scraping von Social-Media-Plattformen: Erklärung und Python-Beispiele
|
11 |
|
12 |
Web Scraping ist eine Technik, um Daten automatisiert aus Webseiten zu extrahieren. Beim Scraping von Social-Media-Plattformen wie Facebook, Twitter (jetzt X), Instagram oder LinkedIn müssen strenge rechtliche, ethische und technische Vorgaben eingehalten werden. Diese Regeln schützen sowohl die Plattformen als auch die Nutzer vor Missbrauch, Datenmanipulation und Verletzungen der Privatsphäre.
|
src/_quarto.yml
CHANGED
@@ -1,7 +1,7 @@
|
|
1 |
project:
|
2 |
type: website
|
3 |
website:
|
4 |
-
title: "🧭
|
5 |
navbar:
|
6 |
left:
|
7 |
- href: agenda.qmd
|
|
|
1 |
project:
|
2 |
type: website
|
3 |
website:
|
4 |
+
title: "🧭 Collecting Data on the Web - Webscraping Workshop 2025"
|
5 |
navbar:
|
6 |
left:
|
7 |
- href: agenda.qmd
|