bsenst commited on
Commit
a8a19b7
·
1 Parent(s): ca2f0f4

add images, update preview details

Browse files
Files changed (29) hide show
  1. src/01_setup/erforderlich/_265d4758-abbf-4be7-9aba-c51096f58f4a.jpeg +0 -0
  2. src/01_setup/erforderlich/_a180ffc3-5c47-48cd-9e8e-2d70bdb48cb7.jpeg +0 -0
  3. src/01_setup/erforderlich/_c6cbaab4-a264-43bf-8b0f-311e210cd959.jpeg +0 -0
  4. src/01_setup/erforderlich/colab.qmd +9 -0
  5. src/01_setup/erforderlich/google-konto.qmd +10 -19
  6. src/01_setup/erforderlich/huggingface.qmd +9 -0
  7. src/01_setup/optional/_4386bf69-e8a9-4259-980a-6fd75d66cddb.jpeg +0 -0
  8. src/01_setup/optional/_bebbf63f-874e-4d27-b6a5-f0e0116fd587.jpeg +0 -0
  9. src/01_setup/optional/colab-github.qmd +9 -0
  10. src/01_setup/optional/quarto-lokal.qmd +6 -2
  11. src/02_basics/app_market/_9d81d3d2-f372-476b-beb6-fe6a4841739b.jpeg +0 -0
  12. src/02_basics/app_market/google-play-search.qmd +5 -3
  13. src/02_basics/pdf/_30a8d023-6f69-46e3-8ae1-1d7555d04902.jpeg +0 -0
  14. src/02_basics/pdf/_5a00e9f5-52f7-4e9b-b22d-499e40257a4b.jpeg +0 -0
  15. src/02_basics/pdf/pdf-grouping.qmd +5 -3
  16. src/02_basics/pdf/pdf-link-extractor.qmd +5 -3
  17. src/02_basics/webspider/_1fca0884-d58a-4271-b90f-90afcb2c4be9.jpeg +0 -0
  18. src/02_basics/webspider/_24e522b8-a6d0-4212-a02e-7738b3098105.jpeg +0 -0
  19. src/02_basics/webspider/website-url-extractor.qmd +5 -3
  20. src/02_basics/webspider/webspider.qmd +9 -0
  21. src/03_low_code/app_market_scraping/_2f0cb788-71a6-4817-ab94-d38c346e4f6f.jpeg +0 -0
  22. src/03_low_code/app_market_scraping/app_market_scraping.qmd +9 -0
  23. src/03_low_code/catalogue/_2be49964-b89e-45be-8897-491eaa1aad84.jpeg +0 -0
  24. src/03_low_code/catalogue/_be1bcdc2-f540-4a95-a27c-775e8f2c1c07.jpeg +0 -0
  25. src/03_low_code/catalogue/bookstoscrape.qmd +5 -1
  26. src/03_low_code/catalogue/quotes_scraper.ipynb +14 -0
  27. src/03_low_code/video_transcripts/_26268650-a612-4658-b5e2-4cccceb05541.jpeg +0 -0
  28. src/03_low_code/video_transcripts/social-media.qmd +9 -0
  29. src/_quarto.yml +1 -1
src/01_setup/erforderlich/_265d4758-abbf-4be7-9aba-c51096f58f4a.jpeg ADDED
src/01_setup/erforderlich/_a180ffc3-5c47-48cd-9e8e-2d70bdb48cb7.jpeg ADDED
src/01_setup/erforderlich/_c6cbaab4-a264-43bf-8b0f-311e210cd959.jpeg ADDED
src/01_setup/erforderlich/colab.qmd CHANGED
@@ -1,3 +1,12 @@
 
 
 
 
 
 
 
 
 
1
  ## Programmieren in Google Colab mit Hilfe von ChatGPT 🤖💻
2
 
3
  ### Schritt 1: Öffne Google Colab
 
1
+ ---
2
+ title: "Unterstützung durch große Sprachmodelle in Google Colab"
3
+ description: "Eine Anleitung zur Verwendung von ChatGPT in Google Colab, einschließlich der Code-Vervollständigung, Fehlerbehebung und Verbesserung."
4
+ author: "Benjamin"
5
+ date: "12/22/2024"
6
+ date-modified: "12/22/2024"
7
+ image: _c6cbaab4-a264-43bf-8b0f-311e210cd959.jpeg
8
+ ---
9
+
10
  ## Programmieren in Google Colab mit Hilfe von ChatGPT 🤖💻
11
 
12
  ### Schritt 1: Öffne Google Colab
src/01_setup/erforderlich/google-konto.qmd CHANGED
@@ -1,3 +1,12 @@
 
 
 
 
 
 
 
 
 
1
  ## Erstellung eines Google-Kontos 📧
2
 
3
  1. **Besuche die Google-Registrierungsseite**:
@@ -39,25 +48,7 @@ Jetzt hast du ein Google-Konto! 🎉
39
  - Klicke im linken Seitenbereich auf das Ordnersymbol.
40
  - Klicke auf das Upload-Symbol (Pfeil nach oben) und wähle die Dateien aus, die du hochladen möchtest.
41
 
42
- ### Schritt 4: Verwendung von Gemini zur Unterstützung beim Programmieren 🤖
43
-
44
- Gemini ist ein fortgeschrittener KI-Code-Assistent, der dir beim Programmieren in Google Colab helfen kann. Um Gemini zu verwenden:
45
-
46
- 1. **Installiere die benötigten Pakete**:
47
- - Führe im Notebook folgende Befehle aus:
48
- ```python
49
- !pip install gemini
50
- ```
51
-
52
- 2. **Importiere Gemini und starte die Unterstützung**:
53
- - Füge im Notebook folgenden Code hinzu:
54
- ```python
55
- import gemini
56
- gemini.start()
57
- ```
58
- - Gemini wird nun aktiviert und kann dir beim Programmieren assistieren.
59
-
60
- ### Schritt 5: Dateien und Notebook downloaden 📂
61
 
62
  1. **Notebook herunterladen**:
63
  - Klicke auf "Datei" und wähle "Download .ipynb", um dein Notebook im Jupyter-Format herunterzuladen.
 
1
+ ---
2
+ title: "Erstellung eines Google-Kontos"
3
+ description: "Eine Schritt-für-Schritt-Anleitung zur Erstellung eines Google-Kontos, einschließlich der Eingabe persönlicher Informationen, Verifizierung und Abschluss der Einrichtung."
4
+ author: "Benjamin"
5
+ date: "12/22/2024"
6
+ date-modified: "12/22/2024"
7
+ image: _265d4758-abbf-4be7-9aba-c51096f58f4a.jpeg
8
+ ---
9
+
10
  ## Erstellung eines Google-Kontos 📧
11
 
12
  1. **Besuche die Google-Registrierungsseite**:
 
48
  - Klicke im linken Seitenbereich auf das Ordnersymbol.
49
  - Klicke auf das Upload-Symbol (Pfeil nach oben) und wähle die Dateien aus, die du hochladen möchtest.
50
 
51
+ ### Schritt 4: Dateien und Notebook downloaden 📂
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
52
 
53
  1. **Notebook herunterladen**:
54
  - Klicke auf "Datei" und wähle "Download .ipynb", um dein Notebook im Jupyter-Format herunterzuladen.
src/01_setup/erforderlich/huggingface.qmd CHANGED
@@ -1,3 +1,12 @@
 
 
 
 
 
 
 
 
 
1
  ### Schritt 1: Ein Hugging Face-Konto erstellen
2
 
3
  1. **Besuche die Hugging Face-Website**:
 
1
+ ---
2
+ title: "Duplizieren eines Spaces auf Hugging Face"
3
+ description: "Eine Schritt-für-Schritt-Anleitung zum Duplizieren eines Spaces auf Hugging Face, einschließlich der Suche, Duplizierung und Anpassung des Spaces."
4
+ author: "Benjamin"
5
+ date: "12/22/2024"
6
+ date-modified: "12/22/2024"
7
+ image: _a180ffc3-5c47-48cd-9e8e-2d70bdb48cb7.jpeg
8
+ ---
9
+
10
  ### Schritt 1: Ein Hugging Face-Konto erstellen
11
 
12
  1. **Besuche die Hugging Face-Website**:
src/01_setup/optional/_4386bf69-e8a9-4259-980a-6fd75d66cddb.jpeg ADDED
src/01_setup/optional/_bebbf63f-874e-4d27-b6a5-f0e0116fd587.jpeg ADDED
src/01_setup/optional/colab-github.qmd CHANGED
@@ -1,3 +1,12 @@
 
 
 
 
 
 
 
 
 
1
  ## Erstellung eines GitHub-Kontos 🚀
2
 
3
  1. **Besuche die GitHub-Registrierungsseite**:
 
1
+ ---
2
+ title: "Verbinden eines Colab-Notebooks mit GitHub"
3
+ description: "Eine Schritt-für-Schritt-Anleitung zur Verbindung eines Colab-Notebooks mit GitHub, einschließlich der Erstellung eines GitHub-Kontos und der Integration in Google Colab."
4
+ author: "Benjamin"
5
+ date: "12/22/2024"
6
+ date-modified: "12/22/2024"
7
+ image: _bebbf63f-874e-4d27-b6a5-f0e0116fd587.jpeg
8
+ ---
9
+
10
  ## Erstellung eines GitHub-Kontos 🚀
11
 
12
  1. **Besuche die GitHub-Registrierungsseite**:
src/01_setup/optional/quarto-lokal.qmd CHANGED
@@ -1,8 +1,12 @@
1
  ---
2
- title: "Quarto lokal"
 
 
 
 
 
3
  ---
4
 
5
-
6
  ## Quarto lokal starten 🚀
7
 
8
  Hier sind die Schritte, um das Repository `https://huggingface.co/spaces/datenwerkzeuge/CDL-Webscraping-Workshop-2025` lokal zu klonen, Quarto zu installieren und die Website zu starten.
 
1
  ---
2
+ title: "Lokale Installation von Quarto"
3
+ description: "Eine Schritt-für-Schritt-Anleitung zur Installation von Quarto auf Windows und Linux, einschließlich der Überprüfung der Installation."
4
+ author: "Benjamin"
5
+ date: "12/22/2024"
6
+ date-modified: "12/22/2024"
7
+ image: _4386bf69-e8a9-4259-980a-6fd75d66cddb.jpeg
8
  ---
9
 
 
10
  ## Quarto lokal starten 🚀
11
 
12
  Hier sind die Schritte, um das Repository `https://huggingface.co/spaces/datenwerkzeuge/CDL-Webscraping-Workshop-2025` lokal zu klonen, Quarto zu installieren und die Website zu starten.
src/02_basics/app_market/_9d81d3d2-f372-476b-beb6-fe6a4841739b.jpeg ADDED
src/02_basics/app_market/google-play-search.qmd CHANGED
@@ -1,8 +1,10 @@
1
  ---
2
  title: "Google-Play-App-Suche"
3
- author: "datenwerkzeuge"
4
- date: "2024-06-16"
5
- format: html
 
 
6
  ---
7
 
8
  # Google-Play-App-Suche
 
1
  ---
2
  title: "Google-Play-App-Suche"
3
+ description: "Ein Tool zur Suche nach Apps im Google Play Store basierend auf einem Suchbegriff, einschließlich der Anzeige von App-Details und direkten Links."
4
+ author: "Benjamin"
5
+ date: "2024-12-16"
6
+ date-modified: "2024-12-16"
7
+ image: _9d81d3d2-f372-476b-beb6-fe6a4841739b.jpeg
8
  ---
9
 
10
  # Google-Play-App-Suche
src/02_basics/pdf/_30a8d023-6f69-46e3-8ae1-1d7555d04902.jpeg ADDED
src/02_basics/pdf/_5a00e9f5-52f7-4e9b-b22d-499e40257a4b.jpeg ADDED
src/02_basics/pdf/pdf-grouping.qmd CHANGED
@@ -1,8 +1,10 @@
1
  ---
2
  title: "PDF-Keyword-Grouping-App"
3
- author: "datenwerkzeuge"
4
- date: "2024-06-16"
5
- format: html
 
 
6
  ---
7
 
8
  # PDF-Keyword-Grouping-App
 
1
  ---
2
  title: "PDF-Keyword-Grouping-App"
3
+ description: "Eine App zur Gruppierung von hochgeladenen PDF-Dateien basierend auf semantischen Themen, einschließlich Keyword-Extraktion und themenbasierter Gruppierung."
4
+ author: "Benjamin"
5
+ date: "2024-12-16"
6
+ date-modified: "2024-12-16"
7
+ image: _5a00e9f5-52f7-4e9b-b22d-499e40257a4b.jpeg
8
  ---
9
 
10
  # PDF-Keyword-Grouping-App
src/02_basics/pdf/pdf-link-extractor.qmd CHANGED
@@ -1,8 +1,10 @@
1
  ---
2
  title: "PDF-Link-Extractor"
3
- author: "datenwerkzeuge"
4
- date: "2024-06-16"
5
- format: html
 
 
6
  ---
7
 
8
  # PDF-Link-Extractor
 
1
  ---
2
  title: "PDF-Link-Extractor"
3
+ description: "Eine Anwendung zur Extraktion und Organisation von PDF-Links von Webseiten oder hochgeladenen HTML-Dateien, einschließlich Download und Komprimierung."
4
+ author: "Benjamin"
5
+ date: "2024-12-16"
6
+ date-modified: "2024-12-16"
7
+ image: _30a8d023-6f69-46e3-8ae1-1d7555d04902.jpeg
8
  ---
9
 
10
  # PDF-Link-Extractor
src/02_basics/webspider/_1fca0884-d58a-4271-b90f-90afcb2c4be9.jpeg ADDED
src/02_basics/webspider/_24e522b8-a6d0-4212-a02e-7738b3098105.jpeg ADDED
src/02_basics/webspider/website-url-extractor.qmd CHANGED
@@ -1,8 +1,10 @@
1
  ---
2
  title: "Webseiten-URL-Extraktor"
3
- author: "datenwerkzeuge"
4
- date: "2024-06-16"
5
- format: html
 
 
6
  ---
7
 
8
  # Webseiten-URL-Extraktor
 
1
  ---
2
  title: "Webseiten-URL-Extraktor"
3
+ description: "Ein Tool zur Extraktion und Darstellung aller Links von einer angegebenen Webseite, einschließlich Filterung und übersichtlicher Darstellung."
4
+ author: "Benjamin"
5
+ date: "2024-12-16"
6
+ date-modified: "2024-12-16"
7
+ image: _1fca0884-d58a-4271-b90f-90afcb2c4be9.jpeg
8
  ---
9
 
10
  # Webseiten-URL-Extraktor
src/02_basics/webspider/webspider.qmd CHANGED
@@ -1,3 +1,12 @@
 
 
 
 
 
 
 
 
 
1
  **Spaces / Webspider** ist eine private Webanwendung, die mithilfe von **Streamlit** und **Scrapy** entwickelt wurde, um strukturierte Daten von Webseiten zu extrahieren. Sie bietet eine benutzerfreundliche Oberfläche, um Webseiten zu durchsuchen und die Ergebnisse in einem leicht zugänglichen Format herunterzuladen.
2
 
3
  #### Hauptfunktionen:
 
1
+ ---
2
+ title: "Webspider"
3
+ description: "Eine private Webanwendung zur Extraktion strukturierter Daten von Webseiten mithilfe von Streamlit und Scrapy, einschließlich benutzerdefinierter Scraping-Parameter und Datenexport."
4
+ author: "Benjamin"
5
+ date: "2024-12-16"
6
+ date-modified: "2024-12-16"
7
+ image: _24e522b8-a6d0-4212-a02e-7738b3098105.jpeg
8
+ ---
9
+
10
  **Spaces / Webspider** ist eine private Webanwendung, die mithilfe von **Streamlit** und **Scrapy** entwickelt wurde, um strukturierte Daten von Webseiten zu extrahieren. Sie bietet eine benutzerfreundliche Oberfläche, um Webseiten zu durchsuchen und die Ergebnisse in einem leicht zugänglichen Format herunterzuladen.
11
 
12
  #### Hauptfunktionen:
src/03_low_code/app_market_scraping/_2f0cb788-71a6-4817-ab94-d38c346e4f6f.jpeg ADDED
src/03_low_code/app_market_scraping/app_market_scraping.qmd CHANGED
@@ -1 +1,10 @@
 
 
 
 
 
 
 
 
 
1
  # App Market Scraping
 
1
+ ---
2
+ title: "App-Market-Scraping"
3
+ description: "Ein Tool zur Extraktion und Analyse von App-Marktdaten, einschließlich benutzerdefinierter Suchparameter und Datenexport."
4
+ author: "Benjamin"
5
+ date: "2024-12-16"
6
+ date-modified: "2024-12-16"
7
+ image: _2f0cb788-71a6-4817-ab94-d38c346e4f6f.jpeg
8
+ ---
9
+
10
  # App Market Scraping
src/03_low_code/catalogue/_2be49964-b89e-45be-8897-491eaa1aad84.jpeg ADDED
src/03_low_code/catalogue/_be1bcdc2-f540-4a95-a27c-775e8f2c1c07.jpeg ADDED
src/03_low_code/catalogue/bookstoscrape.qmd CHANGED
@@ -1,6 +1,10 @@
1
  ---
2
  title: "Web Scraping mit Python: Bücher von Books to Scrape"
3
- author: "Dein Name"
 
 
 
 
4
  format:
5
  html:
6
  toc: true
 
1
  ---
2
  title: "Web Scraping mit Python: Bücher von Books to Scrape"
3
+ description: "Eine Anleitung zum Scraping von Büchern von der Website Books to Scrape, einschließlich Python-Beispielen und Datenexport."
4
+ author: "Benjamin"
5
+ date: "2024-12-16"
6
+ date-modified: "2024-12-16"
7
+ image: _be1bcdc2-f540-4a95-a27c-775e8f2c1c07.jpeg
8
  format:
9
  html:
10
  toc: true
src/03_low_code/catalogue/quotes_scraper.ipynb CHANGED
@@ -1,5 +1,19 @@
1
  {
2
  "cells": [
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3
  {
4
  "cell_type": "markdown",
5
  "metadata": {},
 
1
  {
2
  "cells": [
3
+ {
4
+ "cell_type": "markdown",
5
+ "metadata": {},
6
+ "source": [
7
+ "---\n",
8
+ "title: \"Web Scraping mit Python: Bücher von Books to Scrape\"\n",
9
+ "description: \"Eine Anleitung zum Scraping von Zitate von der Website Quotes to Scrape, einschließlich Python-Beispielen und Datenexport.\"\n",
10
+ "author: \"Benjamin\"\n",
11
+ "date: \"2024-12-16\"\n",
12
+ "date-modified: \"2024-12-16\"\n",
13
+ "image: _2be49964-b89e-45be-8897-491eaa1aad84.jpeg\n",
14
+ "---"
15
+ ]
16
+ },
17
  {
18
  "cell_type": "markdown",
19
  "metadata": {},
src/03_low_code/video_transcripts/_26268650-a612-4658-b5e2-4cccceb05541.jpeg ADDED
src/03_low_code/video_transcripts/social-media.qmd CHANGED
@@ -1,3 +1,12 @@
 
 
 
 
 
 
 
 
 
1
  ### Web Scraping von Social-Media-Plattformen: Erklärung und Python-Beispiele
2
 
3
  Web Scraping ist eine Technik, um Daten automatisiert aus Webseiten zu extrahieren. Beim Scraping von Social-Media-Plattformen wie Facebook, Twitter (jetzt X), Instagram oder LinkedIn müssen strenge rechtliche, ethische und technische Vorgaben eingehalten werden. Diese Regeln schützen sowohl die Plattformen als auch die Nutzer vor Missbrauch, Datenmanipulation und Verletzungen der Privatsphäre.
 
1
+ ---
2
+ title: "Web Scraping von Social-Media-Plattformen"
3
+ description: "Erklärung und Python-Beispiele zum Scraping von Social-Media-Plattformen unter Berücksichtigung rechtlicher, ethischer und technischer Vorgaben."
4
+ author: "Benjamin"
5
+ date: "2024-12-16"
6
+ date-modified: "2024-12-16"
7
+ image: _26268650-a612-4658-b5e2-4cccceb05541.jpeg
8
+ ---
9
+
10
  ### Web Scraping von Social-Media-Plattformen: Erklärung und Python-Beispiele
11
 
12
  Web Scraping ist eine Technik, um Daten automatisiert aus Webseiten zu extrahieren. Beim Scraping von Social-Media-Plattformen wie Facebook, Twitter (jetzt X), Instagram oder LinkedIn müssen strenge rechtliche, ethische und technische Vorgaben eingehalten werden. Diese Regeln schützen sowohl die Plattformen als auch die Nutzer vor Missbrauch, Datenmanipulation und Verletzungen der Privatsphäre.
src/_quarto.yml CHANGED
@@ -1,7 +1,7 @@
1
  project:
2
  type: website
3
  website:
4
- title: "🧭 CDL Webscraping Workshop 2025"
5
  navbar:
6
  left:
7
  - href: agenda.qmd
 
1
  project:
2
  type: website
3
  website:
4
+ title: "🧭 Collecting Data on the Web - Webscraping Workshop 2025"
5
  navbar:
6
  left:
7
  - href: agenda.qmd