Spaces:

datenwerkzeuge
/

CDL-Webscraping-Workshop-2025

Sleeping

App Files Files Community

bsenst commited on Dec 23, 2024

Commit

a8a19b7

1 Parent(s): ca2f0f4

add images, update preview details

Browse files

Files changed (29) hide show

src/01_setup/erforderlich/_265d4758-abbf-4be7-9aba-c51096f58f4a.jpeg +0 -0
src/01_setup/erforderlich/_a180ffc3-5c47-48cd-9e8e-2d70bdb48cb7.jpeg +0 -0
src/01_setup/erforderlich/_c6cbaab4-a264-43bf-8b0f-311e210cd959.jpeg +0 -0
src/01_setup/erforderlich/colab.qmd +9 -0
src/01_setup/erforderlich/google-konto.qmd +10 -19
src/01_setup/erforderlich/huggingface.qmd +9 -0
src/01_setup/optional/_4386bf69-e8a9-4259-980a-6fd75d66cddb.jpeg +0 -0
src/01_setup/optional/_bebbf63f-874e-4d27-b6a5-f0e0116fd587.jpeg +0 -0
src/01_setup/optional/colab-github.qmd +9 -0
src/01_setup/optional/quarto-lokal.qmd +6 -2
src/02_basics/app_market/_9d81d3d2-f372-476b-beb6-fe6a4841739b.jpeg +0 -0
src/02_basics/app_market/google-play-search.qmd +5 -3
src/02_basics/pdf/_30a8d023-6f69-46e3-8ae1-1d7555d04902.jpeg +0 -0
src/02_basics/pdf/_5a00e9f5-52f7-4e9b-b22d-499e40257a4b.jpeg +0 -0
src/02_basics/pdf/pdf-grouping.qmd +5 -3
src/02_basics/pdf/pdf-link-extractor.qmd +5 -3
src/02_basics/webspider/_1fca0884-d58a-4271-b90f-90afcb2c4be9.jpeg +0 -0
src/02_basics/webspider/_24e522b8-a6d0-4212-a02e-7738b3098105.jpeg +0 -0
src/02_basics/webspider/website-url-extractor.qmd +5 -3
src/02_basics/webspider/webspider.qmd +9 -0
src/03_low_code/app_market_scraping/_2f0cb788-71a6-4817-ab94-d38c346e4f6f.jpeg +0 -0
src/03_low_code/app_market_scraping/app_market_scraping.qmd +9 -0
src/03_low_code/catalogue/_2be49964-b89e-45be-8897-491eaa1aad84.jpeg +0 -0
src/03_low_code/catalogue/_be1bcdc2-f540-4a95-a27c-775e8f2c1c07.jpeg +0 -0
src/03_low_code/catalogue/bookstoscrape.qmd +5 -1
src/03_low_code/catalogue/quotes_scraper.ipynb +14 -0
src/03_low_code/video_transcripts/_26268650-a612-4658-b5e2-4cccceb05541.jpeg +0 -0
src/03_low_code/video_transcripts/social-media.qmd +9 -0
src/_quarto.yml +1 -1

src/01_setup/erforderlich/_265d4758-abbf-4be7-9aba-c51096f58f4a.jpeg ADDED Viewed

src/01_setup/erforderlich/_a180ffc3-5c47-48cd-9e8e-2d70bdb48cb7.jpeg ADDED Viewed

src/01_setup/erforderlich/_c6cbaab4-a264-43bf-8b0f-311e210cd959.jpeg ADDED Viewed

src/01_setup/erforderlich/colab.qmd CHANGED Viewed

@@ -1,3 +1,12 @@
 ## Programmieren in Google Colab mit Hilfe von ChatGPT 🤖💻
 ### Schritt 1: Öffne Google Colab

+---
+title: "Unterstützung durch große Sprachmodelle in Google Colab"
+description: "Eine Anleitung zur Verwendung von ChatGPT in Google Colab, einschließlich der Code-Vervollständigung, Fehlerbehebung und Verbesserung."
+author: "Benjamin"
+date: "12/22/2024"
+date-modified: "12/22/2024"
+image: _c6cbaab4-a264-43bf-8b0f-311e210cd959.jpeg
+---
 ## Programmieren in Google Colab mit Hilfe von ChatGPT 🤖💻
 ### Schritt 1: Öffne Google Colab

src/01_setup/erforderlich/google-konto.qmd CHANGED Viewed

@@ -1,3 +1,12 @@
 ## Erstellung eines Google-Kontos 📧
 1. **Besuche die Google-Registrierungsseite**:
@@ -39,25 +48,7 @@ Jetzt hast du ein Google-Konto! 🎉
    - Klicke im linken Seitenbereich auf das Ordnersymbol.
    - Klicke auf das Upload-Symbol (Pfeil nach oben) und wähle die Dateien aus, die du hochladen möchtest.
-### Schritt 4: Verwendung von Gemini zur Unterstützung beim Programmieren 🤖
-Gemini ist ein fortgeschrittener KI-Code-Assistent, der dir beim Programmieren in Google Colab helfen kann. Um Gemini zu verwenden:
-1. **Installiere die benötigten Pakete**:
-   - Führe im Notebook folgende Befehle aus:
-     ```python
-     !pip install gemini
-     ```
-2. **Importiere Gemini und starte die Unterstützung**:
-   - Füge im Notebook folgenden Code hinzu:
-     ```python
-     import gemini
-     gemini.start()
-     ```
-   - Gemini wird nun aktiviert und kann dir beim Programmieren assistieren.
-### Schritt 5: Dateien und Notebook downloaden 📂
 1. **Notebook herunterladen**:
    - Klicke auf "Datei" und wähle "Download .ipynb", um dein Notebook im Jupyter-Format herunterzuladen.

+---
+title: "Erstellung eines Google-Kontos"
+description: "Eine Schritt-für-Schritt-Anleitung zur Erstellung eines Google-Kontos, einschließlich der Eingabe persönlicher Informationen, Verifizierung und Abschluss der Einrichtung."
+author: "Benjamin"
+date: "12/22/2024"
+date-modified: "12/22/2024"
+image: _265d4758-abbf-4be7-9aba-c51096f58f4a.jpeg
+---
 ## Erstellung eines Google-Kontos 📧
 1. **Besuche die Google-Registrierungsseite**:
    - Klicke im linken Seitenbereich auf das Ordnersymbol.
    - Klicke auf das Upload-Symbol (Pfeil nach oben) und wähle die Dateien aus, die du hochladen möchtest.
+### Schritt 4: Dateien und Notebook downloaden 📂
 1. **Notebook herunterladen**:
    - Klicke auf "Datei" und wähle "Download .ipynb", um dein Notebook im Jupyter-Format herunterzuladen.

src/01_setup/erforderlich/huggingface.qmd CHANGED Viewed

@@ -1,3 +1,12 @@
 ### Schritt 1: Ein Hugging Face-Konto erstellen
 1. **Besuche die Hugging Face-Website**:

+---
+title: "Duplizieren eines Spaces auf Hugging Face"
+description: "Eine Schritt-für-Schritt-Anleitung zum Duplizieren eines Spaces auf Hugging Face, einschließlich der Suche, Duplizierung und Anpassung des Spaces."
+author: "Benjamin"
+date: "12/22/2024"
+date-modified: "12/22/2024"
+image: _a180ffc3-5c47-48cd-9e8e-2d70bdb48cb7.jpeg
+---
 ### Schritt 1: Ein Hugging Face-Konto erstellen
 1. **Besuche die Hugging Face-Website**:

src/01_setup/optional/_4386bf69-e8a9-4259-980a-6fd75d66cddb.jpeg ADDED Viewed

src/01_setup/optional/_bebbf63f-874e-4d27-b6a5-f0e0116fd587.jpeg ADDED Viewed

src/01_setup/optional/colab-github.qmd CHANGED Viewed

@@ -1,3 +1,12 @@
 ## Erstellung eines GitHub-Kontos 🚀
 1. **Besuche die GitHub-Registrierungsseite**:

+---
+title: "Verbinden eines Colab-Notebooks mit GitHub"
+description: "Eine Schritt-für-Schritt-Anleitung zur Verbindung eines Colab-Notebooks mit GitHub, einschließlich der Erstellung eines GitHub-Kontos und der Integration in Google Colab."
+author: "Benjamin"
+date: "12/22/2024"
+date-modified: "12/22/2024"
+image: _bebbf63f-874e-4d27-b6a5-f0e0116fd587.jpeg
+---
 ## Erstellung eines GitHub-Kontos 🚀
 1. **Besuche die GitHub-Registrierungsseite**:

src/01_setup/optional/quarto-lokal.qmd CHANGED Viewed

@@ -1,8 +1,12 @@
 ---
-title: "Quarto lokal"
 ---
 ## Quarto lokal starten 🚀
 Hier sind die Schritte, um das Repository `https://huggingface.co/spaces/datenwerkzeuge/CDL-Webscraping-Workshop-2025` lokal zu klonen, Quarto zu installieren und die Website zu starten.

 ---
+title: "Lokale Installation von Quarto"
+description: "Eine Schritt-für-Schritt-Anleitung zur Installation von Quarto auf Windows und Linux, einschließlich der Überprüfung der Installation."
+author: "Benjamin"
+date: "12/22/2024"
+date-modified: "12/22/2024"
+image: _4386bf69-e8a9-4259-980a-6fd75d66cddb.jpeg
 ---
 ## Quarto lokal starten 🚀
 Hier sind die Schritte, um das Repository `https://huggingface.co/spaces/datenwerkzeuge/CDL-Webscraping-Workshop-2025` lokal zu klonen, Quarto zu installieren und die Website zu starten.

src/02_basics/app_market/_9d81d3d2-f372-476b-beb6-fe6a4841739b.jpeg ADDED Viewed

src/02_basics/app_market/google-play-search.qmd CHANGED Viewed

@@ -1,8 +1,10 @@
 ---
 title: "Google-Play-App-Suche"
-author: "datenwerkzeuge"
-date: "2024-06-16"
-format: html
 ---
 # Google-Play-App-Suche

 ---
 title: "Google-Play-App-Suche"
+description: "Ein Tool zur Suche nach Apps im Google Play Store basierend auf einem Suchbegriff, einschließlich der Anzeige von App-Details und direkten Links."
+author: "Benjamin"
+date: "2024-12-16"
+date-modified: "2024-12-16"
+image: _9d81d3d2-f372-476b-beb6-fe6a4841739b.jpeg
 ---
 # Google-Play-App-Suche

src/02_basics/pdf/_30a8d023-6f69-46e3-8ae1-1d7555d04902.jpeg ADDED Viewed

src/02_basics/pdf/_5a00e9f5-52f7-4e9b-b22d-499e40257a4b.jpeg ADDED Viewed

src/02_basics/pdf/pdf-grouping.qmd CHANGED Viewed

@@ -1,8 +1,10 @@
 ---
 title: "PDF-Keyword-Grouping-App"
-author: "datenwerkzeuge"
-date: "2024-06-16"
-format: html
 ---
 # PDF-Keyword-Grouping-App

 ---
 title: "PDF-Keyword-Grouping-App"
+description: "Eine App zur Gruppierung von hochgeladenen PDF-Dateien basierend auf semantischen Themen, einschließlich Keyword-Extraktion und themenbasierter Gruppierung."
+author: "Benjamin"
+date: "2024-12-16"
+date-modified: "2024-12-16"
+image: _5a00e9f5-52f7-4e9b-b22d-499e40257a4b.jpeg
 ---
 # PDF-Keyword-Grouping-App

src/02_basics/pdf/pdf-link-extractor.qmd CHANGED Viewed

@@ -1,8 +1,10 @@
 ---
 title: "PDF-Link-Extractor"
-author: "datenwerkzeuge"
-date: "2024-06-16"
-format: html
 ---
 # PDF-Link-Extractor

 ---
 title: "PDF-Link-Extractor"
+description: "Eine Anwendung zur Extraktion und Organisation von PDF-Links von Webseiten oder hochgeladenen HTML-Dateien, einschließlich Download und Komprimierung."
+author: "Benjamin"
+date: "2024-12-16"
+date-modified: "2024-12-16"
+image: _30a8d023-6f69-46e3-8ae1-1d7555d04902.jpeg
 ---
 # PDF-Link-Extractor

src/02_basics/webspider/_1fca0884-d58a-4271-b90f-90afcb2c4be9.jpeg ADDED Viewed

src/02_basics/webspider/_24e522b8-a6d0-4212-a02e-7738b3098105.jpeg ADDED Viewed

src/02_basics/webspider/website-url-extractor.qmd CHANGED Viewed

@@ -1,8 +1,10 @@
 ---
 title: "Webseiten-URL-Extraktor"
-author: "datenwerkzeuge"
-date: "2024-06-16"
-format: html
 ---
 # Webseiten-URL-Extraktor

 ---
 title: "Webseiten-URL-Extraktor"
+description: "Ein Tool zur Extraktion und Darstellung aller Links von einer angegebenen Webseite, einschließlich Filterung und übersichtlicher Darstellung."
+author: "Benjamin"
+date: "2024-12-16"
+date-modified: "2024-12-16"
+image: _1fca0884-d58a-4271-b90f-90afcb2c4be9.jpeg
 ---
 # Webseiten-URL-Extraktor

src/02_basics/webspider/webspider.qmd CHANGED Viewed

@@ -1,3 +1,12 @@
 **Spaces / Webspider** ist eine private Webanwendung, die mithilfe von **Streamlit** und **Scrapy** entwickelt wurde, um strukturierte Daten von Webseiten zu extrahieren. Sie bietet eine benutzerfreundliche Oberfläche, um Webseiten zu durchsuchen und die Ergebnisse in einem leicht zugänglichen Format herunterzuladen.
 #### Hauptfunktionen:

+---
+title: "Webspider"
+description: "Eine private Webanwendung zur Extraktion strukturierter Daten von Webseiten mithilfe von Streamlit und Scrapy, einschließlich benutzerdefinierter Scraping-Parameter und Datenexport."
+author: "Benjamin"
+date: "2024-12-16"
+date-modified: "2024-12-16"
+image: _24e522b8-a6d0-4212-a02e-7738b3098105.jpeg
+---
 **Spaces / Webspider** ist eine private Webanwendung, die mithilfe von **Streamlit** und **Scrapy** entwickelt wurde, um strukturierte Daten von Webseiten zu extrahieren. Sie bietet eine benutzerfreundliche Oberfläche, um Webseiten zu durchsuchen und die Ergebnisse in einem leicht zugänglichen Format herunterzuladen.
 #### Hauptfunktionen:

src/03_low_code/app_market_scraping/_2f0cb788-71a6-4817-ab94-d38c346e4f6f.jpeg ADDED Viewed

src/03_low_code/app_market_scraping/app_market_scraping.qmd CHANGED Viewed

	@@ -1 +1,10 @@









1	# App Market Scraping

+---
+title: "App-Market-Scraping"
+description: "Ein Tool zur Extraktion und Analyse von App-Marktdaten, einschließlich benutzerdefinierter Suchparameter und Datenexport."
+author: "Benjamin"
+date: "2024-12-16"
+date-modified: "2024-12-16"
+image: _2f0cb788-71a6-4817-ab94-d38c346e4f6f.jpeg
+---
 # App Market Scraping

src/03_low_code/catalogue/_2be49964-b89e-45be-8897-491eaa1aad84.jpeg ADDED Viewed

src/03_low_code/catalogue/_be1bcdc2-f540-4a95-a27c-775e8f2c1c07.jpeg ADDED Viewed

src/03_low_code/catalogue/bookstoscrape.qmd CHANGED Viewed

@@ -1,6 +1,10 @@
 ---
 title: "Web Scraping mit Python: Bücher von Books to Scrape"
-author: "Dein Name"
 format:
   html:
     toc: true

 ---
 title: "Web Scraping mit Python: Bücher von Books to Scrape"
+description: "Eine Anleitung zum Scraping von Büchern von der Website Books to Scrape, einschließlich Python-Beispielen und Datenexport."
+author: "Benjamin"
+date: "2024-12-16"
+date-modified: "2024-12-16"
+image: _be1bcdc2-f540-4a95-a27c-775e8f2c1c07.jpeg
 format:
   html:
     toc: true

src/03_low_code/catalogue/quotes_scraper.ipynb CHANGED Viewed

@@ -1,5 +1,19 @@
 {
  "cells": [
   {
    "cell_type": "markdown",
    "metadata": {},

 {
  "cells": [
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "---\n",
+    "title: \"Web Scraping mit Python: Bücher von Books to Scrape\"\n",
+    "description: \"Eine Anleitung zum Scraping von Zitate von der Website Quotes to Scrape, einschließlich Python-Beispielen und Datenexport.\"\n",
+    "author: \"Benjamin\"\n",
+    "date: \"2024-12-16\"\n",
+    "date-modified: \"2024-12-16\"\n",
+    "image: _2be49964-b89e-45be-8897-491eaa1aad84.jpeg\n",
+    "---"
+   ]
+  },
   {
    "cell_type": "markdown",
    "metadata": {},

src/03_low_code/video_transcripts/_26268650-a612-4658-b5e2-4cccceb05541.jpeg ADDED Viewed

src/03_low_code/video_transcripts/social-media.qmd CHANGED Viewed

@@ -1,3 +1,12 @@
 ### Web Scraping von Social-Media-Plattformen: Erklärung und Python-Beispiele
 Web Scraping ist eine Technik, um Daten automatisiert aus Webseiten zu extrahieren. Beim Scraping von Social-Media-Plattformen wie Facebook, Twitter (jetzt X), Instagram oder LinkedIn müssen strenge rechtliche, ethische und technische Vorgaben eingehalten werden. Diese Regeln schützen sowohl die Plattformen als auch die Nutzer vor Missbrauch, Datenmanipulation und Verletzungen der Privatsphäre.

+---
+title: "Web Scraping von Social-Media-Plattformen"
+description: "Erklärung und Python-Beispiele zum Scraping von Social-Media-Plattformen unter Berücksichtigung rechtlicher, ethischer und technischer Vorgaben."
+author: "Benjamin"
+date: "2024-12-16"
+date-modified: "2024-12-16"
+image: _26268650-a612-4658-b5e2-4cccceb05541.jpeg
+---
 ### Web Scraping von Social-Media-Plattformen: Erklärung und Python-Beispiele
 Web Scraping ist eine Technik, um Daten automatisiert aus Webseiten zu extrahieren. Beim Scraping von Social-Media-Plattformen wie Facebook, Twitter (jetzt X), Instagram oder LinkedIn müssen strenge rechtliche, ethische und technische Vorgaben eingehalten werden. Diese Regeln schützen sowohl die Plattformen als auch die Nutzer vor Missbrauch, Datenmanipulation und Verletzungen der Privatsphäre.

src/_quarto.yml CHANGED Viewed

@@ -1,7 +1,7 @@
 project:
   type: website
 website:
-  title: "🧭 CDL Webscraping Workshop 2025"
   navbar:
     left:
       - href: agenda.qmd

 project:
   type: website
 website:
+  title: "🧭 Collecting Data on the Web - Webscraping Workshop 2025"
   navbar:
     left:
       - href: agenda.qmd