abstimmung <- read.delim("https://baselland.opendatasoft.com/api/explore/v2.1/catalog/datasets/11990/exports/csv", sep = ";")Praktium 05b: Bedingt mutate()
Tastaturkürzel
| Einen neuen Code-chunk hinzufügen | Ctrl + Alt + I |
| Code “Zeile für Zeile” innerhalb eines Code-chunks ausführen | Ctrl + Enter |
| Den gesamten Code-chunk ausführen | Ctrl + Shift + Enter |
| (Aus-)kommentieren | Ctrl + Shift + C |
Das Pipe |> |
Ctrl + Shift + M |
Der Zuweisungs-Operator <- |
Alt + - |
OGD-Datensätze
Wir werden mit zwei OGD-Datensätze arbeiten:
Man könnte OGD-Daten direkt aus dem OGd-Portal so einlesen:
gebaeude <- read.delim("https://baselland.opendatasoft.com/api/explore/v2.1/catalog/datasets/12160/exports/csv", sep = ";")Achtung aktuell read.delim() statt read_delim().
Packages laden
- Lädt das
tidyverse-Package.
if_else()
- Lädt die Daten “data/ogd_abstimmungsarchiv_11990.csv”.
- Erkundet die Daten:
glimpse(),summary(),View() - Was ist die durchschnittliche Wahlbeteiligung? (
summary(),summarise() + mean(),summarise() + median()) - Erstellt eine neue kategorielle Variable
turnout_cat, die zwei Niveaus hat:- unterdurchschnittlich
- überdurchschnittlich
case_when()
- Lädt die Daten “data/ogd_gebaeude12160.csv”
- Erkundet die Daten:
glimpse(),summary(),View() - Behaltet nur die folgenden Spalten:
- “gemeindenummer_bfs”
- “gemeindename”
- “baujahr_des_gebaeudes”
- “energie_waermequelle_heizung_primaer_code”
- “energie_waermequelle_heizung_primaer_bezeichnung”
- “gebaeudeflaeche”
- “anzahl_geschosse”
- “gemeindenummer_bfs”
- Wie viele verschiedene Primäre Wärmequellen gibt es?
- Verwendet
case_when()und die Variableenergie_waermequelle_heizung_primaer_bezeichnungum eine neue Variable der Wärmequelle zu erstellen, die vier Kategorien hat:- Gas, Heizöl → Fossil
- Keine → Keine
- Unbestimmt → Unbestimmt
- alle andere Quellen → Erneuerbare