Vorlesung “Programmierung für Data Science”

Dies ist die Webseite zur Vorlesung “Programmierung für Data Science” im Erweiterungsmodul “Advnaced Data Science”1 von Prof. Dr. Michael Bücker.

“Programs must be written for people to read, and only incidentally for machines to execute.”
— Harold Abelson & Gerald Jay Sussman (Structure and Interpretation of Computer Programs, 1985)

Warum Programmieren?

Im modernen Datenumfeld ist Programmierung keine Nebendisziplin mehr, sondern eine Grundvoraussetzung für analytisches Arbeiten. Wer Daten verstehen, strukturieren und auswerten möchte, muss in der Lage sein, Probleme algorithmisch zu denken und in Code umzusetzen.

Diese Veranstaltung vermittelt die zentralen Grundlagen, um mit der Programmiersprache R Daten aufzubereiten, zu analysieren und zu visualisieren. Sie lernen, Schritt für Schritt analytische Fragestellungen in lauffähigen Code zu übersetzen – eine Kernkompetenz für Data Scientists, Analyst:innen und Wirtschaftswissenschaftler:innen gleichermaßen.

Ziel der Veranstaltung

Nach Abschluss der Vorlesung können Sie:

  • eigenständig R-Skripte schreiben, die reale Datenprobleme lösen,
  • Daten in R importieren, transformieren, bereinigen und visualisieren,
  • statistische Auswertungen und einfache Modelle (z. B. lineare Regression) durchführen,
  • Ihre Analysen reproduzierbar dokumentieren,
  • und Ergebnisse klar und nachvollziehbar interpretieren und kommunizieren.

Darüber hinaus erwerben Sie methodische Kompetenzen wie:

  • Analytisches Denken und Problemlösefähigkeit,
  • Fehleranalyse und Debugging,
  • Übertragung des Gelernten auf neue Kontexte.

Lehr- und Lernkonzept

Die Veranstaltung folgt einem Inverted-Classroom-Ansatz: Sie bearbeiten die Inhalte des Online-Skripts (Programmierung in R) zunächst selbstständig und bereiten die Übungen vor.
Die Präsenzveranstaltungen dienen dann der Anwendung, Diskussion und Vertiefung – mit zahlreichen Beispielen, praktischen Aufgaben und individueller Unterstützung.

Durch dieses Vorgehen können Sie Ihr Lerntempo selbst steuern und gezielt Fragen einbringen. Ziel ist ein aktives, anwendungsorientiertes Lernen: Lesen, Ausprobieren, Verstehen.

Themenüberblick

Ein Auszug der behandelten Themen:

  • Grundlagen der Programmierung in R
  • Datentypen, Variablen, Operatoren
  • Kontrollstrukturen und Schleifen
  • Funktionen und Modularisierung
  • Datenmanipulation mit dem Tidyverse
  • Deskriptive und induktive Statistik
  • Datenvisualisierung
  • Lineare Modelle und erste Schritte in Machine Learning

Arbeitsweise

  • Vorbereitung: eigenständige Bearbeitung der Kapitel im Online-Skript
  • Präsenz: aktive Anwendung, Fragen, gemeinsame Übungen
  • Übungsaufgaben: regelmäßiges Arbeiten sichert den Lernerfolg
  • Austausch: Diskussionen über typische Fehler, Lösungswege und Best Practices

Verwendung von KI-Tools

Der Einsatz von Künstlicher Intelligenz (KI) – etwa ChatGPT oder Copilot – ist in dieser Veranstaltung grundsätzlich erlaubt, sofern er unterstützend und reflektiert erfolgt. Ziel ist es, dass Sie die Funktionsweise solcher Werkzeuge verstehen und sinnvoll in Ihren Lernprozess integrieren.

Bitte beachten Sie dabei folgende Grundsätze:

  • Selbst ausprobieren kommt zuerst.
    Versuchen Sie stets, eine Aufgabe oder ein Problem zunächst eigenständig zu lösen, bevor Sie eine KI hinzuziehen. Nur so entsteht echter Lerneffekt.
  • KI ist kein Ersatz für Verständnis.
    Wenn Sie Code oder Erklärungen übernehmen, sollten Sie jede Zeile nachvollziehen können. Verwenden Sie KI-generierten Code nur dann, wenn Sie dessen Funktionsweise erklären könnten.
  • KI als Lernbegleitung.
    Nutzen Sie KI-Tools z. B. zum Debugging, zur Ideenfindung, für Erklärungen oder zum Vergleich eigener Lösungen – aber nicht als primäre Quelle.
  • Transparenz.
    Wenn Sie KI bei größeren Aufgaben oder Abgaben verwenden, kennzeichnen Sie dies bitte offen.

KI kann wertvolle Unterstützung bieten – entscheidend ist, wie Sie sie einsetzen: nicht als Abkürzung, sondern als Werkzeug zum besseren Verständnis.

Motivation

Programmieren lernen heißt, aktiv zu experimentieren. Fehler sind dabei kein Rückschritt, sondern Teil des Prozesses. Das Ziel dieser Veranstaltung ist, dass Sie sich sicher im Umgang mit Daten fühlen – und verstehen, wie aus Zahlen strukturierte Erkenntnisse entstehen.

Zurück nach oben

Fußnoten

  1. vormals Vorlesung “Data Science” im Erweiterungsmodul “Quantitative Methoden II”↩︎