
Allgemeines
Kurzbeschreibung
Data Science (engl. data “Daten” und science “Wissenschaft”) ist eine Disziplin, die sich mit der Extraktion von Wissen aus Daten beschäftigt – in der Regel im Kontext von Unternehmensentscheidungen. Es ist damit ein interdisziplinäres Fach, das Methoden aus Mathematik, Statistik, Informatik und Wirtschaftswissenschaften verbindet. Neben dem Verständnis des jeweiligen betriebswirtschaftlichen Kontexts werden Methoden wie Wahrscheinlichkeitsmodelle, Maschinelles Lernen bzw. Künstliche Intelligenz, Datentechnik, Algorithmen und Programmierung hinzugezogen.
Fokus dieser Vorlesung ist der technische Teil von Data Science, d.h. die Programmierung und Implementierung von Algorithmen sowie das praktische Arbeiten mit Daten und Analysen. Hierzu wird die Vorlesung Ihnen das notwendige Handwerkzeug an die Hand geben.
Um Data Science zu betreiben bedarf es spezieller Softwaretools. Eines der bedeutendsten Werkzeuge in diesem Bereich ist die Programmiersprache R. In dieser Vorlesung erlangen Sie Grundkenntnisse in der Programmierung mit R, welche Sie im Laufe des Semesters in den weiteren Veranstaltungen des Erweiterungsmoduls ‘Advanced Data cience’ anwenden und vertiefen werden. Insbesondere dient diese Vorlesung als Vorbereitung auf die Veranstaltung ‘Machine Learning’. Sie werden nach dieser Vorlesung in der Lage sein, eine Vielzahl betriebswirtschaftlicher Problemstellungen mittels Datenanalyse zu lösen.
Vorlesungszeiten
Die Vorlesung “Programmierung für Data Science” findet als Blockveranstaltung zu folgenden Zeiten statt:
- Freitag, 25.10.2024, 08:30-17:30 Uhr; B 404
- Freitag, 08.11.2024, 08:30-17:30 Uhr; D 420
- Freitag, 15.11.2024, 08:30-17:30 Uhr; D 420
Vorlesungskonzept
Sage es mir, und ich werde es vergessen;
zeige es mir, und ich werde mich daran erinnern;
beteilige mich, und ich werde es verstehen.Laotse, chinesischer Philosoph
Die Vorlesung folgt dem “Inverted Classroom” Konzept. Das heißt, dass die üblichen Aktivitäten innerhalb und außerhalb des Hörsaals „umgedreht” werden: Sie bekommen das Vorlesungsskript vor der Vorlesung bereitgestellt und die Lerninhalte werden Ihnen nicht mehr vor Ort an der Hochschule vermittelt; vielmehr erarbeiten Sie sich die Inhalte ortsunabhängig, individuell, selbstgesteuert und im eigenen Lerntempo anhand der bereitgestellten Lernmaterialien. Die wertvollen Präsenzzeiten an der Hochschule werden zur gemeinsamen, interaktiven Vertiefung genutzt, z.B. durch gemeinsame Aufgabenbearbeitung, Beantwortung von Fragen und praktische Umsetzung des Gelernten.
Dazu ist es notwendig, dass Sie sich vor den jeweiligen Terminen die dafür vorgesehenen Lerninhalte erarbeiten, indem Sie das Skript studieren und die darin enthaltenen Übungsaufgaben lösen.
Für die drei Termine der Vorlesung sind jeweils folgende Kapitel vorgesehen:
- Freitag, 25.10.2024, Kapitel 0-2
- Freitag, 08.11.2024, Kapitel 3-5
- Freitag, 15.11.2024, Kapitel 6-7
Bitte studieren Sie die Kapitel und lösen Sie die Aufgaben jeweils vor dem Termin der Veranstaltung.
Lernziele
- Fachkompetenzen
- Grundlagen- und Anwendungswissen in Programmierung mit R
- Schreiben von R Code zur Lösung statistischer und analytischer Fragestellungen
- Automatisierung von Analysen
- Methodenkompetenzen
- Problemlösungskompetenz: Problemdefinition, Ermittlung Ursachen, Lösungsweg
- Analytisches Denkvermögen: Zerlegung komplexer Problemstellungen in ihre Einzelteile und deren Interdependenzen sowie deren systematische und vollständige Strukturierung
- Transferkompetenz: In der Theorie erlernte Inhalte auf einen praktischen Fall anwenden
- Medienkompetenz: Einsatz von R mit Hilfe von RStudio
- Sozialkompetenzen
- Teamkompetenz: Effektive und positiv erlebbare Zusammenarbeit mit anderen; Fähigkeit zu verantwortungsvollem Handeln, Zuverlässigkeit und Engagement
- Schriftliche Kommunikationskompetenz: Dokumentation von Code zur Weitergabe an dritte
- Selbstkompetenzen
- Selbstlernkompetenz: Selbstständiges Arbeiten und Lernen
- Entscheidungskompetenz: Fähigkeit und Bereitschaft, Entscheidungen situationsadäquat, kontextsensitiv und zielführend zu treffen
Modulprüfung
Nach jedem der drei Vorlesungstermine bekommen Sie eine Programmieraufgabe. Diese müssen Sie zu Hause eigenständig lösen und einzeln bis zum angegebenen Termin abgeben. Ihre Lösungen werden nach folgenden Kriterien bewertet:
- Lauffähigkeit des Codes
- Effektive Namensgebung (Objekte, Funktionen, …)
- Strukturierung des Codes und Einteilung in sinnvolle Teilaufgaben (z.B. durch Funktionen)
- Lesbarkeit und Kommentierung des Codes
- Korrektheit der Ergebnisse
- Geschwindigkeit der Berechnungen
- Interpretation der Ergebnisse
Für die gestellten Aufgaben werden diese Kriterien jeweils entsprechend der Aufgabenstellung gewichtet.
Skript
Das Skript ist in mehreren Formaten verfügbar. Als Webseite, als PDF Dokument und im EPUB Format (für diverse e-Reader). Es wird empfohlen, während des Semesters die Web-Version für das Studium zu nutzen, da basierend auf Ihrem Feedback Änderungen eingepflegt werden. Am Ende des Semesters können Sie dann für Ihre Unterlagen das finale Skript als PDF oder EPUB archivieren.
Die Web-Version des Skripts ist verfügbar unter https://datascience.fh-muenster.io/programming-in-r. Die PDF und EPUB Versionen können auf dieser Webseite über den Download-Button heruntergeladen werden (siehe Abbildung 1).

Im Skript finden Sie verschiedene Boxen mit Warnungen, Tipps und Übungsaufgaben.
Warnungen weisen auf wichtige Aspekte hin, welche häufig zu Fehlern in R Skripten führen. Lesen Sie diese aufmerksam durch, um hohen Zeitaufwand für Debugging zu vermeiden.
Tipps helfen Ihnen, verschiedene Problemstellungen in R möglichst effizient zu lösen. Sparen Sie sich zusätzlichen Aufwand, indem Sie diese Tipps beherzigen.
Verweise auf weitere Quellen bezüglich einzelner Themen können zur weiteren Vertiefung genutzt werden. Besuchen Sie diese Links um mehr über ein Thema zu erfahren.
Übungsaufgaben helfen dabei, das Erlernte zu vertiefen und zu verinnerlichen. Lösen Sie diese Aufgaben im Selbststudium, um den Stoff der Vorlesung praktisch anzuwenden.
Weiterhin enthält das Skript viele Code Beispiele. Diese sind grau hinterlegt, in Monospace
Schrift gesetzt und mit Syntaxhighlighting versehen. Wenn das Skript neben dem Code auch die Ausgaben von R zeigt, werden diese direkt darunter ohne Hintergrund angezeigt. Der erste Block enthält dann die Eingaben in R, der zweite die Rückgabe der Ergebnisse durch R. Abbildung 2 zeigt ein Beispiel für einen Codeblock mit Eingabe und Ausgabe.

Dies ist ein Beispiel:
<- 1:10
x x
[1] 1 2 3 4 5 6 7 8 9 10
Solche Code-Snippets können Sie leicht kopieren und in R oder RStudio einfügen, um den Code selbst auszuführen und sich so mit der Verwendung vertraut zu machen.
Tutorium
Für die Bearbeitung der Fallstudie können Sie die Untersützung durch Tutoren in Anspruch nehmen. Die Kommunikation erfolgt in der Regel über Teams. Details werden im Laufe der Vorlesung bekannt gegeben.
Software
- In dieser Vorlesung (wie auch in den weiteren Vorlesungen im Erweiterungsmodul QMII) nutzen wir die Programmiersprache R und die Entwicklungsumgebung RStudio bzw. posit
- Eine vollständig eingerichtete Arbeitsumgebung finden Sie unter r-workbench.fh-muenster.de
- Es wird strengstens empfohlen, diese Arbeitsumgebung zu nutzen, es besteht aber auch die Möglichkeit, RStudio selbst zu installieren
Um auf die RStudio bzw. Posit Workbench zuzugreifen, müssen Sie sich im Netz der FH Münster befinden. Dazu verbinden Sie sich entweder in den Gebäuden der FH mit dem eduroam WLAN oder greifen Sie von zu Hause aus über die VPN1 Verbindung zu.
Selbstlernplattform DataCamp
Sie haben die Möglichkeit Ihr Methodenwissen und Ihre Kenntnisse in der Anwendung mit R (oder auch Python und SQL) mit Hilfe der Selbstlernplattform DataCamp zu erweitern. Über diesen Einladungslink können Sie der Plattform beitreten: Link.
MS Teams
- Für die Zusammenarbeit während der Vorlesung und der Fallstudie nutzen wir Microsoft Teams
- Fragen in Teams werden durch den Tutoren und mir beantwortet
- Bitte nutzen Sie die öffentlichen Channels um Fragen zu stellen, damit andere Teams ebenfalls von den Antworten profitieren
- Bei größeren Schwierigkeiten sind auch persönliche Termine möglich
- In der Veranstaltung werden wir gemeinsam das nötige Handwerkszeug erarbeiten (z.B. Grundlagen und Methoden des Data Mining, Umsetzung mit Hilfe der Programmiersprache R)
- Zu jedem Themenblock werden wir praktische Übungen anhand zweier Beispieldatensätze machen
- In den Veranstaltungen werden wir gemeinsam häufig gestellte Fragen diskutieren