R und RStudio/Posit
Einführung
In vielen meiner Vorlesungen (z.B. im Erweiterungsmodul “Advanced Data Science”) nutzen wir die Programmiersprache R und die Entwicklungsumgebung RStudio bzw. posit
Eine vollständig eingerichtete Arbeitsumgebung finden Sie unter r-workbench.fh-muenster.de. Es wird wärmstens empfohlen, diese Arbeitsumgebung zu nutzen, es besteht aber auch die Möglichkeit, RStudio selbst zu installieren.
Um auf die Posit Workbench zuzugreifen, müssen Sie sich im Netz der FH Münster befinden. Dazu verbinden Sie sich entweder in den Gebäuden der FH mit dem eduroam WLAN oder greifen Sie von zu Hause aus über die VPN1 Verbindung zu.
R und RStudio/Posit
R ist eine freie Programmiersprache für statistische Berechnungen und Grafiken. Sie ist eine der wichtigsten und am häufigsten verwendeten Programmiersprachen im Data Science Kontext. RStudio/Posit ist eine integrierte Entwicklungsumgebung oder IDE (Integrated Development Environment) für die Programmiersprache R und ein wichtiges Werkzeug bei der Arbeit mit R.
R
R wurde von Statistikern für Statistiker bzw. Anwender mit statistischen Aufgaben entwickelt. Die Syntax orientiert sich an der (Vorgänger-)Programmiersprache S, mit der R weitgehend kompatibel ist. Als Standarddistribution wird R mit einem Interpreter als Kommandozeilenumgebung mit rudimentären grafischen Schaltflächen bereitgestellt. R ist aktuell auf den wichtigsten Plattformen (Windows, Mac, Linux) verfügbar. Die Basis-Version von R sowie sämtliche Pakete sind über das “Comprehensive R Archive Network” (CRAN) abrufbar, das unter cran.r-project.org erreichbar ist.
Zahlreiche, online abrufbare Pakete enthalten zusätzliche Funktionen, um Daten hinsichtlich Fragestellungen aus unterschiedlichen Fachrichtungen zu untersuchen. Weitere eigene Funktionen können selbst implementiert und ebenfalls über Pakete anderen Nutzern bereitgestellt werden. Die Sprache ist sehr vielseitig und bietet Schnittstellen zu anderen Programmiersprachen sowie Möglichkeiten zur Integration in verschiedene Software. R grenzt sich in mehrerer Hinsicht von anderen bekannten Statistik-Umgebungen ab und ist nicht ausschließlich als Statistiksoftware zu bezeichnen. Obwohl andere, heutzutage mit grafischen Benutzeroberflächen versehene Statistik-Umgebungen wie SPSS ebenfalls als spezialisierte Programmiersprachen begannen (und diese Fähigkeit bis heute beibehalten), fokussiert sich R auf seine Stärke als Statistik-orientierte Programmiersprache. R grenzt sich von anderen Programmiersprachen durch die für Statistik entworfenen Datenstrukturen und Funktionen sowie die besonderen Möglichkeiten bei der Grafikerzeugung ab. R gilt zunehmend als die Standardsprache für statistische Problemstellungen sowohl in der Wirtschaft als auch in der Wissenschaft.2
RStudio/Posit
RStudio/Posit ist eine integrierte Entwicklungsumgebung für die Programmiersprache R und bietet für viele Funktionen von R eine grafische Benutzeroberfläche (z.B. für den Datenimport). RStudio/Posit ermöglicht eine Autovervollständigung, automatische Einrückungen, Syntaxhervorhebung, Code-Faltung, integrierte Hilfe und Informationen zu Objekten in der Arbeitsumgebung. Es gibt die Möglichkeit Datensätze zu betrachten und zu bearbeiten. Skripte, Daten und weitere Dateien können zu Projekten zusammengefasst werden, was die Zusammenarbeit erleichtert, zumal eine Versionsverwaltung mit Git oder Subversion ebenfalls integriert ist. Mit Hilfe der Paketverwaltung lassen sich Pakete installieren und laden. Die Erstellung von Berichten mit Hilfe von knitr oder Sweave kann aus RStudio/Posit heraus erfolgen. Dieses Skript ist beispielsweise auch mit R entstanden.
RStudio/Posit ist sowohl als Desktop-Version also auch in einer Server-Version verfügbar. Die Desktop-Version können Sie herunterladen und auf Ihrem eigenen Rechner installieren. Das Softwarepaket ist verfügbar unter posit.co. Die Server-Version von RStudio/Posit wird auf einem Server installiert und ist dann über einen Browser aufrufbar.
Anmeldung in der Posit Workbench der FH Münster
Für diese Vorlesung wollen wir die Server-Version von RStudio verwenden. Dazu hat die DVZ der FH Münster eine Posit Workbench eingerichtet. Dieser ist erreichbar unter der Domain https://r-workbench.fh-muenster.de.
Zur Anmeldung verwenden Sie Ihre FH Kennung und das dazugehörige Passwort. Außerhalb des FH-Datennetzes ist die VPN Verbindung notwendig.3

Nach dem Login, sehen Sie zunächst die Übersichtsseite in der Posit Workbench:
Sobald Sie eine neue session oder ein Projekt starten, öffnet sich die Arbeitsumgebung:

Nachdem Sie Ihre Arbeit in RStudio beendet haben, sollten Sie die aktive Session immer schließen. Andernfalls blockieren Sie Ressourcen des Servers. Zur Abmeldung verwenden Sie den roten Button in der oberen rechen Ecke der Benutzeroberfläche der Posit Workbench. Bitte schließen Sie vorher nicht das Browserfenster!
Installation R und RStudio
Falls es zu Problemen bei der Verwendung des RStudio Servers der FH Münster kommt oder ohne Internetverbindung an R Projekten gearbeitet werden soll, ist eine lokale Installation von R und RStudio auf dem eigenen Rechner notwendig. Dazu können beide Softwarepakete heruntergeladen werden:
- Das Softwarepaket R ist verfügbar unter cran.r-project.org.
- Das graphische Frontend R-Studio ist verfügbar unter posit.co.
Anschließend müssen beide Programme in genau dieser Reihenfolge installiert werden (zunächst R, dann RStudio). Eventuell müssen noch zusätzliche Pakete nachinstalliert werden.
Posit Cloud
RStudio Cloud ist eine cloudbasierte Lösung, mit der jeder online Data Science betreiben, teilen, lehren und lernen kann. Sie können RStudio Cloud kostenlos nutzen, die Nutzungsdauer ist allerdings auf 25 Stunden pro Monat begrenzt. Um RStudio Cloud nutzen zu können, erstellen Sie sich dazu einen Account unter posit.cloud.
Fußnoten
Hier finden Sie eine Anleitung der DVZ für die Einrichtung des VPN: Link↩︎
Die Programmiersprache Python wird inzwischen im Data Science Umfeld neben R vermehrt verwendet. Dazu wurden spezielle Bibliotheken zur Datenverarbeitung (pandas) und für Machine Learning Algorithmen (scikit learn) entwickelt.↩︎
Informationen, wie Sie sich per VPN mit den Netzen der Fachhochschule verbinden, finden Sie unter https://wiki.fh-muenster.de/dvz/anleitungen/doku.php?id=netzwerk:vpn_anyconnect:uebersicht↩︎