pip install notebook
Pyhon, JupyterHub, Visual Studio Code
Einführung
In vielen meiner Vorlesungen nutzen wir die Programmiersprache Python und als Entwicklungsumgebung Jupyter oder Visual Studio Code
Eine vollständig eingerichtete Arbeitsumgebung unter Verwendung von JupyterHub finden Sie unter jupyter.fh-muenster.de. Es wird wärmstens empfohlen, diese Arbeitsumgebung zu nutzen, es besteht aber auch die Möglichkeit, Jupyter selbst zu installieren.
Um auf das JupyterHub zuzugreifen, müssen Sie sich im Netz der FH Münster befinden. Dazu verbinden Sie sich entweder in den Gebäuden der FH mit dem eduroam WLAN oder greifen Sie von zu Hause aus über die VPN1 Verbindung zu.
Python und Jupyter Notebooks
Python
Python ist eine interpretierte High-Level-Programmiersprache, die für ihre klare Syntax, Lesbarkeit und Vielseitigkeit bekannt ist. Entwickelt von Guido van Rossum und erstmals 1991 veröffentlicht, ist Python zu einer der beliebtesten Programmiersprachen der Welt geworden. Sie ist so konzipiert, dass sie leicht zu erlernen und zu verwenden ist, was sie zu einer ausgezeichneten Wahl für Anfänger macht, und dennoch ist sie leistungsfähig genug für die Entwicklung komplexer Software und die wissenschaftliche Forschung.
Aufgrund mehrerer Schlüsselfaktoren ist Python für viele Datenwissenschaftler, Analysten und Forscher die Sprache der Wahl geworden:
- Reichhaltiges Ökosystem von Bibliotheken und Frameworks: Python verfügt über eine umfangreiche Sammlung von Bibliotheken und Frameworks, die verschiedene Aspekte der Datenwissenschaft abdecken, z. B. NumPy für numerische Berechnungen, Pandas für die Datenmanipulation, Matplotlib und Seaborn für die Datenvisualisierung, scikit-learn für maschinelles Lernen sowie TensorFlow und PyTorch für Deep Learning. Dieses reichhaltige Ökosystem ermöglicht es Datenwissenschaftlern, eine breite Palette von Aufgaben - von der Datenbereinigung und -analyse bis hin zur Entwicklung komplexer Modelle für maschinelles Lernen - mit relativer Leichtigkeit durchzuführen.
- Einfachheit und Produktivität: Die einfache Syntax von Python ähnelt der natürlichen Sprache, wodurch sie für Personen mit unterschiedlichem Hintergrund leichter zugänglich ist, auch für Personen ohne formale Informatikausbildung. Diese Einfachheit ermöglicht es Datenwissenschaftlern, sich mehr auf die Lösung von Datenproblemen zu konzentrieren, anstatt Zeit damit zu verbringen, komplexe Programmierkonstrukte zu verstehen.
- Gemeinschaft und Unterstützung: Python verfügt über eine große und aktive Gemeinschaft, was bedeutet, dass Datenwissenschaftler und Entwickler leicht Unterstützung finden, Wissen austauschen und zur Entwicklung von Bibliotheken und Tools beitragen können.Die Community spielt auch eine entscheidende Rolle bei der kontinuierlichen Verbesserung der Data-Science-Funktionen von Python durch Open-Source-Beiträge.
- Interoperabilität und Flexibilität: Python kann mit anderen Sprachen und Technologien integriert werden, so dass Datenwissenschaftler bei Bedarf auf andere Tools zurückgreifen können.Es kann in verschiedenen Umgebungen eingesetzt werden, von kleinen persönlichen Projekten bis hin zu großen, komplexen Systemen in Unternehmen.
- Datenanalyse und -visualisierung: Mit Bibliotheken wie Pandas für die Datenanalyse und Matplotlib und Seaborn für die Visualisierung ermöglicht Python es Datenwissenschaftlern, Erkenntnisse aus Daten zu gewinnen und diese in einer visuell ansprechenden Weise zu präsentieren. Diese Fähigkeit ist entscheidend, um Datentrends und -muster zu verstehen und fundierte Entscheidungen zu treffen.
Jupyter Notebooks
Jupyter Notebooks sind eine Open-Source-Webanwendung, mit der Benutzer Dokumente erstellen und teilen können, die Live-Code, Gleichungen, Visualisierungen und erzählenden Text enthalten. Jupyter Notebooks sind eine Hommage an die Programmiersprachen Julia, Python und R. Jupyter Notebooks unterstützen über 40 Programmiersprachen und sind ein vielseitiges Werkzeug für Data Science, wissenschaftliche Berechnungen, Computerjournalismus und Bildungszwecke. Es wurde im Rahmen des Projekts Jupyter entwickelt und hat sich zu einem zentralen Werkzeug im datenwissenschaftlichen Arbeitsablauf entwickelt, das eine einzigartige Kombination von Funktionen bietet, die interaktives Rechnen und Datenanalyse fördern.
Die Rolle von Jupyter Notebooks in Data Science und in verwandten Bereichen ist aufgrund mehrerer Hauptmerkmale sehr wichtig:
- Interactive Computing: Das Herzstück von Jupyter Notebooks ist die Möglichkeit, Code Schritt für Schritt auszuführen und dabei sofortiges Feedback zu erhalten. Diese Interaktivität erleichtert das experimentelle und explorative Computing und ermöglicht es Datenwissenschaftlern, Hypothesen zu testen, Code zu verfeinern und Daten im laufenden Betrieb zu analysieren.
- Umfassende Dokumentation: Mit Jupyter Notebooks können Benutzer ihren Code mit reichhaltigen Textelementen wie Gleichungen, Visualisierungen und erzählendem Text begleiten. Diese Integration von Code und Inhalt macht Notebooks zu einem idealen Werkzeug für die Dokumentation, den Unterricht und den Austausch umfassender Analysen, da der Text den Leser durch die Logik und den Prozess hinter der Analyse führen kann.
- Zusammenarbeit und gemeinsame Nutzung: Jupyter-Notizbücher können leicht zwischen Nutzern oder öffentlich geteilt werden, was die Zusammenarbeit zwischen Datenwissenschaftlern, Forschern und Lehrern erleichtert. Notebooks können in verschiedene Formate exportiert werden, darunter HTML, PDF und Diashows, was die Präsentation und Weitergabe von Ergebnissen an ein größeres Publikum vereinfacht.
- Visualisierungsunterstützung: Durch die Unterstützung von Bibliotheken wie Matplotlib, seaborn und Plotly sind Jupyter Notebooks leistungsstarke Werkzeuge für die Datenvisualisierung. Benutzer können Grafiken und Diagramme direkt im Notebook erstellen und mit ihnen interagieren, was eine dynamische Datenexploration und -visualisierung ermöglicht.
- Flexibel und erweiterbar: Jupyter Notebooks sind in hohem Maße erweiterbar, mit Unterstützung für Plugins und Erweiterungen, die zusätzliche Funktionen wie Versionskontrolle, Code-Linting und interaktive Widgets hinzufügen. Diese Flexibilität stellt sicher, dass Jupyter Notebooks auf die spezifischen Anforderungen eines Projekts oder Workflows zugeschnitten werden können.
- Pädagogisches Werkzeug: Neben ihrer Verwendung in der Datenwissenschaft haben sich Jupyter Notebooks zu einem beliebten Bildungswerkzeug entwickelt. Sie ermöglichen es Pädagogen, interaktive Lehrbücher zu erstellen, die Live-Code, Gleichungen und Erzählungen kombinieren und so eine praxisnahe Lernerfahrung bieten. Die Schüler können direkt mit dem Material interagieren, was es zu einem effektiven Werkzeug für die Vermittlung von Programmier- und Datenwissenschaftkonzepten macht.
Verwendung des JupyterHub der FH Münster
Eine vollständig eingerichtete Arbeitsumgebung unter Verwendung von JupyterHub finden Sie unter jupyter.fh-muenster.de.
Die Anmeldung unter jupyter.fh-muenster.de erfolgt über die FH-Kennung und das dazugehörige Passwort:
Im nächsten Schritt ist das passende Image auszuwählen, das für die Vorelsung vorgegeben wird (in der Regel FB09 Bücker):

Anschließend benötigt das Laden des Images ein wenig Zeit:

Schließlich steht ein Jupyter Notebook als Arbeitsumgebung zur Verfügung:

Installation von Python und Jupyter Notebooks
Um Python und Jupyter auf einem persönlichen Computer zu installieren und einzurichten, können Sie den folgenden Anweisungen folgen. Diese Anleitung geht davon aus, dass Sie Windows, macOS oder Linux als Betriebssystem verwenden.
Schritt 1: Python installieren
- Besuchen Sie die offizielle Python-Website um die neueste Version von Python herunterzuladen.
- Wählen Sie das für Ihr Betriebssystem passende Installationspaket aus.
- Starten Sie den Download und führen Sie anschließend die Installationsdatei aus. Stellen Sie sicher, dass Sie während des Installationsprozesses die Option auswählen, um Python zur Umgebungsvariablen PATH hinzuzufügen. Dies ermöglicht es Ihnen, Python und Pip (den Python-Paketmanager) von der Kommandozeile aus zu verwenden.
Schritt 2: Pip verwenden, um Jupyter zu installieren
Nachdem Python installiert ist, können Sie Pip (Python’s Paketmanager) verwenden, um Jupyter zu installieren. Öffnen Sie dafür das Terminal (Linux/macOS) oder die Eingabeaufforderung bzw. PowerShell (Windows) und führen Sie den folgenden Befehl aus:
Schritt 3: Jupyter Notebook starten
Um Jupyter Notebook zu starten, öffnen Sie das Terminal oder die Eingabeaufforderung/PowerShell und geben Sie den folgenden Befehl ein:
jupyter notebook
Dieser Befehl startet den Jupyter Notebook Server und öffnet automatisch Ihr Standard-Webbrowserfenster, das die Jupyter-Oberfläche anzeigt. Von hier aus können Sie neue Notebooks erstellen, vorhandene öffnen und mit Python in einer interaktiven Umgebung arbeiten.
Zusätzliche Schritte
Für eine erweiterte Nutzung oder spezifische Pakete kann es erforderlich sein, zusätzliche Bibliotheken über Pip zu installieren. Dies kann mit dem Befehl pip install gefolgt vom Namen des Pakets erfolgen. Beispiel:
pip install numpy pandas matplotlib