Hausarbeit 2
Data Wrangling in R
Aufgaben (10 Punkte)
In dieser zweiten Hausaufgabe sollen Sie den Umgang mit Daten in R vertiefen. Dazu wollen wir Daten zu Verkaufszahlen von Videospielen verwenden, die in dieser Datenbank zu finden sind.
Die für diese Aufgabe betrachtete Datenbank bietet einen umfassenden Überblick über Videospiele, deren Plattformen, Genres, Herausgeber sowie Verkaufszahlen in verschiedenen Regionen. Sie enthält detaillierte Informationen zu einzelnen Spielen, den Plattformen, auf denen sie veröffentlicht wurden, den Veröffentlichungsjahren, sowie den Verkaufszahlen in Europa, Japan, Nordamerika und anderen Regionen. Die Datenbank ist speziell für Analysen im Bereich der Videospieleindustrie konzipiert, um Trends zu erkennen, die Beliebtheit von Genres zu analysieren, die Leistung von Herausgebern zu bewerten und die Marktdurchdringung in verschiedenen Regionen zu erforschen. Sie besteht aus 6 Haupttabellen: game
, platform
, game_platform
, publisher
, game_publisher
und sales
, die so gestaltet sind, dass sie umfassende Abfragen zur Erforschung von Trends und Mustern in der Videospieleindustrie ermöglichen.
Nutzen Sie für die folgenden Analysen die Tools, welche Sie in der Vorlesung kennen gelernt haben, d.h. insbesondere die Pakete dpylr
1 und dbplyr
. Die folgenden Aufgaben bzw. Fragen sind sehr offen gestellt, d.h. Sie haben viele Freiheitsgrade, eine passende Antwort mit Hilfe von Datenanalysen zu finden. Ihre Aufgabe besteht darin, geeignete Kennzahlen und Darstellungen zu wählen und diese Analysen adäquat in R umzusetzen.
1. Aufgabe (2 Punkte)
Welches ist das meist verkaufte Spiel über alle Plattformen und Regionen hinweg? Wie ändert sich das Ergebnis, wenn Sie als Plattform nur Playstation und XBox betrachten?
2. Aufgabe (4 Punkte)
Welche Spieleplattform ist je Region am populärsten? Wie erklären Sie sich das Ergebnis?
3. Aufgabe (4 Punkte)
Welche Genres sind je Region am beliebtesten? Interpretieren Sie das Ergebnis!
Abgabe
Abgabe des Codes und der Erklärungen/Interpretation in Form eines Quarto Skripts und des dazugehörigen HTMLs über Teams bis zum 15.11.2024. Bitte nutzen Sie für die Abgabe die Vorlage Abgabe_Hausaufgabe2_ab123456.qmd
und ersetzen im Dateinamen ab123456
durch Ihre FH Kennung sowie im RMarkdown Dokument ebenfalls Ihren Namen und die Matrikelnummer. Die Vorlage finden Sie auch in der Workbench unter dem Pfad /home/share/datascience/templates/Abgabe_Hausaufgabe2_ab12345.qmd
.
Bewertungskriterien
- Umfang der bearbeiteten Aufgaben.
- Korrektheit und Vollständigkeit des Codes.
- Effizienz und Klarheit des Codes.
- Einhaltung der Programmierstandards und -konventionen.