Code aus der Vorlesung

Vorlesung vom 04.04.2025

(1+1+3)*2
[1] 10
(1+1+3)*2
[1] 10
5-2
[1] 3
10/2
[1] 5
log(8,2)
[1] 3
log(x = 8, base = 2)
[1] 3
log(base = 2, x = 8)
[1] 3
log(2,8)
[1] 0.3333333
log(1)
[1] 0
x <- 5
x <- 10

x*3
[1] 30
y <- "gut"

v <- c(4,5,2,9,5)
v/2
[1] 2.0 2.5 1.0 4.5 2.5
v2 <- c("gut", "schlecht", "mittel", "schlecht")

v3 <- 1:20
m <- matrix(v3, 
            nrow = 4, 
            byrow = TRUE)



df <- data.frame(Name = c("Mueller", "Meyer", "Schneider", "Meyer", "Meier"), 
                 Alter = c(45,23,62,32,22), 
                 Premiumkunde = c(TRUE, FALSE, FALSE, TRUE, TRUE))

mean(df$Alter)
[1] 36.8
# Erstellen eines Vektors mit den Verspätungen
verspaetungen <- c(10, 20, 5, 10, 30, 
                   25, 5, 5, 10, 20, 
                   15, 10, 5, 20, 15, 
                   10, 5, 20, 25, 10)


#Tabelle mit absoluten Häufigkeiten
haeufigkeiten <- table(verspaetungen)

#Tabelle mit relativen Häufigkeiten
prop.table(haeufigkeiten)
verspaetungen
   5   10   15   20   25   30 
0.25 0.30 0.10 0.20 0.10 0.05 
# relative Häufigkeiten der Gänge
prop.table(table(mtcars$gear))

      3       4       5 
0.46875 0.37500 0.15625 
plot(prop.table(table(mtcars$gear)),
     type = "h",
     xlab = "Gänge",
     ylab = "relative Häufigkeit")

# Absoluten Häufigkeiten der Viertelmeilenzeit
table(mtcars$qsec)

 14.5  14.6 15.41  15.5 15.84 16.46  16.7 16.87  16.9 17.02 17.05  17.3  17.4 
    1     1     1     1     1     1     1     1     1     2     1     1     1 
17.42  17.6 17.82 17.98    18  18.3 18.52  18.6 18.61  18.9 19.44 19.47  19.9 
    1     1     1     1     1     1     1     1     1     2     1     1     1 
   20 20.01 20.22  22.9 
    1     1     1     1 
# Visualisierungen
plot(table(mtcars$qsec),
     xlab = "Viertelmeilenzeit",
     ylab = "absolute Häufigkeit")

hist(mtcars$qsec,
     xlab = "Vierteilmeilenzeit",
     main = "",
     breaks = 3)

hist(mtcars$qsec,
     xlab = "Vierteilmeilenzeit",
     main = "",
     breaks = c(14,16,18,20,24))

Vorlesung vom 11.04.2025

# Aufgabe 2.1

# Absolute Häufigkeiten des Ursprungs der Aufträge
## 120 Aufträge stammen aus Bayern, 
## 136 aus Niedersachsen, 
## 301 aus Hessen,
## 80 aus dem Saarland und 
## 326 aus Nordrhein-Westfalen

df <- data.frame(Bundesland = c("Bayern", "Niedersachsen", 
                                "Hessen", "Saarland", 
                                "Nordrhein-Westfalen"),
                 Haeufigkeit = c(120,136,301,80,326))

barplot(height = df$Haeufigkeit,
        names.arg = df$Bundesland)

# Empirische Verteilungsfunktion für qseq

plot(ecdf(mtcars$qsec))

hist(mtcars$qsec)

boxplot(mtcars$qsec)

# Aufgabe 4.1

mieten <- c(300,250,400,500,250,600,300,300,450,400)

## Lagemaße
mean(mieten)
[1] 375
median(mieten)
[1] 350
## Streuungsmaße

### Mittlere absolute Abweichung
mean(abs(mieten-median(mieten)))
[1] 95
### Median der absoluten Abweichung
median(abs(mieten-median(mieten)))
[1] 75
### Varianz
n <- length(mieten)
mean((mieten - mean(mieten))^2)
[1] 12125
var(mieten)*(n-1)/n
[1] 12125
### Standardabweichung
sqrt(mean((mieten - mean(mieten))^2))
[1] 110.1136
sd(mieten)*sqrt((n-1)/n)
[1] 110.1136
### Spannweite
diff(range(mieten))
[1] 350

Vorlesung vom 09.05.2025

# Laden der Daten
library(MSBStatsData)


# Berechnung der paarweisen Korrelationen
round(cor(decathlon), 2)
                race100m longjump shotput highjump race400m race110mhurdles
race100m            1.00    -0.48   -0.15    -0.12     0.57            0.45
longjump           -0.48     1.00    0.25     0.36    -0.31           -0.38
shotput            -0.15     0.25    1.00     0.16    -0.03           -0.25
highjump           -0.12     0.36    0.16     1.00    -0.11           -0.25
race400m            0.57    -0.31   -0.03    -0.11     1.00            0.38
race110mhurdles     0.45    -0.38   -0.25    -0.25     0.38            1.00
discus             -0.12     0.20    0.72     0.14    -0.04           -0.22
polevault          -0.17     0.27    0.25     0.19    -0.13           -0.29
javelinthrow       -0.06     0.17    0.44     0.07    -0.02           -0.13
race1500m          -0.09     0.02    0.11    -0.01     0.38            0.01
                discus polevault javelinthrow race1500m
race100m         -0.12     -0.17        -0.06     -0.09
longjump          0.20      0.27         0.17      0.02
shotput           0.72      0.25         0.44      0.11
highjump          0.14      0.19         0.07     -0.01
race400m         -0.04     -0.13        -0.02      0.38
race110mhurdles  -0.22     -0.29        -0.13      0.01
discus            1.00      0.27         0.42      0.08
polevault         0.27      1.00         0.19     -0.01
javelinthrow      0.42      0.19         1.00      0.02
race1500m         0.08     -0.01         0.02      1.00
# Aufgabe 5.4

kontingenztafel <- matrix(c(17,149,19,141), ncol = 2, byrow = TRUE)

## Chi-Quadrat
chisq <- chisq.test(kontingenztafel, 
                    correct = FALSE)

chisq$statistic
X-squared 
0.2214463 
## Cramérs V
n <- sum(kontingenztafel)
k <- min(ncol(kontingenztafel),
         nrow(kontingenztafel))

V <- sqrt(chisq$statistic/(n*(k-1)))

V
 X-squared 
0.02606306 

Vorlesung vom 16.05.2025

# X~GV(1,5)

## Dichtefunktion
dunif(c(1,4,5,100), min = 1, max = 5)
[1] 0.25 0.25 0.25 0.00
curve(dunif(x, min = 1, max = 5), 
      from = -2, to = 7, col = "darkblue")

# Verteilungsfunktion

punif(0, min = 1, max = 5)
[1] 0
punif(3, min = 1, max = 5)
[1] 0.5
curve(punif(x, min = 1, max = 5), 
      from = -2, to = 7, col = "darkblue")

# P(2 <= X <= 4,5) = F(4.5) - F(2)

punif(4.5, min = 1, max = 5) - punif(2, min = 1, max = 5)
[1] 0.625
integrate(function(x) dunif(x, min = 1, max = 5), 
          lower = 2, upper = 4.5)
0.625 with absolute error < 6.9e-15
# (Pseudo-)Zufallszahl

set.seed(123)
x <- runif(n = 1000000, min = 1, max = 5)

all(x<=5)
[1] TRUE
all(x>=1)
[1] TRUE
# Darstellung der Häufigkeiten
boxplot(x)

hist(x, xlim=c(-2,7))

plot(ecdf(x), xlim=c(-2,7))

mean(x >= 2 & x <= 4.5)
[1] 0.62396
## 100 mal würfeln

set.seed(123)
wuerfe <- sample(x = 1:6, size = 100000, replace = TRUE)

prop.table(table(wuerfe))
wuerfe
      1       2       3       4       5       6 
0.16685 0.16818 0.16656 0.16536 0.16774 0.16531 
Zurück nach oben