Code aus der Vorlesung

Vorlesung vom 22.03.2024

Häufigkeiten der Verspätungen

# Erstellen eines Vektors mit den Verspätungen
verspaetungen <- c(10, 20, 5, 10, 30, 
                   25, 5, 5, 10, 20, 
                   15, 10, 5, 20, 15, 
                   10, 5, 20, 25, 10)

# Stabiagramm auf Basis absoluter Häufigkeiten
plot(table(verspaetungen), type = "h",
     xlab = "Verspätungen",
     ylab = "absolute Häufigkeiten")

Histogramm der Bierpreise

bierpreise <- c(2.10,  2.30,  2.00,  2.20,  2.35,  2.10,  2.25,  1.80,  2.00,  2.50,
                1.95,  2.15,  1.90,  2.30,  2.10,  1.85,  2.20,  2.15,  1.85,  1.95)

hist(bierpreise, breaks = c(1.8,2,2.2,2.5),
     right = FALSE)

hist(mtcars$qsec, right = FALSE,
     breaks = c(14,16,17,18,19,20,21,25))

Vorlesung vom 19.04.2024

Empirische Verteilungsfunktion der Zugverspätungen

# Erstellen eines Vektors mit den Verspätungen
verspaetungen <- c(10, 20, 5, 10, 30, 
                   25, 5, 5, 10, 20, 
                   15, 10, 5, 20, 15, 
                   10, 5, 20, 25, 10)

ecdf(verspaetungen)
Empirical CDF 
Call: ecdf(verspaetungen)
 x[1:6] =      5,     10,     15,  ...,     25,     30
plot(ecdf(verspaetungen), 
     main = "Empirische Verteilungsfunktion", 
     xlab = "x (Verspätung in Minuten)",
     ylab = "F(x)")

Empirische Verteilungsfunktion des Merkmals qsec aus dem Datensatz mtcars

plot(ecdf(mtcars$qsec),
     main = "Empirische Verteilungsfunktion",
     xlab = "qsec",
     ylab = "F(x)")

Vorlesung vom 24.05.2024

Lineare Regression (Beispiel)

# Datensatz erstellen
df_miete <- data.frame(Wohnflaeche = c(55,65,65,80,95),
                       Kaltmiete = c(300,340,410,435,530))

# Korrelation
cor(df_miete$Wohnflaeche, df_miete$Kaltmiete)
[1] 0.9532826
# Regressionsgerade
model_miete <- lm(Kaltmiete ~ Wohnflaeche, data = df_miete)

# Visualisierung
plot(x = df_miete$Wohnflaeche,
     y = df_miete$Kaltmiete,
     xlab = "Wohnfläche",
     ylab = "Kaltmiete")
abline(model_miete, col = "red")

# Vorhersage
df_miete_neu <- data.frame(Wohnflaeche = c(85))
predict(model_miete, newdata = df_miete_neu)
       1 
473.5714 

Softwareaufgabe 6.1

mtcars_modell <- lm(mpg ~ cyl + hp + disp, data = mtcars)
summary(mtcars_modell)

Call:
lm(formula = mpg ~ cyl + hp + disp, data = mtcars)

Residuals:
    Min      1Q  Median      3Q     Max 
-4.0889 -2.0845 -0.7745  1.3972  6.9183 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 34.18492    2.59078  13.195 1.54e-13 ***
cyl         -1.22742    0.79728  -1.540   0.1349    
hp          -0.01468    0.01465  -1.002   0.3250    
disp        -0.01884    0.01040  -1.811   0.0809 .  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.055 on 28 degrees of freedom
Multiple R-squared:  0.7679,    Adjusted R-squared:  0.743 
F-statistic: 30.88 on 3 and 28 DF,  p-value: 5.054e-09
mtcars_neu <- data.frame(cyl = 8, disp = 200, hp = 150)
predict(mtcars_modell, newdata = mtcars_neu)
       1 
18.39604 
Zurück nach oben