Grundlagen des Modellierens
Letzte Änderung am 14. July 2025 um 08:58:42
“Curiosity is the beginning of knowledge. Action is the beginning of change.” — James Clear
In diesem Teil des Buches und den folgenden Kapiteln wollen wir uns mit der statistischen Modellierung von Daten beschäftigen. Wir fangen erstmal mit einem simplen linearen Modell an und erweitern dann dieses Modell zu einem multiplen Modell. Das heißt, wir haben ein Messwert \(y\), was normalverteilt ist, sowie eine Einflussvariable \(x\), die eine kontinuierliche Variable ist. Wir wollen jetzt herausfinden, welchen Einfluss oder Effekt die Einflussvariable \(x\) auf den Messwert \(y\) hat. Hier nutzen wir dann die Steigung \(\beta_1\) um den Effekt zu bestimmen. Sehr simple gesprochen legen wir eine Gerade durch eine Punktewolke. Ziel ist es jetzt die Geradengleichung mit der Steigung und dem y-Achsenabschnitt aus Daten zu bestimmen. Wir konzentrieren wir uns hierbei aber erst einmal auf ein normalverteilten Messwert und nutzen eine Gaussian linearen Regression.
Dabei hat ein simples lineares Modell nur eine Einflussvariable \(x_1\). Damit können wir den einfachen Zusammenhang zwischen zwei Variablen erklären. Wir nutzen die simple Modellierung um zu verstehen, wie eine statistische Modellierung funktioniert. Im nächsten Schritt erweitern wir dann die simple Modellierung zu multiplen Modellierung.
Ein multiples lineares Modell hat mehrere Einflussvariablen \(x_1, ..., x_p\). Damit haben wir dann auch die Möglichkeit komplexere Zusammenhänge darzustellen und zu modellieren. In der Praxis wird die multiple Modellierung genutzt, hier rechnen wir dann aber alles mit R und nicht mehr mit der Hand.
Viele der Konzepte, die ich in den folgenden Abschnitten vorstelle, brauchen wir in den folgenden Kapiteln und in den Abschnitten zum statistischen Modellieren. Wir lernen hier also eher die Aufwärmübungen und Konzepte um dann multiple lineare Regressionen mit anderen Verteilungsfamilien als der Normalverteilung rechnen zu können. In den seltensten Fällen reichen simple lineare Modell aus, um die Realität abzubilden. Fangen wir also mit den Grundlagen an und bauen dann systematisch die Konzepte der simplen linearen Regression auf.