Letzte Änderung am 17. February 2025 um 20:30:12

“The ‘C’ students run the world” — Harry Truman

Stand des Kapitels: Konstruktion (seit 02.2025)

Dieses Kapitel wird in den nächsten Wochen geschrieben. Ich plane zum Ende des SoSe 2025 eine neue Version des Kapitels erstellt zu haben. Während das Kapitel entsteht, funktioniert so manaches dann nicht so wie es soll.

Das Modell

Beginnen wir also mit der Festlegung welche Art der Analyse wir rechnen wollen. Wichtig ist hier, dass du einen normmalverteiten Messwert \(y\) vorliegen hast und ein oder mehrere Faktoren \(f\). Was sind im Kontext von R Faktoren? Ein Faktor ist eine Behandlung oder eben eine Spalte in deinem Datensatz, der verschiedene Gruppen oder Kategorien beinhaltet. Wir nennen diese Kategorien Level. In den folgenden Datenbeispielen ist die Spalte animal ein Faktor mit drei Leveln. Wir haben dort nämlich die Sprungweiten von drei Floharten gemessen. Jetzt kann es aber auch sein, dass du neben einem Faktor noch eine numeriche Kovariate \(c\) gemessen hast. Oder aber du hast zwei Messwerte, die du dann gemeinsam mit einem Faktor vergleichen willst. Diese drei Analysetypen wollen wir uns in den folgenden Tabs mal näher anschauen.

33.1 MANOVA (multivariat)

Am Ende des Kapitels schauen wir uns noch einen weiteren Spezialfall an. Nämlich den Fall, dass wir nicht nur einen Messwert \(y\) vorliegen haben sondern eben mehrere die wir simultan auswerten wollen. Das klingt jetzt erstmal etwas schräg, aber es wird dann klarer, wenn wir uns die Sachlage einmal an einem Beispiel anschauen.

\[ (y_1, y_2, ..., y_j) \sim f_A + f_B + ... + f_P + f_A \times f_B \]

mit

  • \((y_1, y_2)\) gleich der Messwerte oder Outcomes
  • \(f_A + f_B + ... + f_P\) gleich experimenteller Faktoren
  • \(f_A \times f_B\) gleich einem beispielhaften Interaktionsterm erster Ordnung

Die ganze multivariate Analyse ist dann etwas seltener, da wir hier dann doch schon einiges an Fallzahl brauchen, damit es dann auch einen Sinn macht. Einiges an Fallzahl heißt dann hier, dass wir dann schon mehr als sechs Beobachtungen in einer Gruppe haben sollten. Wenn du weniger hast, kann es sein, dass du keine signifikanten Unterschiede findest.

Daneben gibt es natürlich noch Spezialfälle wie die gemischte ANOVA (eng. mixed ANOVA), wenn wir Beobachtungen wiederholt messen. Dieses Modell schauen wir uns dann auch nochmal an. Der Unterschied in der Modellierung ist ein Fehlerterm (eng. Error), den wir dann nochmal mit angeben müssen. Dazu dann aber mehr in dem Kapitel zur repeated & mixed ANOVA.

Die MANOVA

Testing the Assumptions of ANOVAs

One-Way MANOVA in R

33.2 Allgemeiner Hintergrund

Gueorguieva und Krystal (2004) mit der wissenschaftlichen Veröffentlichung Move Over ANOVA

“Mixed-effects models use all available data, can properly account for correlation between repeated measurements on the same subject, have greater flexibility to model time effects, and can handle missing data more appropriately. Their flexibility makes them the preferred choice for the analysis of repeatedmeasures data”Gueorguieva und Krystal (2004)

“However, the fundamental difference is that in a mixed ANOVA, the subjects that undergo each condition (e.g., a control and treatment) are different, whereas in a two-way repeated measures ANOVA, the subjects undergo both conditions (e.g., they undergo the control and the treatment).”Two-way repeated measures ANOVA using SPSS Statistics

Weitere Tutorien für die repeated & mixed ANOVA

Wir oben schon erwähnt, kann dieses Kapitel nicht alle Themen der ANOVA abarbeiten. Daher präsentiere ich hier eine Liste von Literatur und Links, die mich für dieses Kapitel hier inspiriert haben. Nicht alles habe ich genutzt, aber vielleicht ist für dich was dabei.

33.3 Genutzte R Pakete

Wir wollen folgende R Pakete in diesem Kapitel nutzen.

R Code [zeigen / verbergen]
pacman::p_load(tidyverse, magrittr, broom, WRS2, scales,
               readxl, see, car, patchwork, emmeans,
               interactions, effectsize, afex, report,
               conflicted)
conflicts_prefer(dplyr::mutate)
conflicts_prefer(dplyr::summarize)
conflicts_prefer(dplyr::filter)
cbbPalette <- c("#000000", "#E69F00", "#56B4E9", "#009E73", 
                "#F0E442", "#0072B2", "#D55E00", "#CC79A7")

An der Seite des Kapitels findest du den Link Quellcode anzeigen, über den du Zugang zum gesamten R-Code dieses Kapitels erhältst.

33.4 Daten

Mit Messwiederholung und Subjekt gleich

R Code [zeigen / verbergen]
repated_fac3_tbl <- read_excel("data/fleas_complex_data.xlsx", sheet = "repeated") |> 
  select(animal, stage, t0:t3) |> 
  rowid_to_column(".id") |>   
  pivot_longer(cols = t0:t3,
               values_to = "jump_length",
               names_to = "time_num") |> 
  mutate(animal = as_factor(animal),
         stage = factor(stage, level = c("juvenile", "adult")),
         time_fac = as_factor(time_num),
         jump_length = round(jump_length, 2))
Tabelle 33.1— foo.
tinytable_dziyyaulolcr2qe0ohqh
animal stage t0 t1 t2 t3
cat adult 25.38 23.65 25.69 26.7
cat adult 30.03 18.85 14.13 20.09
cat adult 25.09 18.55 16.33 18.87
... ... ... ... ... ...
fox juvenile 46.28 31.85 29.87 21.36
fox juvenile 41.43 39.68 27.66 27.44
fox juvenile 36.18 36.48 30.1 31.28
Abbildung 33.1— Darstellung der Varianzhomogenität und Varianzheterogenität in einem Barplot. [Zum Vergrößern anklicken]

Mit Messwiederholung und Subjekt ungleich

R Code [zeigen / verbergen]
mixed_fac3_tbl <- read_excel("data/fleas_complex_data.xlsx", sheet = "mixed") |> 
  select(animal, stage, spring:winter) |> 
  rowid_to_column(".id") |>   
  pivot_longer(cols = spring:winter,
               values_to = "jump_length",
               names_to = "season_num") |> 
  mutate(animal = as_factor(animal),
         stage = factor(stage, level = c("juvenile", "adult")),
         season_fac = as_factor(season_num),
         jump_length = round(jump_length, 2))
Tabelle 33.2— foo.
tinytable_got1x4cbpl5v9leiwp2g
animal stage spring summer autumn winter
cat adult 28.71 31.84 17.92 26.85
cat adult 26.02 33.32 20.01 17.1
cat adult 22.39 23.6 10.29 15.51
... ... ... ... ... ...
fox juvenile 48.88 54.36 24.94 41.92
fox juvenile 51.16 55.93 37.93 46.02
fox juvenile 47.61 57.66 30.3 40.39
Abbildung 33.2— Darstellung der Varianzhomogenität und Varianzheterogenität in einem Barplot. [Zum Vergrößern anklicken]

33.5 Repeated measurement ANOVA

Hier eine kurze Betrachtung. Mehr dazu in dem Kapitel zu gemischten Modellen

33.6 Mixed ANOVA

Hier eine kurze Betrachtung. Mehr dazu in dem Kapitel zu gemischten Modellen

Referenzen

Friedrich S, Konietschke F, Pauly M. 2019. Resampling-based analysis of multivariate data and repeated measures designs with the R package MANOVA. RM.
Gueorguieva R, Krystal JH. 2004. Move over anova: progress in analyzing repeated-measures data andits reflection in papers published in the archives of general psychiatry. Archives of general psychiatry 61: 310–317.