67 Metaanalysen

Letzte Änderung am 15. October 2025 um 15:46:10

“The only way to test a hypothesis is to look for all the information that disagrees with it.” — Karl Popper

Dieses Kapitel ist archiviert

Ich benötige die Thematik aktuell nicht in meiner Lehre oder der statistischen Beratung. Mir ist es als Nachschlagewerk aber immer noch wichtig zu behalten. Archivierte Kapitel werden nicht von mir weiter gepflegt oder ergänzt. Auftretende Fehler werden aber natürlich beseitigt, wenn die Fehler mir auffallen oder gemeldet werden.

In diesem Kapitel wollen wir uns einmal die Metaanalyse oder indirekte Vergleiche anschauen. Wir halten das Kapitel bewusst kurz, denn wenn wir das Thema ausführlich behandeln wollten, dann wäre es ein eigenes Buch. Das wollen wir aber nicht, es reicht, wenn wir hier die Grundlagen verstehen. Das heißt vor allem, dass wir die Daten so erstellt kriegen, dass wir selber eine Marktanalyse rechnen können. Der Fokus ist hier auf den Agrarwissenschaften, aber die Beispiele wurden von mir aus dem “Doing Meta-Analysis with R: A Hands-On Guide” von Harrer et al. (2021) adaptiert und in einen neuen Kontext gesetzt. Wenn du wirklich eine Metaanalyse rechnen willst, dann musst du nochmal durch das Buch von Harrer et al. (2021) oder den Artikel von Balduzzi et al. (2019) durcharbeiten.

Also gut, was macht also eine Metananalyse oder warum heißt es den indirekter Vergleich? Wenn wir normalerweise ein Experiment durchführen, dann messen wir verschiedene Outcomes und Einflussvariablen, rechnen ein Modell oder einen einfacheren statistischen Test und berichten die Effektschätzer und den \(p\)-Wert in einer wissenschaftlichen Veröffentlichung. Hier setzt die Metaanalyse dann an. Wir kombinieren nämlich die Ergebnisse und damit die Effektschätzer verschiedener Studien in einer riesigen Studie. Und diese riesige Studie nennen wir dann Metaanalyse. Wir kombinieren hierbei nur die Effektschätzer aus den verschiedenen Studien. Der algorithmische Prozess ist nicht so simple, basiert aber auf der wichtigen Annahme, dass die Studien alle in etwa homogen sind. Der Begriff ist hier sehr weit gefasst. Alle Studien müssen natürlich das gleiche Outcome haben, die gleichen Menschen, Tiere oder Pflanzen beobachten sowie das statistische Modell muss das Gleiche sein. Du siehst schnell, bevor du eine Metaanalyse rechnen kannst, geht sehr viel Zeit in die Suche nach passenden wissenschaftlichen Veröffentlichungen. Daher ist jeder Metaanalyse eigentlich eine systematische Literaturrecherche (eng. systematic review) vorgeschaltet. Wenn du mehr darüber lesen möchtest, dann kann dir Tawfik et al. (2019) einen Einstieg liefern.

Das ist hier natürlich eine Metanalyse für Arme. Wie man es richtig umfangreich macht, findest du in einem sehr gutem und umfangreichen Tutorial zu Doing Meta-Analysis in R: A Hands-on Guide

Noch als kleine Randbemerkung, wenn du aus den medizinischen Bereich kommst, dann solltest du die Leitlinien in den Allgemeinen Methoden des Institut für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) zu den Metaanalysen oder indirketen Vergleichen kennen. Wir können hier leider nicht in die Tiefe der Leitlinien abtauchen.

67.1 Genutzte R Pakete

Wir wollen folgende R Pakete in diesem Kapitel nutzen.

R Code [zeigen / verbergen]

pacman::p_load(tidyverse, magrittr, meta, conflicted)

An der Seite des Kapitels findest du den Link Quellcode anzeigen, über den du Zugang zum gesamten R-Code dieses Kapitels erhältst.

67.2 Daten

Woher kommen eigentlich die Daten einer Metaanalyse? Wir können Google Scholar nutzen um zu einem Thema systematisch wissenschaftliche Veröffentlichungen zu suchen. Der Fokus liegt hier auf systematisch und beschreibt einen strukturierten Reviewprozess. In diesem Kapitel nutzen wir die Daten von Harrer et al. (2021) modifiziert auf ein agrarwissenschaftliches Beispiel. Wie immer liefert die originale Quelle noch mehr Informationen, wir kürzen hier einmal ab, damit wir die Kerngedanken verstehen.

A step by step guide for conducting a systematic review and meta-analysis with simulation data

Beginnen wir mit einer Datensatz in dem wir uns den Effekt von mittleren Erträgen in Weizen unter der Gabe von Eisen anschauen. Wir haben uns hier für eine Eisendosis mit \(10\mu mol\) entschieden, die in allen Studien vorgekommen ist. Dann haben wir noch geschaut wie viele Pflanzen in der Gruppe untersucht wurden und wie die mitteleren Effekte plus die Standardabweichung waren.

R Code [zeigen / verbergen]

drymatter_tbl <- read_excel("data/meta/drymatter_iron_studies.xlsx")

Schauen wir uns nochmal die Daten genauer an. Hier ist es besonders wichtig zu beachten, dass wir uns einen Wert aus einem ganzen Experiment anschauen und verschiedene Werte aus verschiedenen Experimenten dann miteinander in Verbindung setzen wollen.

Tabelle 67.1— Daten zu den Weizenerträgen nach der Gabe von einer Eisendosis mit \(10\mu mol\). In allen Studien wurde die gleiche Dosis auf die \(n\) Pflanzen gegeben.

author	n	mean	sd
DeRubeis, 2005	180	32.6	9.4
Dimidjian, 2006	145	31.9	7.4
Dozois, 2009	48	28.6	9.9
Lesperance, 2007	142	30.3	9.1
McBride, 2007	301	31.9	9.2
Quilty, 2014	104	29.8	8.6

Ein weiterer Effekt den wir uns anschauen können ist der Vergleich von Anteilen. In diesem Fall haben wir Ereignisse (eng. event) gezählt und wissen aber auch die Gesamtzahl an möglichen Ereignissen. Konkret haben wir die Anzahl an infizierten Sonnenblumensamen mit Mehltau nach der Behandlung mit MoldEx betrachtet. Dabei haben wir richtig viele Pflanzen (\(n\)) angeschaut und gezählt wie viele Samen dann mit Mehltau infiziert waren (event).

R Code [zeigen / verbergen]

sunflower_tbl <- read_excel("data/meta/infected_sunflower_studies.xlsx")

Auch hier haben wir einmal in die ganzen Studien zu dem Wirkstoff MoldEx geschaut und jeweils rausgeschrieben, wie viele Sonnenblumensamen (\(n\)) betrachtet wurden und wie viele von den Sonnenblumen dann infiziert waren (event).

Tabelle 67.2— Daten zu den mit Mehltau infizierten Sonnenblumensamen nach der Behandlung mit MoldEx.

author	event	n
Becker, 2008	2186	21826
Boyd, 2009	91	912
Boyd, 2007	126	1084
Cerda, 2014	543	7646
Fiellin, 2013	6496	55215
Jones, 2013	10850	114783
Lord, 2011	86	527
McCabe, 2005	668	9403
McCabe, 2012	843	11274
McCabe, 2013	647	8888
Nakawai, 2012	11521	126764
Sung, 2005	1111	11554
Tetrault, 2007	2090	16599
Wu, 2008	2193	25127
Zullig, 2012	1913	22783

Häufig kann es vorkommen, dass wir weder die Mittelwerte und die Standardabweichung vorliegen haben oder aber die Anteile. Meist haben wir dann Glück, dass wir Effektschätzer wie das Odds ratio (\(OR\)), Risk ratio (\(RR\)) für die Anteile vorliegen haben. Oder aber wir finden Cohen’s \(d\) oder Hedge’s \(g\) für den Effekt der standardisierten Mittelwertsunterschiede.

In unserem Fall haben wir jetzt Euterkrebsdaten von Kühen und die entsprechenden Hedge’s \(g\) Werte für die Differenz der Kontrolle zur Chemotherapie. Auch hier haben alle Kühe die gleiche Chemotherapie erhalten und wir sind nur an dem Effekt zu der Kontrolle interessiert. Es gibt also nur einen paarweisen Gruppenvergleich.

R Code [zeigen / verbergen]

cow_tbl <- read_excel("data/meta/cow_cancer_studies.xlsx")

Schauen wir uns nochmal einen Ausschnitt der Daten in der zu dem Euterkrebs von Kühen an.

Tabelle 67.3— Daten zum Euterkrebs von Kühen nach der Behandlung mit einer Chemotherapie zu einer Kontrolle.

Author	TE	seTE
Call et al.	0.71	0.26
Cavanagh et al.	0.35	0.20
DanitzOrsillo	1.79	0.35
de Vibe et al.	0.18	0.12
Frazier et al.	0.42	0.14
Frogeli et al.	0.63	0.20
Gallego et al.	0.72	0.22
Hazlett-Stevens & Oren	0.53	0.21
Hintz et al.	0.28	0.17
Kang et al.	1.28	0.34
Kuhlmann et al.	0.10	0.19
Lever Taylor et al.	0.39	0.23
Phang et al.	0.54	0.24
Rasanen et al.	0.43	0.26
Ratanasiripong	0.52	0.35
Shapiro et al.	1.48	0.32
Song & Lindquist	0.61	0.23
Warnecke et al.	0.60	0.25

Wir haben jetzt also insgesamt drei Datensätze. Einmal einen Datensatz zu Weizenerträgen mit dem Effekt der Mittelwerte, einen Datensatz der Infektionen von Sonnenblumen mit Anteilen sowie einem Datensatz mit Euterkrebs mit vorausberechneten Effektmaß Hedge’s \(g\).

67.3 Das Modell mit fixen Effekten

Die Idee hinter dem Modell mit fixen Effekten (eng. fixed effect) ist, dass die beobachteten Effektgrößen von Studie zu Studie variieren können, was aber nur auf den Stichprobenfehler zurückzuführen ist. In Wirklichkeit sind die wahren Effektgrößen alle gleich: die Effekte sind fix. Aus diesem Grund wird das Modell mit festen Effekten manchmal auch als Modell mit “gleichen Effekten” oder “gemeinsamen Effekten” bezeichnet.

Das Modell der festen Effekte geht davon aus, dass alle unsere Studien Teil einer homogenen Population sind und dass die einzige Ursache für Unterschiede in den beobachteten Effekten der Stichprobenfehler der Studien ist. Wenn wir die Effektgröße jeder Studie ohne Stichprobenfehler berechnen würden, wären alle wahren Effektgrößen absolut gleich.

67.4 Das Modell mit zufälligen Effekten

Das Modell der zufälligen Effekte (eng. random effect) geht davon aus, dass es nicht nur eine wahre Effektgröße gibt, sondern eine Verteilung der wahren Effektgrößen. Das Ziel des Modells mit zufälligen Effekten ist es daher nicht, die eine wahre Effektgröße aller Studien zu schätzen, sondern den Mittelwert der Verteilung der wahren Effekte.

In der Praxis ist es sehr ungewöhnlich, eine Auswahl von Studien zu finden, die vollkommen homogen ist. Dies gilt selbst dann, wenn wir uns an bewährte Verfahren halten und versuchen, den Umfang unserer Analyse so präzise wie möglich zu gestalten.

In vielen Bereichen, einschließlich der Medizin und der Sozialwissenschaften, ist es daher üblich, immer ein Modell mit zufälligen Effekten zu verwenden, da ein gewisses Maß an Heterogenität zwischen den Studien praktisch immer zu erwarten ist. Ein Modell mit festen Effekten kann nur dann verwendet werden, wenn keine Heterogenität zwischen den Studien festgestellt werden konnte und wenn wir sehr gute Gründe für die Annahme haben, dass der wahre Effekt fest ist. Dies kann zum Beispiel der Fall sein, wenn nur exakte Replikationen einer Studie betrachtet werden oder wenn wir Teilmengen einer großen Studie meta-analysieren. Natürlich ist dies nur selten der Fall, und Anwendungen des Modells mit festem Effekt “in freier Wildbahn” sind eher selten.

67.5 Indirekte Vergleiche in R

R Code [zeigen / verbergen]

m.mean <- metamean(n = n,
                   mean = mean,
                   sd = sd,
                   studlab = author,
                   data = drymatter_tbl,
                   sm = "MRAW",
                   fixed = FALSE,
                   random = TRUE,
                   method.tau = "REML",
                   hakn = TRUE,
                   title = "Ertrag von Weizen nach Eisenbehandlung")


summary(m.mean)

Review:     Ertrag von Weizen nach Eisenbehandlung

                    mean             95%-CI %W(random)
DeRubeis, 2005   32.6000 [31.2268; 33.9732]       18.0
Dimidjian, 2006  31.9000 [30.6955; 33.1045]       19.4
Dozois, 2009     28.6000 [25.7993; 31.4007]        9.1
Lesperance, 2007 30.3000 [28.8033; 31.7967]       17.0
McBride, 2007    31.9000 [30.8607; 32.9393]       20.7
Quilty, 2014     29.8000 [28.1472; 31.4528]       15.8

Number of studies: k = 6
Number of observations: o = 920

                        mean             95%-CI
Random effects model 31.1221 [29.6656; 32.5786]

Quantifying heterogeneity (with 95%-CIs):
 tau^2 = 1.0937 [0.0603; 12.9913]; tau = 1.0458 [0.2456; 3.6043]
 I^2 = 64.3% [13.8%; 85.2%]; H = 1.67 [1.08; 2.60]

Test of heterogeneity:
     Q d.f. p-value
 14.00    5  0.0156

Details of meta-analysis methods:
- Inverse variance method
- Restricted maximum-likelihood estimator for tau^2
- Q-Profile method for confidence interval of tau^2 and tau
- Calculation of I^2 based on Q
- Hartung-Knapp adjustment for random effects model (df = 5)
- Untransformed (raw) means

R Code [zeigen / verbergen]

m.prop <- metaprop(event = event,
                   n = n,
                   studlab = author,
                   data = sunflower_tbl,
                   method = "GLMM",
                   sm = "PLOGIT",
                   fixed = FALSE,
                   random = TRUE,
                   hakn = TRUE,
                   title = "Befall von Sonnenblumen mit Mehltau")
summary(m.prop)

Review:     Befall von Sonnenblumen mit Mehltau

               proportion           95%-CI
Becker, 2008       0.1002 [0.0962; 0.1042]
Boyd, 2009         0.0998 [0.0811; 0.1211]
Boyd, 2007         0.1162 [0.0978; 0.1368]
Cerda, 2014        0.0710 [0.0654; 0.0770]
Fiellin, 2013      0.1176 [0.1150; 0.1204]
Jones, 2013        0.0945 [0.0928; 0.0962]
Lord, 2011         0.1632 [0.1327; 0.1976]
McCabe, 2005       0.0710 [0.0659; 0.0764]
McCabe, 2012       0.0748 [0.0700; 0.0798]
McCabe, 2013       0.0728 [0.0675; 0.0784]
Nakawai, 2012      0.0909 [0.0893; 0.0925]
Sung, 2005         0.0962 [0.0908; 0.1017]
Tetrault, 2007     0.1259 [0.1209; 0.1311]
Wu, 2008           0.0873 [0.0838; 0.0908]
Zullig, 2012       0.0840 [0.0804; 0.0876]

Number of studies: k = 15
Number of observations: o = 434385
Number of events: e = 41364

                     proportion           95%-CI
Random effects model     0.0944 [0.0836; 0.1066]

Quantifying heterogeneity (with 95%-CIs):
 tau^2 = 0.0558; tau = 0.2362; I^2 = 98.3% [97.9%; 98.7%]; H = 7.74 [6.92; 8.66]

Test of heterogeneity:
           Q d.f.  p-value
 Wald 838.21   14 < 0.0001
 LRT  826.87   14 < 0.0001

Details of meta-analysis methods:
- Random intercept logistic regression model
- Maximum-likelihood estimator for tau^2
- Calculation of I^2 based on Q
- Random effects confidence interval based on t-distribution (df = 14)
- Logit transformation
- Clopper-Pearson confidence interval for individual studies

R Code [zeigen / verbergen]

m.gen <- metagen(TE = TE,
                 seTE = seTE,
                 studlab = Author,
                 data = cow_tbl,
                 sm = "SMD",
                 fixed = FALSE,
                 random = TRUE,
                 method.tau = "REML",
                 hakn = TRUE,
                 title = "Third Wave Psychotherapies")
summary(m.gen)

Review:     Third Wave Psychotherapies

                          SMD            95%-CI %W(random)
Call et al.            0.7091 [ 0.1979; 1.2203]        5.0
Cavanagh et al.        0.3549 [-0.0300; 0.7397]        6.3
DanitzOrsillo          1.7912 [ 1.1139; 2.4685]        3.8
de Vibe et al.         0.1825 [-0.0484; 0.4133]        7.9
Frazier et al.         0.4219 [ 0.1380; 0.7057]        7.3
Frogeli et al.         0.6300 [ 0.2458; 1.0142]        6.3
Gallego et al.         0.7249 [ 0.2846; 1.1652]        5.7
Hazlett-Stevens & Oren 0.5287 [ 0.1162; 0.9412]        6.0
Hintz et al.           0.2840 [-0.0453; 0.6133]        6.9
Kang et al.            1.2751 [ 0.6142; 1.9360]        3.9
Kuhlmann et al.        0.1036 [-0.2781; 0.4853]        6.3
Lever Taylor et al.    0.3884 [-0.0639; 0.8407]        5.6
Phang et al.           0.5407 [ 0.0619; 1.0196]        5.3
Rasanen et al.         0.4262 [-0.0794; 0.9317]        5.1
Ratanasiripong         0.5154 [-0.1731; 1.2039]        3.7
Shapiro et al.         1.4797 [ 0.8618; 2.0977]        4.2
Song & Lindquist       0.6126 [ 0.1683; 1.0569]        5.7
Warnecke et al.        0.6000 [ 0.1120; 1.0880]        5.2

Number of studies: k = 18

                             SMD           95%-CI    t  p-value
Random effects model (HK) 0.5771 [0.3782; 0.7760] 6.12 < 0.0001

Quantifying heterogeneity (with 95%-CIs):
 tau^2 = 0.0820 [0.0295; 0.3533]; tau = 0.2863 [0.1717; 0.5944]
 I^2 = 62.6% [37.9%; 77.5%]; H = 1.64 [1.27; 2.11]

Test of heterogeneity:
     Q d.f. p-value
 45.50   17  0.0002

Details of meta-analysis methods:
- Inverse variance method
- Restricted maximum-likelihood estimator for tau^2
- Q-Profile method for confidence interval of tau^2 and tau
- Calculation of I^2 based on Q
- Hartung-Knapp adjustment for random effects model (df = 17)

67.6 Forest Plots

Forest Plots

R Code [zeigen / verbergen]

forest(m.mean, 
            sortvar = TE,
            prediction = TRUE, 
            print.tau2 = FALSE)

R Code [zeigen / verbergen]

forest(m.prop, 
            sortvar = TE,
            prediction = TRUE, 
            print.tau2 = FALSE,
            leftlabs = c("Author", "event", "n"))

R Code [zeigen / verbergen]

forest(m.gen, 
            sortvar = TE,
            prediction = TRUE, 
            print.tau2 = FALSE,
            leftlabs = c("Author", "g", "SE"))

67.7 Publication Bias

Publication Bias

R Code [zeigen / verbergen]

funnel(m.prop,
            xlim = c(-3, -1.5),
            studlab = TRUE)

funnel(m.mean,
            xlim = c(27, 35),
            studlab = TRUE)

funnel(m.gen,
            xlim = c(-0.5, 2),
            studlab = TRUE)

Referenzen

Balduzzi, S., Rücker, G., & Schwarzer, G. (2019). How to perform a meta-analysis with R: a practical tutorial. BMJ Ment Health, 22(4), 153–160.

Harrer, M., Cuijpers, P., A, F. T., & Ebert, D. D. (2021). Doing Meta-Analysis With R: A Hands-On Guide (1st Aufl.). Chapman & Hall/CRC Press.

Tawfik, G. M., Dila, K. A. S., Mohamed, M. Y. F., Tam, D. N. H., Kien, N. D., Ahmed, A. M., & Huy, N. T. (2019). A step by step guide for conducting a systematic review and meta-analysis with simulation data. Tropical medicine and health, 47(1), 1–9.