Bonferroni p-Wert Korrektur Rechner

Berechnen Sie den adjustierten p-Wert nach der Bonferroni-Methode für multiple Tests

Roh-p-Wert (0-1)

Anzahl der Tests

Signifikanzniveau (α)

Dezimalstellen

Ergebnisse der Bonferroni-Korrektur

Adjustierter p-Wert:

Kritischer p-Wert (α/n):

Umfassender Leitfaden zur Bonferroni-Korrektur für p-Werte

Die Bonferroni-Korrektur ist eine der am häufigsten verwendeten Methoden zur Kontrolle der Familienweisen Fehlerrate (Family-Wise Error Rate, FWER) bei multiplen Hypothesentests. Dieser Leitfaden erklärt die theoretischen Grundlagen, praktische Anwendungen und häufige Fallstricke dieser statistischen Methode.

1. Warum benötigen wir p-Wert-Korrekturen?

Wenn Sie mehrere statistische Tests gleichzeitig durchführen, steigt die Wahrscheinlichkeit, mindestens einen falsch-positiven Befund (Fehler 1. Art) zu erhalten. Ohne Korrektur:

Bei 20 Tests mit α = 0.05 beträgt die FWER bereits 64,15%
Bei 100 Tests steigt sie auf 99.41%
Die Formel für die FWER ohne Korrektur: FWER = 1 – (1 – α)ⁿ

Anzahl Tests (n)	FWER bei α=0.05	FWER bei α=0.01
5	22.62%	4.89%
10	40.13%	9.56%
20	64.15%	18.21%
50	92.31%	39.50%
100	99.41%	63.40%

2. Mathematische Grundlagen der Bonferroni-Korrektur

Die Bonferroni-Methode ist eine konservative Korrektur, die die FWER auf maximal α begrenzt. Die Grundidee:

Teilen Sie das globale Signifikanzniveau α durch die Anzahl der Tests n:
α_Bonferroni = α / n
Vergleichen Sie jeden einzelnen p-Wert mit diesem neuen Schwellenwert
Ein Test wird als signifikant betrachtet, wenn:
p ≤ α_Bonferroni

Alternativ können Sie die p-Werte direkt adjustieren:
p_adjustiert = min(p_roh × n, 1)

3. Vor- und Nachteile der Bonferroni-Korrektur

Vorteile	Nachteile
Einfach zu berechnen und zu implementieren Garantiert FWER ≤ α unter allen Bedingungen Keine Annahmen über Abhängigkeiten zwischen Tests Weit verbreitet und akzeptiert	Sehr konservativ – verliert statistische Power Kann zu vielen falsch-negativen Ergebnissen führen Nicht optimal für korrelierte Tests Bei vielen Tests wird α/Bonferroni extrem klein

4. Wann sollte die Bonferroni-Korrektur verwendet werden?

Die Bonferroni-Methode eignet sich besonders für:

Exploratorische Analysen mit vielen Hypothesen
Situationen, in denen keine Informationen über Abhängigkeiten zwischen Tests vorliegen
Studien, bei denen falsch-positive Ergebnisse besonders kritisch wären (z.B. klinische Studien)
Fälle mit relativ wenigen Tests (n < 20)

Für Szenarien mit vielen Tests oder bekannten Abhängigkeiten zwischen Tests sind oft modernere Methoden wie Holm-Bonferroni, Benjamini-Hochberg oder Benjamini-Yekutieli besser geeignet.

5. Praktische Anwendung in verschiedenen Disziplinen

Die Bonferroni-Korrektur findet in zahlreichen wissenschaftlichen Bereichen Anwendung:

Genetik: Bei GWAS-Studien (Genomweite Assoziationsstudien) mit Millionen von Tests
Neurowissenschaften: Bei fMRI-Studien mit tausenden Voxel-vergleichen
Medizin: Bei klinischen Studien mit multiplen Endpunkten
Psychologie: Bei Experimenten mit mehreren abhängigen Variablen
Ökonomie: Bei der Analyse multipler Marktindikatoren

6. Häufige Fehler und Missverständnisse

Falsche Interpretation: Ein nicht-signifikantes Ergebnis nach Bonferroni bedeutet nicht, dass der Effekt nicht existiert – es könnte einfach an mangelnder Power liegen.
Übermäßige Korrektur: Bei vielen Tests wird α/n so klein, dass selbst starke Effekte nicht signifikant werden.
Ignorieren von Abhängigkeiten: Bei korrelierten Tests ist Bonferroni zu konservativ – spezifischere Methoden wären besser.
Selektives Reporting: Nur die signifikanten Ergebnisse nach Korrektur zu berichten, verzerrt die Ergebnisse (“p-hacking”).

7. Alternativen zur Bonferroni-Korrektur

Je nach Situation können andere Methoden appropriate sein:

Holm-Bonferroni: Weniger konservativ, aber immer noch FWER-kontrollierend
Benjamini-Hochberg: Kontrolliert die False Discovery Rate (FDR) statt FWER
Benjamini-Yekutieli: FDR-Kontrolle auch bei abhängigen Tests
Scheffé-Methode: Für komplexe Kontraste in ANOVA
Tukey’s HSD: Für paarweise Vergleiche in ANOVA

8. Implementierung in statistischer Software

Die Bonferroni-Korrektur ist in allen gängigen Statistikprogrammen verfügbar:

R: p.adjust(p_values, method="bonferroni")
Python (SciPy): statsmodels.stats.multitest.multipletests(p_values, method='bonferroni')
SPSS: Über “Analyse → Mehrfachvergleiche → Bonferroni”
SAS: Mit PROC MULTTEST oder manuell mit DATA Step
Stata: pwcompare ... , mcompare(bonferroni)

9. Beispiel aus der Praxis: Klinische Studie

Angenommen, eine klinische Studie testet ein neues Medikament mit 3 Endpunkten (n=3):

Blutdruck: p = 0.03
Cholesterin: p = 0.008
Blutzucker: p = 0.12

Mit α = 0.05:

Kritischer p-Wert: 0.05/3 = 0.0167
Nur der Cholesterin-Test (p=0.008) bleibt signifikant
Blutdruck (p=0.03) wird nicht-signifikant nach Korrektur

10. Kritische Betrachtung und aktuelle Forschung

Die Bonferroni-Korrektur wird in der modernen Statistik zunehmend kritisch gesehen:

Eine Studie von Perneger (1998) zeigte, dass Bonferroni in vielen Fällen zu konservativ ist
Bender & Lange (2001) empfahlen, die Korrektur nur bei unabhängigen Tests anzuwenden
Neuere Ansätze wie die “Independent Hypothesis Weighting” (IHW) versuchen, die Power zu erhöhen
Die American Statistical Association warnte 2016 vor dem mechanischen Einsatz von p-Wert-Korrekturen

Brechnugn P Wert Bonferroni Rechner