Korrelationsrechner: Ab welchem n ist die Korrelation signifikant?

Berechnen Sie die minimale Stichprobengröße (n), ab der eine Korrelation bei gegebenem Effektstärke, Signifikanzniveau und Power statistisch signifikant wird.

Effektstärke (r)

Signifikanzniveau (α)

Teststärke (1 – β)

Testrichtung

Ergebnis:

Die minimale Stichprobengröße (n), ab der eine Korrelation von 0.3 bei einem Signifikanzniveau von 0.05 und einer Teststärke von 0.8 signifikant wird, beträgt:

42 Teilnehmer.

Korrelationen berechnen: Ab welchem n wird eine Korrelation signifikant?

Die Frage, ab welcher Stichprobengröße (n) eine Korrelation statistisch signifikant wird, ist zentral für die Planung von Studien in Psychologie, Medizin, Sozialwissenschaften und Marktforschung. Dieser Leitfaden erklärt die theoretischen Grundlagen, praktischen Berechnungsmethoden und häufige Fallstricke bei der Bestimmung der minimalen Stichprobengröße für Korrelationsanalysen.

1. Grundlagen: Was bedeutet Signifikanz bei Korrelationen?

Eine Korrelation misst den linearen Zusammenhang zwischen zwei Variablen (Pearson’s r). Die statistische Signifikanz gibt an, mit welcher Wahrscheinlichkeit ein beobachteter Zusammenhang nicht auf Zufall beruht. Die wichtigsten Parameter sind:

Effektstärke (r): Stärke des Zusammenhangs (0 = kein Zusammenhang, 1 = perfekter Zusammenhang)
Signifikanzniveau (α): Typischerweise 0.05 (5% Irrtumswahrscheinlichkeit)
Teststärke (1 – β): Wahrscheinlichkeit, einen bestehenden Effekt zu entdecken (meist 0.8 oder 80%)
Stichprobengröße (n): Anzahl der Beobachtungspaare

Die Formel zur Berechnung der minimalen Stichprobengröße leitet sich aus der t-Verteilung ab. Für große Stichproben (n > 120) nähert sich die t-Verteilung der Normalverteilung an, was die Berechnung vereinfacht.

2. Die mathematische Grundlage: Fisher’s Z-Transformation

Um die Signifikanz einer Korrelation zu testen, wird häufig Fisher’s Z-Transformation verwendet, die die Verteilung von r in eine Normalverteilung überführt:

Z = 0.5 * [ln(1 + r) – ln(1 – r)]

Die Standardabweichung von Z beträgt:

σ_Z = 1 / √(n – 3)

Für den Signifikanztest wird geprüft, ob der beobachtete Z-Wert signifikant von 0 abweicht. Die minimale Stichprobengröße ergibt sich aus der Umstellung dieser Formel nach n.

3. Praktische Berechnung: Schritt-für-Schritt-Anleitung

Folgen Sie diesen Schritten, um die minimale Stichprobengröße zu berechnen:

Effektstärke festlegen: Schätzen Sie die erwartete Korrelation (z.B. r = 0.3 für einen mittleren Effekt)
Signifikanzniveau wählen: Typisch sind α = 0.05 (5%) oder α = 0.01 (1%)
Teststärke definieren: Üblich sind 80% oder 90% (1 – β = 0.8 oder 0.9)
Testrichtung bestimmen: Einseitig (gerichtete Hypothese) oder zweiseitig (ungerichtete Hypothese)
Formel anwenden: Nutzen Sie die oben genannte Fisher-Transformation oder spezielle Software

Unser Rechner automatisiert diesen Prozess und gibt Ihnen direkt die benötigte Stichprobengröße aus.

4. Beispielrechnungen für verschiedene Szenarien

Effektstärke (r)	Signifikanzniveau (α)	Teststärke (1-β)	Testrichtung	Minimales n
0.1 (klein)	0.05	0.8	Zweiseitig	783
0.3 (mittel)	0.05	0.8	Zweiseitig	84
0.5 (groß)	0.05	0.8	Zweiseitig	29
0.3 (mittel)	0.01	0.9	Einseitig	119
0.5 (groß)	0.001	0.95	Zweiseitig	63

Diese Tabelle zeigt, wie stark die benötigte Stichprobengröße von der Effektstärke abhängt. Kleine Effekte (r = 0.1) erfordern deutlich größere Stichproben als mittlere oder große Effekte.

5. Häufige Fehler und wie man sie vermeidet

Bei der Planung von Korrelationsstudien werden oft folgende Fehler gemacht:

Unterschätzung der Effektstärke: Viele Studien gehen von zu großen Effekten aus (z.B. r = 0.5), obwohl in der Praxis oft nur kleine bis mittlere Effekte (r = 0.1-0.3) auftreten. Dies führt zu unterpowered studies.
Vernachlässigung der Teststärke: Eine Power von 80% ist Minimum. Für wichtige Studien sollte 90% oder höher angestrebt werden.
Ignorieren der Testrichtung: Einseitige Tests erfordern kleinere Stichproben, sind aber nur gerechtfertigt, wenn die Richtungsannahme theoretisch stark begründet ist.
Keine A-priori-Berechnung: Viele Forscher bestimmen n erst nach der Datenerhebung, was zu verzerrten Ergebnissen führt (“p-hacking”).

Ein besonderes Problem stellt die Publikationsverzerrung dar: Studien mit signifikanten Ergebnissen werden eher veröffentlicht, was zu einer Überschätzung von Effektstärken in der Literatur führt.

6. Fortgeschrittene Themen: Konfidenzintervalle und Äquivalenztests

Moderne statistische Praxis geht über reine Signifikanztests hinaus:

Konfidenzintervalle für r: Geben an, in welchem Bereich der wahre Korrelationskoeffizient mit 95% Wahrscheinlichkeit liegt. Beispiel: r = 0.3 [0.1, 0.48]
Äquivalenztests: Prüfen, ob eine Korrelation praktisch äquivalent zu einem vordefinierten Wert ist (z.B. “ist r kleiner als 0.2?”)
Bayes-Faktoren: Quantifizieren die Evidenz für oder gegen die Nullhypothese, ohne sich auf p-Werte zu verlassen

Diese Methoden erfordern oft größere Stichproben als klassische Signifikanztests, liefern aber aussagekräftigere Ergebnisse.

7. Software-Tools für Stichprobenumfangsplanung

Neben unserem Online-Rechner existieren folgende professionelle Tools:

G*Power: Kostenloses Desktop-Programm mit umfangreichen Optionen für Korrelationsanalysen
PASS: Kommerzielles Tool mit besonders genauen Berechnungen für komplexe Designs
R-Pakete: pwr und WebPower bieten Funktionen für Power-Analysen in R
Python-Bibliotheken: statsmodels und pingouin enthalten Power-Analyse-Funktionen

Für die meisten Anwendungsfälle reicht unser Online-Rechner oder G*Power aus. Bei komplexen Designs (z.B. multiple Korrelationen mit Bonferroni-Korrektur) empfiehlt sich jedoch spezialisierte Software.

8. Ethische Aspekte der Stichprobenplanung

Die Bestimmung der Stichprobengröße hat auch ethische Implikationen:

Unterpowered Studien: Verschwenden Ressourcen und können zu falsch-negativen Ergebnissen führen
Überpowered Studien: Können klinisch irrelevante Effekte als “signifikant” ausweisen
Replikationskrise: Viele publizierte Ergebnisse lassen sich nicht replizieren, oft wegen zu kleiner Stichproben

Die National Institutes of Health (NIH) empfehlen für klinische Studien eine Power von mindestens 80% und die Publikation aller Ergebnisse – auch nicht-signifikanter – um die Replikationskrise zu bekämpfen.

9. Fallstudie: Korrelationsanalyse in der Psychologie

Betrachten wir eine Studie, die den Zusammenhang zwischen Schlafqualität (gemessen mit dem Pittsburgh Sleep Quality Index) und Arbeitsleistung (Selbsteinschätzung auf einer 10-Punkte-Skala) untersucht:

Erwartete Effektstärke: r = 0.25 (basierend auf Metaanalysen)
Signifikanzniveau: α = 0.05
Teststärke: 1 – β = 0.85
Testrichtung: Zweiseitig (keine klare Richtungsannahme)

Mit unserem Rechner ergibt sich eine benötigte Stichprobengröße von 123 Teilnehmern. Die Forscher rekrutierten jedoch nur 80 Teilnehmer (n = 80) und fanden eine Korrelation von r = 0.18 (p = 0.12), die nicht signifikant war.

Dieses Beispiel zeigt, wie Unterpowerung zu nicht-konklusiven Ergebnissen führt. Mit der korrekten Stichprobengröße (n = 123) hätte die Studie entweder:

Ein signifikantes Ergebnis geliefert (wenn der wahre Effekt ≥ 0.25 ist), oder
Mit hoher Sicherheit gezeigt, dass der Effekt kleiner als erwartet ist

10. Zukunft der Korrelationsforschung: Big Data und Machine Learning

Mit dem Aufkommen von Big Data ändern sich die Anforderungen an Stichprobenumfangsplanung:

Sehr große n: Bei n > 10.000 werden selbst minimale Effekte (r = 0.05) signifikant. Hier rücken effektgrößenbasierte Interpretationen in den Vordergrund.
Machine Learning: Algorithmen wie Random Forests können nichtlineare Zusammenhänge entdecken, die klassische Korrelationsanalysen verpassen.
Replikationsstudien: Große Konsortien (z.B. Open Science Framework) führen systematische Replikationen durch, um die Robustheit von Effekten zu prüfen.

Trotz dieser Entwicklungen bleibt die klassische Power-Analyse wichtig, besonders in Bereichen mit begrenzten Ressourcen (z.B. klinische Psychologie).

Wissenschaftliche Quellen und weiterführende Links:

National Library of Medicine: Guide to Statistics and Methods – Umfassende Einführung in statistische Methoden inkl. Korrelationsanalysen
UC Berkeley Statistics Department – Ressourcen zu fortgeschrittenen Korrelationsanalysen und Power-Berechnungen
American Psychological Association: Responsible Conduct of Research – Ethische Richtlinien für Stichprobenplanung

Korrelationen Rechnen Ab Welchem N