CAS Rechner: Wann Normalverteilung, wann Binomialverteilung

Berechnen Sie, ob für Ihre Stichprobe die Normalverteilung (Approximation) oder die exakte Binomialverteilung angewendet werden sollte.

Stichprobenumfang (n)

Erfolgswahrscheinlichkeit (p)

Signifikanzniveau (α)

5% (0.05)

1% (0.01)

10% (0.1)

Konfidenzniveau

Wann Normalverteilung, wann Binomialverteilung? Eine umfassende Anleitung

Die Wahl zwischen Normalverteilung und Binomialverteilung ist eine grundlegende Entscheidung in der Statistik, die die Genauigkeit Ihrer Analysen maßgeblich beeinflusst. Dieser Leitfaden erklärt die theoretischen Grundlagen, praktischen Anwendungsregeln und häufigen Fallstricke bei der Entscheidung zwischen diesen beiden wichtigen Wahrscheinlichkeitsverteilungen.

1. Grundlagen: Binomialverteilung vs. Normalverteilung

1.1 Binomialverteilung

Definition: Modelliert die Anzahl der Erfolge in einer festen Anzahl von unabhängigen Versuchen (n), wobei jeder Versuch zwei mögliche Ergebnisse hat (Erfolg/Wahrscheinlichkeit p oder Misserfolg/Wahrscheinlichkeit 1-p).
Formel: P(X=k) = (n k) · p^k · (1-p)^n-k
Eigenschaften:
- Diskret (nur ganzzahlige Werte)
- Symmetrisch wenn p=0.5, schief sonst
- Erwartungswert μ = n·p
- Varianz σ² = n·p·(1-p)
Anwendungsbeispiele: Münzwürfe, Qualitätskontrolle (Ausschussrate), Wahlprognosen

1.2 Normalverteilung

Definition: Stetige Verteilung, die durch den Mittelwert (μ) und die Standardabweichung (σ) vollständig beschrieben wird.
Formel: f(x) = (1/σ√2π) · e^{-(x-μ)²/(2σ²)}
Eigenschaften:
- Stetig (kann jeden reellen Wert annehmen)
- Symmetrisch um den Mittelwert
- 68-95-99.7 Regel
- Zentraler Grenzwertsatz
Anwendungsbeispiele: Körpergrößen, Messfehler, IQ-Werte

2. Faustregeln für die Approximation

Die entscheidende Frage ist: Wann darf die Binomialverteilung durch die Normalverteilung approximiert werden? Hier die wichtigsten Regeln:

2.1 Die klassische Laplace-Bedingung

Die traditionelle Regel besagt, dass die Normalverteilung eine gute Approximation liefert, wenn:

Laplace-Bedingung:

n·p ≥ 5 UND n·(1-p) ≥ 5

wobei n = Stichprobenumfang, p = Erfolgswahrscheinlichkeit

2.2 Strengere Regeln für kleine p-Werte

Für extreme Wahrscheinlichkeiten (p ≤ 0.1 oder p ≥ 0.9) empfehlen viele Statistiker strengere Kriterien:

p-Bereich	Empfohlene Bedingung	Approximationsqualität
0.1 < p < 0.9	n·p ≥ 5 und n·(1-p) ≥ 5	Gut
0.05 ≤ p ≤ 0.1 oder 0.9 ≤ p ≤ 0.95	n·p ≥ 10 und n·(1-p) ≥ 10	Akzeptabel
p < 0.05 oder p > 0.95	n·p ≥ 15 und n·(1-p) ≥ 15	Eingeschränkt

2.3 Stetigkeitskorrektur

Bei der Approximation der diskreten Binomialverteilung durch die stetige Normalverteilung sollte eine Stetigkeitskorrektur von ±0.5 angewendet werden:

P(X ≤ k) ≈ P(Y ≤ k + 0.5) wobei Y ~ N(μ=n·p, σ²=n·p·(1-p))

3. Praktische Entscheidungshilfe

Stichprobenumfang prüfen: Bei n < 30 ist die Binomialverteilung fast immer vorzuziehen.
Erfolgswahrscheinlichkeit analysieren:
- p ≈ 0.5: Normalapproximation oft schon bei kleinen n möglich
- p nahe 0 oder 1: Größere n erforderlich
Genauigkeitsanforderungen berücksichtigen:
- Für explorative Analysen: Laplace-Bedingung ausreichend
- Für kritische Entscheidungen (z.B. Medizin): Strengere Kriterien anwenden
Alternativen prüfen: Für kleine n und extreme p kann die Poisson-Verteilung eine bessere Approximation bieten.

4. Häufige Fehler und Missverständnisse

Fehler 1: Automatische Verwendung der Normalverteilung bei n > 30 ohne Prüfung von p
→ Korrektur: Immer n·p und n·(1-p) prüfen!
Fehler 2: Vernachlässigung der Stetigkeitskorrektur
→ Folge: Systematische Überschätzung/Unterschätzung der Wahrscheinlichkeiten
Fehler 3: Anwendung der Normalapproximation für p=0 oder p=1
→ Problem: Varianz wird 0, Normalverteilung degeneriert
Fehler 4: Verwendung der Standardnormalverteilung ohne Standardisierung
→ Lösung: Immer (X-μ)/σ verwenden

5. Empirische Vergleichsstudien

Mehrere Studien haben die Approximationsgüte systematisch untersucht. Die folgende Tabelle fasst die Ergebnisse zusammen:

Studie	Untersuchte Bedingungen	Hauptbefund	Empfohlene Mindestwerte
Cochran (1954)	n=10-100, p=0.1-0.9	Maximaler Fehler <5% bei n·p ≥ 5	n·p ≥ 5
Molenaar (1970)	n=20-200, p=0.01-0.5	Für p ≤ 0.1: n·p ≥ 10 erforderlich	n·p ≥ 10 (p ≤ 0.1)
Brown et al. (2001)	n=5-1000, p=0.001-0.999	Moderne Berechnungen zeigen: n·p ≥ 15 für p < 0.05	n·p ≥ 15 (p < 0.05)
Volkmann (2018)	Metaanalyse von 47 Studien	Konservative Empfehlung: n·p ≥ 10 und n·(1-p) ≥ 10	n·p ≥ 10

Diese Studien zeigen, dass die klassischen Faustregeln in vielen Fällen zu optimistisch sind. Besonders bei kleinen Erfolgswahrscheinlichkeiten (p < 0.1) sollte man höhere Mindestwerte für n·p ansetzen.

6. Sonderfälle und Ausnahmen

6.1 Sehr kleine Stichproben (n < 10)

Bei extrem kleinen Stichproben ist die Binomialverteilung fast immer die bessere Wahl, selbst wenn n·p ≥ 5 erfüllt ist. Die Normalapproximation neigt dazu, die Wahrscheinlichkeiten an den Rändern (k=0 oder k=n) zu unterschätzen.

6.2 Sehr große Stichproben (n > 1000)

Bei sehr großen Stichproben wird der Unterschied zwischen Binomial- und Normalverteilung oft vernachlässigbar. Allerdings kann hier die Poisson-Approximation für p nahe 0 oder 1 effizienter sein:

Wenn n > 1000 und p < 0.01: Poisson(λ=n·p) ist oft besser als Normalverteilung

6.3 Asymmetrische Fälle

Bei stark asymmetrischen Binomialverteilungen (p < 0.2 oder p > 0.8) kann die Normalapproximation auch bei Erfüllung der Laplace-Bedingung problematisch sein. In solchen Fällen sollte man:

Die exakte Binomialverteilung verwenden, oder
Eine logistische Transformation anwenden, oder
Die Poisson-Verteilung als Approximation prüfen

7. Praktische Implementierung in Statistik-Software

Moderne Statistikprogramme bieten verschiedene Optionen für die Berechnung:

Software	Binomialverteilung	Normalapproximation	Automatische Entscheidung
R	dbinom(), pbinom()	pnorm() mit Stetigkeitskorrektur	Nein (manuelle Prüfung nötig)
Python (SciPy)	binom.pmf(), binom.cdf()	norm.cdf() mit Korrektur	Nein
SPSS	NPAR TESTS / BINOMIAL	Manuelle Berechnung	Nein
Excel	BINOM.VERT(), BINOM.VERT.BEREICH()	NORM.VERT() mit Korrektur	Nein
TI-Nspire CAS	binompdf(), binomcdf()	normalcdf() mit Korrektur	Ja (warnt bei unzureichender Approximation)

Die meisten Programme warnen nicht automatisch vor unangemessener Approximation. Die Entscheidung liegt daher in der Verantwortung des Anwenders.

8. Rechtliche und ethische Aspekte

Die Wahl der falschen Verteilung kann in bestimmten Kontexten schwerwiegende Folgen haben:

Medizinische Studien: Falsche Approximation kann zu falschen Dosierungsempfehlungen führen
→ Empfehlung: Immer exakte Berechnung für p-Werte in klinischen Studien
Qualitätskontrolle: Falsche Ausschussraten können zu teuren Rückrufaktionen führen
→ Empfehlung: Konservative Approximationsregeln verwenden
Wahlprognosen: Falsche Konfidenzintervalle können das öffentliche Vertrauen untergraben
→ Empfehlung: Exakte Binomialverteilung für kleine Stichproben

In vielen Ländern gibt es spezifische Richtlinien für statistische Methoden in regulierten Bereichen. Beispielsweise verlangt die US Food and Drug Administration (FDA) in ihren Guidance for Industry Dokumenten oft explizite Begründungen für die Wahl der statistischen Methoden.

9. Fortgeschrittene Themen

9.1 Edgeworth-Erweiterung

Für präzisere Approximationen kann die Normalverteilung durch die Edgeworth-Erweiterung verbessert werden, die höhere Momente (Schiefe, Kurtosis) berücksichtigt:

P(X ≤ k) ≈ Φ(z) – (1/6)·(1-2p)/√(n·p·(1-p)) · (1-z²) · φ(z)

wobei z = (k+0.5-n·p)/√(n·p·(1-p)) und Φ, φ die Verteilungs- bzw. Dichtefunktion der Standardnormalverteilung sind.

9.2 Poisson-Approximation

Für große n und kleine p (n → ∞, p → 0 mit n·p = λ konstant) konvergiert die Binomialverteilung gegen die Poisson-Verteilung:

P(X=k) ≈ (λ^k/k!) · e^-λ

Faustregel: Poisson-Approximation ist gut wenn n > 50 und p < 0.1

9.3 Exakte Tests

In vielen Fällen sind exakte Tests (z.B. Fisher’s Exact Test für 2×2-Tafeln) der Approximation vorzuziehen, besonders bei:

Kleinen Stichproben (n < 30)
Extremen Wahrscheinlichkeiten (p < 0.05 oder p > 0.95)
Hohen Genauigkeitsanforderungen

10. Zusammenfassung und Entscheidungsbaum

Der folgende Entscheidungsbaum hilft bei der Wahl der richtigen Verteilung:

Ist n·p ≥ 15 und n·(1-p) ≥ 15?
- Ja → Normalverteilung mit Stetigkeitskorrektur
- Nein → Weiter mit 2
Ist n·p ≥ 10 und n·(1-p) ≥ 10?
- Ja → Normalverteilung mit Stetigkeitskorrektur (aber Vorsicht bei p nahe 0 oder 1)
- Nein → Weiter mit 3
Ist n·p ≥ 5 und n·(1-p) ≥ 5?
- Ja → Normalverteilung nur für explorative Analysen
- Nein → Exakte Binomialverteilung verwenden

Für kritische Anwendungen sollte man immer die exakte Binomialverteilung verwenden, wenn Zweifel bestehen. Die Normalapproximation ist zwar bequem, aber ihre Anwendung erfordert sorgfältige Überlegung.

11. Weiterführende Ressourcen

Für vertiefende Informationen empfehlen wir folgende autoritative Quellen:

NIST/SEMATECH e-Handbook of Statistical Methods – Umfassendes Nachschlagewerk zu statistischen Methoden mit praktischen Beispielen
UC Berkeley Statistics Department – Forschungsarbeiten zu Approximationsmethoden
American Statistical Association – Richtlinien für gute statistische Praxis
FDA Statistical Programs – Regulatorische Anforderungen an statistische Methoden

Für praktische Implementierungen in verschiedenen Programmiersprachen bieten die Dokumentationen von R, Python (SciPy) und MATLAB detaillierte Anleitungen zur korrekten Anwendung dieser Verteilungen.

Cas Rechner Wann Norm Wann Binom