Hypergeometrische Verteilung Online Rechner
Berechnen Sie Wahrscheinlichkeiten für die hypergeometrische Verteilung mit diesem präzisen statistischen Tool.
Umfassender Leitfaden zur hypergeometrischen Verteilung
Was ist die hypergeometrische Verteilung?
Die hypergeometrische Verteilung ist ein diskretes Wahrscheinlichkeitsmodell, das die Wahrscheinlichkeit beschreibt, genau k Erfolge in n Ziehungen ohne Zurücklegen aus einer endlichen Grundgesamtheit von N Elementen zu erzielen, von denen K als Erfolge klassifiziert werden.
Dieses Modell findet Anwendung in:
- Qualitätskontrolle (Stichprobenprüfung)
- Biostatistik (Genetik, Ökologie)
- Marktforschung (Umfragen ohne Zurücklegen)
- Spieltheorie (Kartenspiele, Lotto)
Mathematische Definition
Die Wahrscheinlichkeitsfunktion der hypergeometrischen Verteilung lautet:
P(X = k) = [C(K, k) × C(N-K, n-k)] / C(N, n)
Wobei C(a, b) den Binomialkoeffizienten “a über b” darstellt.
Wichtige Parameter
| Parameter | Bedeutung | Bereich |
|---|---|---|
| N | Gesamtpopulation | N ≥ 1 (ganzzahlig) |
| K | Anzahl Erfolge in Population | 0 ≤ K ≤ N |
| n | Stichprobengröße | 1 ≤ n ≤ N |
| k | Anzahl Erfolge in Stichprobe | max(0, n-(N-K)) ≤ k ≤ min(n, K) |
Erwartungswert und Varianz
Für eine hypergeometrisch verteilte Zufallsvariable X gelten folgende Momente:
- Erwartungswert: μ = n × (K/N)
- Varianz: σ² = n × (K/N) × (1 – K/N) × ((N-n)/(N-1))
- Standardabweichung: σ = √σ²
Anwendungsbeispiele
1. Qualitätskontrolle in der Produktion
Ein Hersteller produziert 1000 Glühbirnen (N=1000), von denen 20 defekt sind (K=20). Der Qualitätskontrolleur entnimmt eine Stichprobe von 50 Birnen (n=50). Wie groß ist die Wahrscheinlichkeit, dass genau 2 defekte Birnen (k=2) in der Stichprobe sind?
2. Lotto 6 aus 49
Beim deutschen Lotto werden 6 Kugeln aus 49 gezogen (n=6, N=49). Die Wahrscheinlichkeit für genau 3 Richtige (k=3) bei K=6 (Ihre getippten Zahlen) beträgt:
P(X=3) ≈ 0.0177 (1.77%)
3. Genetische Vererbung
In einer Population von 100 Pflanzen (N=100) tragen 30 eine bestimmte Genvariante (K=30). Ein Forscher untersucht 10 zufällig ausgewählte Pflanzen (n=10). Die Wahrscheinlichkeit, dass genau 4 davon (k=4) die Genvariante aufweisen, folgt der hypergeometrischen Verteilung.
Vergleich mit anderen Verteilungen
| Eigenschaft | Hypergeometrische Verteilung | Binomialverteilung | Poisson-Verteilung |
|---|---|---|---|
| Ziehung mit Zurücklegen | Nein | Ja | Nicht anwendbar |
| Populationsgröße | Endlich (N) | Theoretisch unendlich | Theoretisch unendlich |
| Erfolgswahrscheinlichkeit | Verändert sich (K/N, (K-1)/(N-1), …) | Konstant (p) | Sehr klein (λ) |
| Varianz | n(K/N)(1-K/N)((N-n)/(N-1)) | np(1-p) | λ |
| Typische Anwendung | Stichproben ohne Zurücklegen | Bernoulli-Experimente | Seltene Ereignisse |
Approximation durch andere Verteilungen
Für große Populationen (N → ∞) und kleine Stichproben (n << N) kann die hypergeometrische Verteilung durch die Binomialverteilung approximiert werden, wobei p = K/N. Die Faustregel besagt, dass diese Approximation gut ist, wenn n/N < 0.05.
Für große N und K, aber kleine p = K/N, kann die Poisson-Verteilung mit λ = np als Approximation dienen.
Praktische Berechnungstipps
- Binomialkoeffizienten effizient berechnen: Nutzen Sie die Eigenschaft C(n,k) = C(n, n-k) um Rechenaufwand zu reduzieren.
- Gültigkeitsprüfung: Stellen Sie sicher, dass k im zulässigen Bereich liegt (max(0, n-(N-K)) ≤ k ≤ min(n, K)).
- Numerische Stabilität: Bei großen Zahlen verwenden Sie logarithmische Berechnungen um Überlauf zu vermeiden.
- Kumulative Wahrscheinlichkeiten: Für P(X ≤ k) summieren Sie die Einzelwahrscheinlichkeiten von 0 bis k.
Häufige Fehler und wie man sie vermeidet
- Falsche Parameter: Verwechseln von N (Populationsgröße) mit K (Anzahl Erfolge). Immer prüfen: K ≤ N und n ≤ N.
- Ziehung mit Zurücklegen: Die hypergeometrische Verteilung gilt nur ohne Zurücklegen. Bei Ziehung mit Zurücklegen muss die Binomialverteilung verwendet werden.
- Ungültige k-Werte: Nicht alle k-Werte sind möglich. Der Rechner prüft automatisch die Gültigkeit.
- Rundungsfehler: Bei sehr kleinen Wahrscheinlichkeiten können Rundungsfehler auftreten. In solchen Fällen empfiehlt sich die Verwendung von Logarithmen.
Erweiterte Anwendungen
1. Mehrdimensionale hypergeometrische Verteilung
Verallgemeinerung auf mehrere Kategorien von “Erfolgen”. Beispiel: Eine Urne enthält rote, blaue und grüne Kugeln, und man zieht ohne Zurücklegen.
2. Bayesianische Statistik
Die hypergeometrische Verteilung dient als konjugierte Prior-Verteilung für die Binomialverteilung in bayesianischen Modellen.
3. Ökologische Studien
Schätzung von Populationsgrößen in Markierung-Wiederfang-Experimenten (Lincoln-Petersen-Schätzer).
Historische Entwicklung
Die hypergeometrische Verteilung wurde erstmals im 18. Jahrhundert untersucht, als Mathematiker begannen, Wahrscheinlichkeitsprobleme im Zusammenhang mit Glücksspielen systematisch zu analysieren. Jacob Bernoulli (1655-1705) und später Pierre-Simon Laplace (1749-1827) leisteten wichtige Beiträge zur Entwicklung dieser Verteilung.
Im 20. Jahrhundert fand die hypergeometrische Verteilung breite Anwendung in der statistischen Qualitätskontrolle, insbesondere durch die Arbeiten von Walter A. Shewhart (1891-1967), dem Begründer der modernen Qualitätskontrolle.
Software-Implementierungen
Die hypergeometrische Verteilung ist in allen gängigen statistischen Softwarepaketen implementiert:
- R:
dhyper(k, K, N-K, n)für die Dichtefunktion - Python (SciPy):
hypergeom.pmf(k, N, K, n) - Excel:
=HYPGEOM.VERT(k; n; K; N; KUMULIERT) - MATLAB:
hygepdf(k, N, K, n)
Weiterführende Ressourcen
Für vertiefende Informationen empfehlen wir folgende autoritative Quellen: