Kolmogorov-Smirnov-Test Kritischer Wert Rechner
Berechnen Sie den kritischen Wert für den Kolmogorov-Smirnov-Test (KS-Test) zur Beurteilung der Anpassung einer Stichprobe an eine theoretische Verteilung oder zum Vergleich zweier Stichproben.
Ergebnisse
Umfassender Leitfaden zum Kolmogorov-Smirnov-Test und kritischen Werten
Der Kolmogorov-Smirnov-Test (KS-Test) ist ein nichtparametrischer Test, der in der Statistik weit verbreitet ist, um zu überprüfen, ob eine Stichprobe aus einer bestimmten Verteilung stammt (Einstichproben-KS-Test) oder ob zwei Stichproben aus derselben Verteilung stammen (Zweistichproben-KS-Test). Dieser Leitfaden erklärt die theoretischen Grundlagen, praktische Anwendungen und die korrekte Interpretation der kritischen Werte.
1. Grundlagen des Kolmogorov-Smirnov-Tests
Der KS-Test basiert auf der empirischen Verteilungsfunktion (EVF) der Stichprobe. Die Teststatistik D misst die maximale absolute Differenz zwischen der EVF der Stichprobe und der kumulativen Verteilungsfunktion (CDF) der theoretischen Verteilung (im Einstichprobenfall) oder zwischen den EVFs zweier Stichproben (im Zweistichprobenfall).
Zweistichproben-KS-Test: Dn,m = supx |F1,n(x) – F2,m(x)|
Dabei ist:
- Fn(x): Empirische Verteilungsfunktion der Stichprobe
- F(x): Theoretische kumulative Verteilungsfunktion
- F1,n(x), F2,m(x): Empirische Verteilungsfunktionen der beiden Stichproben
- supx: Supremum (kleinste obere Schranke) über alle x
2. Kritische Werte und ihre Bedeutung
Der kritische Wert ist der Schwellenwert, mit dem die Teststatistik D verglichen wird, um die Nullhypothese zu akzeptieren oder abzulehnen:
- Wenn D ≤ kritischer Wert: Die Nullhypothese wird nicht abgelehnt (kein signifikanter Unterschied)
- Wenn D > kritischer Wert: Die Nullhypothese wird abgelehnt (signifikanter Unterschied)
Die kritischen Werte hängen ab von:
- Stichprobenumfang(n): Größere Stichproben führen zu kleineren kritischen Werten
- Signifikanzniveau (α): Gängige Werte sind 0.01, 0.05 und 0.10
- Testtyp: Einstichproben- vs. Zweistichproben-KS-Test
| Stichprobenumfang (n) | α = 0.10 | α = 0.05 | α = 0.01 |
|---|---|---|---|
| 5 | 0.563 | 0.632 | 0.776 |
| 10 | 0.409 | 0.457 | 0.565 |
| 20 | 0.294 | 0.331 | 0.400 |
| 30 | 0.242 | 0.270 | 0.329 |
| 50 | 0.190 | 0.210 | 0.258 |
| 100 | 0.134 | 0.148 | 0.180 |
3. Praktische Anwendung des KS-Tests
Der KS-Test findet Anwendung in verschiedenen Bereichen:
- Qualitätssicherung: Überprüfung, ob Produktionsdaten einer Soll-Verteilung folgen
- Finanzmarktanalyse: Testen, ob Renditen normalverteilt sind
- Biometrie: Vergleich von Verteilungen biologischer Merkmale
- Maschinelles Lernen: Überprüfung von Datenverteilungen vor dem Training
Beispiel aus der Praxis: Ein Hersteller von Glühbirnen möchte testen, ob die Lebensdauer seiner Produkte einer Normalverteilung mit μ=1000h und σ=50h folgt. Mit einer Stichprobe von n=50 und α=0.05 würde der kritische Wert 0.210 betragen. Wenn die berechnete Teststatistik D=0.18 wäre, könnte die Nullhypothese nicht abgelehnt werden.
4. Vor- und Nachteile des KS-Tests
| Kriterium | Kolmogorov-Smirnov-Test | Chi-Quadrat-Test | Anderson-Darling-Test |
|---|---|---|---|
| Anwendbarkeit | Stetige und diskrete Verteilungen | Primär diskrete Verteilungen | Besonders empfindlich für Schwanzverhalten |
| Stichprobengröße | Klein und groß (exakte Werte für n ≤ 100) | Benötigt größere Stichproben | Effektiv für kleine Stichproben |
| Parameteranpassung | Verteilung muss vollständig spezifiziert sein | Kann Parameter aus Daten schätzen | Kann Parameter aus Daten schätzen |
| Berechnungsaufwand | Gering | Mittel | Hoch |
5. Häufige Fehler und ihre Vermeidung
Bei der Durchführung des KS-Tests treten häufig folgende Fehler auf:
-
Falsche Nullhypothese: Die Nullhypothese muss vollständig spezifiziert sein (inkl. aller Parameter). Wenn Parameter aus den Daten geschätzt werden, sind die kritischen Werte nicht mehr gültig.
Lösung: Verwenden Sie den Lilliefors-Test für normalverteilte Daten mit geschätzten Parametern. -
Ignorieren von Bindungen: Bei diskreten Daten oder vielen gleichen Werten (Bindungen) ist der KS-Test zu konservativ.
Lösung: Verwenden Sie den Chi-Quadrat-Test oder den Anderson-Darling-Test für diskrete Daten. -
Kleine Stichproben: Für n < 5 sind die kritischen Werte unzuverlässig.
Lösung: Verwenden Sie exakte Tests oder nichtparametrische Alternativen wie den Shapiro-Wilk-Test (für Normalverteilung).
6. Mathematische Herleitung der kritischen Werte
Die asymptotische Verteilung der KS-Teststatistik wurde von Kolmogorov (1933) und Smirnov (1939) entwickelt. Für große Stichproben (n → ∞) konvergiert die Verteilung von √n·D gegen die Kolmogorov-Verteilung:
Die kritischen Werte für endliche Stichproben werden durch Simulation oder exakte Berechnung bestimmt. Die folgende Tabelle zeigt die Konvergenz der kritischen Werte für α=0.05:
| Stichprobenumfang (n) | Kritischer Wert | Asymptotischer Wert (1.3581/√n) | Relativer Fehler |
|---|---|---|---|
| 10 | 0.457 | 0.429 | 6.0% |
| 20 | 0.331 | 0.304 | 8.2% |
| 50 | 0.210 | 0.192 | 8.5% |
| 100 | 0.148 | 0.136 | 8.1% |
| ∞ | 0.000 | 0.000 | 0.0% |
Man erkennt, dass die asymptotische Approximation für n ≥ 30 recht genau wird (Fehler < 10%). Für praktische Anwendungen werden jedoch meist die exakten kritischen Werte verwendet, wie sie in statistischen Tabellenwerken (z.B. NIST Engineering Statistics Handbook) zu finden sind.
7. Alternative Tests und Erweiterungen
In bestimmten Situationen sind andere Tests besser geeignet:
- Anderson-Darling-Test: Gewichtet die Schwänze der Verteilung stärker und ist daher empfindlicher für Abweichungen in den Rändern. Besonders nützlich für Normalverteilungstests.
- Cramér-von-Mises-Test: Berücksichtigt die gesamte Differenz zwischen den Verteilungen, nicht nur das Maximum. Weniger empfindlich gegen Ausreißer.
- Shapiro-Wilk-Test: Spezifisch für Normalverteilungstests mit kleinen Stichproben (n < 50). Höhere Power als KS-Test in diesem Kontext.
- Lilliefors-Test: Modifikation des KS-Tests für Normalverteilung mit geschätzten Parametern (μ und σ aus den Daten).
Für den Vergleich zweier Stichproben gibt es neben dem Zweistichproben-KS-Test auch:
- Wilcoxon-Rangsummentest: Für den Vergleich von Medianen (nicht der gesamten Verteilung)
- Permutationstests: Nichtparametrische Tests, die die Verteilung der Teststatistik durch Permutation der Daten approximieren
8. Implementierung in Statistik-Software
Die meisten statistischen Softwarepakete bieten Implementierungen des KS-Tests:
-
R:
ks.test(x, "pnorm", mean=0, sd=1) # Einstichproben-KS-Test ks.test(x, y) # Zweistichproben-KS-Test
-
Python (SciPy):
from scipy.stats import kstest, ks_2samp kstest(rvs, cdf) # Einstichproben-KS-Test ks_2samp(data1, data2) # Zweistichproben-KS-Test
- SPSS: Über “Analysieren → Nichtparametrische Tests → Alte Dialogfelder → K-S bei einer Stichprobe” bzw. “K-S bei zwei Stichproben”
- Minitab: “Statistik → Nichtparametrische Tests → Kolmogorov-Smirnov”
Wichtig: Die meisten Softwareimplementierungen berechnen p-Werte statt kritische Werte. Der p-Wert gibt die Wahrscheinlichkeit an, eine mindestens so extreme Teststatistik wie die beobachtete zu erhalten, wenn die Nullhypothese wahr ist. Die Entscheidungskriterien sind:
- Wenn p-Wert ≤ α: Nullhypothese ablehnen
- Wenn p-Wert > α: Nullhypothese nicht ablehnen
9. Fallstudie: Anwendung in der Finanzmarktanalyse
Ein Hedge-Fonds möchte testen, ob die täglichen Renditen eines Portfolios einer Normalverteilung folgen. Die Stichprobe umfasst n=250 Handelstage. Mit einem Signifikanzniveau von α=0.05 ergibt sich ein kritischer Wert von 0.0885 (aus Tabellen für große Stichproben: 1.3581/√250 ≈ 0.0861, aber exakter Wert ist 0.0885).
Die berechnete Teststatistik beträgt D=0.12. Da 0.12 > 0.0885, wird die Nullhypothese abgelehnt. Dies deutet darauf hin, dass die Renditen nicht normalverteilt sind – ein häufiges Ergebnis in Finanzmarktdaten, das auf Fat Tails (extreme Ereignisse) hindeutet.
Diese Erkenntnis ist entscheidend für Risikomanagementstrategien, da viele finanzmathematische Modelle (z.B. Black-Scholes) Normalverteilung voraussetzen. Alternativen wie die stabile Verteilung von Lévy oder die Student-t-Verteilung könnten besser geeignet sein.
10. Zusammenfassung und Empfehlungen
Der Kolmogorov-Smirnov-Test ist ein vielseitiges Werkzeug für:
- Anpassungstests (Vergleich von Stichprobe mit theoretischer Verteilung)
- Zweistichprobenvergleiche (Test auf gleiche Verteilung)
Empfehlungen für die Praxis:
- Verwenden Sie den KS-Test nur, wenn die Verteilung vollständig spezifiziert ist (keine Parameter aus den Daten schätzen)
- Für kleine Stichproben (n < 30) ziehen Sie exakte Tests wie Shapiro-Wilk in Betracht
- Bei diskreten Daten oder vielen Bindungen bevorzugen Sie den Chi-Quadrat-Test
- Für Normalverteilungstests ist der Anderson-Darling-Test oft die bessere Wahl
- Visualisieren Sie immer die empirische und theoretische Verteilung (z.B. mit Q-Q-Plots) zur Plausibilitätsprüfung
- Berichten Sie neben dem p-Wert immer auch die Teststatistik und Stichprobengröße
Der KS-Test bleibt trotz seiner Einschränkungen ein Standardwerkzeug in der statistischen Analyse – insbesondere wegen seiner Einfachheit und Nichtparametrik. Für komplexere Fragestellungen sollten jedoch moderne Alternativen in Betracht gezogen werden.