Kolmogorov-Smirnov-Test Kritischer Wert Rechner

Berechnen Sie den kritischen Wert für den Kolmogorov-Smirnov-Test (KS-Test) zur Beurteilung der Anpassung einer Stichprobe an eine theoretische Verteilung oder zum Vergleich zweier Stichproben.

Stichprobenumfang (n)

Signifikanzniveau (α)

Testtyp

Ergebnisse

Kritischer Wert (D): –

Interpretation: –

Umfassender Leitfaden zum Kolmogorov-Smirnov-Test und kritischen Werten

Der Kolmogorov-Smirnov-Test (KS-Test) ist ein nichtparametrischer Test, der in der Statistik weit verbreitet ist, um zu überprüfen, ob eine Stichprobe aus einer bestimmten Verteilung stammt (Einstichproben-KS-Test) oder ob zwei Stichproben aus derselben Verteilung stammen (Zweistichproben-KS-Test). Dieser Leitfaden erklärt die theoretischen Grundlagen, praktische Anwendungen und die korrekte Interpretation der kritischen Werte.

1. Grundlagen des Kolmogorov-Smirnov-Tests

Der KS-Test basiert auf der empirischen Verteilungsfunktion (EVF) der Stichprobe. Die Teststatistik D misst die maximale absolute Differenz zwischen der EVF der Stichprobe und der kumulativen Verteilungsfunktion (CDF) der theoretischen Verteilung (im Einstichprobenfall) oder zwischen den EVFs zweier Stichproben (im Zweistichprobenfall).

Einstichproben-KS-Test: D_n = sup_x |F_n(x) – F(x)|
Zweistichproben-KS-Test: D_n,m = sup_x |F_1,n(x) – F_2,m(x)|

Dabei ist:

F_n(x): Empirische Verteilungsfunktion der Stichprobe
F(x): Theoretische kumulative Verteilungsfunktion
F_1,n(x), F_2,m(x): Empirische Verteilungsfunktionen der beiden Stichproben
supx: Supremum (kleinste obere Schranke) über alle x

2. Kritische Werte und ihre Bedeutung

Der kritische Wert ist der Schwellenwert, mit dem die Teststatistik D verglichen wird, um die Nullhypothese zu akzeptieren oder abzulehnen:

Wenn D ≤ kritischer Wert: Die Nullhypothese wird nicht abgelehnt (kein signifikanter Unterschied)
Wenn D > kritischer Wert: Die Nullhypothese wird abgelehnt (signifikanter Unterschied)

Die kritischen Werte hängen ab von:

Stichprobenumfang(n): Größere Stichproben führen zu kleineren kritischen Werten
Signifikanzniveau (α): Gängige Werte sind 0.01, 0.05 und 0.10
Testtyp: Einstichproben- vs. Zweistichproben-KS-Test

Kritische Werte für den Einstichproben-KS-Test (ausgewählte α-Niveaus)
Stichprobenumfang (n)	α = 0.10	α = 0.05	α = 0.01
5	0.563	0.632	0.776
10	0.409	0.457	0.565
20	0.294	0.331	0.400
30	0.242	0.270	0.329
50	0.190	0.210	0.258
100	0.134	0.148	0.180

3. Praktische Anwendung des KS-Tests

Der KS-Test findet Anwendung in verschiedenen Bereichen:

Qualitätssicherung: Überprüfung, ob Produktionsdaten einer Soll-Verteilung folgen
Finanzmarktanalyse: Testen, ob Renditen normalverteilt sind
Biometrie: Vergleich von Verteilungen biologischer Merkmale
Maschinelles Lernen: Überprüfung von Datenverteilungen vor dem Training

Beispiel aus der Praxis: Ein Hersteller von Glühbirnen möchte testen, ob die Lebensdauer seiner Produkte einer Normalverteilung mit μ=1000h und σ=50h folgt. Mit einer Stichprobe von n=50 und α=0.05 würde der kritische Wert 0.210 betragen. Wenn die berechnete Teststatistik D=0.18 wäre, könnte die Nullhypothese nicht abgelehnt werden.

4. Vor- und Nachteile des KS-Tests

Vergleich mit anderen Anpassungstests
Kriterium	Kolmogorov-Smirnov-Test	Chi-Quadrat-Test	Anderson-Darling-Test
Anwendbarkeit	Stetige und diskrete Verteilungen	Primär diskrete Verteilungen	Besonders empfindlich für Schwanzverhalten
Stichprobengröße	Klein und groß (exakte Werte für n ≤ 100)	Benötigt größere Stichproben	Effektiv für kleine Stichproben
Parameteranpassung	Verteilung muss vollständig spezifiziert sein	Kann Parameter aus Daten schätzen	Kann Parameter aus Daten schätzen
Berechnungsaufwand	Gering	Mittel	Hoch

5. Häufige Fehler und ihre Vermeidung

Bei der Durchführung des KS-Tests treten häufig folgende Fehler auf:

Falsche Nullhypothese: Die Nullhypothese muss vollständig spezifiziert sein (inkl. aller Parameter). Wenn Parameter aus den Daten geschätzt werden, sind die kritischen Werte nicht mehr gültig.

Lösung: Verwenden Sie den Lilliefors-Test für normalverteilte Daten mit geschätzten Parametern.
Ignorieren von Bindungen: Bei diskreten Daten oder vielen gleichen Werten (Bindungen) ist der KS-Test zu konservativ.

Lösung: Verwenden Sie den Chi-Quadrat-Test oder den Anderson-Darling-Test für diskrete Daten.
Kleine Stichproben: Für n < 5 sind die kritischen Werte unzuverlässig.

Lösung: Verwenden Sie exakte Tests oder nichtparametrische Alternativen wie den Shapiro-Wilk-Test (für Normalverteilung).

6. Mathematische Herleitung der kritischen Werte

Die asymptotische Verteilung der KS-Teststatistik wurde von Kolmogorov (1933) und Smirnov (1939) entwickelt. Für große Stichproben (n → ∞) konvergiert die Verteilung von √n·D gegen die Kolmogorov-Verteilung:

P(√n·D ≤ x) = 1 – 2∑_k=1^∞ (-1)^k+1 e^-2k²x²

Die kritischen Werte für endliche Stichproben werden durch Simulation oder exakte Berechnung bestimmt. Die folgende Tabelle zeigt die Konvergenz der kritischen Werte für α=0.05:

Konvergenz der kritischen Werte für α=0.05
Stichprobenumfang (n)	Kritischer Wert	Asymptotischer Wert (1.3581/√n)	Relativer Fehler
10	0.457	0.429	6.0%
20	0.331	0.304	8.2%
50	0.210	0.192	8.5%
100	0.148	0.136	8.1%
∞	0.000	0.000	0.0%

Man erkennt, dass die asymptotische Approximation für n ≥ 30 recht genau wird (Fehler < 10%). Für praktische Anwendungen werden jedoch meist die exakten kritischen Werte verwendet, wie sie in statistischen Tabellenwerken (z.B. NIST Engineering Statistics Handbook) zu finden sind.

7. Alternative Tests und Erweiterungen

In bestimmten Situationen sind andere Tests besser geeignet:

Anderson-Darling-Test: Gewichtet die Schwänze der Verteilung stärker und ist daher empfindlicher für Abweichungen in den Rändern. Besonders nützlich für Normalverteilungstests.
Cramér-von-Mises-Test: Berücksichtigt die gesamte Differenz zwischen den Verteilungen, nicht nur das Maximum. Weniger empfindlich gegen Ausreißer.
Shapiro-Wilk-Test: Spezifisch für Normalverteilungstests mit kleinen Stichproben (n < 50). Höhere Power als KS-Test in diesem Kontext.
Lilliefors-Test: Modifikation des KS-Tests für Normalverteilung mit geschätzten Parametern (μ und σ aus den Daten).

Für den Vergleich zweier Stichproben gibt es neben dem Zweistichproben-KS-Test auch:

Wilcoxon-Rangsummentest: Für den Vergleich von Medianen (nicht der gesamten Verteilung)
Permutationstests: Nichtparametrische Tests, die die Verteilung der Teststatistik durch Permutation der Daten approximieren

8. Implementierung in Statistik-Software

Die meisten statistischen Softwarepakete bieten Implementierungen des KS-Tests:

ks.test(x, "pnorm", mean=0, sd=1)  # Einstichproben-KS-Test
ks.test(x, y)                   # Zweistichproben-KS-Test

Python (SciPy):

from scipy.stats import kstest, ks_2samp
kstest(rvs, cdf)               # Einstichproben-KS-Test
ks_2samp(data1, data2)        # Zweistichproben-KS-Test

SPSS: Über “Analysieren → Nichtparametrische Tests → Alte Dialogfelder → K-S bei einer Stichprobe” bzw. “K-S bei zwei Stichproben”
Minitab: “Statistik → Nichtparametrische Tests → Kolmogorov-Smirnov”

Wichtig: Die meisten Softwareimplementierungen berechnen p-Werte statt kritische Werte. Der p-Wert gibt die Wahrscheinlichkeit an, eine mindestens so extreme Teststatistik wie die beobachtete zu erhalten, wenn die Nullhypothese wahr ist. Die Entscheidungskriterien sind:

Wenn p-Wert ≤ α: Nullhypothese ablehnen
Wenn p-Wert > α: Nullhypothese nicht ablehnen

9. Fallstudie: Anwendung in der Finanzmarktanalyse

Ein Hedge-Fonds möchte testen, ob die täglichen Renditen eines Portfolios einer Normalverteilung folgen. Die Stichprobe umfasst n=250 Handelstage. Mit einem Signifikanzniveau von α=0.05 ergibt sich ein kritischer Wert von 0.0885 (aus Tabellen für große Stichproben: 1.3581/√250 ≈ 0.0861, aber exakter Wert ist 0.0885).

Die berechnete Teststatistik beträgt D=0.12. Da 0.12 > 0.0885, wird die Nullhypothese abgelehnt. Dies deutet darauf hin, dass die Renditen nicht normalverteilt sind – ein häufiges Ergebnis in Finanzmarktdaten, das auf Fat Tails (extreme Ereignisse) hindeutet.

Diese Erkenntnis ist entscheidend für Risikomanagementstrategien, da viele finanzmathematische Modelle (z.B. Black-Scholes) Normalverteilung voraussetzen. Alternativen wie die stabile Verteilung von Lévy oder die Student-t-Verteilung könnten besser geeignet sein.

10. Zusammenfassung und Empfehlungen

Der Kolmogorov-Smirnov-Test ist ein vielseitiges Werkzeug für:

Anpassungstests (Vergleich von Stichprobe mit theoretischer Verteilung)
Zweistichprobenvergleiche (Test auf gleiche Verteilung)

Empfehlungen für die Praxis:

Verwenden Sie den KS-Test nur, wenn die Verteilung vollständig spezifiziert ist (keine Parameter aus den Daten schätzen)
Für kleine Stichproben (n < 30) ziehen Sie exakte Tests wie Shapiro-Wilk in Betracht
Bei diskreten Daten oder vielen Bindungen bevorzugen Sie den Chi-Quadrat-Test
Für Normalverteilungstests ist der Anderson-Darling-Test oft die bessere Wahl
Visualisieren Sie immer die empirische und theoretische Verteilung (z.B. mit Q-Q-Plots) zur Plausibilitätsprüfung
Berichten Sie neben dem p-Wert immer auch die Teststatistik und Stichprobengröße

Der KS-Test bleibt trotz seiner Einschränkungen ein Standardwerkzeug in der statistischen Analyse – insbesondere wegen seiner Einfachheit und Nichtparametrik. Für komplexere Fragestellungen sollten jedoch moderne Alternativen in Betracht gezogen werden.