Introduction
Le test de Kolmogorov-Smirnov, créée par Andréï Nicolaïevitch Kolmogorov en 1933 (statisticien russe créateur de l’université de Moscou), permet de connaître le niveau d’ajustement de nos données à une loi quelconque.
On note que pour tester la normalité, on lui préférera le Normal Probability Plot et pour tester une correspondance à une loi diverse, on lui préférera le test du Chi2, plus robuste et plus fiable particulièrement pour les échantillons de faibles tailles (moins de 30 observations).
Pour autant, ce test est parmi les plus fiables pour les échantillons de grandes tailles.
Le principe
Le test de Kolmogorov Smirnov est un test non paramétrique (très pratique donc pour des données ordonnées par exemple) qui permet de tester l’hypothèse H0 selon laquelle les données observées suivent une loi théorique. Les calculs de probabilité reposent sur l’écart maximal entre la fonction théorique et la fonction observée réellement.
On note que si l’utilisation de ce test consiste à comparer nos données à la loi normale, le test se nomme alors test de Lilliefors.
Etape 1 : les hypothèses
On souhaite tester les hypothèses suivantes :
- H0 : D = D0 : nos données suivent la loi théorique
- H1 : D ≠ D0 : nos données ne suivent pas la loi théorique
Etape 2 : calculer la valeur pratique
La valeur pratique consiste à calculer l’écart le plus grand entre le cumul réel de nos fréquences de données et le cumul théorique calculé à partir de la loi que nous avons déterminée.
- Identifier les fréquences des classes : On reprend le processus de calcul des graphiques de distributions.
- Créer à côté une colonne affichant la fréquence théoriques. Celle-ci peuvent être uniquement “souhaitées” ou calculées selon la loi binomiale ou toutes autres lois.
- Calculer le cumul réel et le cumul théorique.
- Déduire la différence entre le cumul théorique et le cumul réel pour chacune des intervalles.
- Enfin on en déduit la valeur pratique K qui est égale au maximum de la différence calculée précédemment (flèche verte dans le schéma ci-contre) rapporté au nombre d’échantillons.

Etape 3 : calculer la valeur critique
La valeur critique de Kolmogorov Smirnov est donnée dans les tables exactes de Kolmogorov Smirnov pour un risque α donné et un nombre d’observations n relatif à notre situation.
Etape 4 : interprétation
Au regard de nos hypothèses initiales, l’interprétation du test est la suivante :
Résultat | Conclusion statistique | Conclusion pratique |
---|---|---|
Valeur pratique ≥ Valeur critique | On rejette H0 | Nos données ne suivent pas la loi théorique au niveau de risque α donné. |
Valeur pratique < Valeur critique | On retient H0 | Nos données suivent la loi théorique au niveau de risque α donné. |
Source
R. Rakotomalala (2011) – Probabilités et statistiques
Norme NF X 06-050 – Etude de la normalité d’une distribution