[Total : 1    Moyenne : 5/5]
Le test de Kolmogorov Smirnov a pour principal intérêt de traiter des données ordinales.

Introduction

Le test de Kolmogorov-Smirnov, créée par Andréï Nicolaïevitch Kolmogorov en 1933 (statisticien russe créateur de l’université de Moscou), permet de connaître le niveau d’ajustement de nos données à une loi quelconque.

On note que pour tester la normalité, on lui préférera le Normal Probability Plot et pour tester une correspondance à une loi diverse, on lui préférera le test du Chi2, plus robuste et plus fiable particulièrement pour les échantillons de faibles tailles (moins de 30 observations).

Pour autant, ce test est parmi les plus fiables pour les échantillons de grandes tailles.

Le principe

Le test de Kolmogorov Smirnov est un test non paramétrique (très pratique donc pour des données ordonnées par exemple) qui permet de tester l’hypothèse H0 selon laquelle les données observées suivent une loi théorique. Les calculs de probabilité reposent sur l’écart maximal entre la fonction théorique et la fonction observée réellement.

On note que si l’utilisation de ce test consiste à comparer nos données à la loi normale, le test se nomme alors test de Lilliefors.

Etape 1 : les hypothèses

On souhaite tester les hypothèses suivantes :

  • H0 : D = D0 : nos données suivent la loi théorique
  • H1 : D ≠ D0 : nos données ne suivent pas la loi théorique

Etape 2 : calculer la valeur pratique

La valeur pratique consiste à calculer l’écart le plus grand entre le cumul réel de nos fréquences de données et le cumul théorique calculé à partir de la loi que nous avons déterminée.

  1. Identifier les fréquences des classes : On reprend le processus de calcul des graphiques de distributions.
  2. Créer à côté une colonne affichant la fréquence théoriques. Celle-ci peuvent être uniquement “souhaitées” ou calculées selon la loi binomiale ou toutes autres lois.
  3. Calculer le cumul réel et le cumul théorique.
  4. Déduire la différence entre le cumul théorique et le cumul réel pour chacune des intervalles.
  5. Enfin on en déduit la valeur pratique K qui est égale au maximum de la différence calculée précédemment (flèche verte dans le schéma ci-contre) rapporté au nombre d’échantillons.

Etape 3 : calculer la valeur critique

La valeur critique de Kolmogorov Smirnov est donnée dans les tables exactes de Kolmogorov Smirnov pour un risque α donné et un nombre d’observations n relatif à notre situation.

Etape 4 : interprétation

Au regard de nos hypothèses initiales, l’interprétation du test est la suivante :

RésultatConclusion statistiqueConclusion pratique
Valeur pratique ≥ Valeur critiqueOn rejette H0Nos données ne suivent pas la loi théorique au niveau de risque α donné.
Valeur pratique < Valeur critiqueOn retient H0Nos données suivent la loi théorique au niveau de risque α donné.

Source

R. Rakotomalala (2011) – Probabilités et statistiques

Norme NF X 06-050 – Etude de la normalité d’une distribution

Share This