[Total : 1    Moyenne : 5/5]
Il permet de tester si nos données suivent une loi diverse, en particulier la loi normale.

Introduction

Il s’agit d’un test d’adéquation à la loi Normale. C’est T.W. Anderson et D. A. Darling qui ont développé ce test en 1954. Il sera ensuite repris et développé par Stephens dans les années 70. L’intérêt de ce test est qu’il donne de l’importance aux queues de distribution.

Ce test peut être utilisé pour démontrer une adéquation avec la loi Normale, Lognormal, Exponentielle ou encore Weibull. Le fonctionnement est le même, simplement, il faudra alors changer la table de la valeur critique ainsi que le calcul des Fi. Dans cet article, nous nous concentrerons uniquement sur l’adéquation à la loi Normale.

Le principe

Le principe de calcul est très similaire au Test de Kolmogorov-Smirnov. La différence réside dans le fait que la valeur critique est calculée à partir de la loi Normale, ainsi que la variable de test Fi.

Etape 1 : les hypothèses

Le test d’Anderson Darling est un test d’adéquation unilatéral. Les hypothèses de test sont :

  • H0 : les données suivent la loi Normale
  • H1 : Les données ne suivent pas la loi Normale

Etape 2 : calculer la valeur pratique

  1. Trier les données dans l’ordre croissant.
  2. Déduire la moyenne et l’écart-type.
  3. Calculer les données centrées réduites selon la loi normale
  4. Utiliser la fonction de répartition de la loi normale centrée réduite pour obtenir les fréquences.
  5. Calculer le logarithme népérien de cette valeur.
  6. De la même manière, on forme Fn-i+1 puis on en déduit le logarithme népérien.
  7. On calcule ensuite la somme S : 

 

               8. On en déduit la statistique A2 via le calcul suivant :

Etape 3 : calculer la valeur critique

La valeur critique du test ne se calcule pas mais a été tabulée par les créateurs. Ces valeurs dépendant de la loi d’ajustement, et pour le cas d’un ajustement à la loi Normale, les valeurs sont les suivantes :

Niveau de risque

1%

2,5%

5%

10%

Valeur critique

1,035

0,873

0,752

0,631

Etape 4 : calculer la p-value

La p-value est calculée à partir de la Statistique A2 par interpolation à partir d’une table décrite par Stephens (1986). On utilise le tableau suivant :

Valeur de A2

p-Value

A2 < 0,2

1 – e(-13,436 + 101,14 * A2-223,73 * A2^2

0,2 ≤ A2 ≤ 0,34

1 – e(-8,318 + 42,796 * A2 – 59,938 * A2^2)

0,34 ≤ A2 < 0,6

e(0,9177 – 4,279 * A2 – 1,38 * A2^2)

0,6 ≤ A2

e(1,2937 – 5,709 * A2 + 0,0186 * A2^2)

Etape 5 : interprétation

RésultatConclusion statistiqueConclusion pratique
Valeur pratique ≥ Valeur critiqueOn rejette H0Nos données ne suivent pas la loi normale au niveau de risque α donné.
Valeur pratique < Valeur critiqueOn retient H0Nos données suivent la loi normale au niveau de risque α donné.
RésultatConclusion statistiqueConclusion pratique
p-value > αOn retient H0Nos données suivent une loi normale avec un risque de se tromper de p-value%
p-Value < αOn rejette H0Nos données ne suivent pas une loi normale avec un risque de se tromper de p-value%

Source

M. A. Stephens (1974) – EDF Statistics for Goodness of Fit and Some comparisons

M. A. Stephens (1986) – Tests based on EDF statistics

Share This