[Total : 1    Moyenne : 5/5]
Le test de Friedman est une généralisation du test de Wilcoxon pour plus de 2 échantillons.

Introduction

Le test de Friedman, test non paramétrique, est une généralisation du test de Wilcoxon pour plus de 2 échantillons. Il permet de tester K groupes de données appariées. Par exemple, on souhaite savoir si les notes données à des élèves par plusieurs professeurs sont cohérentes, et valider la qualité du mode de notation. L’appariement est ici les élèves qui sont les mêmes pour les professeurs.

Le fonctionnement du test est proche de celui de Kruskal Wallis. Il est une alternative au test de l’ANOVA à mesure répétée pour les échantillons dépendants non normaux.

Le principe

Tout d’abord, on appelle :

  • Les n « blocs » : Ils représentent la variable d’appariement du test.
  • Les K « échantillons » : ils représentent les éléments que nous souhaitons tester.

Exemple 1 : Nous souhaitons tester la cohérence des notations des professeurs. Le nombre de bloc sera égal au nombre d’élève (commun pour tous les professeurs), et les échantillons seront le nombre de professeur (c’est eux que nous souhaitons tester).

Exemple 2 : Nous souhaitons tester la durée de vie de pneumatique sur différents circuits. Le nombre de bloc sera égal au nombre de circuits différents, et le nombre d’échantillons sera le nombre de pneumatiques que nous souhaitons tester.

L’idée du test est de mettre en avant les écarts qu’il peut y avoir entre les différents échantillons. La statistique de Friedman repose sur un rapport de variance entre les échantillons d’un même bloc et la variance entre les blocs. Tout l’apport est de mesurer cet écart et de conclure que plus l’écart est grand, au plus les échantillons sont différents.

Toute la spécificité avec les autres tests non paramétriques repose sur le fait que nous travaillons sur les rangs à l’intérieur de chaque bloc et non sur la totalité des données.

Etape 1 : Les hypothèses

Au regard du nombre d’échantillon, supérieur à 2, on peut faire uniquement un test bilatéral. Le couple d’hypothèse est toujours :

H0 : les échantillons ne sont pas différents.

H1 : Les échantillons sont différents.

Etape 2. Calculer la somme total des rangs

Le tableau de calcul se compose de K lignes (le nombre d’échantillon) et de n colonnes (le nombre de bloc). Il se présente sous cette forme :

Bloc

Somme des rangs

Échantillon

n1

n2

n3

K1

K2

K3

Le rang de chacune des valeurs est donné par rapport à sa position à l’intérieur d’un bloc. La complexité réside dans le cas où nous avons des ex-aequo. Pour cela, on utilise la méthode des rangs moyens : on leur donne la valeur moyenne de leurs rangs.

Par exemple :

  • si nous avons 2 valeurs égales qui prennent la 8 et 9ème place, alors on leur donne le rang 8,5.
  • Si nous avons 3 valeurs égales, qui prennent la 10, 11 et 12ème place, alors on leur donne à chacune le rang de 11.

Enfin, pour chacun des échantillons, on additionne les rangs qu’ils ont obtenu au sein de chacun des blocs.

Etape 3. Calculer la valeur pratique de Friedman

La valeur pratique de Friedman ressemble à celle de Krukal Wallis. Elle se note Fr est vaut : 

  • n : nombre de bloc
  • K : nombre d’échantillons
  • SRk : somme des rangs du groupe
Dans le cas où nous avons eu des ex-aequo, on prend en compte un facteur de correction qui se calcule de la manière suivante :

Valeur pratique corrigée = Fr / facteur de correction

  • n : nombre de bloc
  • K : nombre d’échantillons
  • t: le nombre d’observation associée à la valeur en question. Si par exemple nous avons 2 valeurs de 6, alors tg sera de 2.

Etape 5. Calculer la valeur critique

Cas 1 : nb d’échantillon K <= 6

Dans ce cas, on utilise les tables exactes de Friedman. Pour un risque α donnée (1 ou 5%), on choisi dans la table la valeur associée pour la colonne K et la ligne n.

Cas 2 : nb d’échantillon K > 6

La valeur pratique Fr suit une loi du χ2 pour un nombre de ddl égal à K – 1. Avec Excel, on utilise la formule KHIDEUX.INVERSE (α ; K – 1).

Etape 6 : Calcul de la p-value

La aussi la p-Value se calcule via la loi du χ2. Avec Excel, on la calcule de la manière suivante :

LOI.KHIDEUX (valeur pratique ; K – 1)

Etape 7. Interprétation

RésultatConclusion statistiqueConclusion pratique
Valeur pratique Fr < valeur critiqueOn retient H0Il n’y a pas de différence entre les échantillons.
Valeur pratique Fr > valeur critiqueOn rejette H0Il y a une différence entre les échantillons.
RésultatConclusion statistiqueConclusion pratique
p-value > αOn retient H0Il n’y a pas de différence entre les échantillons avec un risque de se tromper de p-value%
p-Value est ≤ αOn rejette H0Il y a une différence entre les échantillons avec un risque de se tromper de p-value%

Source

D. Chessel, A. B. Dufour (2003) – Pratique des tests élémentaires

G. W. Corder, D. I. Foreman (2009) – Non parametric statistics for non statisticians

P. Capéraà, B. Van Cutsem (1988) – Méthodes et modèles en statistique non paramétrique

Share This