[Total : 1    Moyenne : 5/5]
Le test de McNemar permet de comparer 2 populations ne pouvant prendre que des valeurs 0 ou 1 : 0 étant la non présence d’un caractère, 1 étant la présence d’un caractère.

Introduction

C’est le docteur Quinn McNemar qui créa ce test en 1947. A l’époque, il l’a développé dans le cadre de tests génétiques sur la relation de déséquilibre de transmission (il s’agit de l’étude des associations non aléatoires des allèles à 2 ou plus de gênes qui proviennent d’un même chromosome)1.

Le test de McNemar est un test non-paramétrique dont le but est de comparer 2 populations ne pouvant prendre que des valeurs 0 ou 1 : 0 étant la non présence d’un caractère, 1 étant la présence d’un caractère. Les 2 populations de comparaison étant les mêmes (test sur données appariées). Le test de McNemar est tout particulièrement utilisé dans le cadre des données appariées « avant – après »2 :

Le principe

On considère que l’on veut comparer l’apparition d’un évènement à deux moments différents sur une même population de n individus :

  1. Dans un premier temps, on effectue une mesure du nombre d’apparition de l’évènement recherché.
  2. Dans un second temps, on ré-effectue cette mesure sur ces mêmes individus pour comparer les résultats.
  AprèsTotal
01
Avant0ABA + B
1CDC + D
TotalA + CB + Dn

Etape 1 – Les hypothèses

Supposons que π est la probabilité d’apparition de notre événement. Ce test étant uniquement bilatéral, les hypothèses de test sont :

H0 : π1 = π2 : les probabilités de l’évènement sont identiques

H1 : π1 ≠ π2 : les probabilités de l’évènement sont différentes

Etape 2 – Relever les données

Le test s’appuie sur un tableau de contingence.

Exemple :

Nous fabriquons des sirops pour la toux. Nous avons actuellement un problème important d’étiquettes plissées. Après étude, nous savons qu’un certain défaut de forme du flacon est à l’origine du défaut. Ne sachant pas assurer une production suffisamment fiable au niveau des flacons, nous souhaitons étudier la possibilité d’améliorer notre équipement pour absorber le défaut et éradiquer le problème.

Nous avons sélectionné 40 flacons qui ont été fabriqué dans les moules « à problème ». Nous mettons en place 2 essais :

  • Un premier avec les caractéristiques actuelles de l’équipement.
  • Un second, avec les mêmes flacons que nous avons dés-étiquetés et que nous repassons dans notre équipement que nous avons alors amélioré.

On construit la table de contingence suivante :

  AprèsTotal
Sans défautAvec défaut
AvantSans défaut404
Avec défaut35136
Total39140

Le tableau se lie de la manière suivante :

  • Lors du premier test 36 flacons avaient le défaut.
  • Seulement 1 de ces 36 flacons avec défauts a toujours un défaut lors du second essai.

Etape 3 – Valeur pratique

La statistique de test va consister à comparer le nombre d’apparition de l’évènement entre la situation avant et après. La statistique est la suivante :

On note que si b + c est < 30 alors on apportera la correction de Yates3 pour améliorer l’approximation. Dans ce cas, la statistique est la suivante :

Dans notre cas, le calcul est le suivant :

X2 = (0-35)2/(0+35) = 35

Etape 4 – Valeur critique

La valeur pratique va être comparée à la valeur critique que nous renvoie la loi de distribution du χ2 à 1 degré de liberté.

Soit on la détermine en recherchant directement dans la table du χ2, soit via le tableur Excel avec la fonction : KHIDEUX.INVERSE (risque α;  ddl).

Dans notre cas, la valeur critique est de 3,8415.

Etape 5 – La p-Value

La p-Value du test va nous permettre de conclure définitivement sur le modèle. Elle suit une loi du χ2 et se calcule sous Excel via la formule :

LOI.KHIDEUX (Valeur pratique ; 1)

Dans notre cas, cette valeur est de 0,0000000033.

Cette valeur nous indique qu’on a donc que 0,000000033% de chance de faire une erreur du premier type (risque de voir un écart alors qu’il n’y en a pas).

Etape 6 – Interprétation

RésultatConclusion statistiqueConclusion pratique
Valeur pratique ≥ Valeur critiqueOn rejette H0On conclue que nos 2 séries de valeurs sont statistiquement différentes au niveau de risque α donné.
Valeur pratique < Valeur critiqueOn retient H0On conclue que nos 2 séries de valeurs sont statistiquement identiques ou proches au niveau de risque α donné.
RésultatConclusion statistiqueConclusion pratique
p-value > αOn retient H0Nos séries de données sont identiques ou proches avec un risque de se tromper de p-value%
p-Value < αOn rejette H0Nos séries de données sont statistiquement différentes avec un risque de se tromper de p-value%

Source

1 – Q. McNemar (1947) – Note on the sampling error of the difference between correlated proportions or percentages.

2 – J. Rice (1995) – Mathematical statistics and data analysis.

3 – S. Siegel, N. J. Castellan (1988) –nonparametric statistics for the behavioral science

Share This