[Total : 1    Moyenne : 5/5]
L’Anova en blocs permet d’étudier plus de 2 échantillons appariées.
L’Anova en blocs, appelée également à mesures répétées ou randomized blocks en anglais, est un cas particulier de l’Anova qui peut s’appliquer pour étudier :

Plus de 2 échantillons appariées, là où le test ne peut en faire que 2
Des échantillons dont un certain nombre de mesure ont été faite à plusieurs reprises.

Le principe

Au même titre que l’Anova, on compare la moyenne des différents groupes d’échantillons. On identifie l’énoncé du sujet comme :

  • n : Le nombre de blocs, soit le nombre de groupe de K mesures, soit le nombre de K groupes de données appariées. Il est relatif aux conditions que nous souhaitons tester.
  • K : Le nombre de mesures. Il est représentatif de l’élément que nous souhaitons tester.

 

Exemple :

  • Cas de données appariées : on souhaite étudier l’efficacité d’un additif permettant de réduire la consommation des voitures. On réalise des essais sans et avec additif et on compare sur 5 marques de voitures différentes. Nous avons ainsi n = 2 groupes  (Avant-Après) avec chacun K = 5 voitures.
  • Cas de mesures répétées : on souhaite étudier l’endurance des pneus de voiture. On effectue pour cela K = 5 marques de pneus différents et l’on effectue n = 10 fois l’essai sur chaque pneu, consistant à faire rouler une voiture jusqu’à ce que l’on atteigne le témoin d’usure.

Etant donné que nous sommes dans un cas particulier de l’Anova, on décompose la variance de façon à mettre en évidence celle dû au K mesures. C’est une ANOVA à deux facteurs avec K mesures comme premier facteur et n blocs, le second facteur. Le principe repose sur la comparaison de la moyenne d’une multitude de groupe avec la moyenne générale. On calcule :

  • Variance intergroupe K, SCE : différence entre la moyenne de chaque K groupe de et la moyenne générale.
  • Variance intragroupe n, SCB : différence entre la valeur de chaque bloc et la moyenne générale.
  • Variance résiduelle, SCR : différence entre la variance totale et la somme des variances intergroupe (SCE + SCB).
  • Variance Totale, SCT : différence entre la valeur de chaque individu et la moyenne générale.

Tableau ANOVA en blocs

Source de variance∑carrésDDLCarré moyenFp-value
Intergroupe (K mesures)SCEK - 1CMECMECMRp-value
Intragroupe (n blocs)SCBn - 1CMB
RésiduelleSCR(n - 1) * (K - 1)CMR
TotaleSCTn * K - 1

Etape 1 : Les hypothèses

La finalité du test est strictement la même que pour l’Anova à 1 facteur.  L’hypothèse initiale est :

H : μ1 = μ2 = … = μk

H1 : au moins 2 moyennes sont différentes

Etape 2 : Calculer la Somme des Carrés des Ecarts – SCE

On calcule la différence entre la moyenne générale et la moyenne de chacun des K groupes. Autrement dit, au plus cette valeur sera grande au plus la moyenne de chacun des K groupes diffèrent les uns des autres.

  •  n : Nb de blocs de mesures
  • μkgroupe : Moyenne de chacun des groupes de K mesures
  • μgénérale : Moyenne de l’ensemble des mesures

Etape 3 : Calculer la Somme des Carrés des Blocs – SCB

On calcule la Variance expliquée par les blocs. Ainsi, au plus celle-ci sera grande, au plus la variance apportée par les K mesures sera faible et donc au moins nos échantillons seront différents.

  • K : Nb de mesures par blocs
  • μnblocs : Moyenne de chacun des blocs
  • μgénérale : Moyenne de l’ensemble des mesures

Etape 4 : Calculer la Somme des Carrés Totale – SCT

La somme des carrés totale représente la différence de chacune de nos mesures vis-à -vis de la moyenne générale.

Etape 5 : Déduire la Somme des Carrés des Résidus – SCR

On déduit les résidus en calculant la différence entre la variance totale et les variances des groupes. Autrement dit, il s’agit de la variabilité que l’on ne sait expliquée par la variance des n blocs ou des K mesures.

SCR = SCT – SCE – SCB

Etape 6 : Calculer le nombre de degrés de liberté

Les degrés de liberté sont représentatifs du niveau de connaissance que nous pouvons tirer de notre test. Dans notre cas, nous obtenons les éléments suivant :

  • Nb de ddl intragroupe : ddliSCE = K – 1
  • Nb de ddl intergroupe : ddlSCB = n – 1
  • Nb de ddl résiduel : ddlSCR = (n – 1) * (K – 1)
  • Nb de ddl total : ddlSCT = n * K – 1

Etape 7 : Calculer les Carrés Moyens

Les carrés moyens représentent le “poids” que l’on peut donner aux différentes valeurs de variances. Ils se calculent en faisant le rapport avec les DDL.

  • CME = SCE / ddlSCE
  • CMB = SCB / ddlSCB

Etape 8 : Valeur pratique

La statistique de test représente le rapport entre la variance expliquée par nos K mesures et la variance résiduelle. Elle se calcule de la manière suivante :

F = CME / CMR

Etape 9 : Calculer la valeur critique

La statistique de test suit une loi de Fisher à (K-1, (n-1)*(K-1)) degrés de libertés. On choisit la valeur du risque souhaité, généralement 5%, puis on détermine la valeur critique via Excel en utilisant la formule suivante :

INVERSE.LOI.F.N(1 – α ; ddliSCE ; ddlSCR)

Etape 10 : Calculer la p-Value

Pour valider la significativité du test, on calcule la p-value qui suit également une loi de Fisher. On utilise pour cela Excel avec la formule suivante :

p-value = Loi.F ( Valeur pratique ; ddliSCE ; ddlSCR )

Etape 11 : Interprétation

Sens du testRésultatConclusion statistiqueConclusion pratique
BilatéralValeur pratique ≥ Valeur critiqueOn rejette H0Les échantillons ont des moyennes qui diffèrent au niveau de risque α donné.
Valeur pratique < Valeur critiqueOn retient H0Les échantillons ont des moyennes qui ne diffèrent pas au niveau de risque α donné.
RésultatConclusion statistiqueConclusion pratique
p-value > αOn retient H0Nos séries de données sont identiques ou proches avec un risque de se tromper de p-value%
p-Value < αOn rejette H0Nos séries de données sont statistiquement différentes avec un risque de se tromper de p-value%

Source

D. R. Shupe (1995) – Inferential statistics : an introduction to the analysis of variance

D. C. Howell (2001) –  Statistical methods for psychology

G. W. Cobb (1998) – Introduction to design and analysis of experiments

R. Rakotomalala (2013) – Comparaison de populations, tests paramétriques

Share This