[Total : 3    Moyenne : 3.7/5]
Les plans d’expériences permettent de structurer le recueil d’informations pour évaluer les liens entre une variable à expliquer Y, et une ou plusieurs variables explicatives X.

Introduction

Les plans d’expériences permettent de structurer le recueil d’informations pour évaluer les liens entre une variable à expliquer Y, appelée réponse, et une ou plusieurs variables explicatives X appelées facteurs (ou encore variable de prédiction selon la norme IS0 3534-3). Ces liens nous permettant par la suite d’identifier une relation de cause à effet ou d’identifier un optimum pour concevoir un meilleur produit.

Mathématiquement parlant, il s’agit ni plus ni moins que des calculs de régressions. La particularité des plans d’expériences reposent sur le fait de faire varier simultanément plusieurs facteurs et ainsi :

  • De réduire le nombre d’essais au juste nécessaire pour prendre une décision, dans le but de faire gagner du temps, de l’argent ou tout simplement de rendre possible l’identification des liens entre réponses et facteurs.
  • Prendre en compte les interactions entre les différents facteurs pour construire le modèle de prédiction.
  • Identifier les facteurs ayant une influence et de quantifier les effets des facteurs sur la réponse.

On notera par ailleurs qu’un plan d’expériences correspond à la réalisation de N expériences qui sont toutes :

  • Déterminées à priori.
  • Obligatoirement réalisables.
  • Indépendantes entre elles.

Historique

  • Au 17ème siècle : les principes de base sont énoncés par Francis Bacon. Il fait par exemple macérer des grains de blés dans des concoctions différentes pour étudier l’effet de celle-ci sur la vitesse de germination.
  • Au 18ème siècle : des scientifiques de l’époque approfondissent le sujet. Nous retrouvons parmi eux Antoine-Laurent de Lavoisier, Arthur Young et Johann Georg Von Zimmermann dont nous extrayons le texte suivant : « une expérience diffère d’une simple observation, en ce que la connaissance qu’une observation nous procure, semble se présenter d’elle-même ; au lieu que celle qu’une expérience nous fournit, est le fruit de quelques tentatives que l’on fait dans le dessein de voir si quelque chose est, ou n’est point1».
  • Au 19ème siècle : Introduction de la statistique dans la planification des expériences et dans l’analyse des résultats.

 

Ce sera à partir de 1920, par le mathématicien britannique Sir Ronald Fisher, que l’on définit le point de départ de l’expérimentation moderne. Ses travaux, développés dans le secteur de l’agronomie (il souhaitait alors augmenter les rendements agricoles en combinant divers types d’engrais, de terrains, de variétés, de méthodes de cultures…), seront ensuite améliorés et déployés au cours du siècle et en particulier après la seconde guerre mondiale. De nombreuses publications apparaissent : les statisticiens comme Yates, Cochran, Plackett et Burman enrichissent les méthodes2, 3, 4.

Mais à l’époque, ces méthodes complexes ne pouvaient être appliquées que par les statisticiens spécialistes. A partir des années 1950, dans la démarche d’amélioration de la qualité, les Japonais impriment un nouveau souffle. Taguchi et Masuyama élaborent des tables permettant de simplifier la mise en oeuvre des plans d’expériences et qui s’adaptent à la majorité des problèmes industriels5.

Ces différentes manières d’aborder la planification des expériences ont été proposées à des époques variées, dans différents pays et dans différentes disciplines. Les statisticiens parlent de carrés latins et de plans factoriels. Les chimistes utilisent plus volontiers les plans de Plackett et Burman. Les qualiticiens et spécialistes du Six Sigma ne voient que par les tables de Taguchi.

Désormais avec la démocratisation des outils informatiques, les plans d’expériences sont de plus en plus utilisés et de nouvelles méthodes apparaissent.

Etape 1 : La définition de la problématique d’étude

La première étape est de définir le sujet de l’étude. Il se traduit par une problématique d’étude qui peut être très diverse :

  • Dysfonctionnement d’un produit ou d’un service.
  • Identification des réglages pour obtenir la meilleure performance d’une machine.
  • Définition du meilleur mélange pour obtenir un produit.

Quant à la variable à expliquer, la réponse peut être de tout type (une vitesse, une quantité, un pourcentage…), mais reste à la définir avec précision :

  • Qui effectue la mesure ?
  • Qu’est ce que l’on mesure ?
  • Où on le mesure ?
  • Quand on le mesure ?
  • Comment on le mesure ?
  • Combien de fois on le mesure et dans quelle unité ?

Etape 2 : La définition des facteurs

2.1 – La liste de tous les facteurs

On doit identifier les paramètres à priori responsables des variations des réponses. Ce recensement exhaustif doit se faire en groupe et en s’appuyant sur des outils comme le brainstorming, le 5M ou encore l’AMDEC.

2.2 – Le choix des facteurs

Le nombre d’expériences et la qualité du modèle dépendent directement du nombre de facteurs que nous allons prendre en compte. Il est donc nécessaire de supprimer les facteurs sans influence dès le départ. Pour cela, plusieurs techniques sont possibles :

  • Supprimer « à priori » des facteurs nous paraissant peu probable : Par exemple, dans l’analyse 5M des causes à un problème, il s’agit de supprimer les causes improbables ou celles que nous sommes certains qu’elles ne peuvent influer sur le problème.
  • Utiliser l’approche traditionnelle : on fait varier un facteur à la fois, les autres étant fixes, pour simplement voir si un facteur à une quelconque influence sur la réponse.
  • Enlever les facteurs « non contrôlables » : Si un des facteurs potentiels est difficilement mesurable ou simplement, dans la réalité, on ne pourra pas s’assurer de son niveau, il n’est donc pas utile de le prendre en compte. On indiquera simplement que pour ces essais, ce facteur était à ce niveau ou environ ce niveau. On appelle cela une variable de contrôle.
  • Utiliser une grille de choix : on peut prioriser les facteurs en fonction de différents critères qui peuvent être le niveau d’influence supposé, la faisabilité, le besoin d’informations…

Comment intégrer une variable qualitative

Comme dans toute étude statistique, toute la complexité est dans le traitement des variables qualitatives. Diverses solutions existent :

  • Transformer un facteur qualitatif en quantitatif : c’est l’exemple typique de la couleur. On pourra transformer un facteur à 3 modalités (bleu, jaune, violet) en quantitatif en parlant de longueur d’onde (respectivement 446-520, 565-590, 380-446).
  • Intégrer les facteurs qualitatifs en « paramètre » : ils ne rentrent pas dans le modèle mathématique mais permettent d’effectuer des groupes d’essais dont nous allons pouvoir comparer les résultats.
  • Utiliser uniquement la technique du Screening : décrite ci-dessous, elle permet de prendre en compte uniquement 2 modalités, et on pourra déjà « déblayer le terrain ».

2.3 – Choisir les interactions

En fonction des estimations, essais et expériences, on souhaite intégrer ou non les interactions dans le modèle. On le comprend, au moins nous n’avons d’interactions à étudier au plus un plan d’expériences sera réduit. Mais de quoi parle t’on ?

On dit qu’il y a interaction entre deux facteurs si l’effet moyen de l’un n’est pas le même suivant que l’on se place au niveau bas ou au niveau haut de l’autre.

Par exemple :

N° d’expérience

X1

X2

Réponse Y

1

-1

-1

60

2

+1

-1

85

3

-1

+1

75

4

+1

+1

90

On remarque que lorsque l’effet X1 est à +1, nous avons une variation moyenne de 2,5 ((90-85)/2). Lorsque cet effet est à -1, l’effet moyen est de 7,5 ((75-60)/2). Ces 2 nombres étant différents, nous avons donc bien une interaction avec un autre facteur. On notera cette interaction X1X2.

On note également qu’une interaction entre 2 facteurs est dite d’ordre 2, une interaction entre 3 facteurs d’ordre 3…

L’interaction entre deux facteurs X1 et X2 sera, dans la suite, considérée comme un nouveau facteur que l’on notera X1X2.

Etape 3 : Le choix du domaine expérimental

Chaque facteur doit être défini avec différents « niveaux ». Là aussi, c’est un point essentiel pour le calcul du nombre d’expériences. Au plus les facteurs ont de niveau (exemple : 1, 5, 10), au plus le nombre d’expériences augmentent. Le nombre d’expériences dans le cas où nous souhaitons faire un plan complet, la formule de calcul est :

N = Nb de niveaux facteur 1 *  Nb de niveaux facteur 2…

3.1 – Définition des niveaux des facteurs

Pour 3 facteurs à 2 niveaux (un niveau est un Traitement), nous serions emmenés à faire 23 expériences, soit 6 expériences pour un plan complet. Pour 3 facteurs avec respectivement 3, 2 et 4 niveaux, nous avons 24 expériences. Le nombre de niveaux dépend de la précision que nous souhaitons, mais surtout du type de données :

  • Facteur Quantitatif : Généralement, on choisit 2 niveaux qui correspondent à la borne inférieure et à la borne supérieure. Si nous souhaitons avoir plus de précision ou que nous avons de nombreux doutes, on prend plus de niveaux.
  • Facteur Qualitatif : Les niveaux correspondent au nombre de modalité que peut prendre le facteur. Toutefois, on devra essayer de les limiter car le nombre d’expériences peut très rapidement augmenter.

On va les choisir en fonction :

  • Des réalités du système : il ne sert à rien de prendre des valeurs que l’on sait que l’on ne pourra atteindre dans la réalité.
  • De la connaissance du système : suivant la connaissance à priori du système, on peut définir le domaine d’étude suivant les évolutions recherchées des réponses.

On appellera ce système de valeur le domaine expérimental qui se présente sous la forme d’un tableau :

Facteur 1

Facteur 2

-1

2 bar

50°C

+1

10 bar

80°C

3.2 – Définition des paramètres

Ils jouent le même rôle que les facteurs, mais ils ne sont pas pris en compte dans la définition des plans d’expériences, et ne figurent donc pas dans les expressions mathématiques des modèles. Les paramètres sont des variables prenant un nombre fini de valeurs distinctes. Généralement, ils peuvent simplement servir « d’aide mémoire » pour savoir que les essais se sont effectués dans telle ou telle condition (température ambiante…).

De manière pratique, les paramètres permettent de faire intervenir les facteurs qualitatifs. Par exemple, nous avons un facteur qui est la présence d’une pièce ou non sur une machine jouera t’elle une influence sur la performance de celle-ci. On définira les différents facteurs de réglages de la machine, puis on fera 2 séries d’essais : une avec la pièce, une autre sans la pièce. On comparera ensuite les 2 séries de résultats.

Lorsque plusieurs paramètres sont définis dans la même étude, il y a alors définition des combinaisons de paramètres, c’est-à-dire de toutes les combinaisons possibles entre les valeurs de chaque paramètre. Leur nombre peut devenir rapidement important. L’usage des paramètres s’avère délicat car extrêmement coûteux. Lors de l’utilisation typique des paramètres, les calculs utilisant les plans d’expériences sont réalisés pour chacune de ces combinaisons.

3.3 – Les contraintes particulières

Il y a deux types de contraintes à l’élaboration d’un plan d’expériences :

  • Les essais interdits : il peut y avoir des incompatibilités physiques ou tout autre raison qui puisse faire qu’un essai ne peut être réalisé.
  • Les essais obligatoires : si nous savons qu’un essai peut être très représentatif, il faut absolument le prévoir. De la même manière, si nous avons déjà réalisé des essais nous pouvons les intégrer ou comparer les résultats avec de nouveaux essais.

Ces contraintes ne sont prises en compte que lorsqu’elles viennent restreindre le domaine expérimental. Dans le cas contraire, il faudra utiliser des techniques de construction de plans utilisant les critères optimalités. Parmi les plus courants, nous retrouvons les critères de D-optimalité, A-optimalité, E-optimalité, G-optimalité ou encore J-optimalité.

Etape 4 : Choisir le modèle

Le choix du type de modèle de plan d’expériences se fait en fonction de l’objectif et du niveau de connaissances que nous avons du système à étudier. On précise toutefois, que pour tout plan d’expériences non complet, l’économie du nombre d’expériences se paye :

  • Il n’est plus possible de calculer toutes les interactions entre tous les facteurs. Ce point n’est pas fondamental si l’objectif est uniquement de déterminer l’influence relative des facteurs vis-à-vis de la réponse et donc de ne pas considérer les interactions entre les facteurs.
  • Les effets calculés sont la plupart des cas aliasés. Cela signifie qu’ils ne traduisent pas directement l’effet des facteurs considérés individuellement mais un ensemble de facteurs et d’interactions. Il est donc parfois impossible de conclure de façon sûre sur l’effet d’un facteur, puisque dans un aliase, chaque terme peut se révéler influent. Cependant, il est couramment admis que, plus les interactions sont d’ordre élevé, moins elles sont supposées être influentes. Il est préférable d’aliaser avec des interactions d’ordre élevé en priorité. Cela amène à la notion de résolution.

Etape 4.1 : « Déblayer le terrain » et valider l’influence des facteurs

On utilise la technique du screening (appelé également plan de criblage). Les facteurs ont obligatoirement 2 niveaux, et le choix du type de plan se fait en fonction des interactions que nous souhaitons prendre en compte. On notera que pour ce type de plan, les facteurs peuvent être quantitatif ou qualitatifs.

Type de plans*Nb d'essaisPrise en compte des interactionsPrécision du résultatFacilité de constructionFacilité d'interprétation
Plans factoriels complets0quantitatifsToutes++++Très facile
Plans factoriels fractionnaires+En fonction de la résolution choisie+0Nécessité de connaître les notions d'aliases
Taguchi+Uniquement d'ordre 2++
Plackett Burman++Aucune00Facile

* L’ensemble de ces plans repose sur le principe des matrices d’Hadamard.

Un cas est toutefois bien spécifique, les mélanges : si nous sommes dans le cas de mélange de produit (autrement dit les variables sont dépendantes les unes des autres) des plans spécifiques « pour mélanges » utilisant les réseaux de Scheffé sont à utiliser.

De façon plus large, le Screening permet de classer les facteurs entre eux en fonction de leur influence. Elle permet d’avancer dans la compréhension du système et de ne retenir que les facteurs dignes d’intérêt. Pour utiliser cette technique, on a tout intérêt à prendre en compte le maximum de facteurs pour éviter d’en oublier un.

Etape 4.2 : Optimiser le modèle

Utiliser généralement à la suite du Screening, les méthodes des surfaces de réponses sont utilisées pour optimiser notre modèle. On prend en compte uniquement les facteurs que nous avons jugés influents lors de la phase de Screening, et on les évalue en prenant en compte plus de niveaux et les effets quadratiques (autrement dit les relations non proportionnelles qu’il peut y avoir entre un facteur et une réponse).

On notera que pour cette phase d’optimisation, les facteurs sont nécessairement quantitatifs.

Type de plansNb d'essaisPrise en compte des interactionsPrécision du résultatFacilité de constructionFacilité d'interprétationNb de niveau par facteur
Doelhert+quantitatifsOui000X
Composite centré-Oui+++Multiple de 3 ou 5
Box Behnken+Oui000Multiple de 3
Taguchi+Uniquement d'ordre 2+++Jusqu'à 5
Factoriel complet -Toutes++++++X
Factoriel fractionnaire+Aucune+002

Etape 5 : Construire la matrice d’expériences

Dès lors, on construit la matrice d’expériences et des réponses. C’est le tableau qui indique la liste des expériences à réaliser et la façon de faire varier les facteurs. Elle dépend bien entendu de l’ensemble des éléments choisis en amont. Par exemple :

N° d’expérience

X1

X2

Réponse Y

1

-1

-1

60

2

+1

-1

85

3

-1

+1

75

4

+1

+1

90

Etape 6 : Effectuer les essais

6.1 La taille d’échantillon

Par essai, on défini un nombre d’échantillons que nous allons tester. Dans le cadre d’une production en grande série, il est généralement admis que l’on utilise 30 échantillons par essai et la réponse sera la moyenne de ces 30 échantillons.

6.2 Les essais

Les essais doivent s’effectuer en respectant les conditions d’expérimentation. L’ensemble des paramètres en dehors du plan doit être sous contrôle et noté (température ambiante…) et le personnel formé aux instructions.

L’ordre des essais est quand à lui aléatoire. En effet, les conditions devant être “maîtrisées“, quelque soit l’ordre des essais, on doit toujours obtenir les mêmes résultats. Pour cette raison, les logiciels indiquent un ordre aléatoire des essais.

Toutefois, en pratique, pour des raisons de faisabilité, on effectue les expériences dans l’ordre qui nous arrange. Typiquement, si modifier le facteur X1, cela nous demande 2 heures de réglage, alors que le X2 nous demande 5mn, on va plutôt faire toutes les expériences où X1 = -1 à la suite, pour n’avoir à effectuer qu’un seul changement.

C’est ici un bon moyen de vérifier que nos essais s’effectuent dans des conditions maîtrisées. On peut refaire un essai pour vérifier que le résultat est bien identique au premier. Si tel n’est pas le cas, le plan n’est pas maîtrisé, et on doit investiguer sur le sujet car le process n’est pas robuste.

Etape 7 : Calculer les effets

Les calculs reposent sur les mêmes principes mathématiques que les régressions multiples dont le modèle est dépendant de la relation que nous avons choisie initialement. Nous retrouvons :

Phase de Screening

Modèle avec interaction (complet, Taguchi ou fractionnaire)

Y = a  + a1X1 + a2X2 + a3X1X2

Modèle sans interaction (Plackett Burman)

Y = a  + a1X1 + a2X2

Phase d’optimisation

Modèle avec interactions

Y = a  + a1X1 + a2X12 + a3X13 + a4X2 + a5X1X2

Modèle sans interactions

Y = a  + a1X1 + a2X12 + a3X13 + a4X2

Etape 7.1 : Mettre en place la matrice des effets

Sur la base de la matrice d’expériences précédentes, on construit la matrice des effets. Celle-ci dépend du type de modèle de plan d’expériences choisi :

  1. Rajouter première colonne de +1 à gauche de la matrice pour prendre en compte la constante a .
  2. Rajouter ou non les colonnes des interactions, selon un protocole identifié par les différents plans d’expériences.
  3. Suivre le processus de construction proposé par chacune des méthodes.

Etape 7.2 : Calculer les effets

Le calcul est le même que pour une régression multiple. On propose juste ci-dessous une version simplifiée du complexe calcul matriciel classique, mais les résultats sont les mêmes :

  1. On calcule la transposée de la matrice des effets
  2. On effectue le produit matriciel de cette matrice avec les réponses Y
  3. On divise les résultats par le nombre d’essai n

D’une manière encore plus simple et pour « le faire à la main », chaque estimation d’un coefficient est égale à la somme des réponses Y affectées des signes de la colonne de la matrice des effets correspondant au facteur divisé par le nombre d’expériences.

Par exemple :

Essai

A 

A1X1

A2X2

A12X1X2

Réponse Y

1

+1

-1

-1

+1

60

2

+1

+1

-1

-1

65

3

+1

-1

+1

-1

75

4

+1

+1

+1

+1

85

Nous avons :

  • a  = (+60 + 65 + 75 + 85) / 4 = 71,25
  • a1 = (-60 + 65 – 75 + 85) / 4 = 3,75
  • a2 = (-60 – 65 + 75 + 85) / 4 = 8,75
  • a12 = (+60 – 65 – 75 + 85) / 4 = 1,25

Etape 8 : Calculer le coefficient de détermination R2

Au même titre que pour les régressions, on calcule le coefficient de détermination. Celui-ci permet d’avoir un indicateur sur le taux de variation des réponses que notre modèle permet d’expliquer. Il se calcule de la manière suivante :

Attention, si le nombre de coefficient est égal au nombre d’essais, alors le modèle est dit descriptif et le R2 sera égal de 100%. Pour éviter cela, on calcule le R2 ajusté, qui se calcule via la formule6 :

Etape 9 : Lecture graphique des résultats

Il est usuel de représenter l’effet d’un facteur par un segment de droite dont le coefficient directeur vaut cet effet. Sur l’axe des abscisses, on indique les positions -1 et +1. En ordonnée, on indique la moyenne des réponses lorsque le facteur est à -1 ou à +1. Puis on trace la droite qui lie les 2 points.

Dans l’exemple ci-dessus, on observe que l’effet du facteur représenté à gauche est plus important que celui de droite (la pente étant plus importante). A noter que si les droites sont parallèles alors il n’y a pas d’interaction entre les facteurs. A contrario, si les droites ne sont pas parallèles ou si celles-ci se croisent, il y a donc une forte interaction.

Dans l’exemple ci-dessus, on observe que l’effet du facteur représenté à gauche est plus important que celui de droite (la pente étant plus importante). A noter que si les droites sont parallèles alors il n’y a pas d’interaction entre les facteurs. A contrario, si les droites ne sont pas parallèles ou si celles-ci se croisent, il y a donc une forte interaction.

Etape 10 : Significativité des coefficients

Pour chacun des coefficients, on effectue une Anova pour identifier l’importance de l’influence du facteur dans le modèle de prédiction. La spécificité réside dans le fait que la variation résiduelle SCR est égale à la somme des SCE des différentes interactions.

Il est essentiel d’effectuer cette opération. Cette analyse permet de retirer du modèle les facteurs peu significatifs et ainsi réduire le nombre d’expériences et d’analyses supplémentaires. Et donc les coûts.

10.1 – Les hypothèses

Dans notre cas, nous exprimons les hypothèses sous la forme :

H0 : ax = 0

H1 : ax ≠ 0

10.2 – Calcul des Ecarts SCE

Pour chacun des facteurs principaux, on calcule les écarts vis-à-vis de la moyenne. Nous les calculons de la manière suivante :

SCEi = nk(Y-i - Y-)2
Avec :

  • nk : le nombre de fois où le facteur prend la une valeur i
  • Yibarre : moyenne des réponses quand le facteur a pris sa valeur i
  • Ybarre : moyenne des réponses

10.3 – Calcul de la variation Résiduelle SCR

La variation résiduelle équivaut à la somme des écarts des différentes interactions. On peut soit calculer l’ensemble des SCE des interactions et les additionner ou le déduire via la formule :

SCR = SCT – Σ SCE

Avec :

  • SCT : Somme carré des écarts Totaux = Σ (Yi – Ybarre)2
  • Σ SCE : somme de l’ensemble des SCE des facteurs principaux

10.4 – Calcul des Carrés Moyens

On poursuit le processus Anova et on calcule les Carrés Moyens. On les calcule de la manière suivante :

CMEx = SCEx / ddlx

CMR =SCR / ddlr

Avec :

  • CMEx : Carré Moyen de chacun des facteurs principaux
  • ddlx : degré de liberté de chacun des facteurs principaux, toujours égal à 1
  • CMR : Carré Moyen des résidus.
  • ddlr : degré de liberté des résidus, égal au nombre d’interactions

10.5 – Calcul de la valeur pratique

Pour chacun des facteurs principaux, on calcule une valeur pratique. Celle-ci se calcule via la formule suivante :

Valeur pratique = CMEx / CMR

L’interprétation est la suivante :

  • Valeur pratique > Valeur critique : On rejette H0, et on conclue que le facteur a une influence forte au sein du modèle.
  • Valeur pratique < Valeur critique : On retient H0, et on conclue que le facteur n’a pas d’influence sur le modèle.

10.6 – Calcul de la p-Value

On calcule la p-Value qui nous indique l’influence de chaque facteur. Elle suit une loi de Fisher. Sous Excel, on la calculer via la formule :

p-Value = LOI.F. (Valeur pratique ; ddlSCEx, ddlSCR)

L’interprétation est la suivante  :

  • p-Value < α : le facteur est influent, il faut le retenir dans notre modèle.
  • p-Value > α : le facteur est peu influent, il faut le sortir de notre modèle. 

Etape 11 : Significativité du modèle

Ce test permet de dire si le modèle nous apporte quelque chose, si l’équation établit bien une relation entre la variation des facteurs et la réponse, ou si c’est dû à un changement ou à une fluctuation aléatoire. On va également procéder à une Anova.

11.1 – Les Hypothèses

Dans notre cas, nous exprimons les hypothèses sous la forme :

H0 : le modèle ne permet pas de décrire la variation des résultats d’essais

H1 : le modèle permet de décrire la variation des résultats des essais

11.2 – Calculer les écarts dû à la liaison – SCEL

On additionne l’ensemble des écarts entre les valeurs estimées de notre modèle et la moyenne des réponses.

SCEL = Σ (Yest – Ybarre)2

Avec :

  • Yest : Chacune des réponses estimées par notre modèle
  • Ybarre : moyenne des réponses observées

11.3 – Calculer les résidus du modèle – SCER

Ils représentent la différence entre la réponse observée et la prédiction du modèle que nous venons de construire. Il se calcule avec la formule suivante :

SCER = Σ (Yest – Yi)2

On le comprend, l’enjeu est de pouvoir minimiser cette valeur, indiquant ainsi que notre modèle « colle » au mieux à la réalité.

Dans le cas où notre modèle prend en compte l’ensemble des facteurs, on ne peut effectuer le test car nous avons “utilisé” tous les degrés de liberté du modèle. Il est donc nécessaire de retirer du modèle le ou les facteurs les moins influents.

11.4 – Calculer les Carrés Moyens

On poursuit l’Anova et on calcule les carrés moyens. Nous obtenons les 2 formules suivantes :

CML = SCEL / ddlSCEL

CMR = SCER / ddlSCER

Avec :

  • ddlSCEL : degré de liberté du modèle. Il est égal au nombre de facteurs et d’interactions pris en compte dans le modèle moins 1.
  • ddlSCER : degré de liberté des résidus. Il est égal au nombre d’essai moins le nombre de facteurs et d’interactions pris en compte dans le modèle.

11.5 – Calcul de la valeur pratique

La valeur pratique est le rapport entre les carrés moyens soit :

Valeur pratique = CML / CMR

La valeur pratique exprime le rapport de 2 variances. Au plus ce rapport sera grand, au plus on estimera que la Variance globale est donc dû à la Variance de notre modèle est par conséquence, au plus notre modèle est significatif.

11.6 – Calcul de la valeur critique

La valeur pratique du test est une variable aléatoire dont la répartition théorique suit une loi de Fisher-Snedecor. Nous effectuons toujours un test unilatéral droite (car nous travaillons sur la base d’un rapport de Variance dont le numérateur est forcément supérieur au dénominateur. Nous recherchons ainsi la valeur dans la table de Fisher pour :

Valeur Critique = (1 – α ; ddlSCEL ; ddlSCER)

On peut retrouver cette valeur en lisant les tables spécifiques ou en utilisant Excel via la formule INVERSE.LOI.F.N (1 – α, ddlSCEL, ddlSCER ).

L’interprétation est la suivante :

  • Valeur pratique > Valeur critique : On rejette H0, et on conclue que le modèle permet de décrire correctement les variations des réponses.
  • Valeur pratique < Valeur critique : On retient H0, et on conclue que le modèle ne permet pas de décrire correctement les variations des réponses. 

11.7 – Calculer la p-Value

Là aussi, nous pouvons calculer la p-Value. Elle suit également une loi de Fisher. Sous Excel, nous pouvons la calculer via la formule :

p-Value = LOI.F. (Valeur pratique ; ddlSCEL, ddlSCER)

L’interprétation est la suivante :

  • p-Value < α : le test est significatif est non dû au hasard. La conclusion apportée par l’étape précédente est valide au risque α.
  • p-Value > α : le test n’est pas significatif donc dû au hasard. La conclusion apportée par l’étape précédente ne peut être valide au risque α.

Etape 12 : Conclure sur le modèle

Les conclusions sur le modèle dépendent des objectifs recherchés. Ainsi, nous allons retrouver différents cas détaillés ci-dessous.

Vous avez utilisé la technique du Screening pour identifier les facteurs influents :

On peut s’arrêter là. Grace à la lecture des coefficients de chacun des facteurs, on établi le Pareto des facteurs influents. Dans ce type d’usage, il n’est pas nécessaire de rechercher un bon coefficient de détermination, ni forcément d’avoir de bons résultats au test Anova.

Vous avez utilisé la technique du Screening pour valider un modèle de prédiction :

  • Cas 1 : le coefficient de détermination et le test Anova sont positifs. On considérera que le modèle est satisfaisant.
  • Cas 2 : le coefficient de détermination et le test Anova sont négatifs. Il se peut soit que vous ayez un facteur influençant la réponse dans votre modèle, soit que les relations entre facteur et réponse ne soient pas linéaires. Il faudra alors utiliser les plans de Surface de Réponse pour modéliser votre situation.

Validation finale

Quoi qu’il en soit, il sera essentiel d’effectuer des essais de validation du modèle en dehors du domaine expérimental et comparer les résultats avec le modèle de prédiction.

L’écart entre la réalité est le modèle, on l’appellera “Erreur expérimentale” et est dû à des variables non mises sous contrôle.

On note que pour réduire l’erreur, on pourra utiliser des “Blocs“. Il s’agit d’élaborer des “Blocs” dans lesquels tous les traitements seront présents au moins une fois (plan randomisé à blocs complets) ou non (plan randomisé à blocs incomplet).

Exemple : un agriculteur possède 5 parcelles de terrains sur lesquelles il veut faire pousser du maïs. Il a à sa disposition 2 espèces de maïs et 2 espèces d’engrais. il sait que son terrain présente des hétérogénéités vis-à-vis de l’ensoleillement. Le soleil est donc source d’erreur mais il ne peut mettre sous contrôle cette variable. On va créer 5 “blocs” de parcelle dont lesquelles on applique l’ensemble des combinaisons possibles :

Traitement

Bloc

1

2

3

4

Parcelle 1

Maïs 2 avec engrais 2

Maïs 2 avec engrais 1

Maïs 1 avec engrais 1

Maïs 1 avec engrais 2

Parcelle 2

Maïs 2 avec engrais 1

Maïs 1 avec engrais 2

Maïs 1 avec engrais 1

Maïs 2 avec engrais 2

Parcelle 3

Maïs 1 avec engrais 1

Maïs 1 avec engrais 2

Maïs 2 avec engrais 1

Maïs 2 avec engrais 2

Parcelle 4

Maïs 1 avec engrais 1

Maïs 2 avec engrais 1

Maïs 1 avec engrais 2

Maïs 2 avec engrais 2

Parcelle 5

Maïs 2 avec engrais 2 Maïs 2 avec engrais 1

Maïs 1 avec engrais 1

Maïs 1 avec engrais 2

Une ANOVA sur les résultats des traitements permettra de voir les différences en ayant supprimer les erreurs dû au soleil.

Source

1 – G. Von Zimmermann (1774) – Traité de l’expérience en général, et en particulier dans l’art de guérir

2 – Yates (1937) – The design and analysis of factorial experiments

3 – W. G. Cochran, G. M. Cox (1957) – Experimental design

4 – R. L. Plackett, J. P. Burman (1946) – The design of optimum multifactorial experiments

5 – G. Taguchi (1986) – Introduction to quality engineering

6 – R. Linder (2005) – Les plans d’expériences

7 – J. J. Droesbeke, J. Fine, G. Saporta (1997) – Plans d’expériences

J. J. Sylvester (1867) – Thoughts on inverse orthogonal matrices, simultaneous sign-successions, and tessellated pavements in two or more colors, with applications to Newton’s rule, ornamental tile-work, and the theory of numbers

J. J. Droesbeke, J. Fine, G. Soporta (1996) – Plans d’expériences, application à l’entreprise

D. Benoist, Y. Tourbier, S. Germain-Tourbier (1994) – Plans d’expériences : construction et analyse

A. Lamure (2012) – Méthodologie des plans d’expériences

P. Schimmerling, J. C. Sisson, A. Zaidi (1998) – Pratique des plans d’expériences

S. Vivier (2009) – Méthode des plans d’expériences

J. L. Goupy (1990) – Etude comparative de divers plans d’expériences

J. P. Gauchi (2005) – Plans d’expériences optimaux : un exposé didactique

Norme NF X06-080 – Plan d’expériences

Share This