[Total : 1    Moyenne : 5/5]

Partant d’un échantillon pour déduire le comportement de la population, la statistique inférentielle incorpore toujours une notion de confiance dans les mesures.

Introduction

La question cruciale des statistiques inférentielles : jusqu’à quel point peut-on se fier aux valeurs estimées à partir d’un simple échantillon ?  A quel niveau, je suis sûr de mes conclusions ?

La réponse s’obtient par le calcul des intervalles de confiance. Précisons tout de suite ce qu’un intervalle de confiance n’est pas l’intervalle dans lequel la véritable valeur du paramètre se trouve avec certitude. En effet, la variable aléatoire peut théoriquement prendre toutes les valeurs possibles dans les limites des lois de la physique. L’intervalle de confiance représente en fait la zone dans laquelle se trouve « très probablement », et avec une probabilité qu’on choisit, la véritable valeur (à jamais inconnue) du paramètre que l’on étudie dans la population.

Dans son utilisation, un intervalle repose sur le calcul d’un seuil de confiance, d’une marge d’erreur et d’un coefficient de marge. Ces éléments dépendent :

Les indicateurs pour calculer un intervalle de confiance

Le seuil de confiance – s

Appelé aussi Niveau de confiance ou encore Taux de confiance, il représente le niveau de confiance que l’on souhaite garantir à la mesure. Par exemple, avec un seuil de confiance de 90%, cela signifie 10% de risque de se tromper. Généralement, la bonne pratique est de choisir un seuil de confiance de 95%.

Par conséquent, au plus le seuil de confiance est grand (donc le coefficient de marge – voir ci-dessous), au plus la taille d’échantillon est grand.

Le coefficient de marge

Le coefficient de marge est un indicateur déduit directement du seuil de confiance via la table de la loi normale (si n > 30) ou la table de Student (si n < 30). Le tableau ci-dessous donne quelques exemples pour les valeurs les plus courantes.

Taux de confiance s

Coefficient de marge si n > 30

80%

1,28

85%

1,44

90%

1,645

95% 1,96
96% 2,05
98% 2,33

99%

2,575

Intervalle de confiance sur une moyenne

Dans le cas où nous souhaitons estimer la moyenne d’une population à partir d’un échantillon de celle-ci, on va devoir estimer un intervalle de confiance. Celui-ci, nous permettra de dire à quel niveau je peux être confiant sur le fait que la moyenne de population est comprise dans l’intervalle de moyenne calculé sur la base de l’échantillon. Le calcul de l’intervalle de confiance dépend de la taille de l’échantillon et de la loi que suit la variable. Sur le principe la formule est la suivante :

  • La borne inférieure de l’intervalle = moyenne de l’échantillon – coefficient de marge * erreur standard d’une moyenne
  • La borne supérieure de l’intervalle = moyenne de l’échantillon + coefficient de marge * erreur standard d’une moyenne

 

La valeur de t va dépendre de la taille de l’échantillon :

  • n > 30 : coefficient de marge de la loi normale (appelé z)
  • n < 30 : coefficient de marge de la loi de Student (appelé t) pour n-1

Exemple

Un fabriquant d’ampoule souhaite étudier la durée de vie de sa production. Pour cela, il grille 25 ampoules (on prend donc le confient de marge de la loi de Student) et défini ainsi une distribution normale de moyenne 860 heures et d’écart type 30. A un niveau de confiance de 95%, on déduit l’intervalle suivant :

  • Borne inférieure : 847,6
  • Borne supérieure : 872,4

Intervalle de confiance pour une proportion

On souhaite estimer la proportion de pièces défectueuses d’une fabrication à partir d’un échantillon. On va donc estimer un intervalle de confiance à partir des valeurs de l’échantillon. Le calcul de cet intervalle suit le principe de la formule suivante :

  • La borne inférieure de l’intervalle = fréquence moyenne – coefficient de marge * erreur standard d’un pourcentage
  • La borne supérieure de l’intervalle = fréquence moyenne + coefficient de marge * erreur standard d’un pourcentage

La valeur du coefficient de marge va dépendre de la taille de l’échantillon :

  • n*p > 5 : on prend le coefficient de marge de la loi normale (appelé z)
  • n*p < 5 : on prend le coefficient de marge de la loi de poisson (appelé μ)

Intervalle de confiance pour un écart-type

On souhaite estimer l’écart type du diamètre d’usinage d’une fabrication à partir d’un échantillon. On va donc estimer un intervalle de confiance à partir des valeurs de l’échantillon. Le calcul de cet intervalle suit le principe de la formule suivante :

  • La borne inférieure de l’intervalle = écart-type de l’échantillon – coefficient de marge * erreur standard d’un écart-type
  • La borne supérieure de l’intervalle = écart-type de l’échantillon + coefficient de marge * erreur standard d’un écart-type

La valeur du coefficient de marge va dépendre de la taille de l’échantillon :

  • n > 30 : on prend le coefficient de marge de la loi normale (appelé z)
  • n < 30 : on prend le coefficient de marge de la loi de Student (appelé t)

Source

R. Veysseyre (2014) – Statistique et probabilité pour les ingénieurs

J. C. Breton (2008) – Statistiques

M. Genin (2009) – Théorie de l’estimation

P. ardilly (1994) – Les techniques de sondages

G. Saporta (1990) – Probabilités – Analyse des données

D. Schwartz (1996) – Méthodes statistiques à l’usage des médecins et des biologistes

F. Yates (1951) – Méthodes de sondage pour recensements et enquêtes

M. R. Tekaya (2006) – Calcul d’intervalle de confiance pour la moyenne dans une population asymétrique

Share This