[Total : 1    Moyenne : 5/5]
Les statistiques inférentielles visent à décrire une population à partir d’un échantillon et donc de réaliser des « inférences ». 

Introduction

Les statistiques inférentielles visent à décrire une population à partir d’un échantillon1 et donc de réaliser des « inférences ». Il existe de très nombreux outils statistiques qui sont à choisir en fonction des objectifs de l’étude, du type de données, des lois de distributions…

Par définition (petit Larousse), “une inférence est une opération par laquelle on passe d’une vérité à une autre, jugée tel en fonction de son lien avec la première“. Autrement dit, les statistiques inférentielles, au contraire des statistiques descriptives, ont pour objectif de déduire un comportement général en fonction du particulier ou en fonction d’une autre série de données.

1. Calculer l’échantillon

Première étape, calculer la taille de l’échantillon à recueillir pour assurer une bonne représentativité de la population.

2. Effectuer le prélèvement

Le recueil des données doit se faire selon un protocole prédéterminé adapter au contexte et objectif de l’étude.

3. Calculer les caractéristiques

On calcule les différents coefficients liés aux statistiques descriptives : paramètre du milieu, variance et étendu. Ceci permet d’avoir une idée des données recueillis et des indications sur les perspectives de l’étude.

4. Identifier la loi de distribution des données

Quel que soit l’objectif de l’étude, la loi de distribution des données est un élément essentiel qui va guider le choix des outils statistiques. Il est nécessaire de :

  1. Mettre en place un graphique de distribution
  2. Interpréter le résultat à priori
  3. Mettre en place un test d’ajustement
  4. Déduire la loi de distribution

5. Analyser les données en fonction de votre objectif

Estimer une proportion, un écart-type ou une moyenne d’une population

On souhaite à partir d’un échantillon d’une population, estimer sa moyenne, son écart-type ou sa proportion. Par exemple, dans l’échantillon, nous retrouvons 10% de défaut. On souhaite savoir quelle est cette proportion sur l’ensemble de la population. Pour cela, on utilise une estimation par intervalle de confiance.

Comparer des groupes de données de variables identiques

On souhaite comparer différentes populations d’une même variable. C’est particulièrement le cas lorsque l’on veut savoir si les résultats d’une action portent leurs fruits. On compare les données avant /après les améliorations. Puis on identifie si les deux populations sont significativement différentes ou non. Pour cela, utilise les tests d’hypothèses.

Etudier les corrélations et/ou prédire les comportements entre des groupes de données de variables différentes

On souhaite comparer des données pour comprendre des relations de causes à effet. On cherche ainsi à étudier l’influence d’une ou plusieurs variables sur une ou plusieurs autres et mettre en place un modèle qui permet de prédire le comportement de celle-ci. On utilise différents outils en fonction du type de données :

 Variable expliquée Y
Quantitative continue et discrèteQualitative nominale et ordinale
Variable explicative XQuantitative continue ou discrète
Etude de Régression

Exemple :

X : Diamètre d'un arbre
Y : Hauteur d'un arbre
Etude de Régression

Exemple :

X : Taille
Y : Couleur des cheveux
Qualitative
Tests d'hypothèses ou Etude de régression.

Exemple :

X : Traitement pharmacologique
Y : Taux de globules blancs
Tests d'hypothèses

Exemple :

X : Port de la ceinture de sécurité
Y : Gravité des blessures

6. Effectuer l’étude

Pour la suite, il suffit de suivre le processus de déroulement de l’outil choisi.

7. Calculer la significativité et conclure

Quel que soit l’outil statistique utilisé et le type d’étude, le rôle du statisticien est de s’assurer que le résultat obtenu est significativement viable. Autrement dit,

Est-ce que le résultat obtenu est-il réel ou seulement dû au hasard ?

Pour cela, on utilise un test d’hypothèses.

Source

1 – C. P. Dancey, J. reidy (2007) – Statistiques sans maths pour psychologues

J. P. Oriol (2007) – Formation à la statistique par la pratique d’enquêtes par questionnaires et simulation

A. Baccini (2010) – Statistique descriptive élémentaire

T. Lorino (2005) – Probabilités et statistique

S. Robin (2007) – Régression linéaire simple

Share This