[Total : 0    Moyenne : 0/5]

Recueillir des données fiables et respectant les règles de base de la statistique est nécessaire pour s’assurer d’un résultat significatif.

Introduction

Le principal enjeu des méthodes de prélèvement est de recueillir des données viables pour un traitement statistique significatif.

La méthodes de recueil

Le choix de la méthode de recueils dépend de l’existence et de la difficulté à recueillir les données de l’étude. Pour s’assurer de cette faisabilité, il faut :

  1. Aller sur le terrain avec l’équipe de travail.
  2. Répondre aux 5 questions primordiales que sont : Que doit-on observer ? Quels types d’informations a-t-on besoin ? Quelles données sont nécessaires ? Quelle quantité de données a-t-on besoin ? Quelle précision a-t-on besoin ?
  3. Récupérer les données en s’assurant qu’elles sont simples, objectives et fiables.
  4. Synthétiser les données.

Ainsi, si les données sont d’ores et déjà existantes (historique disponible, base de données à acheter…), il suffira d’identifier l’ensemble sources possibles et de sélectionner les données.

Dans le cas où les données sont difficiles à recueillir ou non existante, il faut utiliser des méthodes spécifiques :

La feuille de relevé

La feuille de relevé est l’outil clé dans le recueil des données. Outil simple, il répond à des règles précises :

  • Il est précisé clairement le nom des données à recueillir. Il doit être le plus court possible.
  • L’ensemble ligne/colonne doit être cohérent et ergonomique pour que la personne en charge du recueil ne puisse se tromper.
  • Les données doivent être codées sur le document : unité, nombre de chiffres après la virgule…
  • La date, le lieu et la personne en charge du relevé doivent être noté.
  • Prévoir un code dans le cas ou une donnée n’a pu être relevé ou n’a pu être relevé correctement.
  • Un exemple doit être donné permettant à quelqu’un d’extérieur au projet de comprendre les données.

Les erreurs possibles

Les erreurs dues aux instruments de mesure

  • Un instrument est fidèle s’il répond exactement de la même façon quand il est placé dans deux situations identiques.
  • Un instrument est valide lorsqu’il mesure  vraiment ce qu’il est censé mesurer.
  • Pour s’assurer de cela, on mènera une analyse du système de mesure.

Les erreurs dues à l’organisation

  • Ce sont les erreurs qui se glissent lors de la collecte des données : est-ce que les consignes ont été respectées ?  Les enquêteurs ont-ils agi de la même façon ?
  • Pour éviter ces erreurs il faut utiliser les mêmes instruments et les mêmes conditions.

Les erreurs dues à la méthode d’échantillonnage

  • Il faut toujours vérifier, à la lumière des objectifs de l’étude statistique, que la méthode d’échantillonnage est adaptée.
  • En particulier éviter la surreprésentation de certaines parties de la population.
  • Par ailleurs, sauf cas particulier, les données doivent être recueillies de manière aléatoire : chacune doit avoir la même chance d’être prélevée.

La notion de Biais statistique

En statistique, un biais est une démarche qui engendre des erreurs dans le résultat de l’étude. Le biais d’un estimateur (de moyenne, d’écart type…) est la différence entre la valeur de son espérance (la moyenne de son estimation) et la vraie valeur de la variable aléatoire qu’il est censé estimer.

Par exemple, Un échantillon biaisé est un ensemble d’individus d’une population, censé la représenter, mais dont la sélection des individus a introduit un biais qui ne permet alors plus de conclure correctement pour l’ensemble de la population.

Les erreurs dues à des données aberrantes

Dans certains cas, quelques points peuvent totalement fausser les résultats. Ces points s’écartent significativement des autres, on parle de points aberrants, dans le sens où ils n’appartiennent vraisemblablement pas à la population parente.

Les raisons de l’apparition de ce type d’observations sont :

  • Erreur lors du recueil des données : Une personne de 4 ans souscrit à une assurance-vie, en réalité elle a 40 ans.
  • Un comportement réellement différent : Un sportif tellement dopé qu’il porte les records du monde à des sommets jamais atteints.

Le positionnement de ces points par rapport au nuage global laisse croire (ou masque) l’existence d’une liaison manifeste entre les variables. La plupart du temps, pour les détecter, un simple graphique nuage de points est suffisant. Le cas contraire utiliser :

  • Une carte de contrôle : les points validant un critère devront être considérés comme aberrants.
  • Un test d’homoscédaticité : si le test valide une différence de variance, il y a présence de points aberrants.

Quelques conseils

  • Obtenir l’appui de la direction et des intervenants ceci pour éviter les barrières lors du recueil des données.
  • Communiquer auprès de l’ensemble des personnes impactées directement ou indirectement par le recueil.
  • Déterminer qui récoltera les données.
  • Déterminer la logistique, les ressources et la technologie.
  • Minimiser les répercussions et les inconvénients pour les personnes concernées dans le lieu de travail ou dans un environnement de services, ce qui signifie notamment choisir le moment le plus approprié pour récolter les données.
  • Prévoir une période d’essai ou une phase pilote pour permettre d’améliorer et de modifier la méthode de collecte des données.

Source

P. Ardilly (1994) – Les techniques de sondage

B. Le Maux (2013) – Le choix de l’échantillon

F. Kohler (2014) – Collecte de données

L. Gerville Réache, V. Couallier, N. Paris (2012) – Echantillon représentatif

J. Desabie (1963) – Revue de statistique appliquée

C. Durand (2002) – L’échantillonnage, la gestion du terrain

Share This