Publié par Julie Fortin le 2 avril 2009

La qualité des données : six dimensions importantes

Je bouquinais au bureau, toujours à l’affût d’un nouveau thème à traiter dans ce blogue, quand je suis tombée sur un texte de Gordon Brackstone*, ancien statisticien en chef adjoint à Statistique Canada.

L’auteur traite des six dimensions qu’il juge importantes pour assurer la qualité des données :

  1. L’exactitude
  2. La pertinence
  3. L’actualité
  4. L’accessibilité
  5. L’intelligibilité
  6. La cohérence

Ça vaut la peine de s’y attarder. Bien que l’auteur fasse référence à la gestion d’un bureau de statistique gouvernemental (BSG), les dimensions retenues s’appliquent tout autant à une maison de sondage. Je vous les décris en quelques mots, en adaptant parfois les propos de M. Brackstone à la réalité d’une firme comme SOM.

L’exactitude
L’exactitude des données de sondage est un aspect essentiel de la qualité des données. Dès la conception du projet de recherche jusqu’à sa conclusion, une foule de mesures doivent être prises pour s’assurer d’obtenir des données exactes, par exemple : un plan d’échantillonnage adéquat, le prétest du questionnaire, la maximisation du taux de réponse, l’écoute des entrevues, un codage uniforme des questions ouvertes, une pondération, un traitement des données et des tests statistiques appropriés, etc. L’exactitude ne peut être garantie que par la rigueur de la méthodologie.

La pertinence
Les données sont pertinentes lorsqu’elles sont utiles! Pour générer des données pertinentes, le sondeur doit comprendre les grandes lignes du domaine de recherche de son client. Sans être un expert, il doit au moins saisir quelle utilisation le client fera des données recueillies, et ce, afin de produire des données mais aussi des analyses pertinentes.

L’actualité
L’actualité correspond à la période qui s’écoule entre la date où les données sont recueillies et la date à laquelle les résultats sont disponibles. Des données de qualité sont actuelles, c’est-à-dire récentes, pour que leur utilisation ait une valeur ajoutée. Il serait totalement inutile, par exemple, de publier des données sur les habitudes d’Internet vieilles de deux ans!

L’accessibilité
Pour l’auteur, l’accessibilité «vise à garantir que les utilisateurs peuvent déterminer quelles données sont disponibles et les consulter selon un mode de présentation qui leur convient.» Comme les données produites par une maison de sondage sont souvent privées (par opposition à publiques dans les BSG), on s’assurera de remettre les données au client dans une forme appropriée (préfère-t-il un rapport? une banque de données? des tableaux statistiques? des graphiques?). On s’assurera également de protéger la confidentialité des renseignements personnels.

L’intelligibilité
L’intelligibilité consiste à «fournir aux utilisateurs l’information dont ils ont besoin pour évaluer et utiliser les données.» Pour ce faire, il importe de documenter la méthodologie du sondage de façon détaillée. Le client pourra ainsi comprendre la portée des résultats et les limites inhérentes à l’enquête. De plus, pour être intelligibles pour le client, les données doivent être replacées dans le contexte de la problématique étudiée.

La cohérence
Les données livrées au client doivent être cohérentes entre elles : exemptes d’erreurs ou de zones grises qui rendraient l’interprétation incertaine; uniformes dans leur traitement et leur présentation. De plus, lorsqu’un sondage est effectué plusieurs fois pour un client (à tous les ans par exemple), il importe de maintenir la cohérence d’un sondage à l’autre, et ce, afin d’obtenir des données comparables.

_______________

* Le texte, intitulé «Qualité dans les enquêtes», est tiré du collectif Méthodes d’enquêtes et sondages : pratiques européenne et nord-américaine, sous la direction de Pierre Lavallée et Louis-Paul Rivest, publié aux éditions Dunod en 2006 (p. 1-13). J’ai essayé en vain de trouver une version en ligne de l’article…

Laisser un commentaire