Étiquette : représentativité

La pondération des données

La pondération des données

Balance-pondérationLorsqu’on lit la méthodologie d’un sondage, on remarque souvent la phrase suivante (ou son équivalent) : «Les données ont été pondérées pour refléter les caractéristiques de la population à l’étude…». Et si on s’arrêtait un instant à cette fameuse pondération? Évidemment, je simplifie grandement le concept à des fins de compréhension.

Qu’est-ce que la pondération? Pourquoi pondérer les données?

La pondération des données consiste à accorder un coefficient de pondération (un poids) à chacun des individus d’un échantillon. L’objectif premier de l’exercice est de corriger la représentativité de l’échantillon en fonction de certaines variables clés afin d’être en mesure d’extrapoler les résultats du sondage à la population.

Lire la suiteLire la suite

Nouvelle tendance : échantillonnage basé sur les adresses de résidence

Nouvelle tendance : échantillonnage basé sur les adresses de résidence

Address-based-samplingDepuis environ 25 ans au Québec, on utilise la génération aléatoire de numéros de téléphone (GANT) (en anglais Random Digit Dialing – RDD) pour constituer des échantillons probabilistes. SOM a d’ailleurs utilisé cette méthode dès sa fondation en 1986.

Comme solution de rechange au RDD, une nouvelle tendance se dessine (surtout aux États-Unis pour le moment) : il s’agit de l’échantillonnage basé sur les adresses de résidence pour sélectionner les ménages qui répondront à un sondage (en anglais Address Based Sampling – ABS).

Lire la suiteLire la suite

Twitter remplacera-t-il les sondages d’opinion? Bien sûr que non

Twitter remplacera-t-il les sondages d’opinion? Bien sûr que non

logotwitterTwitter remplacera-t-il les sondages d’opinion? est le titre d’un article publié par Branchez-vous la semaine dernière. On y fait référence à une étude de l’Université Carnegie Mellon (PDF) qui, après l’examen d’un milliard de «tweets», conclut que les données publiées sur Twitter expriment les mêmes tendances que les résultats des sondages d’opinion sur certains thèmes sélectionnés.

La nouvelle a rapidement fait le tour du web. Et comme toujours lorsque des études montrent les avantages et les possibilités des réseaux sociaux, plusieurs ont sauté sur l’occasion pour annoncer la mort des sondages d’opinion. Une chose est sûre, ce n’est pas pour demain!

Lire la suiteLire la suite

L’AAPOR recommande officiellement les panels probabilistes (recrutement aléatoire des panélistes)

L’AAPOR recommande officiellement les panels probabilistes (recrutement aléatoire des panélistes)

sondageweb-bleu2Dans un rapport* publié en mars 2010 (c’est tout frais!), l’American Association for Public Opinion Research (AAPOR) publie les conclusions d’un groupe de travail sur les panels d’internautes (online panels).

Je vous parle aujourd’hui de la première recommandation des experts :

Les chercheurs devraient éviter d’utiliser des panels non probabilistes lorsque leur objectif est de généraliser des résultats à l’ensemble d’une population.

Lire la suiteLire la suite

Internet supplante la télévision chez les Canadiens? Pas sûr!

Internet supplante la télévision chez les Canadiens? Pas sûr!

Television-internet-sondageLa semaine dernière, un intéressant sondage d’Ipsos mentionnait que, pour la première fois, le nombre d’heures consacrées à internet en une semaine dépassait le nombre d’heures passées à regarder la télé. Plusieurs médias et blogues ont relayé la nouvelle en faisant tous la même erreur d’interprétation. Pouvez-vous trouver de quelle erreur il s’agit?

Voici ce que dit l’étude originale :

Ipsos reports that for the first time ever in their tracking research, the weekly Internet usage of online Canadians has moved ahead of the number of hours spent watching television. […] Overall, online Canadians are now spending more than 18 hours a week online, compared to 16.9 hours watching television.

Lire la suiteLire la suite

Vrai ou faux? Mythes et réalités des sondages en ligne (#1)

Vrai ou faux? Mythes et réalités des sondages en ligne (#1)

Le 12 juin dernier, lors du colloque annuel de l’Association des statisticiennes et des statisticiens du Québec (ASSQ), M. Michel Saulnier, président du chapitre québécois de l’ARIM, faisait une présentation sur les «mythes et réalités» des sondages en ligne. Au cours de l’été, je reprendrai individuellement ces huit énoncés, que j’expliquerai à ma façon.

Vrai ou faux?
Les panels Internet livrent des résultats représentatifs de la population.

Lire la suiteLire la suite

Déterminer la taille d’un échantillon… sans y perdre son latin!

Déterminer la taille d’un échantillon… sans y perdre son latin!

Combien d’individus devrais-je interroger, lors d’un sondage, pour obtenir des résultats représentatifs de la population à l’étude? En d’autres mots, quelle devrait être la taille de l’échantillon?

Ici, je vous épargne les équations mathématiques… Je voulais simplement vous faire découvrir quelques outils sur le Web qui peuvent calculer pour vous la taille requise d’un échantillon.

Attention cependant! Ces outils sont utiles pour des échantillons aléatoires simples où chacun des individus de la population a une chance égale d’être sélectionné. Dès que le plan d’échantillonnage se complexifie, ne serait-ce qu’un peu, ils ne sont plus appropriés : c’est d’un expert dont vous aurez alors besoin!

Lire la suiteLire la suite

Méthodes d’échantillonnage probabilistes et sondages Web

Méthodes d’échantillonnage probabilistes et sondages Web

L’échantillonnage probabiliste pose de réels défis lorsqu’il est question de sondages Web, notamment :

  • La non-disponibilité des bases de sondage, c’est-à-dire de listes valables à partir desquelles sélectionner un échantillon aléatoire.
  • S’il est aujourd’hui facile de générer des numéros de téléphone aléatoires pour effectuer des sondages téléphoniques représentatifs, il en va autrement des adresses de courriels. Un tel système ne peut que générer un nombre important d’adresses inexistantes ou inutilisées.
  • La difficulté d’établir avec certitude l’identité du répondant. Il est fort possible, par exemple, qu’une adresse de courriel soit utilisée par plusieurs personnes. Aussi, la personne qui répond au sondage n’est pas nécessairement celle qui a été invitée à le faire.
  • L’impossibilité de joindre les personnes qui n’ont pas accès à Internet.

Bien qu’imparfaites, il existe des méthodes d’échantillonnage probabilistes pour le Web, par exemple :

L’ABC des méthodes d’échantillonnage (partie 2)

L’ABC des méthodes d’échantillonnage (partie 2)

La semaine dernière, je mentionnais qu’il existe deux grandes familles d’échantillons : les échantillons probabilistes et les échantillons non probabilistes.

Les échantillons non probabilistes
Les méthodes d’échantillonnage non probabilistes, contrairement aux précédentes, ne s’appuient pas sur le hasard pour sélectionner les individus d’une population. Les échantillons ainsi constitués ne sont donc pas probabilistes et, de ce fait, on ne peut leur appliquer la notion de marge d’erreur statistique. Autrement dit, on ne connaît pas le niveau de précision des estimations ainsi produites. Ils présentent toutefois d’autres avantages, comme ceux d’être peu coûteux, rapides et faciles à utiliser.

Il faut bien voir également que ce ne sont pas tous les projets qui exigent des échantillons probabilistes; cela dépend des objectifs poursuivis. Ces méthodes sont fréquemment utilisées en recherche qualitative. Voici quelques exemples d’échantillons non probabilistes :

Lire la suiteLire la suite

L’ABC des méthodes d’échantillonnage (partie 1)

L’ABC des méthodes d’échantillonnage (partie 1)

ÉchantillonnageÀ moins d’interroger tous les membres d’une population donnée, il faut déterminer, avant de commencer un sondage, la manière dont les individus qui constitueront l’échantillon seront sélectionnés. Il ne s’agit pas d’une décision facile pour le néophyte des statistiques et les conseils d’un expert sont requis pour assurer la rigueur scientifique des résultats. Cela étant, rien n’empêche le néophyte d’en saisir les principaux fondements. Je vais donc essayer d’exposer la base des méthodes d’échantillonnage.

D’abord, il faut savoir qu’il existe deux grandes familles d’échantillons : les échantillons probabilistes et les échantillons non-probabilistes. Ce billet sera consacré aux premiers.

Les échantillons probabilistes
Les méthodes d’échantillonnage probabilistes ou aléatoires s’appuient sur le hasard pour sélectionner les individus à sonder.

Lire la suiteLire la suite