Étiquette : échantillonnage

Déterminer la taille d’un échantillon… sans y perdre son latin!

Déterminer la taille d’un échantillon… sans y perdre son latin!

Combien d’individus devrais-je interroger, lors d’un sondage, pour obtenir des résultats représentatifs de la population à l’étude? En d’autres mots, quelle devrait être la taille de l’échantillon?

Ici, je vous épargne les équations mathématiques… Je voulais simplement vous faire découvrir quelques outils sur le Web qui peuvent calculer pour vous la taille requise d’un échantillon.

Attention cependant! Ces outils sont utiles pour des échantillons aléatoires simples où chacun des individus de la population a une chance égale d’être sélectionné. Dès que le plan d’échantillonnage se complexifie, ne serait-ce qu’un peu, ils ne sont plus appropriés : c’est d’un expert dont vous aurez alors besoin!

Lire la suiteLire la suite

20 questions qu’un journaliste devrait poser…

20 questions qu’un journaliste devrait poser…

…avant de publier les résultats d’un sondage!

C’est le titre d’un article de Sheldon R. Gawiser et G. Evans Witt, du National Council on Public Polls, dont j’ai pris connaissance via le blogue de MarketResearch.

J’en ai déjà parlé, il arrive que les journalistes publient n’importe quoi en matière de sondage. Les questions qu’on retrouve dans cet article visent justement à aider les journalistes : ont-ils entre les mains un sondage scientifique? Doivent-ils rapporter les résultats de tel sondage?

Lire la suiteLire la suite

À propos de la marge d’erreur d’un sondage

À propos de la marge d’erreur d’un sondage

Les sondages véritablement scientifiques sont accompagnés d’une marge d’erreur. Et bien que les médias sérieux la mentionnent généralement lorsqu’ils présentent les résultats d’un sondage, rares sont les gens qui s’y attardent. Or, la marge d’erreur est importante pour savoir si on peut se fier aux résultats présentés. Prenons cet exemple cité par Radio-Canada :

Le sondage a été réalisé par SOM Recherches et sondages entre le 7 février et le 10 mars 2008. 1594 personnes ont été interrogées. Sa marge d’erreur maximale est de 2,6 %, 19 fois sur 20. Les données ont été pondérées de façon à refléter la répartition exacte de la population canadienne par régions, sexes et groupes d’âge, établie par le Recensement de 2006 de Statistique Canada.

Que veut dire exactement une « marge d’erreur maximale de 2,6 %, 19 fois sur 20 »? En termes simples, ça signifie qu’on est sûr à 95 % (le fameux 19 fois sur 20) que les résultats se situent à plus ou moins 2,6 % des valeurs présentées.

Lire la suiteLire la suite

Méthodes d’échantillonnage probabilistes et sondages Web

Méthodes d’échantillonnage probabilistes et sondages Web

L’échantillonnage probabiliste pose de réels défis lorsqu’il est question de sondages Web, notamment :

  • La non-disponibilité des bases de sondage, c’est-à-dire de listes valables à partir desquelles sélectionner un échantillon aléatoire.
  • S’il est aujourd’hui facile de générer des numéros de téléphone aléatoires pour effectuer des sondages téléphoniques représentatifs, il en va autrement des adresses de courriels. Un tel système ne peut que générer un nombre important d’adresses inexistantes ou inutilisées.
  • La difficulté d’établir avec certitude l’identité du répondant. Il est fort possible, par exemple, qu’une adresse de courriel soit utilisée par plusieurs personnes. Aussi, la personne qui répond au sondage n’est pas nécessairement celle qui a été invitée à le faire.
  • L’impossibilité de joindre les personnes qui n’ont pas accès à Internet.

Bien qu’imparfaites, il existe des méthodes d’échantillonnage probabilistes pour le Web, par exemple :

L’ABC des méthodes d’échantillonnage (partie 2)

L’ABC des méthodes d’échantillonnage (partie 2)

La semaine dernière, je mentionnais qu’il existe deux grandes familles d’échantillons : les échantillons probabilistes et les échantillons non probabilistes.

Les échantillons non probabilistes
Les méthodes d’échantillonnage non probabilistes, contrairement aux précédentes, ne s’appuient pas sur le hasard pour sélectionner les individus d’une population. Les échantillons ainsi constitués ne sont donc pas probabilistes et, de ce fait, on ne peut leur appliquer la notion de marge d’erreur statistique. Autrement dit, on ne connaît pas le niveau de précision des estimations ainsi produites. Ils présentent toutefois d’autres avantages, comme ceux d’être peu coûteux, rapides et faciles à utiliser.

Il faut bien voir également que ce ne sont pas tous les projets qui exigent des échantillons probabilistes; cela dépend des objectifs poursuivis. Ces méthodes sont fréquemment utilisées en recherche qualitative. Voici quelques exemples d’échantillons non probabilistes :

Lire la suiteLire la suite

L’ABC des méthodes d’échantillonnage (partie 1)

L’ABC des méthodes d’échantillonnage (partie 1)

ÉchantillonnageÀ moins d’interroger tous les membres d’une population donnée, il faut déterminer, avant de commencer un sondage, la manière dont les individus qui constitueront l’échantillon seront sélectionnés. Il ne s’agit pas d’une décision facile pour le néophyte des statistiques et les conseils d’un expert sont requis pour assurer la rigueur scientifique des résultats. Cela étant, rien n’empêche le néophyte d’en saisir les principaux fondements. Je vais donc essayer d’exposer la base des méthodes d’échantillonnage.

D’abord, il faut savoir qu’il existe deux grandes familles d’échantillons : les échantillons probabilistes et les échantillons non-probabilistes. Ce billet sera consacré aux premiers.

Les échantillons probabilistes
Les méthodes d’échantillonnage probabilistes ou aléatoires s’appuient sur le hasard pour sélectionner les individus à sonder.

Lire la suiteLire la suite

Calculer l’achalandage avec précision, un beau défi!

Calculer l’achalandage avec précision, un beau défi!

Foule de spectateurs à un concertC’est l’été, la saison des festivals de toutes sortes bat son plein! À Québec, les festivités du 400e anniversaire de la ville sont à l’honneur. Chaque jour, dans les médias, on nous indique que X milliers de personnes ont assisté à tel spectacle, participé à tel événement, visité tel lieu, etc. Mais comment s’assurer que ce nombre est bel et bien fidèle à la réalité? Qu’on n’embellit pas un peu les choses?

Quand il y a une billetterie ou un tourniquet, il est facile de dénombrer la foule. Mais lorsque l’entrée est libre… comment savoir? Il existe plusieurs méthodes. Par exemple, l’une d’entre elles consiste à mettre en rapport la superficie d’un site donné et la densité de la foule (ex. : 2 personnes par mètre carré). Or, si ce genre de méthode a l’avantage de donner des résultats rapides, elle entraîne aussi fréquemment des surestimations.

L’une des méthodes les plus fiables est la réalisation de sondages. Voici brièvement comment on s’y prend :

Lire la suiteLire la suite

La représentativité des sondages Web

La représentativité des sondages Web

Dans un billet récent, j’abordais la question de la représentativité des sondages avec l’anecdote historique de l’élection américaine de 1936. Bien des années ont passé, mais l’engouement récent pour les sondages en ligne ramène cette question de représentativité à l’avant-plan. En effet, quand un sondeur constitue un panel Web en recueillant des masses d’inscriptions d’internautes volontaires pour remplir des sondages et participer à des concours, peut-il prétendre être en mesure d’en tirer un échantillon représentatif de l’ensemble des internautes? Sans doute pas…

Mais, la bonne question à se poser serait plutôt : est-ce que cette absence de représentativité pose un problème? Dans certains cas, non. Par exemple, si on cherche à obtenir l’opinion de 500 buveurs de bière sur le nouveau design d’une étiquette, la représentativité de l’échantillon n’est probablement pas une nécessité fondamentale. Comme dans le cas des groupes de discussion, on cherche davantage des résultats qualitatifs que quantitatifs dans ce type de recherche.

Lire la suiteLire la suite

Représentativité d’un échantillon : clin d’oeil historique

Représentativité d’un échantillon : clin d’oeil historique

L’élection présidentielle américaine de 1936 a marqué l’histoire des sondages d’opinion : un petit échantillon représentatif (1 500 personnes) a fait une meilleure prédiction qu’un énorme échantillon (plus de deux millions de personnes!!!) à participation volontaire. L’introduction d’un rapport du Centre d’expertise des grands organismes du gouvernement du Québec relate l’anecdote (p. 6) :

En 1936, six candidats s’affrontaient pour la présidence des États-Unis, dont le démocrate Franklin D. Roosevelt, président en poste, et son principal adversaire, le Républicain Alfred M. Landon. Avant l’élection, la revue Literary Digest distribua un sondage afin d’anticiper l’issue du scrutin. Près de dix millions de bulletins de sondage furent distribués aux abonnés du magazine, à des gens figurant au bottin téléphonique, à des propriétaires d’automobiles et à des gens inscrits sur les listes électorales. Bien que la participation au sondage se faisait volontairement, plus de deux millions de bulletins ont été retournés. Le Literary Digest ayant prédit correctement le résultat des cinq élections présidentielles précédentes, toute l’Amérique s’attendait à une passation des pouvoirs lorsqu’il annonça que le prochain président serait Alfred M. Landon.

Lire la suiteLire la suite