Archive pour le sujet ‘échantillonnage’

Publié par Julie Fortin le 1 novembre 2012

Estimer la fréquentation des événements récréotouristiques

MH900438548L’évaluation de la fréquentation ou de l’achalandage des grands événements récréotouristiques est une préoccupation importante dans le domaine du tourisme. Cet indicateur est très utilisé par les organismes subventionnaires, les commanditaires ou d’autres partenaires des grands événements pour en apprécier la portée. Les données de fréquentation servent aussi d’intrant direct à l’évaluation des retombées économiques suscitées par l’événement.

Il existe plusieurs méthodes pour estimer la fréquentation d’un événement; ces méthodes se divisent en deux grandes familles selon qu’elles reposent sur le dénombrement total ou partiel des foules.

Mais comment choisir la meilleure méthode, c’est-à-dire celle qui permettra une estimation la plus précise possible?

Lire la suite »

Publié par Julie Fortin le 30 août 2012

Débat sur le recensement obligatoire aux États-Unis

Recensement3Il y a deux ans déjà, la fin annoncée du recensement obligatoire (version longue) avait fait couler beaucoup d’encre au pays.

Depuis le printemps dernier, le même débat fait rage aux États-Unis : le American Community Survey (ACS), l’équivalent de notre formulaire long, est en danger.

Lire la suite »

Publié par Vincent Bouchard le 8 août 2011

Déterminer la taille optimale d’un échantillon

Échantillon-Spaghetti2Plusieurs clients nous demandent quelle est la taille optimale pour que leur échantillon de répondants soit représentatif de la population. Au risque d’en choquer certains, je leur réponds invariablement « 30 », pourvu qu’il s’agisse d’un échantillon probabiliste.

En effet, la statistique nous apprend qu’un échantillon de moins de 30 répondants ne vaut rien… Mais qu’à partir de 30, tout baigne. Alors d’où vient cette obsession de toujours vouloir interroger 400, 500 voire 1 000 répondants?

Lire la suite »

Publié par Julie Fortin le 15 mars 2011

Sondages en ligne : quelle durée pour la période de collecte?

Sablier-durée-sondages-webEn d’autres mots, combien de temps les sondages en ligne doivent-ils demeurer… en ligne? Quelques heures? Quelques jours? Quelques semaines? Évidemment, il n’y a pas de réponse unique à cette question.

Dans les sondages par interception sur un site web, par exemple, où les taux de réponse sont relativement bas, ça peut prendre quelques semaines avant d’obtenir le nombre de répondants visés par l’étude. Lorsqu’on sonde les membres d’une association ou les représentants d’une entreprise au moyen d’un sondage en ligne, on peut aussi vouloir laisser un délai suffisant pour que tous aient la chance de répondre (1 ou 2 semaines par exemple).

En fait, il faut ajuster la période de collecte au type de répondants ciblés. Une période de collecte longue n’est pas un problème en soi, si l’échéancier le permet. C’est plutôt des sondages très rapides dont il faut se méfier.

Lire la suite »

Publié par Julie Fortin le 11 février 2011

Sondage et téléphonie cellulaire : la problématique

Cell-phonesLes sondages téléphoniques sont aujourd’hui confrontés à un problème grandissant : de plus en plus de ménages n’utilisent maintenant plus de ligne fixe ou «terrestre», mais optent plutôt pour le téléphone cellulaire exclusivement.

Aux États-Unis, plus de 25 % des ménages utiliseraient uniquement le cellulaire (source). Selon l’enquête sur le service téléphonique résidentiel de Statistique Canada, cette proportion était estimée à 8 % au Canada et à 6,7 % au Québec en 2008. Si on examine la distribution selon l’âge, on observe que 24,6 % des ménages québécois constitués uniquement de personnes âgées de 18 à 34 ans utiliseraient exclusivement le téléphone cellulaire. Comme ces données datent de 2008, on peut penser que ces proportions se sont légèrement accrues.

Les sondages téléphoniques traditionnels souffrent donc d’un problème de couverture et sont moins représentatifs qu’avant, particulièrement en ce qui concerne les ménages des 18-34 ans.

Lire la suite »

Recensement3La nouvelle, publiée en pleine effervescence de l’après-G20, n’a pas fait beaucoup de bruit. Le 29 juin dernier, on apprenait ainsi que la version longue du questionnaire de recensement, habituellement envoyé à 1 ménage sur 5, ne comportera plus de participation obligatoire (voir l’article de Cyberpresse).

Il sera plutôt remplacé par une enquête à participation volontaire, soit l’enquête nationale auprès des ménages, qui ciblera le tiers des ménages canadiens. En revanche, la version courte du recensement demeurera obligatoire.

Les conséquences de cette décision seront dommageables pour toute l’industrie du sondage. Voici pourquoi.

Lire la suite »

Publié par Julie Fortin le 14 juillet 2010

La pondération des données

Balance-pondérationLorsqu’on lit la méthodologie d’un sondage, on remarque souvent la phrase suivante (ou son équivalent) : «Les données ont été pondérées pour refléter les caractéristiques de la population à l’étude…». Et si on s’arrêtait un instant à cette fameuse pondération? Évidemment, je simplifie grandement le concept à des fins de compréhension.

Qu’est-ce que la pondération? Pourquoi pondérer les données?

La pondération des données consiste à accorder un coefficient de pondération (un poids) à chacun des individus d’un échantillon. L’objectif premier de l’exercice est de corriger la représentativité de l’échantillon en fonction de certaines variables clés afin d’être en mesure d’extrapoler les résultats du sondage à la population.

Lire la suite »

Address-based-samplingDepuis environ 25 ans au Québec, on utilise la génération aléatoire de numéros de téléphone (GANT) (en anglais Random Digit Dialing – RDD) pour constituer des échantillons probabilistes. SOM a d’ailleurs utilisé cette méthode dès sa fondation en 1986.

Comme solution de rechange au RDD, une nouvelle tendance se dessine (surtout aux États-Unis pour le moment) : il s’agit de l’échantillonnage basé sur les adresses de résidence pour sélectionner les ménages qui répondront à un sondage (en anglais Address Based Sampling – ABS).

Lire la suite »

sondageweb-bleu2Dans un rapport* publié en mars 2010 (c’est tout frais!), l’American Association for Public Opinion Research (AAPOR) publie les conclusions d’un groupe de travail sur les panels d’internautes (online panels).

Je vous parle aujourd’hui de la première recommandation des experts :

Les chercheurs devraient éviter d’utiliser des panels non probabilistes lorsque leur objectif est de généraliser des résultats à l’ensemble d’une population.

Lire la suite »

Publié par Julie Fortin le 14 juillet 2009

Sondages en ligne et marges d’erreur : ne vous laissez pas berner!

Un sondage dont les répondants n’ont pas été sélectionnés de façon aléatoire NE DOIT PAS afficher de marge d’erreur. C’est là l’une des normes fondamentales de l’Association de la recherche et de l’intelligence marketing (ARIM). Or, certaines firmes n’ont malheureusement aucun scrupule à berner le public ou, à tout le moins, à laisser planer le doute… exemples à l’appui!

La norme
L’ARIM est en quelque sorte le «chien de garde» de l’industrie du sondage au Canada. Entre autres activités, elle élabore et fait la promotion de normes professionnelles pour garantir des travaux de qualité et ainsi protéger les clients et le public. Selon le code de déontologie de l’ARIM :

Lire la suite »

Combien d’individus devrais-je interroger, lors d’un sondage, pour obtenir des résultats représentatifs de la population à l’étude? En d’autres mots, quelle devrait être la taille de l’échantillon?

Ici, je vous épargne les équations mathématiques… Je voulais simplement vous faire découvrir quelques outils sur le Web qui peuvent calculer pour vous la taille requise d’un échantillon.

Attention cependant! Ces outils sont utiles pour des échantillons aléatoires simples où chacun des individus de la population a une chance égale d’être sélectionné. Dès que le plan d’échantillonnage se complexifie, ne serait-ce qu’un peu, ils ne sont plus appropriés : c’est d’un expert dont vous aurez alors besoin!

Lire la suite »

Publié par Julie Fortin le 28 avril 2009

20 questions qu’un journaliste devrait poser…

…avant de publier les résultats d’un sondage!

C’est le titre d’un article de Sheldon R. Gawiser et G. Evans Witt, du National Council on Public Polls, dont j’ai pris connaissance via le blogue de MarketResearch.

J’en ai déjà parlé, il arrive que les journalistes publient n’importe quoi en matière de sondage. Les questions qu’on retrouve dans cet article visent justement à aider les journalistes : ont-ils entre les mains un sondage scientifique? Doivent-ils rapporter les résultats de tel sondage?

Lire la suite »

Publié par Julie Fortin le 5 septembre 2008

À propos de la marge d’erreur d’un sondage

Les sondages véritablement scientifiques sont accompagnés d’une marge d’erreur. Et bien que les médias sérieux la mentionnent généralement lorsqu’ils présentent les résultats d’un sondage, rares sont les gens qui s’y attardent. Or, la marge d’erreur est importante pour savoir si on peut se fier aux résultats présentés. Prenons cet exemple cité par Radio-Canada :

Le sondage a été réalisé par SOM Recherches et sondages entre le 7 février et le 10 mars 2008. 1594 personnes ont été interrogées. Sa marge d’erreur maximale est de 2,6 %, 19 fois sur 20. Les données ont été pondérées de façon à refléter la répartition exacte de la population canadienne par régions, sexes et groupes d’âge, établie par le Recensement de 2006 de Statistique Canada.

Que veut dire exactement une « marge d’erreur maximale de 2,6 %, 19 fois sur 20 »? En termes simples, ça signifie qu’on est sûr à 95 % (le fameux 19 fois sur 20) que les résultats se situent à plus ou moins 2,6 % des valeurs présentées.

Lire la suite »

Publié par Julie Fortin le 29 juillet 2008

Méthodes d’échantillonnage probabilistes et sondages Web

L’échantillonnage probabiliste pose de réels défis lorsqu’il est question de sondages Web, notamment :

  • La non-disponibilité des bases de sondage, c’est-à-dire de listes valables à partir desquelles sélectionner un échantillon aléatoire.
  • S’il est aujourd’hui facile de générer des numéros de téléphone aléatoires pour effectuer des sondages téléphoniques représentatifs, il en va autrement des adresses de courriels. Un tel système ne peut que générer un nombre important d’adresses inexistantes ou inutilisées.
  • La difficulté d’établir avec certitude l’identité du répondant. Il est fort possible, par exemple, qu’une adresse de courriel soit utilisée par plusieurs personnes. Aussi, la personne qui répond au sondage n’est pas nécessairement celle qui a été invitée à le faire.
  • L’impossibilité de joindre les personnes qui n’ont pas accès à Internet.

Bien qu’imparfaites, il existe des méthodes d’échantillonnage probabilistes pour le Web, par exemple :

Publié par Julie Fortin le 24 juillet 2008

L’ABC des méthodes d’échantillonnage (partie 2)

La semaine dernière, je mentionnais qu’il existe deux grandes familles d’échantillons : les échantillons probabilistes et les échantillons non probabilistes.

Les échantillons non probabilistes
Les méthodes d’échantillonnage non probabilistes, contrairement aux précédentes, ne s’appuient pas sur le hasard pour sélectionner les individus d’une population. Les échantillons ainsi constitués ne sont donc pas probabilistes et, de ce fait, on ne peut leur appliquer la notion de marge d’erreur statistique. Autrement dit, on ne connaît pas le niveau de précision des estimations ainsi produites. Ils présentent toutefois d’autres avantages, comme ceux d’être peu coûteux, rapides et faciles à utiliser.

Il faut bien voir également que ce ne sont pas tous les projets qui exigent des échantillons probabilistes; cela dépend des objectifs poursuivis. Ces méthodes sont fréquemment utilisées en recherche qualitative. Voici quelques exemples d’échantillons non probabilistes :

Lire la suite »

Publié par Julie Fortin le 17 juillet 2008

L’ABC des méthodes d’échantillonnage (partie 1)

ÉchantillonnageÀ moins d’interroger tous les membres d’une population donnée, il faut déterminer, avant de commencer un sondage, la manière dont les individus qui constitueront l’échantillon seront sélectionnés. Il ne s’agit pas d’une décision facile pour le néophyte des statistiques et les conseils d’un expert sont requis pour assurer la rigueur scientifique des résultats. Cela étant, rien n’empêche le néophyte d’en saisir les principaux fondements. Je vais donc essayer d’exposer la base des méthodes d’échantillonnage.

D’abord, il faut savoir qu’il existe deux grandes familles d’échantillons : les échantillons probabilistes et les échantillons non-probabilistes. Ce billet sera consacré aux premiers.

Les échantillons probabilistes
Les méthodes d’échantillonnage probabilistes ou aléatoires s’appuient sur le hasard pour sélectionner les individus à sonder.

Lire la suite »

Publié par Julie Fortin le 10 juillet 2008

Calculer l’achalandage avec précision, un beau défi!

Foule de spectateurs à un concertC’est l’été, la saison des festivals de toutes sortes bat son plein! À Québec, les festivités du 400e anniversaire de la ville sont à l’honneur. Chaque jour, dans les médias, on nous indique que X milliers de personnes ont assisté à tel spectacle, participé à tel événement, visité tel lieu, etc. Mais comment s’assurer que ce nombre est bel et bien fidèle à la réalité? Qu’on n’embellit pas un peu les choses?

Quand il y a une billetterie ou un tourniquet, il est facile de dénombrer la foule. Mais lorsque l’entrée est libre… comment savoir? Il existe plusieurs méthodes. Par exemple, l’une d’entre elles consiste à mettre en rapport la superficie d’un site donné et la densité de la foule (ex. : 2 personnes par mètre carré). Or, si ce genre de méthode a l’avantage de donner des résultats rapides, elle entraîne aussi fréquemment des surestimations.

L’une des méthodes les plus fiables est la réalisation de sondages. Voici brièvement comment on s’y prend :

Lire la suite »

Publié par Eric Lacroix le 25 juin 2008

La représentativité des sondages Web

Dans un billet récent, j’abordais la question de la représentativité des sondages avec l’anecdote historique de l’élection américaine de 1936. Bien des années ont passé, mais l’engouement récent pour les sondages en ligne ramène cette question de représentativité à l’avant-plan. En effet, quand un sondeur constitue un panel Web en recueillant des masses d’inscriptions d’internautes volontaires pour remplir des sondages et participer à des concours, peut-il prétendre être en mesure d’en tirer un échantillon représentatif de l’ensemble des internautes? Sans doute pas…

Mais, la bonne question à se poser serait plutôt : est-ce que cette absence de représentativité pose un problème? Dans certains cas, non. Par exemple, si on cherche à obtenir l’opinion de 500 buveurs de bière sur le nouveau design d’une étiquette, la représentativité de l’échantillon n’est probablement pas une nécessité fondamentale. Comme dans le cas des groupes de discussion, on cherche davantage des résultats qualitatifs que quantitatifs dans ce type de recherche.

Lire la suite »

L’élection présidentielle américaine de 1936 a marqué l’histoire des sondages d’opinion : un petit échantillon représentatif (1 500 personnes) a fait une meilleure prédiction qu’un énorme échantillon (plus de deux millions de personnes!!!) à participation volontaire. L’introduction d’un rapport du Centre d’expertise des grands organismes du gouvernement du Québec relate l’anecdote (p. 6) :

En 1936, six candidats s’affrontaient pour la présidence des États-Unis, dont le démocrate Franklin D. Roosevelt, président en poste, et son principal adversaire, le Républicain Alfred M. Landon. Avant l’élection, la revue Literary Digest distribua un sondage afin d’anticiper l’issue du scrutin. Près de dix millions de bulletins de sondage furent distribués aux abonnés du magazine, à des gens figurant au bottin téléphonique, à des propriétaires d’automobiles et à des gens inscrits sur les listes électorales. Bien que la participation au sondage se faisait volontairement, plus de deux millions de bulletins ont été retournés. Le Literary Digest ayant prédit correctement le résultat des cinq élections présidentielles précédentes, toute l’Amérique s’attendait à une passation des pouvoirs lorsqu’il annonça que le prochain président serait Alfred M. Landon.

Lire la suite »