Month: juillet 2008

Méthodes d’échantillonnage probabilistes et sondages Web

Méthodes d’échantillonnage probabilistes et sondages Web

L’échantillonnage probabiliste pose de réels défis lorsqu’il est question de sondages Web, notamment :

  • La non-disponibilité des bases de sondage, c’est-à-dire de listes valables à partir desquelles sélectionner un échantillon aléatoire.
  • S’il est aujourd’hui facile de générer des numéros de téléphone aléatoires pour effectuer des sondages téléphoniques représentatifs, il en va autrement des adresses de courriels. Un tel système ne peut que générer un nombre important d’adresses inexistantes ou inutilisées.
  • La difficulté d’établir avec certitude l’identité du répondant. Il est fort possible, par exemple, qu’une adresse de courriel soit utilisée par plusieurs personnes. Aussi, la personne qui répond au sondage n’est pas nécessairement celle qui a été invitée à le faire.
  • L’impossibilité de joindre les personnes qui n’ont pas accès à Internet.

Bien qu’imparfaites, il existe des méthodes d’échantillonnage probabilistes pour le Web, par exemple :

L’ABC des méthodes d’échantillonnage (partie 2)

L’ABC des méthodes d’échantillonnage (partie 2)

La semaine dernière, je mentionnais qu’il existe deux grandes familles d’échantillons : les échantillons probabilistes et les échantillons non probabilistes.

Les échantillons non probabilistes
Les méthodes d’échantillonnage non probabilistes, contrairement aux précédentes, ne s’appuient pas sur le hasard pour sélectionner les individus d’une population. Les échantillons ainsi constitués ne sont donc pas probabilistes et, de ce fait, on ne peut leur appliquer la notion de marge d’erreur statistique. Autrement dit, on ne connaît pas le niveau de précision des estimations ainsi produites. Ils présentent toutefois d’autres avantages, comme ceux d’être peu coûteux, rapides et faciles à utiliser.

Il faut bien voir également que ce ne sont pas tous les projets qui exigent des échantillons probabilistes; cela dépend des objectifs poursuivis. Ces méthodes sont fréquemment utilisées en recherche qualitative. Voici quelques exemples d’échantillons non probabilistes :

Lire la suiteLire la suite

Les mathématiques pour dénoncer les crimes!

Les mathématiques pour dénoncer les crimes!

Justicières, les mathématiques? En quelque sorte! « Les mathématiques pour dénoncer les crimes » est en fait le titre d’un article écrit par Jeffrey S. Rosenthal, professeur au département de statistique de l’Université de Toronto. Il y raconte comment l’analyse statistique a permis de découvrir une importante fraude de loterie en Ontario. Paru initialement dans la revue la Gazette de la GRC (le texte intégral peut être consulté ici), l’article est repris ce mois-ci dans le journal Convergence de l’Association des statisticiens et statisticiennes du Québec.

Pour faire une histoire courte, l’analyse des probabilités a démontré hors de tout doute que les vendeurs de billets de loterie ontariens (ex. : employés d’un dépanneur) gagnaient beaucoup plus souvent, toutes proportions gardées, que l’acheteur moyen de loterie. Diffusés à la télé, ces chiffres ont créé suffisamment de remous pour qu’une enquête soit ouverte par l’Ombudsman de l’Ontario, laquelle a confirmé l’existence d’une fraude (le rapport en format PDF peut être consulté ici). Depuis, des réformes ont été entreprises à la Société des loteries et des jeux de l’Ontario.

Mais qu’en est-il chez nous, au Québec?

Lire la suiteLire la suite

L’ABC des méthodes d’échantillonnage (partie 1)

L’ABC des méthodes d’échantillonnage (partie 1)

ÉchantillonnageÀ moins d’interroger tous les membres d’une population donnée, il faut déterminer, avant de commencer un sondage, la manière dont les individus qui constitueront l’échantillon seront sélectionnés. Il ne s’agit pas d’une décision facile pour le néophyte des statistiques et les conseils d’un expert sont requis pour assurer la rigueur scientifique des résultats. Cela étant, rien n’empêche le néophyte d’en saisir les principaux fondements. Je vais donc essayer d’exposer la base des méthodes d’échantillonnage.

D’abord, il faut savoir qu’il existe deux grandes familles d’échantillons : les échantillons probabilistes et les échantillons non-probabilistes. Ce billet sera consacré aux premiers.

Les échantillons probabilistes
Les méthodes d’échantillonnage probabilistes ou aléatoires s’appuient sur le hasard pour sélectionner les individus à sonder.

Lire la suiteLire la suite

Indice du commerce électronique au Québec – Mai 2008

Indice du commerce électronique au Québec – Mai 2008

Pour le mois de mai 2008, les données de l’indice du commerce électronique au Québec indiquent que 17 % des adultes québécois ont acheté pour plus de 251 millions de dollars sur Internet, ce qui correspond à une moyenne d’environ 240 dollars par consommateur.

On apprend également que 58 % des achats ont été effectués sur des sites étrangers (à l’extérieur du Canada). Est considéré comme un site canadien :

  • une entreprise qui a son siège social au pays;
  • les filiales canadiennes d’entreprises étrangères.

Plus de détails sont disponibles dans le communiqué de presse et sur le site de l’indice du commerce électronique au Québec.

Méthodologie
L’indice du commerce électronique au Québec est produit conjointement par SOM, le Cefrio et l’agence internet VDL2. Un sondage téléphonique est réalisé chaque mois auprès de 1000 adultes québécois. La marge d’erreur varie entre 4,1 % et 4,6 %, 19 fois sur 20. Ce projet est sous la responsabilité, chez SOM, de mon collègue Éric Lacroix… qui est présentement en vacances!

Articles liés :
Indice du commerce électronique au Québec – Avril 2008
Indice du commerce électronique au Québec – Mars 2008
Commerce électronique : le partenariat se poursuit

Calculer l’achalandage avec précision, un beau défi!

Calculer l’achalandage avec précision, un beau défi!

Foule de spectateurs à un concertC’est l’été, la saison des festivals de toutes sortes bat son plein! À Québec, les festivités du 400e anniversaire de la ville sont à l’honneur. Chaque jour, dans les médias, on nous indique que X milliers de personnes ont assisté à tel spectacle, participé à tel événement, visité tel lieu, etc. Mais comment s’assurer que ce nombre est bel et bien fidèle à la réalité? Qu’on n’embellit pas un peu les choses?

Quand il y a une billetterie ou un tourniquet, il est facile de dénombrer la foule. Mais lorsque l’entrée est libre… comment savoir? Il existe plusieurs méthodes. Par exemple, l’une d’entre elles consiste à mettre en rapport la superficie d’un site donné et la densité de la foule (ex. : 2 personnes par mètre carré). Or, si ce genre de méthode a l’avantage de donner des résultats rapides, elle entraîne aussi fréquemment des surestimations.

L’une des méthodes les plus fiables est la réalisation de sondages. Voici brièvement comment on s’y prend :

Lire la suiteLire la suite