Étiquette : statistique

«Think big!» (ou le potentiel du big data)

«Think big!» (ou le potentiel du big data)

Notre Elvis Gratton national ne croyait pas si bien dire… «Think big», c’est exactement ce vers quoi nous conduit le «big data». Qu’est-ce que le big data? En français données volumineuses ou données massives, le big data est «l’ensemble des données produites en temps réel et en continu, provenant de sources hétérogènes de différents formats, dont la croissance est faramineuse» (source). On le caractérise généralement par les 3 «v», soit volume, vitesse et variété.  Certains y ajoutent d’autres «v» comme…

Lire la suite Lire la suite

Premières données du recensement 2011

Premières données du recensement 2011

Vous souvenez-vous de la controverse suscitée en 2010 par la fin du recensement obligatoire (version longue)? Quoi qu’il en soit, Statistique Canada diffuse aujourd’hui les premières données issues du recensement 2011. Elles portent sur les chiffres de population et des logements. Voici quelques faits saillants tirés du rapport La population canadienne en 2011 : effectifs et croissance démographique :

Niveau de confiance des résultats : lequel utiliser?

Niveau de confiance des résultats : lequel utiliser?

Le niveau de confiance, aussi appelé seuil de confiance, détermine l’intervalle de confiance et donc la marge d’erreur d’un résultat de sondage. Les niveaux de confiance les plus souvent utilisés en statistique sont 90 %, 95 % et 99 %. Plus le niveau de confiance est élevé, plus la marge d’erreur associée aux résultats sera élevée. Logique, non? En effet, pour être sûr à 99 % qu’un résultat provenant d’un échantillon se situe dans un intervalle qui contient la valeur que…

Lire la suite Lire la suite

Déterminer la taille optimale d’un échantillon

Déterminer la taille optimale d’un échantillon

Plusieurs clients nous demandent quelle est la taille optimale pour que leur échantillon de répondants soit représentatif de la population. Au risque d’en choquer certains, je leur réponds invariablement « 30 », pourvu qu’il s’agisse d’un échantillon probabiliste. En effet, la statistique nous apprend qu’un échantillon de moins de 30 répondants ne vaut rien… Mais qu’à partir de 30, tout baigne. Alors d’où vient cette obsession de toujours vouloir interroger 400, 500 voire 1 000 répondants?

Le vin et la statistique… qui l’eut «cru»?

Le vin et la statistique… qui l’eut «cru»?

Vous aimez les grands crus? Vous vous fiez au jugement des experts pour choisir une bonne bouteille? Vous êtes attiré par les vins médaillés? Sachez alors qu’un statisticien a montré que l’évaluation des vins par les experts n’était pas très différente… du hasard! Je vous invite à lire cet article de Leonard Mlodinow paru dans le Wall Street Journal un peu plus tôt ce mois-ci… Comme quoi la statistique est utile dans tous les domaines! Pour faire une histoire courte,…

Lire la suite Lire la suite

Taux d’utilisation d’Internet : le Québec sous la moyenne canadienne

Taux d’utilisation d’Internet : le Québec sous la moyenne canadienne

Qui dit sondage Web ou sondage en ligne dit également «répondants branchés»! Le choix d’utiliser un sondage Web comme outil de collecte des données requiert en effet que les répondants aient accès à Internet et soient aptes à répondre à un sondage en ligne. Dans son Bulletin de l’analyse en innovation de juin 2009 (PDF), Statistique Canada publie un article sur L’utilisation d’Internet : comparaison internationale et interprovinciale. Voici quelques données.

20 questions qu’un journaliste devrait poser…

20 questions qu’un journaliste devrait poser…

…avant de publier les résultats d’un sondage! C’est le titre d’un article de Sheldon R. Gawiser et G. Evans Witt, du National Council on Public Polls, dont j’ai pris connaissance via le blogue de MarketResearch. J’en ai déjà parlé, il arrive que les journalistes publient n’importe quoi en matière de sondage. Les questions qu’on retrouve dans cet article visent justement à aider les journalistes : ont-ils entre les mains un sondage scientifique? Doivent-ils rapporter les résultats de tel sondage?

La qualité des données : six dimensions importantes

La qualité des données : six dimensions importantes

Je bouquinais au bureau, toujours à l’affût d’un nouveau thème à traiter dans ce blogue, quand je suis tombée sur un texte de Gordon Brackstone*, ancien statisticien en chef adjoint à Statistique Canada. L’auteur traite des six dimensions qu’il juge importantes pour assurer la qualité des données : L’exactitude La pertinence L’actualité L’accessibilité L’intelligibilité La cohérence Ça vaut la peine de s’y attarder. Bien que l’auteur fasse référence à la gestion d’un bureau de statistique gouvernemental (BSG), les dimensions retenues s’appliquent…

Lire la suite Lire la suite

Qu’est-ce qu’une différence statistiquement significative?

Qu’est-ce qu’une différence statistiquement significative?

C’est bien connu, les sondeurs utilisent la statistique pour analyser les résultats d’un sondage. Le calcul de la marge d’erreur en est un exemple. Et il y a aussi les «différences statistiquement significatives»… On entend souvent l’expression, mais ça veut dire quoi, au juste? Qu’est-ce que ça implique pour les autres différences, celles qui ne sont pas «statistiquement significatives»?

Les mathématiques citoyennes

Les mathématiques citoyennes

Grâce à mon collègue Martin Noël, j’ai récemment découvert un petit bijou de livre intitulé Petit cours d’autodéfense intellectuelle publié aux éditions Lux en 2005. Écrit par Normand Baillargeon, professeur à l’UQAM, ce bouquin présente divers outils pour affiner la pensée critique. En d’autres mots, il invite le lecteur, dans sa vie citoyenne, à ne pas tout « gober » ce qu’il voit, lit ou entend, que ce soit dans son entourage, dans les médias ou encore dans les écrits…

Lire la suite Lire la suite

Indice du commerce électronique au Québec – Juin 2008

Indice du commerce électronique au Québec – Juin 2008

L’indice du commerce électronique au Québec du mois de juin 2008 nous renseigne sur le type de produits achetés sur Internet. Le graphique ci-dessous nous donne un aperçu du choix des acheteurs. Les produits les plus populaires sont : les livres, revues et journaux; les vêtements, bijoux et accessoires; les billets de spectacle.

Les mathématiques pour dénoncer les crimes!

Les mathématiques pour dénoncer les crimes!

Justicières, les mathématiques? En quelque sorte! « Les mathématiques pour dénoncer les crimes » est en fait le titre d’un article écrit par Jeffrey S. Rosenthal, professeur au département de statistique de l’Université de Toronto. Il y raconte comment l’analyse statistique a permis de découvrir une importante fraude de loterie en Ontario. Paru initialement dans la revue la Gazette de la GRC (le texte intégral peut être consulté ici), l’article est repris ce mois-ci dans le journal Convergence de l’Association…

Lire la suite Lire la suite

Indice du commerce électronique au Québec – Mai 2008

Indice du commerce électronique au Québec – Mai 2008

Pour le mois de mai 2008, les données de l’indice du commerce électronique au Québec indiquent que 17 % des adultes québécois ont acheté pour plus de 251 millions de dollars sur Internet, ce qui correspond à une moyenne d’environ 240 dollars par consommateur. On apprend également que 58 % des achats ont été effectués sur des sites étrangers (à l’extérieur du Canada). Est considéré comme un site canadien : une entreprise qui a son siège social au pays; les…

Lire la suite Lire la suite

Indice du commerce électronique au Québec – Avril 2008

Indice du commerce électronique au Québec – Avril 2008

En avril dernier, 14 % des adultes québécois (800 000 personnes) ont acheté pour plus de 250 millions de dollars de produits et services sur Internet, soit une moyenne de 298 $ par consommateur. C’est ce que révèle l’indice du commerce électronique au Québec du mois d’avril 2008, réalisé conjointement par SOM, le Cefrio et l’agence internet VDL2. Les produits les plus populaires parmi les acheteurs sont les livres, revues et journaux en ligne, les vêtements, bijoux et accessoires, de…

Lire la suite Lire la suite

Indice du commerce électronique au Québec – Mars 2008

Indice du commerce électronique au Québec – Mars 2008

Depuis juin 2007, SOM sonde chaque mois les Québécois pour connaître leurs habitudes de consommation en ligne. Il en résulte l’indice du commerce électronique au Québec, réalisé conjointement avec le Cefrio et l’agence internet VDL2. Les plus récents résultats révèlent qu’en mars dernier, 18 % des adultes québécois ont acheté pour plus de 245 millions de dollars de produits et services sur Internet, soit une moyenne de 232 $ par consommateur. Une donnée relativement stable depuis mai dernier. La nouveauté…

Lire la suite Lire la suite