<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>SOM : le blogue &#187; échantillonnage</title>
	<atom:link href="http://blogue.som.ca/category/echantillonnage/feed/" rel="self" type="application/rss+xml" />
	<link>http://blogue.som.ca</link>
	<description></description>
	<lastBuildDate>Thu, 02 Feb 2012 21:46:23 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Déterminer la taille optimale d&#8217;un échantillon</title>
		<link>http://blogue.som.ca/determiner-taille-optimale-echantillon/</link>
		<comments>http://blogue.som.ca/determiner-taille-optimale-echantillon/#comments</comments>
		<pubDate>Mon, 08 Aug 2011 16:22:37 +0000</pubDate>
		<dc:creator>Vincent Bouchard</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[statistique]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=4489</guid>
		<description><![CDATA[Plusieurs clients nous demandent quelle est la taille optimale pour que leur échantillon de répondants soit représentatif de la population. Au risque d’en choquer certains, je leur réponds invariablement « 30 », pourvu qu&#8217;il s&#8217;agisse d&#8217;un échantillon probabiliste.
En effet, la statistique nous apprend qu’un échantillon de moins de 30 répondants ne vaut rien&#8230; Mais qu’à partir de [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2011/06/Échantillon-Spaghetti2.jpg"><img class="alignleft size-full wp-image-4559" title="Échantillon-Spaghetti2" src="http://blogue.som.ca/wp-content/uploads/2011/06/Échantillon-Spaghetti2.jpg" alt="Échantillon-Spaghetti2" width="242" height="177" /></a>Plusieurs clients nous demandent quelle est la <strong>taille optimale </strong>pour que leur <strong>échantillon</strong> de répondants soit représentatif de la population. Au risque d’en choquer certains, je leur réponds invariablement « 30 », pourvu qu&#8217;il s&#8217;agisse d&#8217;un <a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/">échantillon probabiliste</a>.</p>
<p>En effet, la statistique nous apprend qu’un échantillon de moins de 30 répondants ne vaut rien&#8230; Mais qu’à partir de 30, tout baigne. Alors d&#8217;où vient cette obsession de toujours vouloir interroger 400, 500 voire 1 000 répondants?</p>
<p><span id="more-4489"></span></p>
<h3>30, un chiffre «magique»?</h3>
<p>Bien que techniquement, un échantillon de 30 répondants sélectionnés de manière probabiliste soit effectivement représentatif d’une population donnée, les résultats issus de cet échantillon souffriront d’une grande imprécision. D’où l’intérêt d&#8217;augmenter les tailles d’échantillon, particulièrement dans les cas où on souhaite un niveau de précision élevé par segment de marché.</p>
<p>Mais attention, votre enthousiasme pour les gros échantillons sera vite tempéré par des considérations budgétaires. En effet, bien qu’un échantillon de 1000 répondants soit deux fois plus coûteux (ou à peu près) qu’un échantillon de 500 répondants, il n’est pas deux fois plus précis. Il faut en fait quadrupler la taille d’un échantillon pour voir diminuer de moitié la marge d’erreur. C’est donc un pensez-y-bien!</p>
<h3>La taille de l&#8217;échantillon dépend du niveau de précision souhaité</h3>
<p>Mais revenons à l’échantillon représentatif de 30 répondants. En pratique, le strict minimum que l’on recommande à nos clients est généralement autour de 100. Au-delà de ce seuil, <strong>les tailles d’échantillon dépendent de la valeur que l’on accorde au niveau de précision accru que l’on obtient et à la présence ou non de segments de marché pour lesquels on veut obtenir un niveau de précision acceptable.</strong></p>
<p>Quant à l’impact de la taille de la population sur la taille de l’échantillon, oubliez les rumeurs qui circulent à ce sujet. Dans des contextes de <strong>grandes populations</strong> (ex. : le Canada ou les États-Unis), <strong>la taille de la population n’a aucune incidence perceptible sur la taille de l’échantillon</strong>, pourvu que l’échantillon soit constitué au hasard (échantillon probabiliste). C’est pourquoi les sondages politiques, par exemple, sont généralement effectués avec 1 000 répondants, peu importe de quel côté de la frontière.</p>
<p>Pour vous convaincre de cette grande vérité, considérez l’exemple culinaire suivant. Lorsque vous cuisinez des pâtes pour un groupe de 8 personnes, vérifiez-vous la cuisson d’une plus grande quantité de pâtes avant de les servir que lorsque vous cuisinez seulement pour vous?</p>
<p><em>* <a href="http://www.som.ca/fr/entreprise/equipe/#vincent-bouchard">Vincent Bouchard</a> est vice-président Marketing chez SOM.<br />
</em></p>
<p><strong>À lire aussi : </strong></p>
<ul>
<li><a href="http://blogue.som.ca/determiner-la-taille-dun-echantillon-sans-y-perdre-son-latin/">Déterminer la taille d&#8217;un échantillon&#8230; sans y perdre son latin!</a></li>
<li><a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/">L&#8217;ABC des méthodes d&#8217;échantillonnage (partie 1)</a></li>
<li><a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-2/">L&#8217;ABC des méthodes d&#8217;échantillonnage (partie 2)</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/determiner-taille-optimale-echantillon/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Sondages en ligne : quelle durée pour la période de collecte?</title>
		<link>http://blogue.som.ca/sondages-en-ligne-duree-periode-collecte/</link>
		<comments>http://blogue.som.ca/sondages-en-ligne-duree-periode-collecte/#comments</comments>
		<pubDate>Tue, 15 Mar 2011 11:03:19 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=4019</guid>
		<description><![CDATA[En d&#8217;autres mots, combien de temps les sondages en ligne doivent-ils demeurer&#8230; en ligne? Quelques heures? Quelques jours? Quelques semaines? Évidemment, il n&#8217;y a pas de réponse unique à cette question.
Dans les sondages par interception sur un site web, par exemple, où les taux de réponse sont relativement bas, ça peut prendre quelques semaines avant [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2010/03/Sablier-durée-sondages-web.jpg"><img class="alignright size-full wp-image-1900" title="Sablier-durée-sondages-web" src="http://blogue.som.ca/wp-content/uploads/2010/03/Sablier-durée-sondages-web.jpg" alt="Sablier-durée-sondages-web" width="120" height="191" /></a>En d&#8217;autres mots, <strong>combien de temps les sondages en ligne doivent-ils demeurer&#8230; en ligne?</strong> Quelques heures? Quelques jours? Quelques semaines? Évidemment, il n&#8217;y a pas de réponse unique à cette question.</p>
<p>Dans les <strong>sondages par interception sur un site web</strong>, par exemple, où les taux de réponse sont relativement bas, ça peut prendre quelques semaines avant d&#8217;obtenir le nombre de répondants visés par l&#8217;étude. Lorsqu&#8217;on sonde les membres d&#8217;une association ou les représentants d&#8217;une entreprise au moyen d&#8217;un <strong>sondage en ligne</strong>, on peut aussi vouloir laisser un délai suffisant pour que tous aient la chance de répondre (1 ou 2 semaines par exemple).</p>
<p>En fait, il faut ajuster la période de collecte au type de répondants ciblés. Une période de collecte longue n&#8217;est pas un problème en soi, si l&#8217;échéancier le permet. C&#8217;est plutôt des <strong>sondages très rapides dont il faut se méfier</strong>.</p>
<p><span id="more-4019"></span></p>
<h3>La technologie permet la rapidité</h3>
<p>Avec les <strong>sondages en ligne</strong> et les <strong>panels d&#8217;internautes</strong>, il est très facile de faire un sondage en quelques heures. Il n&#8217;est pas rare, aujourd&#8217;hui, de voir de tels sondages, surtout dans les médias. On rédige quelques questions, on lance une invitation à un grand nombre de panélistes&#8230; et hop! Deux heures plus tard, vous avez facilement 400 répondants voire 1000 qui ont dûment répondu au sondage.</p>
<h3>La rigueur scientifique commande un minimum de temps de collecte</h3>
<p>Le problème avec ce type de sondage, c&#8217;est que les réponses proviendront uniquement des personnes disponibles pendant ces quelques heures, celles qui étaient près de leur ordinateur et qui ont lu leur courriel d&#8217;invitation. Premier arrivé, premier répondu! Ce n&#8217;est <strong>pas plus scientifique qu&#8217;un «vox pop»</strong> réalisé au coin d&#8217;une rue où vous interceptez les premiers passants venus&#8230;</p>
<p>Dans la vraie vie, il y a toutes sortes d&#8217;internautes. Si certains sont branchés en permanence, d&#8217;autres prennent connaissance de leurs courriels à peine quelques fois par semaine. Certains le font au bureau, d&#8217;autres à la maison. De jour, de soir, de fin de semaine&#8230; les habitudes sont variées.</p>
<p>Qu&#8217;arrive-t-il donc si un sondage en ligne est fait en quelques heures? Il n&#8217;est pas représentatif des internautes, tout simplement. Et s&#8217;il n&#8217;est pas représentatif, il est impossible d&#8217;en généraliser les résultats.</p>
<p><strong>Un sondage web devrait donc être mis en ligne au minimum plusieurs jours, incluant idéalement un week-end. De cette façon, on s&#8217;assure de sonder un échantillon beaucoup plus large et représentatif de la population internaute.</strong></p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/sondages-en-ligne-duree-periode-collecte/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Sondage et téléphonie cellulaire : la problématique</title>
		<link>http://blogue.som.ca/sondage-et-telephonie-cellulaire-la-problematique/</link>
		<comments>http://blogue.som.ca/sondage-et-telephonie-cellulaire-la-problematique/#comments</comments>
		<pubDate>Fri, 11 Feb 2011 14:41:47 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[cellulaire]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=3981</guid>
		<description><![CDATA[Les sondages téléphoniques sont aujourd&#8217;hui confrontés à un  problème grandissant : de plus en plus de ménages n&#8217;utilisent maintenant  plus de ligne fixe ou «terrestre», mais optent plutôt pour le téléphone  cellulaire exclusivement.
Aux États-Unis, plus de 25 % des ménages utiliseraient uniquement le  cellulaire (source). Selon l&#8217;enquête sur le service téléphonique [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2010/11/Cell-phones.jpg"><img class="alignleft size-full wp-image-3624" title="Cell-phones" src="http://blogue.som.ca/wp-content/uploads/2010/11/Cell-phones.jpg" alt="Cell-phones" width="218" height="163" /></a>Les <strong>sondages téléphoniques</strong> sont aujourd&#8217;hui confrontés à un  problème grandissant : de plus en plus de ménages n&#8217;utilisent maintenant  plus de ligne fixe ou «terrestre», mais optent plutôt pour le <strong>téléphone  cellulaire exclusivement</strong>.</p>
<p>Aux <strong>États-Unis</strong>, plus de 25 % des ménages utiliseraient uniquement le  cellulaire (<a href="http://www.cdc.gov/nchs/data/nhis/earlyrelease/wireless201012.htm">source</a>). Selon l&#8217;<a href="http://www.statcan.gc.ca/daily-quotidien/090615/dq090615c-fra.htm">enquête sur le service téléphonique résidentiel</a> de Statistique Canada, cette proportion était estimée à 8 % au<strong> Canada</strong> et à 6,7 % au <strong>Québec</strong> en 2008. Si on examine la <a href="http://www.statcan.gc.ca/daily-quotidien/090615/t090615c1-fra.htm">distribution selon l&#8217;âge</a>, on observe que 24,6 % des ménages québécois constitués uniquement de personnes âgées de 18 à 34 ans utiliseraient exclusivement le téléphone cellulaire. Comme ces données datent de 2008, on peut penser que ces proportions se sont légèrement accrues.</p>
<p>Les <strong>sondages téléphoniques</strong> traditionnels souffrent donc d&#8217;un <strong>problème de  couverture</strong> et sont <strong>moins représentatifs</strong> qu&#8217;avant, particulièrement en ce qui concerne les ménages des 18-34 ans.</p>
<p><span id="more-3981"></span>Dans un récent article de la revue <a href="http://www.statcan.gc.ca/ads-annonces/12-001-x/index-fra.htm">Techniques d&#8217;enquête</a>, des chercheurs expliquent les <a href="http://www.statcan.gc.ca/bsolc/olc-cel/olc-cel?catno=12-001-X201000211382&amp;lang=fra">fondements statistiques des enquêtes par téléphone mobile</a>. L&#8217;article est très (trop) technique, mais a le mérite de bien poser la problématique de la téléphonie cellulaire dans le contexte des sondages. Je me permets d&#8217;en citer quelques extraits (entre guillemets ci-dessous).</p>
<p>L&#8217;échantillonnage d&#8217;un sondage téléphonique traditionnel auprès de la population s&#8217;appuie sur la  <strong>génération aléatoire de numéros de téléphone</strong> (GANT) (en anglais <a title="Définition de RDD sur Wikipédia" href="http://en.wikipedia.org/wiki/Random_digit_dialing" target="_blank"><em>Random Digit Dialing</em></a> – RDD). Dans ce type d&#8217;enquête, « l&#8217;hypothèse est que le téléphone fixe est un appareil électroménager et que chaque personne faisant partie de la population n&#8217;est  attachée qu&#8217;à un seul ménage.» Ainsi, on n&#8217;échantillonne pas des individus, mais des ménages dans un premier temps. Ensuite, on peut sélectionner un individu au sein du ménage.</p>
<p>«L&#8217;enquête par téléphone mobile entraîne un changement de paradigme et pose de nouveaux défis. [...] Dans l&#8217;esprit de la plupart des gens, <strong>un téléphone mobile est un appareil personnel</strong> et non un appareil ménager. [...] Donc, dans les enquêtes par téléphone mobile le ménage ne représente plus forcément la même organisation unifiante que dans le cas des enquêtes par téléphone conventionnelles.»</p>
<p>Dans les faits donc, si on veut intégrer un échantillon de téléphones mobiles, on se retrouve avec deux bases de sondage complètement différentes (l&#8217;une dont l&#8217;unité est le ménage et l&#8217;autre dont l&#8217;unité est l&#8217;individu). Qui plus est, les deux bases de sondage se chevauchent, comme illustré dans le schéma ci-dessous : un nombre important de personnes sont joignables à la fois par ligne fixe ET par téléphone cellulaire.</p>
<p><a href="http://blogue.som.ca/wp-content/uploads/2011/02/Capture-d’écran-2011-02-11-à-08.05.02.png"><img class="aligncenter size-full wp-image-4003" title="Capture d’écran 2011-02-11 à 08.05.02" src="http://blogue.som.ca/wp-content/uploads/2011/02/Capture-d’écran-2011-02-11-à-08.05.02.png" alt="Capture d’écran 2011-02-11 à 08.05.02" width="514" height="291" /></a></p>
<p>Maintenant que la problématique est posée, quelle est la solution? Doit-on sonder les individus sur leur mobile? Ce n&#8217;est pas aussi simple qu&#8217;il y paraît. Je vous en reparle dans un prochain billet!</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/sondage-et-telephonie-cellulaire-la-problematique/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Fin du recensement obligatoire&#8230; quelles conséquences pour les sondeurs?</title>
		<link>http://blogue.som.ca/fin-du-recensement-obligatoire-quelles-consequences-pour-les-sondeurs/</link>
		<comments>http://blogue.som.ca/fin-du-recensement-obligatoire-quelles-consequences-pour-les-sondeurs/#comments</comments>
		<pubDate>Fri, 16 Jul 2010 16:03:18 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=2881</guid>
		<description><![CDATA[La nouvelle, publiée en pleine effervescence de l&#8217;après-G20, n&#8217;a pas fait beaucoup de bruit. Le 29 juin dernier, on apprenait ainsi que la version longue du questionnaire de recensement, habituellement envoyé à 1 ménage sur 5, ne comportera plus de participation obligatoire (voir l&#8217;article de Cyberpresse).
Il sera plutôt remplacé par une enquête à participation volontaire, [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2010/07/Recensement3.jpg"><img class="alignright size-full wp-image-2889" title="Recensement3" src="http://blogue.som.ca/wp-content/uploads/2010/07/Recensement3.jpg" alt="Recensement3" width="166" height="138" /></a>La nouvelle, publiée en pleine effervescence de l&#8217;après-G20, n&#8217;a pas fait beaucoup de bruit. Le 29 juin dernier, on apprenait ainsi que la version longue du questionnaire de <strong>recensement</strong>, habituellement envoyé à 1 ménage sur 5, ne comportera plus de participation obligatoire (voir l&#8217;<a href="http://www.cyberpresse.ca/actualites/quebec-canada/politique-canadienne/201006/29/01-4294277-recensement-le-formulaire-detaille-obligatoire-elimine.php">article</a> de Cyberpresse).</p>
<p>Il sera plutôt remplacé par une <strong>enquête à participation volontaire</strong>, soit l&#8217;<strong><a title="Enquête nationale auprès des ménages - Statistique Canada" href="http://www.statcan.gc.ca/survey-enquete/household-menages/5178-fra.htm">enquête nationale auprès des ménages</a></strong>, qui ciblera le tiers des ménages canadiens. En revanche, la version courte du recensement demeurera obligatoire.</p>
<p><strong>Les conséquences de cette décision seront dommageables pour toute l&#8217;industrie du sondage. Voici pourquoi.</strong></p>
<p><span id="more-2881"></span>Comme je l&#8217;expliquais dans mon <a title="La pondération des données de sondage" href="http://blogue.som.ca/la-ponderation-des-donnees/">précédent billet</a>, nous utilisons les caractéristiques connues de la population pour <strong>pondérer les données de sondage</strong>. Or, plusieurs données relatives aux «caractéristiques connues de la population» sont directement issues&#8230; de la version longue du questionnaire de recensement! Le fait que cette enquête à participation obligatoire devienne facultative aura un effet certain sur le taux de réponse, diminuant ainsi la fiabilité des données et, par conséquent, la précision des sondages.</p>
<p>L&#8217;<a title="Institut de la statistique du Québec (ISQ) page d'accueil" href="http://www.stat.gouv.qc.ca/"><strong>Institut de la statistique du Québec</strong></a> (ISQ) a d&#8217;ailleurs pris position hier sur les impacts de ce changement pour le Québec. Comme je ne saurais mieux l&#8217;expliquer en mes propres mots, je me permets de reprendre quelques extraits (voir l&#8217;<a title="ISQ : Recensement 2011 : Impacts pour le Québec" href="http://www.stat.gouv.qc.ca/salle-presse/communiq/2010/juillet/juillet1015.htm">analyse intégrale</a>) :</p>
<blockquote><p>Les impacts sont importants et concernent notamment trois dimensions de la qualité de l&#8217;information statistique : <strong>fiabilité</strong>, <strong>comparabilité</strong> et <strong>cohérence</strong>.</p>
<p>Tout d&#8217;abord, compte tenu du caractère facultatif de la nouvelle enquête, une diminution des taux de réponse est appréhendée. Cela laisserait présager une perte de la fiabilité des statistiques produites. [...]</p>
<p>Une perte de comparabilité pourrait également être observée à l&#8217;égard des statistiques relatives aux caractéristiques de la population obtenue au fil des ans. [...]</p>
<p>Enfin, il pourrait être difficile pour Statistique Canada d&#8217;assurer la cohérence des statistiques produites à la suite de la nouvelle enquête facultative avec celles produites à l&#8217;aide du questionnaire court du recensement de 2011 [...]</p></blockquote>
<p>Ce questionnaire court obligatoire, rappelons-le, ne contient que <strong>4 variables sociodémographiques</strong> : âge, sexe, état matrimonial et langue maternelle. C&#8217;est insuffisant pour les besoins liés à la pondération des données (voir la <a href="http://www.gazette.gc.ca/rp-pr/p1/2010/2010-06-26/html/order-decret-fra.html" target="_blank">version 2011 du questionnaire court</a> &#8211; à la suite du recensement sur l&#8217;agriculture).</p>
<p>Il n&#8217;y a pas que les <strong>sondeurs</strong> qui redoutent l&#8217;impact de cette décision, vous vous en doutez. Plusieurs groupes ont d&#8217;ailleurs fait connaître leur insatisfaction. Par exemple :</p>
<ul>
<li>L&#8217;<a href="http://www.caut.ca/pages.asp?lang=2&amp;page=906" target="_blank">Association canadienne des professeures et professeurs d&#8217;université</a> exige que le gouvernement fédéral revienne sur sa décision en mentionnant les «conséquences désastreuses que cette mesure aura sur la compréhension  scientifique de la société canadienne et sur la capacité de prendre des  décisions éclairées relatives aux politiques sociales et économiques.»</li>
<li>Le <a href="http://www.ocol-clo.gc.ca/html/release_communique_12072010_f.php" target="_blank">Commissaire aux langues officielles</a> a entrepris une enquête sur la question en soulignant son inquiétude à l&#8217;égard «des répercussions possibles que pourrait avoir cette décision sur la  vitalité des communautés de langue officielle et l’application de la <em>Loi  sur les langues officielles</em>.»</li>
<li>La <a href="http://www.cnw.ca/fr/releases/archive/July2010/15/c4744.html">Conférence des recteurs et des principaux des universités du Québec  (CREPUQ)</a> a également fait part de sa «consternation [à l'égard de] la décision du gouvernement fédéral.»</li>
<li>Même le <a href="http://letoile.jminforme.ca/economie/article/1124829" target="_blank">milieu des affaires</a> s&#8217;est joint au débat pour dénoncer ce changement.</li>
</ul>
<p>Les <strong>raisons évoquées par le gouvernement </strong>pour justifier cette décision sont pour le moins nébuleuses. Selon un <a href="http://www.ledevoir.com/politique/canada/292267/le-ministre-clement-remet-en-doute-les-donnees-du-recensement" target="_blank">article du quotidien <em>Le Devoir</em></a>, le ministre de l&#8217;Industrie, Tony Clement, parle de préoccupations liées à la vie privée et va même jusqu&#8217;à remettre en question la fiabilité des informations du recensement sous prétexte que les citoyens étaient obligés de répondre au questionnaire&#8230;</p>
<p>Ce qu&#8217;il semble ignorer, c&#8217;est que sa décision (prise semble-t-il sans aucune consultation des principaux utilisateurs des données du recensement) aura des <strong>conséquences encore pires sur la fiabilité des données</strong>. Et c&#8217;est sans compter que la nouvelle formule coûtera plus cher aux Canadiens puisque le questionnaire sera envoyé à un plus grand nombre de ménages : un «petit» 30 millions $ de plus, selon <a href="http://www.cyberpresse.ca/actualites/quebec-canada/politique-canadienne/201007/16/01-4298693-recensement-clement-ne-recule-pas.php" target="_blank">Cyberpresse</a>&#8230;</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/fin-du-recensement-obligatoire-quelles-consequences-pour-les-sondeurs/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>La pondération des données</title>
		<link>http://blogue.som.ca/la-ponderation-des-donnees/</link>
		<comments>http://blogue.som.ca/la-ponderation-des-donnees/#comments</comments>
		<pubDate>Wed, 14 Jul 2010 20:01:07 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=2895</guid>
		<description><![CDATA[Lorsqu&#8217;on lit la méthodologie d&#8217;un sondage, on remarque souvent la phrase suivante (ou son équivalent) : «Les données ont été pondérées pour refléter les caractéristiques de la population à l&#8217;étude&#8230;». Et si on s&#8217;arrêtait un instant à cette fameuse pondération? Évidemment, je simplifie grandement le concept à des fins de compréhension.
Qu&#8217;est-ce que la pondération? Pourquoi [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2010/07/Balance-pondération.jpg"><img class="size-full wp-image-2904 alignleft" title="Balance-pondération" src="http://blogue.som.ca/wp-content/uploads/2010/07/Balance-pondération.jpg" alt="Balance-pondération" width="136" height="102" /></a>Lorsqu&#8217;on lit la <strong>méthodologie d&#8217;un sondage</strong>, on remarque souvent la phrase suivante (ou son équivalent) : «Les données ont été pondérées pour refléter les caractéristiques de la population à l&#8217;étude&#8230;». Et si on s&#8217;arrêtait un instant à cette fameuse <strong>pondération</strong>? Évidemment, je simplifie grandement le concept à des fins de compréhension.</p>
<h3>Qu&#8217;est-ce que la pondération? Pourquoi pondérer les données?</h3>
<p>La<strong> pondération des données</strong> consiste à accorder un <strong>coefficient de  pondération </strong>(un poids) à chacun des individus d&#8217;un échantillon. L&#8217;objectif premier de l&#8217;exercice est de corriger la représentativité de l&#8217;échantillon en fonction de certaines variables clés afin d&#8217;être en mesure d&#8217;extrapoler les résultats du sondage à la population.</p>
<p><span id="more-2895"></span><strong>Exemple</strong></p>
<ul>
<li>Prenons une population qui compte 10 000 individus et un nombre égal d&#8217;hommes et de femmes.</li>
<li>Disons maintenant qu&#8217;on fait un sondage avec un échantillon de 1000 individus et, qu&#8217;à cause de certains facteurs (ex. : taux de réponse, stratification), on obtient 800 femmes et 200 hommes.</li>
<li>On constate un déséquilibre, pour la variable «sexe», entre l&#8217;échantillon et la population : chaque homme de l&#8217;échantillon représente 25 hommes de la population (5000/200) alors que chaque femme de l&#8217;échantillon représente 6,25 femmes de la population (5000/800).</li>
<li>On appliquera donc un coefficient de pondération qui aura pour effet de donner plus de poids aux réponses des 200 hommes (et moins à celles des femmes), et ce, afin de corriger le déséquilibre.</li>
</ul>
<h3>Les variables de pondération</h3>
<p>Les variables qu&#8217;on utilisera pour pondérer les données d&#8217;un échantillon dépendent des caractéristiques de la population à l&#8217;étude.</p>
<p>Pour un sondage auprès de la population québécoise par exemple, la distribution des principales variables sociodémographiques sera examinée (ex. : âge, sexe, scolarité, nombre d&#8217;individus par ménage) et, s&#8217;il y a déséquilibre par rapport aux caractéristiques connues de la population, on appliquera le coefficient de pondération approprié. Ainsi, le poids qu&#8217;on attribue à un individu de l&#8217;échantillon correspond au poids que cet individu représente dans la population.</p>
<p><em><strong>Note importante : </strong>La pondération ne compense pas une méthode d&#8217;échantillonnage inappropriée. Si, à la base, on ne dispose pas d&#8217;un <a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/">échantillon probabiliste</a> constitué dans les règles de l&#8217;art, la pondération ne peut pas prétendre rendre un échantillon représentatif.</em></p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/la-ponderation-des-donnees/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Nouvelle tendance : échantillonnage basé sur les adresses de résidence</title>
		<link>http://blogue.som.ca/nouvelle-tendance-echantillonnage-base-sur-les-adresses-de-residence/</link>
		<comments>http://blogue.som.ca/nouvelle-tendance-echantillonnage-base-sur-les-adresses-de-residence/#comments</comments>
		<pubDate>Tue, 25 May 2010 19:00:34 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=268</guid>
		<description><![CDATA[Depuis environ 25 ans au Québec, on utilise la génération aléatoire de numéros de téléphone (GANT) (en anglais Random Digit Dialing &#8211; RDD) pour constituer des échantillons probabilistes. SOM a d&#8217;ailleurs utilisé cette méthode dès sa fondation en 1986.
Comme solution de rechange au RDD, une nouvelle tendance se dessine (surtout aux États-Unis pour le moment) [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: left;"><a href="http://blogue.som.ca/wp-content/uploads/2010/05/Address-based-sampling.jpg"><img class="alignleft size-full wp-image-2452" title="Address-based-sampling" src="http://blogue.som.ca/wp-content/uploads/2010/05/Address-based-sampling.jpg" alt="Address-based-sampling" width="203" height="50" /></a>Depuis environ 25 ans au Québec, on utilise la <strong>génération aléatoire de numéros de téléphone</strong> (GANT) (en anglais <a title="Définition de RDD sur Wikipédia" href="http://en.wikipedia.org/wiki/Random_digit_dialing" target="_blank"><em>Random Digit Dialing</em></a> &#8211; RDD) pour constituer des échantillons probabilistes. <a href="http://www.som.ca">SOM</a> a d&#8217;ailleurs utilisé cette méthode dès sa fondation en 1986.</p>
<p>Comme solution de rechange au RDD, une nouvelle tendance se dessine (surtout aux États-Unis pour le moment) : il s&#8217;agit de l&#8217;<strong>échantillonnage basé sur les adresses de résidence</strong> pour sélectionner les ménages qui répondront à un sondage (en anglais <em>Address Based Sampling</em> &#8211; ABS).</p>
<p><span id="more-268"></span><strong>Pourquoi?</strong></p>
<p>Pour tenter de joindre des groupes de répondants que les autres méthodes arrivent moins bien à joindre, notamment les jeunes (18-34 ans), les ménages qui utilisent exclusivement le téléphone cellulaire, certaines minorités ou encore les non-internautes (lorsqu&#8217;il s&#8217;agit de recherche en ligne).</p>
<p>En d&#8217;autres termes, il s&#8217;agit d&#8217;un moyen qui vise à améliorer la couverture des méthodes actuelles, c&#8217;est-à-dire le degré d’exhaustivité des renseignements relatifs à la population cible (pour plus de détails sur la couverture et les bases de sondage, voir la très claire <a title="Couverture et bases de sondage" href="http://www.statcan.gc.ca/pub/12-539-x/2009001/coverage-couverture-fra.htm" target="_blank">explication de Statistique Canada</a>).</p>
<p><strong>Comment ça marche?</strong></p>
<p>Il s&#8217;agit d&#8217;un processus en plusieurs étapes. Je m&#8217;inspire ici des quelques expériences documentées jusqu&#8217;à maintenant (voir les sources au bas de ce billet) et de la réflexion amorcée par SOM à ce sujet :</p>
<ul>
<li>Il faut d&#8217;abord disposer d&#8217;une base de sondage contenant toutes les adresses de la population cible dans un territoire donné.</li>
<li>On tire ensuite un échantillon aléatoire d&#8217;adresses à partir de de cette base de sondage.</li>
<li>Pour contacter les ménages sélectionnés, plusieurs options sont possibles : le téléphone (lorsqu&#8217;il est possible de trouver le numéro de téléphone correspondant à l&#8217;adresse), la poste ou encore une rencontre en personne. Évidemment, ce dernier moyen nécessite des ressources importantes.</li>
<li>Les ménages contactés sont invités à faire partie d&#8217;un panel dont on contactera les membres pour divers sondages. Ils peuvent signifier leur intérêt à faire partie du panel par divers moyens (au téléphone, par la poste, par internet).</li>
<li>Une rémunération (ou une autre forme d&#8217;incitatif) peut être proposée aux ménages pour joindre le panel et/ou participer à une recherche.</li>
<li>Idéalement, les ménages recrutés doivent avoir le choix du moyen pour répondre à un sondage (téléphone traditionnel, téléphone cellulaire, internet, poste&#8230;), ce qui signifie des <a href="http://blogue.som.ca/donner-aux-repondants-le-pouvoir-de-choisir-un-exemple-de-collecte-mixte/" target="_self">collectes mixtes ou multimodes</a>.</li>
<li>Les membres du panel ainsi formé doivent être régulièrement renouvelés, de façon à ce qu&#8217;on ne s&#8217;adresse pas toujours au même bassin de personnes.</li>
</ul>
<p><strong>Est-ce que ça marche?</strong></p>
<p>Les deux premières références citées plus bas font chacune le bilan d&#8217;une expérience utilisant l&#8217;ABS. Voici en vrac quelques constats qui émergent de l&#8217;une ou l&#8217;autre de ces études :</p>
<ul>
<li>L&#8217;échantillonnage basé sur les adresses de résidence permet effectivement de joindre des groupes qu&#8217;il est difficile de joindre avec le RDD. Dans les deux cas, on a pu joindre une proportion intéressante de ménages n&#8217;utilisant que le téléphone cellulaire. L&#8217;une des études a par ailleurs mieux réussi à joindre des membres des minorités afro-américaine et hispanophone de même que des jeunes de moins de 35 ans.</li>
<li>Les résultats non pondérés sont plus près des paramètres connus de la population avec l&#8217;ABS.</li>
<li>Dans les deux cas, le taux de réponse est inférieur avec une approche ABS comparativement à l&#8217;approche traditionnelle de RDD.</li>
</ul>
<p><strong>Pour en savoir plus :</strong></p>
<ul>
<li><a href="http://surveypractice.files.wordpress.com/2009/06/ui-ssrs-aapor-6-29-09.pdf" target="_blank"><em>Comparing Random Digit Dial (RDD) and United States  Postal Service (USPS) Address-Based Sample Designs for a General  Population Survey: The 2008 Massachusetts Health Insurance Survey</em></a> [document PDF, Urban Institute et Social Science Research Solutions]</li>
<li><a href="http://surveypractice.files.wordpress.com/2009/06/link-abs.pdf" target="_blank"><em>Building a New Foundation : Transitioning to Address  Based Sampling after Nearly 30 Years of RDD</em></a> [document PDF,  Nielsen Company]</li>
<li><a href="http://surveypractice.files.wordpress.com/2009/06/dekkermurphy_aapor_2009.pdf" target="_blank"><em>Address Based Sampling and Address Matching: Experience from REACH U.S.</em></a> [document PDF, Université de Chicago]</li>
<li><em><a href="http://www.knowledgenetworks.com/accuracy/spring2009/Dennis-DiSogra-Graham-spring09.html" target="_blank"><span>Meeting the Challenge of Cell Phone-Only  Households,                                   Young Adults and  Minorities</span><span> : Introducing  Address-Based Sampling to KnowledgePanel</span><span><span>®</span></span></a></em> [Knowledge Networks]</li>
<li><a href="http://www.genesys-sampling.com/ContentPages/2/Page236/Address%20Based%20Sampling.pdf" target="_blank"><em>Recent Developments in Address-Based Sampling</em></a> [document PDF, Marketing Systems Group]</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/nouvelle-tendance-echantillonnage-base-sur-les-adresses-de-residence/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>L&#8217;AAPOR recommande officiellement les panels probabilistes (recrutement aléatoire des panélistes)</title>
		<link>http://blogue.som.ca/aapor-recommande-officiellement-les-panels-probabilistes/</link>
		<comments>http://blogue.som.ca/aapor-recommande-officiellement-les-panels-probabilistes/#comments</comments>
		<pubDate>Thu, 15 Apr 2010 17:37:26 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[panel Web]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage web]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=2135</guid>
		<description><![CDATA[Dans un rapport* publié en mars 2010 (c&#8217;est tout frais!), l&#8217;American Association for Public Opinion Research (AAPOR) publie les conclusions d&#8217;un groupe de travail sur les panels d&#8217;internautes (online panels).
Je vous parle aujourd&#8217;hui de la première recommandation des experts :
Les chercheurs devraient éviter d&#8217;utiliser des panels non probabilistes lorsque leur objectif est de généraliser des [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2008/10/sondageweb-bleu2.jpg"><img class="alignleft size-full wp-image-95" title="sondageweb-bleu2" src="http://blogue.som.ca/wp-content/uploads/2008/10/sondageweb-bleu2.jpg" alt="sondageweb-bleu2" width="155" height="99" /></a>Dans un rapport* publié en mars 2010 (c&#8217;est tout frais!), l&#8217;<a title="AAPOR" href="http://www.aapor.org/Home.htm" target="_blank"><em>American Association for Public Opinion Research</em></a> (AAPOR) publie les conclusions d&#8217;un groupe de travail sur les panels d&#8217;internautes (<em>online panels</em>).</p>
<p>Je vous parle aujourd&#8217;hui de la première recommandation des experts :</p>
<h3><strong>Les chercheurs devraient éviter d&#8217;utiliser des panels non probabilistes lorsque leur objectif est de généraliser des résultats à l&#8217;ensemble d&#8217;une population. </strong></h3>
<p><span id="more-2135"></span></p>
<p>Évidemment, cette conclusion me réjouit puisque je m&#8217;évertue depuis des mois à expliquer la différence entre panel probabiliste (recrutement aléatoire de panélistes) et panel non probabiliste (panel de volontaires, qui s&#8217;inscrivent spontanément) ainsi que les implications de chacun à l&#8217;égard des résultats de recherche.</p>
<p><strong>Argumentation des experts</strong></p>
<p>Je ne prétends pas ici résumer les propos de ce volumineux rapport. Voici toutefois quelques-uns des arguments évoqués pour justifier cette position.</p>
<ul>
<li>Tous les panels d&#8217;internautes souffrent d&#8217;une erreur de couverture par rapport à la population en général (bien sûr, puisque les non-internautes en sont automatiquement exclus).</li>
<li>Toutefois, les méthodes probabilistes de recrutement de panélistes (ex. : au téléphone, par la poste et même en personne) tendent à minimiser cette erreur.</li>
<li>L&#8217;analyse d&#8217;un grand nombre d&#8217;études (le rapport comporte une bibliographie de 12 pages) qui comparent les résultats de sondage où l&#8217;échantillon est constitué de volontaires par rapport à des méthodes aléatoires (téléphone ou internet) continue de montrer que <strong>les échantillons probabilistes fournissent des résultats PLUS PRÉCIS</strong>. Une seule exception ici : dans quelques cas, les sondages non probabilistes sur les intentions de vote ont donné des résultats aussi précis ou même plus précis que les sondages probabilistes.</li>
<li>L&#8217;étude des modèles d&#8217;ajustement des données (ex. : pondération) utilisés pour les panels non probabilistes n&#8217;est pas concluante en ce qui a trait à leur capacité de réduire les biais.</li>
<li>Les préoccupations liées à la qualité des données dans les panels non probabilistes (ex. : présence de répondants «professionnels» ou même «fictifs») demeurent un enjeu majeur.</li>
<li>Bref, il n&#8217;y a pas de cadre théorique généralement accepté qui permette de généraliser les résultats d&#8217;un panel de volontaires. Les experts sont par ailleurs clairs sur la prétention de représentativité, et je cite : «Thus, claims of &laquo;&nbsp;representativeness&nbsp;&raquo; should be avoided when using these sample sources [nonprobability online panels].»</li>
</ul>
<p><strong>Composition du groupe de travail</strong></p>
<p>Le rapport de l&#8217;AAPOR est signé par 20 de ses membres, incluant certes des représentants de firmes privées (ex. : Gallup, SSI), mais également  huit chercheurs provenant de cinq universités (Stanford, Washington State, Michigan, UCLA, CUNY) et un membre du gouvernement américain (U.S. Centers for Disease Control and Prevention). Le président du groupe de travail, Reg Baker, tient par ailleurs un excellent blogue intitulé <a title="Blogue &quot;The Survey Geek&quot; - Reg Baker" href="http://regbaker.typepad.com/" target="_blank"><em>The Survey Geek</em></a>.</p>
<p>Il se trouvera certainement encore des personnes pour clamer que les panels de volontaires peuvent atteindre la «représentativité parfaite». Elles devront toutefois se rendre à l&#8217;évidence : aucune étude sérieuse ne cautionne ce point de vue. C&#8217;est même tout le contraire.</p>
<p>*Le <a title="AAPOR Report on Online Panels" href="http://www.aapor.org/AM/Template.cfm?Section=AAPOR_Committee_and_Task_Force_Reports&amp;Template=/CM/ContentDisplay.cfm&amp;ContentID=2223" target="_blank">rapport</a> complet du groupe de travail (80 pages) peut être consulté en ligne en  format PDF.</p>
<p><strong>À lire sur le même sujet : </strong><br />
<a href="http://blogue.som.ca/une-etude-confirme-la-superiorite-des-panels-web-avec-recrutement-aleatoire-des-repondants/" target="_self">Une étude confirme la supériorité des panels web avec recrutement aléatoire des répondants</a><br />
<a href="http://blogue.som.ca/vrai-ou-faux-mythes-et-realites-des-sondages-en-ligne-1/" target="_self">Vrai ou faux? Les panels internet livrent des résultats représentatifs de la population</a><br />
7 questions à poser aux firmes de sondage qui ont des panels web (<a href="http://blogue.som.ca/7-questions-firmes-de-sondage-panels-web-1/">partie 1</a>, <a href="http://blogue.som.ca/7-questions-firmes-de-sondage-panels-web-2/">partie 2</a>)</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/aapor-recommande-officiellement-les-panels-probabilistes/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Sondages en ligne et marges d&#8217;erreur : ne vous laissez pas berner!</title>
		<link>http://blogue.som.ca/sondages-en-ligne-et-marges-derreur-ne-vous-laissez-pas-berner/</link>
		<comments>http://blogue.som.ca/sondages-en-ligne-et-marges-derreur-ne-vous-laissez-pas-berner/#comments</comments>
		<pubDate>Tue, 14 Jul 2009 12:20:35 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[sondage web]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=244</guid>
		<description><![CDATA[Un sondage dont les répondants n&#8217;ont pas été sélectionnés de façon aléatoire NE DOIT PAS afficher de marge d&#8217;erreur. C&#8217;est là l&#8217;une des normes fondamentales de l&#8217;Association de la recherche et de l&#8217;intelligence marketing (ARIM). Or, certaines firmes n&#8217;ont malheureusement aucun scrupule à berner le public ou, à tout le moins, à laisser planer le doute&#8230; [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2009/07/pt-exclamation2.jpg"><img class="alignright size-medium wp-image-262" title="pt-exclamation2" src="http://blogue.som.ca/wp-content/uploads/2009/07/pt-exclamation2.jpg" alt="" width="142" height="106" /></a>Un sondage dont les répondants n&#8217;ont pas été sélectionnés de façon aléatoire NE DOIT PAS afficher de <strong><a href="http://blogue.som.ca/a-propos-de-la-marge-derreur-dun-sondage/">marge d&#8217;erreur</a></strong>. C&#8217;est là l&#8217;une des normes fondamentales de l&#8217;<a href="http://www.mria-arim.ca/ABOUTFRE/default.asp" target="_blank">Association de la recherche et de l&#8217;intelligence marketing (ARIM)</a>. Or, certaines firmes n&#8217;ont malheureusement aucun scrupule à berner le public ou, à tout le moins, à laisser planer le doute&#8230; exemples à l&#8217;appui!</p>
<p><strong>La norme<br />
</strong>L&#8217;ARIM est en quelque sorte le «chien de garde» de l&#8217;industrie du sondage au Canada. Entre autres activités, elle élabore et fait la promotion de normes professionnelles pour garantir des travaux de qualité et ainsi protéger les clients et le public. Selon le code de déontologie de l&#8217;ARIM :</p>
<p><span id="more-244"></span></p>
<blockquote><p>Les membres doivent s&#8217;abstenir de faire des déclarations concernant les marges d&#8217;erreur d&#8217;un échantillonnage par rapport aux estimations démographiques quand ils n&#8217;utilisent pas des échantillonnages probabilistes.</p></blockquote>
<p>Un échantillon est dit <strong><a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/">probabiliste</a></strong> lorsqu&#8217;il s&#8217;appuie sur le hasard pour sélectionner les individus qui le composent (tous ont une probabilité connue d&#8217;être sélectionnés). <strong>L&#8217;échantillon probabiliste</strong>, parce qu&#8217;il comporte des propriétés mathématiques connues, <strong>est le seul qui permet le calcul de l&#8217;erreur d&#8217;échantillonnage</strong>, communément appelée la marge d&#8217;erreur d&#8217;un sondage.</p>
<p><strong>Où est le problème?</strong><br />
Avec la croissance des sondages Web, les firmes de sondage constituent maintenant des panels d&#8217;internautes. Ces internautes sont régulièrement invités à participer à des sondages en ligne. Dans certains panels, les individus sont des volontaires, c&#8217;est-à-dire des gens qui se sont eux-mêmes inscrits pour remplir des sondages. Dans ce cas, on parle d&#8217;autosélection, et non d&#8217;un échantillon de type probabiliste. Les firmes qui utilisent ce genre de panel ne devraient donc pas, selon les normes de l&#8217;ARIM, accompagner leurs résultats d&#8217;une marge d&#8217;erreur.</p>
<p><strong>Des exemples douteux</strong><br />
Voici deux exemples qui illustrent mon propos. Le premier est tiré d&#8217;une présentation faite récemment par Madame Nathalie Madore, vice-présidente de l&#8217;<a href="http://www.association-assq.qc.ca/" target="_blank">Association des statisticiens et statisticiennes du Québec (ASSQ)</a>. La présentation s&#8217;intitulait <em>Les mauvais usages de la statistique</em>.</p>
<blockquote><p>Ce sondage éclair a été réalisé par Internet le (date) auprès de 511 Québécois et Québécoises. Un échantillon probabiliste aléatoire de cette taille <strong>comporterait</strong> une marge d’erreur maximale de 3,4 % 19 fois sur 20.</p></blockquote>
<p>Avez-vous remarqué l&#8217;utilisation du conditionnel dans cette phrase? «Comporterait»? C&#8217;est donc dire qu&#8217;il n&#8217;est pas probabiliste! Comme le mentionnait Madame Madore, la phrase donne au lecteur un sentiment de sécurité quant à la valeur de l&#8217;information recueillie qui ne reflète pas la réalité. (Qui plus est, il faut mentionner ici que la marge d&#8217;erreur rapportée par le journaliste est erronée! Un échantillon aléatoire simple non pondéré de 511 Québécois aurait plutôt une marge d&#8217;erreur de 4,4 %).</p>
<p>Le deuxième exemple, lu dans un journal, n&#8217;est pas nécessairement mauvais, mais il est suffisamment imprécis pour qu&#8217;on se pose des questions&#8230;</p>
<blockquote><p>Les résultats du sondage proviennent d&#8217;un questionnaire en ligne rempli par 1003 adultes choisis au hasard parmi un <strong>groupe de répondants réguliers</strong> [de la firme]. La marge d&#8217;erreur est de 3,1 points de pourcentage, 19 fois sur 20.</p></blockquote>
<p>C&#8217;est bien beau que les adultes aient été choisis au hasard&#8230; mais qu&#8217;en est-il du «groupe de répondants réguliers»? Les individus qui le composent ont-ils, eux, été sélectionnés au hasard? Ou s&#8217;agit-il plutôt d&#8217;un groupe de volontaires? Le texte ne le précise pas.</p>
<p>Comme quoi il faut toujours être vigilant lorsqu&#8217;on lit les résultats d&#8217;un sondage!</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/sondages-en-ligne-et-marges-derreur-ne-vous-laissez-pas-berner/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Déterminer la taille d&#8217;un échantillon&#8230; sans y perdre son latin!</title>
		<link>http://blogue.som.ca/determiner-la-taille-dun-echantillon-sans-y-perdre-son-latin/</link>
		<comments>http://blogue.som.ca/determiner-la-taille-dun-echantillon-sans-y-perdre-son-latin/#comments</comments>
		<pubDate>Thu, 02 Jul 2009 15:01:16 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=247</guid>
		<description><![CDATA[Combien d&#8217;individus devrais-je interroger, lors d&#8217;un sondage, pour obtenir des résultats représentatifs de la population à l&#8217;étude? En d&#8217;autres mots, quelle devrait être la taille de l&#8217;échantillon?
Ici, je vous épargne les équations mathématiques&#8230; Je voulais simplement vous faire découvrir quelques outils sur le Web qui peuvent calculer pour vous la taille requise d&#8217;un échantillon.
Attention cependant! Ces [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2009/07/calculatrice2.jpg"><img class="alignright size-thumbnail wp-image-257" title="calculatrice2" src="http://blogue.som.ca/wp-content/uploads/2009/07/calculatrice2.jpg" alt="" width="137" height="185" /></a>Combien d&#8217;individus devrais-je interroger, lors d&#8217;un sondage, pour obtenir des résultats représentatifs de la population à l&#8217;étude? En d&#8217;autres mots, quelle devrait être la taille de l&#8217;échantillon?</p>
<p>Ici, je vous épargne les équations mathématiques&#8230; Je voulais simplement vous faire découvrir quelques <strong>outils sur le Web</strong> qui peuvent <strong>calculer pour vous la taille requise d&#8217;un échantillon</strong>.</p>
<p>Attention cependant! Ces outils sont utiles pour des <strong>échantillons aléatoires simples</strong> où chacun des individus de la population a une chance égale d&#8217;être sélectionné. Dès que le plan d&#8217;échantillonnage se complexifie, ne serait-ce qu&#8217;un peu, ils ne sont plus appropriés : c&#8217;est d&#8217;un expert dont vous aurez alors besoin!</p>
<p><span id="more-247"></span></p>
<p><strong>Comment ça fonctionne?<br />
</strong>La taille de l&#8217;échantillon est essentiellement conditionnée par la précision des résultats que l&#8217;on désire obtenir :</p>
<ul>
<li>Vous devez d&#8217;abord entrer la <a href="http://blogue.som.ca/a-propos-de-la-marge-derreur-dun-sondage/">marge d&#8217;erreur</a> que vous êtes prêts à accepter (ex. : 4 %).</li>
<li>Il faut ensuite préciser le <a href="http://fr.wikipedia.org/wiki/Niveau_de_confiance" target="_blank">niveau de confiance</a> dont vous avez besoin (on travaille presque toujours avec un niveau de confiance de 95 %, le fameux «19 fois sur 20»).</li>
<li>On vous demande également d&#8217;indiquer la taille de la population à l&#8217;étude. Toutefois, lorsque la taille de la population est de plusieurs milliers d&#8217;individus, celle-ci n&#8217;a que peu d&#8217;influence sur la taille de l&#8217;échantillon.</li>
</ul>
<p><strong>Quelques outils<br />
</strong>Il existe plusieurs outils pour calculer la taille d&#8217;un échantillon aléatoire simple (la plupart en langue anglaise, malheureusement). Ils sont plutôt équivalents, quoique certains vous proposent des options supplémentaires intéressantes (ex. : scénarios alternatifs selon différents niveaux de confiance, calcul de la marge d&#8217;erreur à partir de la taille de l&#8217;échantillon). Je vous donne des liens vers quelques-uns, mais une simple recherche sur Internet avec les mots clés «sample size calculator» vous en donnera certainement d&#8217;autres.</p>
<ul>
<li><a href="http://fr.gmi-mr.com/resources/sample-size-calculator.php" target="_blank">GMI</a> (en français)</li>
<li><a href="http://www.ezsurvey.com/samplesize.html" target="_blank">Raosoft</a> (en anglais)</li>
<li><a href="http://www.custominsight.com/articles/random-sample-calculator.asp" target="_blank">CustomInsight</a> (en anglais)</li>
<li><a href="http://www.macorr.com/ss_calculator.htm" target="_blank">MaCorr</a> (en anglais)</li>
</ul>
<p><strong>Billets sur des sujets apparentés :</strong></p>
<ul>
<li><a href="http://blogue.som.ca/representativite-dun-echantillon-clin-doeil-historique/">Représentativité d&#8217;un échantillon : clin d&#8217;oeil historique</a></li>
<li><a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/">L&#8217;ABC des méthodes d&#8217;échantillonnage (partie 1)</a></li>
<li><a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-2/">L&#8217;ABC des méthodes d&#8217;échantillonnage (partie 2)</a></li>
<li><a href="http://blogue.som.ca/methodes-dechantillonnage-probabilistes-et-sondages-web/">Méthodes d&#8217;échantillonnage probabilistes et sondages Web</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/determiner-la-taille-dun-echantillon-sans-y-perdre-son-latin/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>20 questions qu&#8217;un journaliste devrait poser&#8230;</title>
		<link>http://blogue.som.ca/20-questions-quun-journaliste-devrait-poser/</link>
		<comments>http://blogue.som.ca/20-questions-quun-journaliste-devrait-poser/#comments</comments>
		<pubDate>Tue, 28 Apr 2009 17:45:35 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[médias]]></category>
		<category><![CDATA[méthode]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[statistique]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=209</guid>
		<description><![CDATA[&#8230;avant de publier les résultats d&#8217;un sondage!
C&#8217;est le titre d&#8217;un article de Sheldon R. Gawiser et G. Evans Witt, du National Council on Public Polls, dont j&#8217;ai pris connaissance via le blogue de MarketResearch.
J&#8217;en ai déjà parlé, il arrive que les journalistes publient n&#8217;importe quoi en matière de sondage. Les questions qu&#8217;on retrouve dans cet [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2009/04/journaux2.jpg"><img class="alignright size-medium wp-image-210" title="journaux2" src="http://blogue.som.ca/wp-content/uploads/2009/04/journaux2.jpg" alt="" width="177" height="115" /></a><strong>&#8230;avant de publier les résultats d&#8217;un sondage!</strong></p>
<p>C&#8217;est le titre d&#8217;un <a href="http://www.ncpp.org/?q=node/4" target="_blank">article de Sheldon R. Gawiser et G. Evans Witt</a>, du <a href="http://www.ncpp.org/?q=node/4" target="_blank"><em>National Council on Public Polls</em></a>, dont j&#8217;ai pris connaissance via le blogue de <a href="http://www.marketresearchtech.com/polls-unscientific-surveys.htm" target="_blank">MarketResearch.</a></p>
<p>J&#8217;en ai déjà parlé, il arrive que les journalistes publient <a href="http://blogue.som.ca/les-sondages-non-scientifiques-ou-lart-de-faire-la-nouvelle-avec-nimporte-quoi/">n&#8217;importe quoi</a> en matière de sondage. Les questions qu&#8217;on retrouve dans cet article visent justement à aider les journalistes : ont-ils entre les mains un sondage scientifique? Doivent-ils rapporter les résultats de tel sondage?</p>
<p><span id="more-209"></span></p>
<blockquote><p><em>Unscientific pseudo-polls are widespread and sometimes entertaining, but they never provide the kind of information that belongs in a serious report.</em></p></blockquote>
<p>Les questions sont toutes accompagnées d&#8217;un commentaire. Je vous en rapporte quelques-unes ici.</p>
<ul>
<li><strong>Qui a fait le sondage?</strong><br />
C&#8217;est toujours la première question à poser. Si vous ne pouvez y répondre, vous ne pouvez répondre aux questions subséquentes.</li>
<li><strong>Qui paie pour faire le sondage et pourquoi est-il mené?</strong><br />
Les sondages ne sont pas effectués pour le «bien-être de l&#8217;humanité». Quelqu&#8217;un, quelque part, a une raison bien précise de connaître l&#8217;opinion ou les perceptions de tel groupe d&#8217;individus.</li>
<li><strong>Comment les répondants ont-ils été choisis?</strong><br />
Les <a href="http://blogue.som.ca/category/echantillonnage/">méthodes d&#8217;échantillonnage</a> y sont pour beaucoup dans la scientificité d&#8217;un sondage. C&#8217;est donc à examiner avec attention!</li>
<li><strong>Les résultats présentés sont-il basés sur l&#8217;ensemble des répondants?</strong><br />
Il faut toujours se rappeler que lorsque des données sont présentées pour un sous-groupe de l&#8217;échantillon, la marge d&#8217;erreur est généralement plus élevée. Aussi, si on veut parler uniquement d&#8217;un sous-groupe il faut s&#8217;assurer que le nombre d&#8217;individus qui le composent est assez grand.</li>
<li><strong>Le sondage a-t-il été fait sur le Web?</strong><br />
Les sondages Web peuvent être scientifiques s&#8217;ils respectent les règles de l&#8217;art. Mais attention! La méthode doit être scrupuleusement évaluée puisque de nombreux sondages Web font appel à des volontaires plutôt que d&#8217;utiliser des méthodes d&#8217;échantillonnage reconnues.</li>
<li><strong>Quand le sondage a-t-il été fait?</strong><br />
Les événements peuvent dramatiquement changer l&#8217;opinion publique. Un exemple? Si vous aviez fait un sondage sur la perception de la population à l&#8217;égard de la menace d&#8217;une pandémie d&#8217;influenza la semaine dernière, il ne serait plus d&#8217;actualité! En effet, la nouvelle grippe porcine, que les médias s&#8217;efforcent de nous présenter comme la prochaine catastrophe, a sûrement un effet sur l&#8217;opinion publique!</li>
</ul>
<p>Et il y a plusieurs autres questions et réponses toutes plus intéressantes les unes que les autres. <a href="http://www.ncpp.org/?q=node/4" target="_blank">C&#8217;est à lire!</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/20-questions-quun-journaliste-devrait-poser/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
	</channel>
</rss>

