<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>SOM : le blogue &#187; échantillonnage</title>
	<atom:link href="http://blogue.som.ca/category/echantillonnage/feed/" rel="self" type="application/rss+xml" />
	<link>http://blogue.som.ca</link>
	<description></description>
	<lastBuildDate>Fri, 03 Sep 2010 13:56:21 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Fin du recensement obligatoire&#8230; quelles conséquences pour les sondeurs?</title>
		<link>http://blogue.som.ca/fin-du-recensement-obligatoire-quelles-consequences-pour-les-sondeurs/</link>
		<comments>http://blogue.som.ca/fin-du-recensement-obligatoire-quelles-consequences-pour-les-sondeurs/#comments</comments>
		<pubDate>Fri, 16 Jul 2010 16:03:18 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=2881</guid>
		<description><![CDATA[La nouvelle, publiée en pleine effervescence de l&#8217;après-G20, n&#8217;a pas fait beaucoup de bruit. Le 29 juin dernier, on apprenait ainsi que la version longue du questionnaire de recensement, habituellement envoyé à 1 ménage sur 5, ne comportera plus de participation obligatoire (voir l&#8217;article de Cyberpresse).
Il sera plutôt remplacé par une enquête à participation volontaire, [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2010/07/Recensement3.jpg"><img class="alignright size-full wp-image-2889" title="Recensement3" src="http://blogue.som.ca/wp-content/uploads/2010/07/Recensement3.jpg" alt="Recensement3" width="166" height="138" /></a>La nouvelle, publiée en pleine effervescence de l&#8217;après-G20, n&#8217;a pas fait beaucoup de bruit. Le 29 juin dernier, on apprenait ainsi que la version longue du questionnaire de <strong>recensement</strong>, habituellement envoyé à 1 ménage sur 5, ne comportera plus de participation obligatoire (voir l&#8217;<a href="http://www.cyberpresse.ca/actualites/quebec-canada/politique-canadienne/201006/29/01-4294277-recensement-le-formulaire-detaille-obligatoire-elimine.php">article</a> de Cyberpresse).</p>
<p>Il sera plutôt remplacé par une <strong>enquête à participation volontaire</strong>, soit l&#8217;<strong><a title="Enquête nationale auprès des ménages - Statistique Canada" href="http://www.statcan.gc.ca/survey-enquete/household-menages/5178-fra.htm">enquête nationale auprès des ménages</a></strong>, qui ciblera le tiers des ménages canadiens. En revanche, la version courte du recensement demeurera obligatoire.</p>
<p><strong>Les conséquences de cette décision seront dommageables pour toute l&#8217;industrie du sondage. Voici pourquoi.</strong></p>
<p><span id="more-2881"></span>Comme je l&#8217;expliquais dans mon <a title="La pondération des données de sondage" href="http://blogue.som.ca/la-ponderation-des-donnees/">précédent billet</a>, nous utilisons les caractéristiques connues de la population pour <strong>pondérer les données de sondage</strong>. Or, plusieurs données relatives aux «caractéristiques connues de la population» sont directement issues&#8230; de la version longue du questionnaire de recensement! Le fait que cette enquête à participation obligatoire devienne facultative aura un effet certain sur le taux de réponse, diminuant ainsi la fiabilité des données et, par conséquent, la précision des sondages.</p>
<p>L&#8217;<a title="Institut de la statistique du Québec (ISQ) page d'accueil" href="http://www.stat.gouv.qc.ca/"><strong>Institut de la statistique du Québec</strong></a> (ISQ) a d&#8217;ailleurs pris position hier sur les impacts de ce changement pour le Québec. Comme je ne saurais mieux l&#8217;expliquer en mes propres mots, je me permets de reprendre quelques extraits (voir l&#8217;<a title="ISQ : Recensement 2011 : Impacts pour le Québec" href="http://www.stat.gouv.qc.ca/salle-presse/communiq/2010/juillet/juillet1015.htm">analyse intégrale</a>) :</p>
<blockquote><p>Les impacts sont importants et concernent notamment trois dimensions de la qualité de l&#8217;information statistique : <strong>fiabilité</strong>, <strong>comparabilité</strong> et <strong>cohérence</strong>.</p>
<p>Tout d&#8217;abord, compte tenu du caractère facultatif de la nouvelle enquête, une diminution des taux de réponse est appréhendée. Cela laisserait présager une perte de la fiabilité des statistiques produites. [...]</p>
<p>Une perte de comparabilité pourrait également être observée à l&#8217;égard des statistiques relatives aux caractéristiques de la population obtenue au fil des ans. [...]</p>
<p>Enfin, il pourrait être difficile pour Statistique Canada d&#8217;assurer la cohérence des statistiques produites à la suite de la nouvelle enquête facultative avec celles produites à l&#8217;aide du questionnaire court du recensement de 2011 [...]</p></blockquote>
<p>Ce questionnaire court obligatoire, rappelons-le, ne contient que <strong>4 variables sociodémographiques</strong> : âge, sexe, état matrimonial et langue maternelle. C&#8217;est insuffisant pour les besoins liés à la pondération des données (voir la <a href="http://www.gazette.gc.ca/rp-pr/p1/2010/2010-06-26/html/order-decret-fra.html" target="_blank">version 2011 du questionnaire court</a> &#8211; à la suite du recensement sur l&#8217;agriculture).</p>
<p>Il n&#8217;y a pas que les <strong>sondeurs</strong> qui redoutent l&#8217;impact de cette décision, vous vous en doutez. Plusieurs groupes ont d&#8217;ailleurs fait connaître leur insatisfaction. Par exemple :</p>
<ul>
<li>L&#8217;<a href="http://www.caut.ca/pages.asp?lang=2&amp;page=906" target="_blank">Association canadienne des professeures et professeurs d&#8217;université</a> exige que le gouvernement fédéral revienne sur sa décision en mentionnant les «conséquences désastreuses que cette mesure aura sur la compréhension  scientifique de la société canadienne et sur la capacité de prendre des  décisions éclairées relatives aux politiques sociales et économiques.»</li>
<li>Le <a href="http://www.ocol-clo.gc.ca/html/release_communique_12072010_f.php" target="_blank">Commissaire aux langues officielles</a> a entrepris une enquête sur la question en soulignant son inquiétude à l&#8217;égard «des répercussions possibles que pourrait avoir cette décision sur la  vitalité des communautés de langue officielle et l’application de la <em>Loi  sur les langues officielles</em>.»</li>
<li>La <a href="http://www.cnw.ca/fr/releases/archive/July2010/15/c4744.html">Conférence des recteurs et des principaux des universités du Québec  (CREPUQ)</a> a également fait part de sa «consternation [à l'égard de] la décision du gouvernement fédéral.»</li>
<li>Même le <a href="http://letoile.jminforme.ca/economie/article/1124829" target="_blank">milieu des affaires</a> s&#8217;est joint au débat pour dénoncer ce changement.</li>
</ul>
<p>Les <strong>raisons évoquées par le gouvernement </strong>pour justifier cette décision sont pour le moins nébuleuses. Selon un <a href="http://www.ledevoir.com/politique/canada/292267/le-ministre-clement-remet-en-doute-les-donnees-du-recensement" target="_blank">article du quotidien <em>Le Devoir</em></a>, le ministre de l&#8217;Industrie, Tony Clement, parle de préoccupations liées à la vie privée et va même jusqu&#8217;à remettre en question la fiabilité des informations du recensement sous prétexte que les citoyens étaient obligés de répondre au questionnaire&#8230;</p>
<p>Ce qu&#8217;il semble ignorer, c&#8217;est que sa décision (prise semble-t-il sans aucune consultation des principaux utilisateurs des données du recensement) aura des <strong>conséquences encore pires sur la fiabilité des données</strong>. Et c&#8217;est sans compter que la nouvelle formule coûtera plus cher aux Canadiens puisque le questionnaire sera envoyé à un plus grand nombre de ménages : un «petit» 30 millions $ de plus, selon <a href="http://www.cyberpresse.ca/actualites/quebec-canada/politique-canadienne/201007/16/01-4298693-recensement-clement-ne-recule-pas.php" target="_blank">Cyberpresse</a>&#8230;</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/fin-du-recensement-obligatoire-quelles-consequences-pour-les-sondeurs/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>La pondération des données</title>
		<link>http://blogue.som.ca/la-ponderation-des-donnees/</link>
		<comments>http://blogue.som.ca/la-ponderation-des-donnees/#comments</comments>
		<pubDate>Wed, 14 Jul 2010 20:01:07 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=2895</guid>
		<description><![CDATA[Lorsqu&#8217;on lit la méthodologie d&#8217;un sondage, on remarque souvent la phrase suivante (ou son équivalent) : «Les données ont été pondérées pour refléter les caractéristiques de la population à l&#8217;étude&#8230;». Et si on s&#8217;arrêtait un instant à cette fameuse pondération? Évidemment, je simplifie grandement le concept à des fins de compréhension.
Qu&#8217;est-ce que la pondération? Pourquoi [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2010/07/Balance-pondération.jpg"><img class="size-full wp-image-2904 alignleft" title="Balance-pondération" src="http://blogue.som.ca/wp-content/uploads/2010/07/Balance-pondération.jpg" alt="Balance-pondération" width="136" height="102" /></a>Lorsqu&#8217;on lit la <strong>méthodologie d&#8217;un sondage</strong>, on remarque souvent la phrase suivante (ou son équivalent) : «Les données ont été pondérées pour refléter les caractéristiques de la population à l&#8217;étude&#8230;». Et si on s&#8217;arrêtait un instant à cette fameuse <strong>pondération</strong>? Évidemment, je simplifie grandement le concept à des fins de compréhension.</p>
<h3>Qu&#8217;est-ce que la pondération? Pourquoi pondérer les données?</h3>
<p>La<strong> pondération des données</strong> consiste à accorder un <strong>coefficient de  pondération </strong>(un poids) à chacun des individus d&#8217;un échantillon. L&#8217;objectif premier de l&#8217;exercice est de corriger la représentativité de l&#8217;échantillon en fonction de certaines variables clés afin d&#8217;être en mesure d&#8217;extrapoler les résultats du sondage à la population.</p>
<p><span id="more-2895"></span><strong>Exemple</strong></p>
<ul>
<li>Prenons une population qui compte 10 000 individus et un nombre égal d&#8217;hommes et de femmes.</li>
<li>Disons maintenant qu&#8217;on fait un sondage avec un échantillon de 1000 individus et, qu&#8217;à cause de certains facteurs (ex. : taux de réponse, stratification), on obtient 800 femmes et 200 hommes.</li>
<li>On constate un déséquilibre, pour la variable «sexe», entre l&#8217;échantillon et la population : chaque homme de l&#8217;échantillon représente 25 hommes de la population (5000/200) alors que chaque femme de l&#8217;échantillon représente 6,25 femmes de la population (5000/800).</li>
<li>On appliquera donc un coefficient de pondération qui aura pour effet de donner plus de poids aux réponses des 200 hommes (et moins à celles des femmes), et ce, afin de corriger le déséquilibre.</li>
</ul>
<h3>Les variables de pondération</h3>
<p>Les variables qu&#8217;on utilisera pour pondérer les données d&#8217;un échantillon dépendent des caractéristiques de la population à l&#8217;étude.</p>
<p>Pour un sondage auprès de la population québécoise par exemple, la distribution des principales variables sociodémographiques sera examinée (ex. : âge, sexe, scolarité, nombre d&#8217;individus par ménage) et, s&#8217;il y a déséquilibre par rapport aux caractéristiques connues de la population, on appliquera le coefficient de pondération approprié. Ainsi, le poids qu&#8217;on attribue à un individu de l&#8217;échantillon correspond au poids que cet individu représente dans la population.</p>
<p><em><strong>Note importante : </strong>La pondération ne compense pas une méthode d&#8217;échantillonnage inappropriée. Si, à la base, on ne dispose pas d&#8217;un <a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/">échantillon probabiliste</a> constitué dans les règles de l&#8217;art, la pondération ne peut pas prétendre rendre un échantillon représentatif.</em></p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/la-ponderation-des-donnees/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Nouvelle tendance : échantillonnage basé sur les adresses de résidence</title>
		<link>http://blogue.som.ca/nouvelle-tendance-echantillonnage-base-sur-les-adresses-de-residence/</link>
		<comments>http://blogue.som.ca/nouvelle-tendance-echantillonnage-base-sur-les-adresses-de-residence/#comments</comments>
		<pubDate>Tue, 25 May 2010 19:00:34 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=268</guid>
		<description><![CDATA[Depuis environ 25 ans au Québec, on utilise la génération aléatoire de numéros de téléphone (GANT) (en anglais Random Digit Dialing &#8211; RDD) pour constituer des échantillons probabilistes. SOM a d&#8217;ailleurs utilisé cette méthode dès sa fondation en 1986.
Comme solution de rechange au RDD, une nouvelle tendance se dessine (surtout aux États-Unis pour le moment) [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: left;"><a href="http://blogue.som.ca/wp-content/uploads/2010/05/Address-based-sampling.jpg"><img class="alignleft size-full wp-image-2452" title="Address-based-sampling" src="http://blogue.som.ca/wp-content/uploads/2010/05/Address-based-sampling.jpg" alt="Address-based-sampling" width="203" height="50" /></a>Depuis environ 25 ans au Québec, on utilise la <strong>génération aléatoire de numéros de téléphone</strong> (GANT) (en anglais <a title="Définition de RDD sur Wikipédia" href="http://en.wikipedia.org/wiki/Random_digit_dialing" target="_blank"><em>Random Digit Dialing</em></a> &#8211; RDD) pour constituer des échantillons probabilistes. <a href="http://www.som.ca">SOM</a> a d&#8217;ailleurs utilisé cette méthode dès sa fondation en 1986.</p>
<p>Comme solution de rechange au RDD, une nouvelle tendance se dessine (surtout aux États-Unis pour le moment) : il s&#8217;agit de l&#8217;<strong>échantillonnage basé sur les adresses de résidence</strong> pour sélectionner les ménages qui répondront à un sondage (en anglais <em>Address Based Sampling</em> &#8211; ABS).</p>
<p><span id="more-268"></span><strong>Pourquoi?</strong></p>
<p>Pour tenter de joindre des groupes de répondants que les autres méthodes arrivent moins bien à joindre, notamment les jeunes (18-34 ans), les ménages qui utilisent exclusivement le téléphone cellulaire, certaines minorités ou encore les non-internautes (lorsqu&#8217;il s&#8217;agit de recherche en ligne).</p>
<p>En d&#8217;autres termes, il s&#8217;agit d&#8217;un moyen qui vise à améliorer la couverture des méthodes actuelles, c&#8217;est-à-dire le degré d’exhaustivité des renseignements relatifs à la population cible (pour plus de détails sur la couverture et les bases de sondage, voir la très claire <a title="Couverture et bases de sondage" href="http://www.statcan.gc.ca/pub/12-539-x/2009001/coverage-couverture-fra.htm" target="_blank">explication de Statistique Canada</a>).</p>
<p><strong>Comment ça marche?</strong></p>
<p>Il s&#8217;agit d&#8217;un processus en plusieurs étapes. Je m&#8217;inspire ici des quelques expériences documentées jusqu&#8217;à maintenant (voir les sources au bas de ce billet) et de la réflexion amorcée par SOM à ce sujet :</p>
<ul>
<li>Il faut d&#8217;abord disposer d&#8217;une base de sondage contenant toutes les adresses de la population cible dans un territoire donné.</li>
<li>On tire ensuite un échantillon aléatoire d&#8217;adresses à partir de de cette base de sondage.</li>
<li>Pour contacter les ménages sélectionnés, plusieurs options sont possibles : le téléphone (lorsqu&#8217;il est possible de trouver le numéro de téléphone correspondant à l&#8217;adresse), la poste ou encore une rencontre en personne. Évidemment, ce dernier moyen nécessite des ressources importantes.</li>
<li>Les ménages contactés sont invités à faire partie d&#8217;un panel dont on contactera les membres pour divers sondages. Ils peuvent signifier leur intérêt à faire partie du panel par divers moyens (au téléphone, par la poste, par internet).</li>
<li>Une rémunération (ou une autre forme d&#8217;incitatif) peut être proposée aux ménages pour joindre le panel et/ou participer à une recherche.</li>
<li>Idéalement, les ménages recrutés doivent avoir le choix du moyen pour répondre à un sondage (téléphone traditionnel, téléphone cellulaire, internet, poste&#8230;), ce qui signifie des <a href="http://blogue.som.ca/donner-aux-repondants-le-pouvoir-de-choisir-un-exemple-de-collecte-mixte/" target="_self">collectes mixtes ou multimodes</a>.</li>
<li>Les membres du panel ainsi formé doivent être régulièrement renouvelés, de façon à ce qu&#8217;on ne s&#8217;adresse pas toujours au même bassin de personnes.</li>
</ul>
<p><strong>Est-ce que ça marche?</strong></p>
<p>Les deux premières références citées plus bas font chacune le bilan d&#8217;une expérience utilisant l&#8217;ABS. Voici en vrac quelques constats qui émergent de l&#8217;une ou l&#8217;autre de ces études :</p>
<ul>
<li>L&#8217;échantillonnage basé sur les adresses de résidence permet effectivement de joindre des groupes qu&#8217;il est difficile de joindre avec le RDD. Dans les deux cas, on a pu joindre une proportion intéressante de ménages n&#8217;utilisant que le téléphone cellulaire. L&#8217;une des études a par ailleurs mieux réussi à joindre des membres des minorités afro-américaine et hispanophone de même que des jeunes de moins de 35 ans.</li>
<li>Les résultats non pondérés sont plus près des paramètres connus de la population avec l&#8217;ABS.</li>
<li>Dans les deux cas, le taux de réponse est inférieur avec une approche ABS comparativement à l&#8217;approche traditionnelle de RDD.</li>
</ul>
<p><strong>Pour en savoir plus :</strong></p>
<ul>
<li><a href="http://surveypractice.files.wordpress.com/2009/06/ui-ssrs-aapor-6-29-09.pdf" target="_blank"><em>Comparing Random Digit Dial (RDD) and United States  Postal Service (USPS) Address-Based Sample Designs for a General  Population Survey: The 2008 Massachusetts Health Insurance Survey</em></a> [document PDF, Urban Institute et Social Science Research Solutions]</li>
<li><a href="http://surveypractice.files.wordpress.com/2009/06/link-abs.pdf" target="_blank"><em>Building a New Foundation : Transitioning to Address  Based Sampling after Nearly 30 Years of RDD</em></a> [document PDF,  Nielsen Company]</li>
<li><a href="http://surveypractice.files.wordpress.com/2009/06/dekkermurphy_aapor_2009.pdf" target="_blank"><em>Address Based Sampling and Address Matching: Experience from REACH U.S.</em></a> [document PDF, Université de Chicago]</li>
<li><em><a href="http://www.knowledgenetworks.com/accuracy/spring2009/Dennis-DiSogra-Graham-spring09.html" target="_blank"><span>Meeting the Challenge of Cell Phone-Only  Households,                                   Young Adults and  Minorities</span><span> : Introducing  Address-Based Sampling to KnowledgePanel</span><span><span>®</span></span></a></em> [Knowledge Networks]</li>
<li><a href="http://www.genesys-sampling.com/ContentPages/2/Page236/Address%20Based%20Sampling.pdf" target="_blank"><em>Recent Developments in Address-Based Sampling</em></a> [document PDF, Marketing Systems Group]</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/nouvelle-tendance-echantillonnage-base-sur-les-adresses-de-residence/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>L&#8217;AAPOR recommande officiellement les panels probabilistes (recrutement aléatoire des panélistes)</title>
		<link>http://blogue.som.ca/aapor-recommande-officiellement-les-panels-probabilistes/</link>
		<comments>http://blogue.som.ca/aapor-recommande-officiellement-les-panels-probabilistes/#comments</comments>
		<pubDate>Thu, 15 Apr 2010 17:37:26 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[panel Web]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage web]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=2135</guid>
		<description><![CDATA[Dans un rapport* publié en mars 2010 (c&#8217;est tout frais!), l&#8217;American Association for Public Opinion Research (AAPOR) publie les conclusions d&#8217;un groupe de travail sur les panels d&#8217;internautes (online panels).
Je vous parle aujourd&#8217;hui de la première recommandation des experts :
Les chercheurs devraient éviter d&#8217;utiliser des panels non probabilistes lorsque leur objectif est de généraliser des [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2008/10/sondageweb-bleu2.jpg"><img class="alignleft size-full wp-image-95" title="sondageweb-bleu2" src="http://blogue.som.ca/wp-content/uploads/2008/10/sondageweb-bleu2.jpg" alt="sondageweb-bleu2" width="155" height="99" /></a>Dans un rapport* publié en mars 2010 (c&#8217;est tout frais!), l&#8217;<a title="AAPOR" href="http://www.aapor.org/Home.htm" target="_blank"><em>American Association for Public Opinion Research</em></a> (AAPOR) publie les conclusions d&#8217;un groupe de travail sur les panels d&#8217;internautes (<em>online panels</em>).</p>
<p>Je vous parle aujourd&#8217;hui de la première recommandation des experts :</p>
<h3><strong>Les chercheurs devraient éviter d&#8217;utiliser des panels non probabilistes lorsque leur objectif est de généraliser des résultats à l&#8217;ensemble d&#8217;une population. </strong></h3>
<p><span id="more-2135"></span></p>
<p>Évidemment, cette conclusion me réjouit puisque je m&#8217;évertue depuis des mois à expliquer la différence entre panel probabiliste (recrutement aléatoire de panélistes) et panel non probabiliste (panel de volontaires, qui s&#8217;inscrivent spontanément) ainsi que les implications de chacun à l&#8217;égard des résultats de recherche.</p>
<p><strong>Argumentation des experts</strong></p>
<p>Je ne prétends pas ici résumer les propos de ce volumineux rapport. Voici toutefois quelques-uns des arguments évoqués pour justifier cette position.</p>
<ul>
<li>Tous les panels d&#8217;internautes souffrent d&#8217;une erreur de couverture par rapport à la population en général (bien sûr, puisque les non-internautes en sont automatiquement exclus).</li>
<li>Toutefois, les méthodes probabilistes de recrutement de panélistes (ex. : au téléphone, par la poste et même en personne) tendent à minimiser cette erreur.</li>
<li>L&#8217;analyse d&#8217;un grand nombre d&#8217;études (le rapport comporte une bibliographie de 12 pages) qui comparent les résultats de sondage où l&#8217;échantillon est constitué de volontaires par rapport à des méthodes aléatoires (téléphone ou internet) continue de montrer que <strong>les échantillons probabilistes fournissent des résultats PLUS PRÉCIS</strong>. Une seule exception ici : dans quelques cas, les sondages non probabilistes sur les intentions de vote ont donné des résultats aussi précis ou même plus précis que les sondages probabilistes.</li>
<li>L&#8217;étude des modèles d&#8217;ajustement des données (ex. : pondération) utilisés pour les panels non probabilistes n&#8217;est pas concluante en ce qui a trait à leur capacité de réduire les biais.</li>
<li>Les préoccupations liées à la qualité des données dans les panels non probabilistes (ex. : présence de répondants «professionnels» ou même «fictifs») demeurent un enjeu majeur.</li>
<li>Bref, il n&#8217;y a pas de cadre théorique généralement accepté qui permette de généraliser les résultats d&#8217;un panel de volontaires. Les experts sont par ailleurs clairs sur la prétention de représentativité, et je cite : «Thus, claims of &laquo;&nbsp;representativeness&nbsp;&raquo; should be avoided when using these sample sources [nonprobability online panels].»</li>
</ul>
<p><strong>Composition du groupe de travail</strong></p>
<p>Le rapport de l&#8217;AAPOR est signé par 20 de ses membres, incluant certes des représentants de firmes privées (ex. : Gallup, SSI), mais également  huit chercheurs provenant de cinq universités (Stanford, Washington State, Michigan, UCLA, CUNY) et un membre du gouvernement américain (U.S. Centers for Disease Control and Prevention). Le président du groupe de travail, Reg Baker, tient par ailleurs un excellent blogue intitulé <a title="Blogue &quot;The Survey Geek&quot; - Reg Baker" href="http://regbaker.typepad.com/" target="_blank"><em>The Survey Geek</em></a>.</p>
<p>Il se trouvera certainement encore des personnes pour clamer que les panels de volontaires peuvent atteindre la «représentativité parfaite». Elles devront toutefois se rendre à l&#8217;évidence : aucune étude sérieuse ne cautionne ce point de vue. C&#8217;est même tout le contraire.</p>
<p>*Le <a title="AAPOR Report on Online Panels" href="http://www.aapor.org/AM/Template.cfm?Section=AAPOR_Committee_and_Task_Force_Reports&amp;Template=/CM/ContentDisplay.cfm&amp;ContentID=2223" target="_blank">rapport</a> complet du groupe de travail (80 pages) peut être consulté en ligne en  format PDF.</p>
<p><strong>À lire sur le même sujet : </strong><br />
<a href="http://blogue.som.ca/une-etude-confirme-la-superiorite-des-panels-web-avec-recrutement-aleatoire-des-repondants/" target="_self">Une étude confirme la supériorité des panels web avec recrutement aléatoire des répondants</a><br />
<a href="http://blogue.som.ca/vrai-ou-faux-mythes-et-realites-des-sondages-en-ligne-1/" target="_self">Vrai ou faux? Les panels internet livrent des résultats représentatifs de la population</a><br />
7 questions à poser aux firmes de sondage qui ont des panels web (<a href="http://blogue.som.ca/7-questions-firmes-de-sondage-panels-web-1/">partie 1</a>, <a href="http://blogue.som.ca/7-questions-firmes-de-sondage-panels-web-2/">partie 2</a>)</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/aapor-recommande-officiellement-les-panels-probabilistes/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Sondages en ligne et marges d&#8217;erreur : ne vous laissez pas berner!</title>
		<link>http://blogue.som.ca/sondages-en-ligne-et-marges-derreur-ne-vous-laissez-pas-berner/</link>
		<comments>http://blogue.som.ca/sondages-en-ligne-et-marges-derreur-ne-vous-laissez-pas-berner/#comments</comments>
		<pubDate>Tue, 14 Jul 2009 12:20:35 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[sondage web]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=244</guid>
		<description><![CDATA[Un sondage dont les répondants n&#8217;ont pas été sélectionnés de façon aléatoire NE DOIT PAS afficher de marge d&#8217;erreur. C&#8217;est là l&#8217;une des normes fondamentales de l&#8217;Association de la recherche et de l&#8217;intelligence marketing (ARIM). Or, certaines firmes n&#8217;ont malheureusement aucun scrupule à berner le public ou, à tout le moins, à laisser planer le doute&#8230; [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2009/07/pt-exclamation2.jpg"><img class="alignright size-medium wp-image-262" title="pt-exclamation2" src="http://blogue.som.ca/wp-content/uploads/2009/07/pt-exclamation2.jpg" alt="" width="142" height="106" /></a>Un sondage dont les répondants n&#8217;ont pas été sélectionnés de façon aléatoire NE DOIT PAS afficher de <strong><a href="http://blogue.som.ca/a-propos-de-la-marge-derreur-dun-sondage/">marge d&#8217;erreur</a></strong>. C&#8217;est là l&#8217;une des normes fondamentales de l&#8217;<a href="http://www.mria-arim.ca/ABOUTFRE/default.asp" target="_blank">Association de la recherche et de l&#8217;intelligence marketing (ARIM)</a>. Or, certaines firmes n&#8217;ont malheureusement aucun scrupule à berner le public ou, à tout le moins, à laisser planer le doute&#8230; exemples à l&#8217;appui!</p>
<p><strong>La norme<br />
</strong>L&#8217;ARIM est en quelque sorte le «chien de garde» de l&#8217;industrie du sondage au Canada. Entre autres activités, elle élabore et fait la promotion de normes professionnelles pour garantir des travaux de qualité et ainsi protéger les clients et le public. Selon le code de déontologie de l&#8217;ARIM :</p>
<p><span id="more-244"></span></p>
<blockquote><p>Les membres doivent s&#8217;abstenir de faire des déclarations concernant les marges d&#8217;erreur d&#8217;un échantillonnage par rapport aux estimations démographiques quand ils n&#8217;utilisent pas des échantillonnages probabilistes.</p></blockquote>
<p>Un échantillon est dit <strong><a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/">probabiliste</a></strong> lorsqu&#8217;il s&#8217;appuie sur le hasard pour sélectionner les individus qui le composent (tous ont une probabilité connue d&#8217;être sélectionnés). <strong>L&#8217;échantillon probabiliste</strong>, parce qu&#8217;il comporte des propriétés mathématiques connues, <strong>est le seul qui permet le calcul de l&#8217;erreur d&#8217;échantillonnage</strong>, communément appelée la marge d&#8217;erreur d&#8217;un sondage.</p>
<p><strong>Où est le problème?</strong><br />
Avec la croissance des sondages Web, les firmes de sondage constituent maintenant des panels d&#8217;internautes. Ces internautes sont régulièrement invités à participer à des sondages en ligne. Dans certains panels, les individus sont des volontaires, c&#8217;est-à-dire des gens qui se sont eux-mêmes inscrits pour remplir des sondages. Dans ce cas, on parle d&#8217;autosélection, et non d&#8217;un échantillon de type probabiliste. Les firmes qui utilisent ce genre de panel ne devraient donc pas, selon les normes de l&#8217;ARIM, accompagner leurs résultats d&#8217;une marge d&#8217;erreur.</p>
<p><strong>Des exemples douteux</strong><br />
Voici deux exemples qui illustrent mon propos. Le premier est tiré d&#8217;une présentation faite récemment par Madame Nathalie Madore, vice-présidente de l&#8217;<a href="http://www.association-assq.qc.ca/" target="_blank">Association des statisticiens et statisticiennes du Québec (ASSQ)</a>. La présentation s&#8217;intitulait <em>Les mauvais usages de la statistique</em>.</p>
<blockquote><p>Ce sondage éclair a été réalisé par Internet le (date) auprès de 511 Québécois et Québécoises. Un échantillon probabiliste aléatoire de cette taille <strong>comporterait</strong> une marge d’erreur maximale de 3,4 % 19 fois sur 20.</p></blockquote>
<p>Avez-vous remarqué l&#8217;utilisation du conditionnel dans cette phrase? «Comporterait»? C&#8217;est donc dire qu&#8217;il n&#8217;est pas probabiliste! Comme le mentionnait Madame Madore, la phrase donne au lecteur un sentiment de sécurité quant à la valeur de l&#8217;information recueillie qui ne reflète pas la réalité. (Qui plus est, il faut mentionner ici que la marge d&#8217;erreur rapportée par le journaliste est erronée! Un échantillon aléatoire simple non pondéré de 511 Québécois aurait plutôt une marge d&#8217;erreur de 4,4 %).</p>
<p>Le deuxième exemple, lu dans un journal, n&#8217;est pas nécessairement mauvais, mais il est suffisamment imprécis pour qu&#8217;on se pose des questions&#8230;</p>
<blockquote><p>Les résultats du sondage proviennent d&#8217;un questionnaire en ligne rempli par 1003 adultes choisis au hasard parmi un <strong>groupe de répondants réguliers</strong> [de la firme]. La marge d&#8217;erreur est de 3,1 points de pourcentage, 19 fois sur 20.</p></blockquote>
<p>C&#8217;est bien beau que les adultes aient été choisis au hasard&#8230; mais qu&#8217;en est-il du «groupe de répondants réguliers»? Les individus qui le composent ont-ils, eux, été sélectionnés au hasard? Ou s&#8217;agit-il plutôt d&#8217;un groupe de volontaires? Le texte ne le précise pas.</p>
<p>Comme quoi il faut toujours être vigilant lorsqu&#8217;on lit les résultats d&#8217;un sondage!</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/sondages-en-ligne-et-marges-derreur-ne-vous-laissez-pas-berner/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Déterminer la taille d&#8217;un échantillon&#8230; sans y perdre son latin!</title>
		<link>http://blogue.som.ca/determiner-la-taille-dun-echantillon-sans-y-perdre-son-latin/</link>
		<comments>http://blogue.som.ca/determiner-la-taille-dun-echantillon-sans-y-perdre-son-latin/#comments</comments>
		<pubDate>Thu, 02 Jul 2009 15:01:16 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=247</guid>
		<description><![CDATA[Combien d&#8217;individus devrais-je interroger, lors d&#8217;un sondage, pour obtenir des résultats représentatifs de la population à l&#8217;étude? En d&#8217;autres mots, quelle devrait être la taille de l&#8217;échantillon?
Ici, je vous épargne les équations mathématiques&#8230; Je voulais simplement vous faire découvrir quelques outils sur le Web qui peuvent calculer pour vous la taille requise d&#8217;un échantillon.
Attention cependant! Ces [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2009/07/calculatrice2.jpg"><img class="alignright size-thumbnail wp-image-257" title="calculatrice2" src="http://blogue.som.ca/wp-content/uploads/2009/07/calculatrice2.jpg" alt="" width="137" height="185" /></a>Combien d&#8217;individus devrais-je interroger, lors d&#8217;un sondage, pour obtenir des résultats représentatifs de la population à l&#8217;étude? En d&#8217;autres mots, quelle devrait être la taille de l&#8217;échantillon?</p>
<p>Ici, je vous épargne les équations mathématiques&#8230; Je voulais simplement vous faire découvrir quelques <strong>outils sur le Web</strong> qui peuvent <strong>calculer pour vous la taille requise d&#8217;un échantillon</strong>.</p>
<p>Attention cependant! Ces outils sont utiles pour des <strong>échantillons aléatoires simples</strong> où chacun des individus de la population a une chance égale d&#8217;être sélectionné. Dès que le plan d&#8217;échantillonnage se complexifie, ne serait-ce qu&#8217;un peu, ils ne sont plus appropriés : c&#8217;est d&#8217;un expert dont vous aurez alors besoin!</p>
<p><span id="more-247"></span></p>
<p><strong>Comment ça fonctionne?<br />
</strong>La taille de l&#8217;échantillon est essentiellement conditionnée par la précision des résultats que l&#8217;on désire obtenir :</p>
<ul>
<li>Vous devez d&#8217;abord entrer la <a href="http://blogue.som.ca/a-propos-de-la-marge-derreur-dun-sondage/">marge d&#8217;erreur</a> que vous êtes prêts à accepter (ex. : 4 %).</li>
<li>Il faut ensuite préciser le <a href="http://fr.wikipedia.org/wiki/Niveau_de_confiance" target="_blank">niveau de confiance</a> dont vous avez besoin (on travaille presque toujours avec un niveau de confiance de 95 %, le fameux «19 fois sur 20»).</li>
<li>On vous demande également d&#8217;indiquer la taille de la population à l&#8217;étude. Toutefois, lorsque la taille de la population est de plusieurs milliers d&#8217;individus, celle-ci n&#8217;a que peu d&#8217;influence sur la taille de l&#8217;échantillon.</li>
</ul>
<p><strong>Quelques outils<br />
</strong>Il existe plusieurs outils pour calculer la taille d&#8217;un échantillon aléatoire simple (la plupart en langue anglaise, malheureusement). Ils sont plutôt équivalents, quoique certains vous proposent des options supplémentaires intéressantes (ex. : scénarios alternatifs selon différents niveaux de confiance, calcul de la marge d&#8217;erreur à partir de la taille de l&#8217;échantillon). Je vous donne des liens vers quelques-uns, mais une simple recherche sur Internet avec les mots clés «sample size calculator» vous en donnera certainement d&#8217;autres.</p>
<ul>
<li><a href="http://fr.gmi-mr.com/resources/sample-size-calculator.php" target="_blank">GMI</a> (en français)</li>
<li><a href="http://www.ezsurvey.com/samplesize.html" target="_blank">Raosoft</a> (en anglais)</li>
<li><a href="http://www.custominsight.com/articles/random-sample-calculator.asp" target="_blank">CustomInsight</a> (en anglais)</li>
<li><a href="http://www.macorr.com/ss_calculator.htm" target="_blank">MaCorr</a> (en anglais)</li>
</ul>
<p><strong>Billets sur des sujets apparentés :</strong></p>
<ul>
<li><a href="http://blogue.som.ca/representativite-dun-echantillon-clin-doeil-historique/">Représentativité d&#8217;un échantillon : clin d&#8217;oeil historique</a></li>
<li><a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/">L&#8217;ABC des méthodes d&#8217;échantillonnage (partie 1)</a></li>
<li><a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-2/">L&#8217;ABC des méthodes d&#8217;échantillonnage (partie 2)</a></li>
<li><a href="http://blogue.som.ca/methodes-dechantillonnage-probabilistes-et-sondages-web/">Méthodes d&#8217;échantillonnage probabilistes et sondages Web</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/determiner-la-taille-dun-echantillon-sans-y-perdre-son-latin/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>20 questions qu&#8217;un journaliste devrait poser&#8230;</title>
		<link>http://blogue.som.ca/20-questions-quun-journaliste-devrait-poser/</link>
		<comments>http://blogue.som.ca/20-questions-quun-journaliste-devrait-poser/#comments</comments>
		<pubDate>Tue, 28 Apr 2009 17:45:35 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[médias]]></category>
		<category><![CDATA[méthode]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[statistique]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=209</guid>
		<description><![CDATA[&#8230;avant de publier les résultats d&#8217;un sondage!
C&#8217;est le titre d&#8217;un article de Sheldon R. Gawiser et G. Evans Witt, du National Council on Public Polls, dont j&#8217;ai pris connaissance via le blogue de MarketResearch.
J&#8217;en ai déjà parlé, il arrive que les journalistes publient n&#8217;importe quoi en matière de sondage. Les questions qu&#8217;on retrouve dans cet [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2009/04/journaux2.jpg"><img class="alignright size-medium wp-image-210" title="journaux2" src="http://blogue.som.ca/wp-content/uploads/2009/04/journaux2.jpg" alt="" width="177" height="115" /></a><strong>&#8230;avant de publier les résultats d&#8217;un sondage!</strong></p>
<p>C&#8217;est le titre d&#8217;un <a href="http://www.ncpp.org/?q=node/4" target="_blank">article de Sheldon R. Gawiser et G. Evans Witt</a>, du <a href="http://www.ncpp.org/?q=node/4" target="_blank"><em>National Council on Public Polls</em></a>, dont j&#8217;ai pris connaissance via le blogue de <a href="http://www.marketresearchtech.com/polls-unscientific-surveys.htm" target="_blank">MarketResearch.</a></p>
<p>J&#8217;en ai déjà parlé, il arrive que les journalistes publient <a href="http://blogue.som.ca/les-sondages-non-scientifiques-ou-lart-de-faire-la-nouvelle-avec-nimporte-quoi/">n&#8217;importe quoi</a> en matière de sondage. Les questions qu&#8217;on retrouve dans cet article visent justement à aider les journalistes : ont-ils entre les mains un sondage scientifique? Doivent-ils rapporter les résultats de tel sondage?</p>
<p><span id="more-209"></span></p>
<blockquote><p><em>Unscientific pseudo-polls are widespread and sometimes entertaining, but they never provide the kind of information that belongs in a serious report.</em></p></blockquote>
<p>Les questions sont toutes accompagnées d&#8217;un commentaire. Je vous en rapporte quelques-unes ici.</p>
<ul>
<li><strong>Qui a fait le sondage?</strong><br />
C&#8217;est toujours la première question à poser. Si vous ne pouvez y répondre, vous ne pouvez répondre aux questions subséquentes.</li>
<li><strong>Qui paie pour faire le sondage et pourquoi est-il mené?</strong><br />
Les sondages ne sont pas effectués pour le «bien-être de l&#8217;humanité». Quelqu&#8217;un, quelque part, a une raison bien précise de connaître l&#8217;opinion ou les perceptions de tel groupe d&#8217;individus.</li>
<li><strong>Comment les répondants ont-ils été choisis?</strong><br />
Les <a href="http://blogue.som.ca/category/echantillonnage/">méthodes d&#8217;échantillonnage</a> y sont pour beaucoup dans la scientificité d&#8217;un sondage. C&#8217;est donc à examiner avec attention!</li>
<li><strong>Les résultats présentés sont-il basés sur l&#8217;ensemble des répondants?</strong><br />
Il faut toujours se rappeler que lorsque des données sont présentées pour un sous-groupe de l&#8217;échantillon, la marge d&#8217;erreur est généralement plus élevée. Aussi, si on veut parler uniquement d&#8217;un sous-groupe il faut s&#8217;assurer que le nombre d&#8217;individus qui le composent est assez grand.</li>
<li><strong>Le sondage a-t-il été fait sur le Web?</strong><br />
Les sondages Web peuvent être scientifiques s&#8217;ils respectent les règles de l&#8217;art. Mais attention! La méthode doit être scrupuleusement évaluée puisque de nombreux sondages Web font appel à des volontaires plutôt que d&#8217;utiliser des méthodes d&#8217;échantillonnage reconnues.</li>
<li><strong>Quand le sondage a-t-il été fait?</strong><br />
Les événements peuvent dramatiquement changer l&#8217;opinion publique. Un exemple? Si vous aviez fait un sondage sur la perception de la population à l&#8217;égard de la menace d&#8217;une pandémie d&#8217;influenza la semaine dernière, il ne serait plus d&#8217;actualité! En effet, la nouvelle grippe porcine, que les médias s&#8217;efforcent de nous présenter comme la prochaine catastrophe, a sûrement un effet sur l&#8217;opinion publique!</li>
</ul>
<p>Et il y a plusieurs autres questions et réponses toutes plus intéressantes les unes que les autres. <a href="http://www.ncpp.org/?q=node/4" target="_blank">C&#8217;est à lire!</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/20-questions-quun-journaliste-devrait-poser/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>À propos de la marge d&#8217;erreur d&#8217;un sondage</title>
		<link>http://blogue.som.ca/a-propos-de-la-marge-derreur-dun-sondage/</link>
		<comments>http://blogue.som.ca/a-propos-de-la-marge-derreur-dun-sondage/#comments</comments>
		<pubDate>Fri, 05 Sep 2008 15:50:50 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=64</guid>
		<description><![CDATA[Les sondages véritablement scientifiques sont accompagnés d&#8217;une marge d&#8217;erreur. Et bien que les médias sérieux la mentionnent généralement lorsqu&#8217;ils présentent les résultats d&#8217;un sondage, rares sont les gens qui s&#8217;y attardent. Or, la marge d&#8217;erreur est importante pour savoir si on peut se fier aux résultats présentés. Prenons cet exemple cité par Radio-Canada :
Le sondage [...]]]></description>
			<content:encoded><![CDATA[<p>Les sondages véritablement scientifiques sont accompagnés d&#8217;une <strong>marge d&#8217;erreur</strong>. Et bien que les médias sérieux la mentionnent généralement lorsqu&#8217;ils présentent les résultats d&#8217;un sondage, rares sont les gens qui s&#8217;y attardent. Or, la marge d&#8217;erreur est importante pour savoir si on peut se fier aux résultats présentés. Prenons <a title="L'importance des vacances - Sondage SOM mené pour le compte de Desjardins Sécurité financière" href="http://www.radio-canada.ca/nouvelles/societe/2008/06/17/001-vacances-entrepreneurs-sondage.shtml" target="_blank">cet exemple cité par Radio-Canada</a> :</p>
<blockquote><p>Le sondage a été réalisé par SOM Recherches et sondages entre le 7 février et le 10 mars 2008. 1594 personnes ont été interrogées. <strong>Sa marge d&#8217;erreur maximale est de 2,6 %, 19 fois sur 20</strong>. Les données ont été pondérées de façon à refléter la répartition exacte de la population canadienne par régions, sexes et groupes d&#8217;âge, établie par le Recensement de 2006 de Statistique Canada.</p></blockquote>
<p>Que veut dire exactement une « marge d&#8217;erreur maximale de 2,6 %, 19 fois sur 20 »? En termes simples, ça signifie qu&#8217;on est sûr à 95 % (le fameux 19 fois sur 20) que les résultats se situent à plus ou moins 2,6 % des valeurs présentées.</p>
<p><span id="more-64"></span></p>
<p>Reprenons l&#8217;<a title="L'importance des vacances - Sondage SOM mené pour le compte de Desjardins Sécurité financière" href="http://www.radio-canada.ca/nouvelles/societe/2008/06/17/001-vacances-entrepreneurs-sondage.shtml" target="_blank">exemple</a> cité plus haut :</p>
<blockquote><p>Selon le sondage, 78 % des entrepreneurs ont dit être allés au travail, en moyenne sept fois l&#8217;année dernière, tandis qu&#8217;ils étaient soit malades soit épuisés.</p></blockquote>
<p>En appliquant la marge d&#8217;erreur, ça veut donc dire qu&#8217;on est sûr à 95 % que la proportion des entrepreneurs canadiens qui diraient être allés au travail en moyenne sept fois l&#8217;année dernière alors qu&#8217;ils étaient malades ou épuisés (si on pouvait tous les interroger) se situerait entre 75,4 % et 80,6 % (plus ou moins 2,6 %).</p>
<p><strong>Pourquoi est-ce si important de tenir compte de la marge d&#8217;erreur? </strong>Disons que les résultats d&#8217;un sondage référendaire hypothétique indiquent une proportion de 48 % pour un camp (celui de votre choix!) et de 52 % pour l&#8217;autre avec une marge d&#8217;erreur de 3 %. Faites le calcul d&#8217;ajouter ou d&#8217;enlever 3 % à ces valeurs&#8230; et vous constaterez que les résultats se chevauchent! Ainsi, le 48 % pourrait en fait être 51 % lorsqu&#8217;extrapolé à la population. Si c&#8217;était le cas, le 52 % vaudrait nécessairement 49 %. On obtient alors un tout autre résultat : la victoire change de camp!</p>
<p>Il faut donc être prudent dans l&#8217;interprétation des données d&#8217;un sondage. Plus la marge d&#8217;erreur est grande, moins on peut avoir confiance que les résultats du sondage sont proches de la réalité. Et si les médias vous présentent des résultats sans même mentionner la marge d&#8217;erreur, une petite lumière rouge devrait s&#8217;allumer : soyez critiques et sceptiques, ne prenez pas les résultats pour acquis!</p>
<p>La marge d&#8217;erreur se calcule à partir de la taille (nombre de personnes sondées) et de la structure de l&#8217;échantillon. Pour plus de détails à ce sujet, vous pouvez consulter l&#8217;<a title="Encyclopédie scientifique en ligne, définition marge d'erreur" href="http://www.techno-science.net/?onglet=glossaire&amp;definition=5995" target="_blank">Encyclopédie scientifique en ligne</a> ou <a title="La marge d'erreur selon Wikipédia" href="http://fr.wikipedia.org/wiki/Marge_d%27erreur" target="_blank">Wikipédia</a>.  <a title="La marge d'erreur selon Wikipédia" href="http://fr.wikipedia.org/wiki/Marge_d%27erreur" target="_blank"><br />
</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/a-propos-de-la-marge-derreur-dun-sondage/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Méthodes d’échantillonnage probabilistes et sondages Web</title>
		<link>http://blogue.som.ca/methodes-dechantillonnage-probabilistes-et-sondages-web/</link>
		<comments>http://blogue.som.ca/methodes-dechantillonnage-probabilistes-et-sondages-web/#comments</comments>
		<pubDate>Tue, 29 Jul 2008 13:47:27 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage web]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=40</guid>
		<description><![CDATA[L’échantillonnage probabiliste pose de réels défis lorsqu’il est question de sondages Web, notamment :

La non-disponibilité des bases de sondage, c’est-à-dire de listes valables à partir desquelles sélectionner un échantillon aléatoire.
S’il est aujourd’hui facile de générer des numéros de téléphone aléatoires pour effectuer des sondages téléphoniques représentatifs, il en va autrement des adresses de courriels. Un [...]]]></description>
			<content:encoded><![CDATA[<p>L’<a title="L'ABC des méthodes d'échantillonnage (partie 1)" href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/" target="_self">échantillonnage probabiliste</a> pose de réels <strong>défis</strong> lorsqu’il est question de <a title="Les sondages en ligne de SOM" href="http://www.som.ca/fr/solutions-web/enquetes-sondages-web" target="_blank">sondages Web</a>, notamment :</p>
<ul>
<li>La non-disponibilité des bases de sondage, c’est-à-dire de listes valables à partir desquelles sélectionner un échantillon aléatoire.</li>
<li>S’il est aujourd’hui facile de générer des numéros de téléphone aléatoires pour effectuer des sondages téléphoniques représentatifs, il en va autrement des adresses de courriels. Un tel système ne peut que générer un nombre important d’adresses inexistantes ou inutilisées.</li>
<li>La difficulté d’établir avec certitude l’identité du répondant. Il est fort possible, par exemple, qu’une adresse de courriel soit utilisée par plusieurs personnes. Aussi, la personne qui répond au sondage n’est pas nécessairement celle qui a été invitée à le faire.</li>
<li>L’impossibilité de joindre les personnes qui n’ont pas accès à Internet.</li>
</ul>
<p>Bien qu’imparfaites, il existe des méthodes d’échantillonnage probabilistes pour le Web, par exemple :</p>
<ul><span id="more-40"></span></p>
<li>La sélection aléatoire d’un échantillon à partir d’une liste de courriels (à condition évidemment que la liste soit à jour et qu’elle couvre l’ensemble de la population à l’étude).</li>
<li>L’interception aléatoire de visiteurs sur un site Web (à condition d’avoir des données fiables sur le nombre total de visiteurs).</li>
<li>La constitution de <a title="Panel Or de SOM" href="http://www.som.ca/fr/solutions-web/panel-web" target="_blank">panels Web</a> – mon collègue <a title="Éric Lacroix, directeur de projet, SOM" href="http://www.som.ca/fr/entreprise/equipe/#eric-lacroix" target="_blank">Éric Lacroix</a> a déjà abordé la question de la représentativité des panels ici.</li>
</ul>
<p>Peu importe la méthode utilisée, il est important d’en connaître les limites et, surtout, d’en tenir compte dans la généralisation et la publication des résultats.</p>
<p>Source : <a title="Sampling and inference in web surveys, part I - Frames and sampling" href="http://www.websm.org/uploadi/editor/1133720576GUIDE_1_Sampling_and_inference_in_web_surveys_part1.pdf" target="_blank">Sampling and Inference in Web surveys, Part I &#8211; Frames and Sampling</a> (document PDF).</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/methodes-dechantillonnage-probabilistes-et-sondages-web/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>L’ABC des méthodes d’échantillonnage (partie 2)</title>
		<link>http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-2/</link>
		<comments>http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-2/#comments</comments>
		<pubDate>Thu, 24 Jul 2008 19:11:52 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=39</guid>
		<description><![CDATA[La semaine dernière, je mentionnais qu’il existe deux grandes familles d’échantillons : les échantillons probabilistes et les échantillons non probabilistes.
Les échantillons non probabilistes 
Les méthodes d’échantillonnage non probabilistes, contrairement aux précédentes, ne s’appuient pas sur le hasard pour sélectionner les individus d’une population. Les échantillons ainsi constitués ne sont donc pas probabilistes et, de ce [...]]]></description>
			<content:encoded><![CDATA[<p>La semaine dernière, je mentionnais qu’il existe deux grandes familles d’échantillons : les <a title="L'ABC des méthodes d'échantillonnage (partie 1)" href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/" target="_self"><strong>échantillons probabilistes</strong></a> et les <strong>échantillons non probabilistes</strong>.</p>
<p><strong>Les échantillons non probabilistes </strong><br />
Les méthodes d’échantillonnage non probabilistes, contrairement aux précédentes, ne s’appuient pas sur le hasard pour sélectionner les individus d’une population. Les échantillons ainsi constitués ne sont donc pas probabilistes et, de ce fait, on ne peut leur appliquer la notion de marge d&#8217;erreur statistique. Autrement dit, on ne connaît pas le niveau de précision des estimations ainsi produites. Ils présentent toutefois d’autres avantages, comme ceux d’être peu coûteux, rapides et faciles à utiliser.</p>
<p>Il faut bien voir également que ce ne sont pas tous les projets qui exigent des échantillons probabilistes; cela dépend des objectifs poursuivis. Ces méthodes sont fréquemment utilisées en recherche qualitative. Voici quelques exemples d’échantillons non probabilistes :</p>
<p><span id="more-39"></span></p>
<ul>
<li><a href="http://blogue.som.ca/wp-content/uploads/2008/07/istock_000005277789xsmallechantillonnage.jpg"><img class="alignright size-thumbnail wp-image-43" title="istock_000005277789xsmallechantillonnage" src="http://blogue.som.ca/wp-content/uploads/2008/07/istock_000005277789xsmallechantillonnage.jpg" alt="Échantillonnage" width="150" height="100" /></a><strong>L’échantillon accidentel.</strong> C’est la méthode des « premiers qui passent ». L’image type est le « vox pop »: on interroge les premières personnes qui se présentent à un endroit donné.</li>
<li><strong>L’éc</strong><strong>hantillon typique.</strong> Appelé aussi échantillonnage par choix raisonné, cette méthode consiste à sélectionner les cas « types », par exemple, les cas extrêmes ou les phénomènes rares.</li>
<li><strong>L’échantillon de volontaires.</strong> Seules les personnes qui se portent volontaires font partie de ce type d’échantillon. Certains panels Web sont constitués exclusivement de cette façon.</li>
<li><strong>L’échantillon « boule de neige ».</strong> Dans ce type d’échantillon, appelé aussi échantillon par réseau, les individus sont sélectionnés en fonction de leurs liens avec un « noyau » d’individus. On se base par exemple sur les réseaux sociaux, les amitiés, les relations d’affaires, etc. pour recruter de nouveaux sujets.</li>
<li><strong>L’échantillon par quotas.</strong> Il s’agit de sélectionner des individus de façon « accidentelle », mais en tentant d’atteindre des quotas préalablement définis en fonction des caractéristiques de la population à l’étude (ex. : 50 % d’hommes et 50 % de femmes, X % de jeunes, etc.).</li>
</ul>
<p><em>Sources</em><br />
<a href="http://www.puq.uquebec.ca/fr/repertoire_fiche.asp?titre=titres&amp;noproduit=d1243" target="_blank">Recherche sociale : de la problématique à la collecte des données</a><br />
<a href="http://www.cheneliere.ca/main+fr+01_500+FONDEMENTS_ET_ETAPES_DU_PROCESSUS_DE_RECHERCHE_.html?DivisionID=0&amp;ItemID=1476" target="_blank"> Fondements et étapes du processus de la recherche</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-2/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
