<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>SOM : le blogue &#187; représentativité</title>
	<atom:link href="http://blogue.som.ca/category/representativite/feed/" rel="self" type="application/rss+xml" />
	<link>http://blogue.som.ca</link>
	<description></description>
	<lastBuildDate>Fri, 03 Sep 2010 13:56:21 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Fin du recensement obligatoire&#8230; quelles conséquences pour les sondeurs?</title>
		<link>http://blogue.som.ca/fin-du-recensement-obligatoire-quelles-consequences-pour-les-sondeurs/</link>
		<comments>http://blogue.som.ca/fin-du-recensement-obligatoire-quelles-consequences-pour-les-sondeurs/#comments</comments>
		<pubDate>Fri, 16 Jul 2010 16:03:18 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=2881</guid>
		<description><![CDATA[La nouvelle, publiée en pleine effervescence de l&#8217;après-G20, n&#8217;a pas fait beaucoup de bruit. Le 29 juin dernier, on apprenait ainsi que la version longue du questionnaire de recensement, habituellement envoyé à 1 ménage sur 5, ne comportera plus de participation obligatoire (voir l&#8217;article de Cyberpresse).
Il sera plutôt remplacé par une enquête à participation volontaire, [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2010/07/Recensement3.jpg"><img class="alignright size-full wp-image-2889" title="Recensement3" src="http://blogue.som.ca/wp-content/uploads/2010/07/Recensement3.jpg" alt="Recensement3" width="166" height="138" /></a>La nouvelle, publiée en pleine effervescence de l&#8217;après-G20, n&#8217;a pas fait beaucoup de bruit. Le 29 juin dernier, on apprenait ainsi que la version longue du questionnaire de <strong>recensement</strong>, habituellement envoyé à 1 ménage sur 5, ne comportera plus de participation obligatoire (voir l&#8217;<a href="http://www.cyberpresse.ca/actualites/quebec-canada/politique-canadienne/201006/29/01-4294277-recensement-le-formulaire-detaille-obligatoire-elimine.php">article</a> de Cyberpresse).</p>
<p>Il sera plutôt remplacé par une <strong>enquête à participation volontaire</strong>, soit l&#8217;<strong><a title="Enquête nationale auprès des ménages - Statistique Canada" href="http://www.statcan.gc.ca/survey-enquete/household-menages/5178-fra.htm">enquête nationale auprès des ménages</a></strong>, qui ciblera le tiers des ménages canadiens. En revanche, la version courte du recensement demeurera obligatoire.</p>
<p><strong>Les conséquences de cette décision seront dommageables pour toute l&#8217;industrie du sondage. Voici pourquoi.</strong></p>
<p><span id="more-2881"></span>Comme je l&#8217;expliquais dans mon <a title="La pondération des données de sondage" href="http://blogue.som.ca/la-ponderation-des-donnees/">précédent billet</a>, nous utilisons les caractéristiques connues de la population pour <strong>pondérer les données de sondage</strong>. Or, plusieurs données relatives aux «caractéristiques connues de la population» sont directement issues&#8230; de la version longue du questionnaire de recensement! Le fait que cette enquête à participation obligatoire devienne facultative aura un effet certain sur le taux de réponse, diminuant ainsi la fiabilité des données et, par conséquent, la précision des sondages.</p>
<p>L&#8217;<a title="Institut de la statistique du Québec (ISQ) page d'accueil" href="http://www.stat.gouv.qc.ca/"><strong>Institut de la statistique du Québec</strong></a> (ISQ) a d&#8217;ailleurs pris position hier sur les impacts de ce changement pour le Québec. Comme je ne saurais mieux l&#8217;expliquer en mes propres mots, je me permets de reprendre quelques extraits (voir l&#8217;<a title="ISQ : Recensement 2011 : Impacts pour le Québec" href="http://www.stat.gouv.qc.ca/salle-presse/communiq/2010/juillet/juillet1015.htm">analyse intégrale</a>) :</p>
<blockquote><p>Les impacts sont importants et concernent notamment trois dimensions de la qualité de l&#8217;information statistique : <strong>fiabilité</strong>, <strong>comparabilité</strong> et <strong>cohérence</strong>.</p>
<p>Tout d&#8217;abord, compte tenu du caractère facultatif de la nouvelle enquête, une diminution des taux de réponse est appréhendée. Cela laisserait présager une perte de la fiabilité des statistiques produites. [...]</p>
<p>Une perte de comparabilité pourrait également être observée à l&#8217;égard des statistiques relatives aux caractéristiques de la population obtenue au fil des ans. [...]</p>
<p>Enfin, il pourrait être difficile pour Statistique Canada d&#8217;assurer la cohérence des statistiques produites à la suite de la nouvelle enquête facultative avec celles produites à l&#8217;aide du questionnaire court du recensement de 2011 [...]</p></blockquote>
<p>Ce questionnaire court obligatoire, rappelons-le, ne contient que <strong>4 variables sociodémographiques</strong> : âge, sexe, état matrimonial et langue maternelle. C&#8217;est insuffisant pour les besoins liés à la pondération des données (voir la <a href="http://www.gazette.gc.ca/rp-pr/p1/2010/2010-06-26/html/order-decret-fra.html" target="_blank">version 2011 du questionnaire court</a> &#8211; à la suite du recensement sur l&#8217;agriculture).</p>
<p>Il n&#8217;y a pas que les <strong>sondeurs</strong> qui redoutent l&#8217;impact de cette décision, vous vous en doutez. Plusieurs groupes ont d&#8217;ailleurs fait connaître leur insatisfaction. Par exemple :</p>
<ul>
<li>L&#8217;<a href="http://www.caut.ca/pages.asp?lang=2&amp;page=906" target="_blank">Association canadienne des professeures et professeurs d&#8217;université</a> exige que le gouvernement fédéral revienne sur sa décision en mentionnant les «conséquences désastreuses que cette mesure aura sur la compréhension  scientifique de la société canadienne et sur la capacité de prendre des  décisions éclairées relatives aux politiques sociales et économiques.»</li>
<li>Le <a href="http://www.ocol-clo.gc.ca/html/release_communique_12072010_f.php" target="_blank">Commissaire aux langues officielles</a> a entrepris une enquête sur la question en soulignant son inquiétude à l&#8217;égard «des répercussions possibles que pourrait avoir cette décision sur la  vitalité des communautés de langue officielle et l’application de la <em>Loi  sur les langues officielles</em>.»</li>
<li>La <a href="http://www.cnw.ca/fr/releases/archive/July2010/15/c4744.html">Conférence des recteurs et des principaux des universités du Québec  (CREPUQ)</a> a également fait part de sa «consternation [à l'égard de] la décision du gouvernement fédéral.»</li>
<li>Même le <a href="http://letoile.jminforme.ca/economie/article/1124829" target="_blank">milieu des affaires</a> s&#8217;est joint au débat pour dénoncer ce changement.</li>
</ul>
<p>Les <strong>raisons évoquées par le gouvernement </strong>pour justifier cette décision sont pour le moins nébuleuses. Selon un <a href="http://www.ledevoir.com/politique/canada/292267/le-ministre-clement-remet-en-doute-les-donnees-du-recensement" target="_blank">article du quotidien <em>Le Devoir</em></a>, le ministre de l&#8217;Industrie, Tony Clement, parle de préoccupations liées à la vie privée et va même jusqu&#8217;à remettre en question la fiabilité des informations du recensement sous prétexte que les citoyens étaient obligés de répondre au questionnaire&#8230;</p>
<p>Ce qu&#8217;il semble ignorer, c&#8217;est que sa décision (prise semble-t-il sans aucune consultation des principaux utilisateurs des données du recensement) aura des <strong>conséquences encore pires sur la fiabilité des données</strong>. Et c&#8217;est sans compter que la nouvelle formule coûtera plus cher aux Canadiens puisque le questionnaire sera envoyé à un plus grand nombre de ménages : un «petit» 30 millions $ de plus, selon <a href="http://www.cyberpresse.ca/actualites/quebec-canada/politique-canadienne/201007/16/01-4298693-recensement-clement-ne-recule-pas.php" target="_blank">Cyberpresse</a>&#8230;</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/fin-du-recensement-obligatoire-quelles-consequences-pour-les-sondeurs/feed/</wfw:commentRss>
		<slash:comments>7</slash:comments>
		</item>
		<item>
		<title>La pondération des données</title>
		<link>http://blogue.som.ca/la-ponderation-des-donnees/</link>
		<comments>http://blogue.som.ca/la-ponderation-des-donnees/#comments</comments>
		<pubDate>Wed, 14 Jul 2010 20:01:07 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=2895</guid>
		<description><![CDATA[Lorsqu&#8217;on lit la méthodologie d&#8217;un sondage, on remarque souvent la phrase suivante (ou son équivalent) : «Les données ont été pondérées pour refléter les caractéristiques de la population à l&#8217;étude&#8230;». Et si on s&#8217;arrêtait un instant à cette fameuse pondération? Évidemment, je simplifie grandement le concept à des fins de compréhension.
Qu&#8217;est-ce que la pondération? Pourquoi [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2010/07/Balance-pondération.jpg"><img class="size-full wp-image-2904 alignleft" title="Balance-pondération" src="http://blogue.som.ca/wp-content/uploads/2010/07/Balance-pondération.jpg" alt="Balance-pondération" width="136" height="102" /></a>Lorsqu&#8217;on lit la <strong>méthodologie d&#8217;un sondage</strong>, on remarque souvent la phrase suivante (ou son équivalent) : «Les données ont été pondérées pour refléter les caractéristiques de la population à l&#8217;étude&#8230;». Et si on s&#8217;arrêtait un instant à cette fameuse <strong>pondération</strong>? Évidemment, je simplifie grandement le concept à des fins de compréhension.</p>
<h3>Qu&#8217;est-ce que la pondération? Pourquoi pondérer les données?</h3>
<p>La<strong> pondération des données</strong> consiste à accorder un <strong>coefficient de  pondération </strong>(un poids) à chacun des individus d&#8217;un échantillon. L&#8217;objectif premier de l&#8217;exercice est de corriger la représentativité de l&#8217;échantillon en fonction de certaines variables clés afin d&#8217;être en mesure d&#8217;extrapoler les résultats du sondage à la population.</p>
<p><span id="more-2895"></span><strong>Exemple</strong></p>
<ul>
<li>Prenons une population qui compte 10 000 individus et un nombre égal d&#8217;hommes et de femmes.</li>
<li>Disons maintenant qu&#8217;on fait un sondage avec un échantillon de 1000 individus et, qu&#8217;à cause de certains facteurs (ex. : taux de réponse, stratification), on obtient 800 femmes et 200 hommes.</li>
<li>On constate un déséquilibre, pour la variable «sexe», entre l&#8217;échantillon et la population : chaque homme de l&#8217;échantillon représente 25 hommes de la population (5000/200) alors que chaque femme de l&#8217;échantillon représente 6,25 femmes de la population (5000/800).</li>
<li>On appliquera donc un coefficient de pondération qui aura pour effet de donner plus de poids aux réponses des 200 hommes (et moins à celles des femmes), et ce, afin de corriger le déséquilibre.</li>
</ul>
<h3>Les variables de pondération</h3>
<p>Les variables qu&#8217;on utilisera pour pondérer les données d&#8217;un échantillon dépendent des caractéristiques de la population à l&#8217;étude.</p>
<p>Pour un sondage auprès de la population québécoise par exemple, la distribution des principales variables sociodémographiques sera examinée (ex. : âge, sexe, scolarité, nombre d&#8217;individus par ménage) et, s&#8217;il y a déséquilibre par rapport aux caractéristiques connues de la population, on appliquera le coefficient de pondération approprié. Ainsi, le poids qu&#8217;on attribue à un individu de l&#8217;échantillon correspond au poids que cet individu représente dans la population.</p>
<p><em><strong>Note importante : </strong>La pondération ne compense pas une méthode d&#8217;échantillonnage inappropriée. Si, à la base, on ne dispose pas d&#8217;un <a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/">échantillon probabiliste</a> constitué dans les règles de l&#8217;art, la pondération ne peut pas prétendre rendre un échantillon représentatif.</em></p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/la-ponderation-des-donnees/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Nouvelle tendance : échantillonnage basé sur les adresses de résidence</title>
		<link>http://blogue.som.ca/nouvelle-tendance-echantillonnage-base-sur-les-adresses-de-residence/</link>
		<comments>http://blogue.som.ca/nouvelle-tendance-echantillonnage-base-sur-les-adresses-de-residence/#comments</comments>
		<pubDate>Tue, 25 May 2010 19:00:34 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=268</guid>
		<description><![CDATA[Depuis environ 25 ans au Québec, on utilise la génération aléatoire de numéros de téléphone (GANT) (en anglais Random Digit Dialing &#8211; RDD) pour constituer des échantillons probabilistes. SOM a d&#8217;ailleurs utilisé cette méthode dès sa fondation en 1986.
Comme solution de rechange au RDD, une nouvelle tendance se dessine (surtout aux États-Unis pour le moment) [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: left;"><a href="http://blogue.som.ca/wp-content/uploads/2010/05/Address-based-sampling.jpg"><img class="alignleft size-full wp-image-2452" title="Address-based-sampling" src="http://blogue.som.ca/wp-content/uploads/2010/05/Address-based-sampling.jpg" alt="Address-based-sampling" width="203" height="50" /></a>Depuis environ 25 ans au Québec, on utilise la <strong>génération aléatoire de numéros de téléphone</strong> (GANT) (en anglais <a title="Définition de RDD sur Wikipédia" href="http://en.wikipedia.org/wiki/Random_digit_dialing" target="_blank"><em>Random Digit Dialing</em></a> &#8211; RDD) pour constituer des échantillons probabilistes. <a href="http://www.som.ca">SOM</a> a d&#8217;ailleurs utilisé cette méthode dès sa fondation en 1986.</p>
<p>Comme solution de rechange au RDD, une nouvelle tendance se dessine (surtout aux États-Unis pour le moment) : il s&#8217;agit de l&#8217;<strong>échantillonnage basé sur les adresses de résidence</strong> pour sélectionner les ménages qui répondront à un sondage (en anglais <em>Address Based Sampling</em> &#8211; ABS).</p>
<p><span id="more-268"></span><strong>Pourquoi?</strong></p>
<p>Pour tenter de joindre des groupes de répondants que les autres méthodes arrivent moins bien à joindre, notamment les jeunes (18-34 ans), les ménages qui utilisent exclusivement le téléphone cellulaire, certaines minorités ou encore les non-internautes (lorsqu&#8217;il s&#8217;agit de recherche en ligne).</p>
<p>En d&#8217;autres termes, il s&#8217;agit d&#8217;un moyen qui vise à améliorer la couverture des méthodes actuelles, c&#8217;est-à-dire le degré d’exhaustivité des renseignements relatifs à la population cible (pour plus de détails sur la couverture et les bases de sondage, voir la très claire <a title="Couverture et bases de sondage" href="http://www.statcan.gc.ca/pub/12-539-x/2009001/coverage-couverture-fra.htm" target="_blank">explication de Statistique Canada</a>).</p>
<p><strong>Comment ça marche?</strong></p>
<p>Il s&#8217;agit d&#8217;un processus en plusieurs étapes. Je m&#8217;inspire ici des quelques expériences documentées jusqu&#8217;à maintenant (voir les sources au bas de ce billet) et de la réflexion amorcée par SOM à ce sujet :</p>
<ul>
<li>Il faut d&#8217;abord disposer d&#8217;une base de sondage contenant toutes les adresses de la population cible dans un territoire donné.</li>
<li>On tire ensuite un échantillon aléatoire d&#8217;adresses à partir de de cette base de sondage.</li>
<li>Pour contacter les ménages sélectionnés, plusieurs options sont possibles : le téléphone (lorsqu&#8217;il est possible de trouver le numéro de téléphone correspondant à l&#8217;adresse), la poste ou encore une rencontre en personne. Évidemment, ce dernier moyen nécessite des ressources importantes.</li>
<li>Les ménages contactés sont invités à faire partie d&#8217;un panel dont on contactera les membres pour divers sondages. Ils peuvent signifier leur intérêt à faire partie du panel par divers moyens (au téléphone, par la poste, par internet).</li>
<li>Une rémunération (ou une autre forme d&#8217;incitatif) peut être proposée aux ménages pour joindre le panel et/ou participer à une recherche.</li>
<li>Idéalement, les ménages recrutés doivent avoir le choix du moyen pour répondre à un sondage (téléphone traditionnel, téléphone cellulaire, internet, poste&#8230;), ce qui signifie des <a href="http://blogue.som.ca/donner-aux-repondants-le-pouvoir-de-choisir-un-exemple-de-collecte-mixte/" target="_self">collectes mixtes ou multimodes</a>.</li>
<li>Les membres du panel ainsi formé doivent être régulièrement renouvelés, de façon à ce qu&#8217;on ne s&#8217;adresse pas toujours au même bassin de personnes.</li>
</ul>
<p><strong>Est-ce que ça marche?</strong></p>
<p>Les deux premières références citées plus bas font chacune le bilan d&#8217;une expérience utilisant l&#8217;ABS. Voici en vrac quelques constats qui émergent de l&#8217;une ou l&#8217;autre de ces études :</p>
<ul>
<li>L&#8217;échantillonnage basé sur les adresses de résidence permet effectivement de joindre des groupes qu&#8217;il est difficile de joindre avec le RDD. Dans les deux cas, on a pu joindre une proportion intéressante de ménages n&#8217;utilisant que le téléphone cellulaire. L&#8217;une des études a par ailleurs mieux réussi à joindre des membres des minorités afro-américaine et hispanophone de même que des jeunes de moins de 35 ans.</li>
<li>Les résultats non pondérés sont plus près des paramètres connus de la population avec l&#8217;ABS.</li>
<li>Dans les deux cas, le taux de réponse est inférieur avec une approche ABS comparativement à l&#8217;approche traditionnelle de RDD.</li>
</ul>
<p><strong>Pour en savoir plus :</strong></p>
<ul>
<li><a href="http://surveypractice.files.wordpress.com/2009/06/ui-ssrs-aapor-6-29-09.pdf" target="_blank"><em>Comparing Random Digit Dial (RDD) and United States  Postal Service (USPS) Address-Based Sample Designs for a General  Population Survey: The 2008 Massachusetts Health Insurance Survey</em></a> [document PDF, Urban Institute et Social Science Research Solutions]</li>
<li><a href="http://surveypractice.files.wordpress.com/2009/06/link-abs.pdf" target="_blank"><em>Building a New Foundation : Transitioning to Address  Based Sampling after Nearly 30 Years of RDD</em></a> [document PDF,  Nielsen Company]</li>
<li><a href="http://surveypractice.files.wordpress.com/2009/06/dekkermurphy_aapor_2009.pdf" target="_blank"><em>Address Based Sampling and Address Matching: Experience from REACH U.S.</em></a> [document PDF, Université de Chicago]</li>
<li><em><a href="http://www.knowledgenetworks.com/accuracy/spring2009/Dennis-DiSogra-Graham-spring09.html" target="_blank"><span>Meeting the Challenge of Cell Phone-Only  Households,                                   Young Adults and  Minorities</span><span> : Introducing  Address-Based Sampling to KnowledgePanel</span><span><span>®</span></span></a></em> [Knowledge Networks]</li>
<li><a href="http://www.genesys-sampling.com/ContentPages/2/Page236/Address%20Based%20Sampling.pdf" target="_blank"><em>Recent Developments in Address-Based Sampling</em></a> [document PDF, Marketing Systems Group]</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/nouvelle-tendance-echantillonnage-base-sur-les-adresses-de-residence/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Twitter remplacera-t-il les sondages d&#8217;opinion? Bien sûr que non</title>
		<link>http://blogue.som.ca/twitter-remplacera-t-il-les-sondages-opinion/</link>
		<comments>http://blogue.som.ca/twitter-remplacera-t-il-les-sondages-opinion/#comments</comments>
		<pubDate>Thu, 20 May 2010 15:39:58 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[médias sociaux]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=2401</guid>
		<description><![CDATA[Twitter remplacera-t-il les sondages d&#8217;opinion? est le titre d&#8217;un article publié par Branchez-vous la semaine dernière. On y fait référence à une étude de l&#8217;Université Carnegie Mellon (PDF) qui, après l&#8217;examen d&#8217;un milliard de «tweets», conclut que les données publiées sur Twitter expriment les mêmes tendances que les résultats des sondages d&#8217;opinion sur certains thèmes [...]]]></description>
			<content:encoded><![CDATA[<p><em><a href="http://blogue.som.ca/wp-content/uploads/2010/05/logotwitter.png"><img class="alignright size-full wp-image-2415" title="logotwitter" src="http://blogue.som.ca/wp-content/uploads/2010/05/logotwitter.png" alt="logotwitter" width="180" height="44" /></a>Twitter remplacera-t-il les sondages d&#8217;opinion?</em> est le titre d&#8217;un article publié par <strong><em>Branchez-vous</em> </strong>la semaine dernière. On y fait référence à une <a href="http://www.cs.cmu.edu/~nasmith/papers/oconnor+balasubramanyan+routledge+smith.icwsm10.pdf" target="_blank">étude de l&#8217;Université Carnegie Mellon</a> (PDF) qui, après l&#8217;examen d&#8217;un milliard de «tweets», conclut que les données publiées sur <em><a title="Twitter.com" href="http://twitter.com/" target="_blank">Twitter</a></em> expriment les mêmes tendances que les résultats des <strong>sondages d&#8217;opinion</strong> sur certains thèmes sélectionnés.</p>
<p>La nouvelle a rapidement fait le tour du web. Et comme toujours lorsque des études montrent les avantages et les possibilités des réseaux sociaux, plusieurs ont sauté sur l&#8217;occasion pour annoncer la mort des sondages d&#8217;opinion. Une chose est sûre, ce n&#8217;est pas pour demain!</p>
<p><span id="more-2401"></span></p>
<h3>Pourquoi Twitter ne remplacera-t-il pas les sondages d&#8217;opinion?</h3>
<ul>
<li>Au Québec, la proportion de personnes adeptes de Twitter est encore très faible (voir les <a title="Notoriété et taux de pénétration de Twitter au Québec" href="http://blogue.som.ca/2-des-adultes-quebecois-ont-un-compte-twitter-selon-un-sondage-sombranchez-vous-com/">données de décembre 2009</a>). Il s&#8217;agit bien sûr d&#8217;internautes et, sans avoir de données sur le profil des utilisateurs, il s&#8217;agit certainement de gens plus scolarisés que la moyenne, partageant certaines caractéristiques moins répandues dans la population en général (ex. : le fait d&#8217;être très «techno»). Impossible de prétendre que l&#8217;opinion de ces personnes est représentative de l&#8217;ensemble de la population.</li>
<li>Le sondage scientifique repose sur des théories éprouvées (probabilités,  statistique) qui en font un outil unique. Une éventuelle utilisation de Twitter pour mesurer l&#8217;opinion publique ne pourrait offrir les mêmes gages de représentativité.</li>
<li>Les propos diffusés sur Twitter sont&#8230; spontanés. Qu&#8217;arrive-t-il si on ne parle pas des sujets qui vous intéressent? Joanne Simonis, dans un <a href="http://survey.cvent.com/blog/online-market-research/0/0/twitter-the-demise-of-opinion-polls-" target="_blank">billet publié sur le blogue de <em>Cvent</em></a>, fait une belle analogie en parlant de Twitter et des sondages; si les sondages sont un baromètre de l&#8217;opinion publique, Twitter s&#8217;apparente plutôt à un thermomètre : utile pour détecter les sujets «chauds» de l&#8217;heure, mais pas pour mesurer l&#8217;opinion publique.</li>
<li>D&#8217;ailleurs, les sujets «chauds» enflamment souvent les esprits et déchaînent les passions. On peut penser que les opinions les plus polarisées sont celles qui ressortent du lot. Les utilisateurs plus modérés ou indifférents à l&#8217;égard d&#8217;un sujet donné se font certainement plus discrets sur Twitter.</li>
<li>Les logiciels utilisés pour l&#8217;analyse de texte sont encore à l&#8217;état embryonnaire; ils classent les éléments textuels en repérant par exemple les mots à connotation négative et ceux à connotation positive. Je ne crois pas me tromper en disant qu&#8217;ils ne sont pas suffisamment sensibles pour détecter l&#8217;ironie ou l&#8217;humour. Aussi, la marge d&#8217;erreur associée à ce type de classement est nécessairement plus élevée que celle d&#8217;un sondage fait dans les règles.</li>
<li>On dit que cette nouvelle méthode permettrait de sauver du temps par rapport à un sondage traditionnel. À la lecture de l&#8217;étude, je n&#8217;en suis pas si sûre. Les chercheurs ont analysé un milliard de «tweets» postés en 2008 et 2009&#8230; et publient les résultats de leur étude en 2010. Je serais curieuse de savoir combien d&#8217;heures de collecte, d&#8217;analyse et de vérification ont été investies dans le projet. Quant à l&#8217;utilité de données d&#8217;opinion qui remontent à 2008&#8230; sans commentaires.</li>
</ul>
<h3>Twitter, un complément possible aux sondages</h3>
<p>L&#8217;étude des chercheurs américains demeure très intéressante. Dans une perspective non pas de sondage, mais plutôt de <strong>recherche qualitative</strong>, les propos véhiculés sur les médias sociaux sont une source de données à ne pas négliger. Mais de là à remplacer le sondage, il y a un pas impossible à franchir. C&#8217;est plutôt une nouvelle avenue de recherche qui s&#8217;offre à nous.</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/twitter-remplacera-t-il-les-sondages-opinion/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>L&#8217;AAPOR recommande officiellement les panels probabilistes (recrutement aléatoire des panélistes)</title>
		<link>http://blogue.som.ca/aapor-recommande-officiellement-les-panels-probabilistes/</link>
		<comments>http://blogue.som.ca/aapor-recommande-officiellement-les-panels-probabilistes/#comments</comments>
		<pubDate>Thu, 15 Apr 2010 17:37:26 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[panel Web]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage web]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=2135</guid>
		<description><![CDATA[Dans un rapport* publié en mars 2010 (c&#8217;est tout frais!), l&#8217;American Association for Public Opinion Research (AAPOR) publie les conclusions d&#8217;un groupe de travail sur les panels d&#8217;internautes (online panels).
Je vous parle aujourd&#8217;hui de la première recommandation des experts :
Les chercheurs devraient éviter d&#8217;utiliser des panels non probabilistes lorsque leur objectif est de généraliser des [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2008/10/sondageweb-bleu2.jpg"><img class="alignleft size-full wp-image-95" title="sondageweb-bleu2" src="http://blogue.som.ca/wp-content/uploads/2008/10/sondageweb-bleu2.jpg" alt="sondageweb-bleu2" width="155" height="99" /></a>Dans un rapport* publié en mars 2010 (c&#8217;est tout frais!), l&#8217;<a title="AAPOR" href="http://www.aapor.org/Home.htm" target="_blank"><em>American Association for Public Opinion Research</em></a> (AAPOR) publie les conclusions d&#8217;un groupe de travail sur les panels d&#8217;internautes (<em>online panels</em>).</p>
<p>Je vous parle aujourd&#8217;hui de la première recommandation des experts :</p>
<h3><strong>Les chercheurs devraient éviter d&#8217;utiliser des panels non probabilistes lorsque leur objectif est de généraliser des résultats à l&#8217;ensemble d&#8217;une population. </strong></h3>
<p><span id="more-2135"></span></p>
<p>Évidemment, cette conclusion me réjouit puisque je m&#8217;évertue depuis des mois à expliquer la différence entre panel probabiliste (recrutement aléatoire de panélistes) et panel non probabiliste (panel de volontaires, qui s&#8217;inscrivent spontanément) ainsi que les implications de chacun à l&#8217;égard des résultats de recherche.</p>
<p><strong>Argumentation des experts</strong></p>
<p>Je ne prétends pas ici résumer les propos de ce volumineux rapport. Voici toutefois quelques-uns des arguments évoqués pour justifier cette position.</p>
<ul>
<li>Tous les panels d&#8217;internautes souffrent d&#8217;une erreur de couverture par rapport à la population en général (bien sûr, puisque les non-internautes en sont automatiquement exclus).</li>
<li>Toutefois, les méthodes probabilistes de recrutement de panélistes (ex. : au téléphone, par la poste et même en personne) tendent à minimiser cette erreur.</li>
<li>L&#8217;analyse d&#8217;un grand nombre d&#8217;études (le rapport comporte une bibliographie de 12 pages) qui comparent les résultats de sondage où l&#8217;échantillon est constitué de volontaires par rapport à des méthodes aléatoires (téléphone ou internet) continue de montrer que <strong>les échantillons probabilistes fournissent des résultats PLUS PRÉCIS</strong>. Une seule exception ici : dans quelques cas, les sondages non probabilistes sur les intentions de vote ont donné des résultats aussi précis ou même plus précis que les sondages probabilistes.</li>
<li>L&#8217;étude des modèles d&#8217;ajustement des données (ex. : pondération) utilisés pour les panels non probabilistes n&#8217;est pas concluante en ce qui a trait à leur capacité de réduire les biais.</li>
<li>Les préoccupations liées à la qualité des données dans les panels non probabilistes (ex. : présence de répondants «professionnels» ou même «fictifs») demeurent un enjeu majeur.</li>
<li>Bref, il n&#8217;y a pas de cadre théorique généralement accepté qui permette de généraliser les résultats d&#8217;un panel de volontaires. Les experts sont par ailleurs clairs sur la prétention de représentativité, et je cite : «Thus, claims of &laquo;&nbsp;representativeness&nbsp;&raquo; should be avoided when using these sample sources [nonprobability online panels].»</li>
</ul>
<p><strong>Composition du groupe de travail</strong></p>
<p>Le rapport de l&#8217;AAPOR est signé par 20 de ses membres, incluant certes des représentants de firmes privées (ex. : Gallup, SSI), mais également  huit chercheurs provenant de cinq universités (Stanford, Washington State, Michigan, UCLA, CUNY) et un membre du gouvernement américain (U.S. Centers for Disease Control and Prevention). Le président du groupe de travail, Reg Baker, tient par ailleurs un excellent blogue intitulé <a title="Blogue &quot;The Survey Geek&quot; - Reg Baker" href="http://regbaker.typepad.com/" target="_blank"><em>The Survey Geek</em></a>.</p>
<p>Il se trouvera certainement encore des personnes pour clamer que les panels de volontaires peuvent atteindre la «représentativité parfaite». Elles devront toutefois se rendre à l&#8217;évidence : aucune étude sérieuse ne cautionne ce point de vue. C&#8217;est même tout le contraire.</p>
<p>*Le <a title="AAPOR Report on Online Panels" href="http://www.aapor.org/AM/Template.cfm?Section=AAPOR_Committee_and_Task_Force_Reports&amp;Template=/CM/ContentDisplay.cfm&amp;ContentID=2223" target="_blank">rapport</a> complet du groupe de travail (80 pages) peut être consulté en ligne en  format PDF.</p>
<p><strong>À lire sur le même sujet : </strong><br />
<a href="http://blogue.som.ca/une-etude-confirme-la-superiorite-des-panels-web-avec-recrutement-aleatoire-des-repondants/" target="_self">Une étude confirme la supériorité des panels web avec recrutement aléatoire des répondants</a><br />
<a href="http://blogue.som.ca/vrai-ou-faux-mythes-et-realites-des-sondages-en-ligne-1/" target="_self">Vrai ou faux? Les panels internet livrent des résultats représentatifs de la population</a><br />
7 questions à poser aux firmes de sondage qui ont des panels web (<a href="http://blogue.som.ca/7-questions-firmes-de-sondage-panels-web-1/">partie 1</a>, <a href="http://blogue.som.ca/7-questions-firmes-de-sondage-panels-web-2/">partie 2</a>)</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/aapor-recommande-officiellement-les-panels-probabilistes/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Internet supplante la télévision chez les Canadiens? Pas sûr!</title>
		<link>http://blogue.som.ca/internet-supplante-la-television-chez-les-canadiens-pas-sur/</link>
		<comments>http://blogue.som.ca/internet-supplante-la-television-chez-les-canadiens-pas-sur/#comments</comments>
		<pubDate>Mon, 29 Mar 2010 15:44:16 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage web]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=1955</guid>
		<description><![CDATA[La semaine dernière, un intéressant sondage d&#8217;Ipsos mentionnait que, pour la première fois, le nombre d&#8217;heures consacrées à internet en une semaine dépassait le nombre d&#8217;heures passées à regarder la télé. Plusieurs médias et blogues ont relayé la nouvelle en faisant tous la même erreur d&#8217;interprétation. Pouvez-vous trouver de quelle erreur il s&#8217;agit?
Voici ce que [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2010/03/Television-internet-sondage.jpg"><img class="alignright size-full wp-image-1958" title="Television-internet-sondage" src="http://blogue.som.ca/wp-content/uploads/2010/03/Television-internet-sondage.jpg" alt="Television-internet-sondage" width="157" height="157" /></a>La semaine dernière, un intéressant <a href="http://www.ipsos-na.com/news-polls/pressrelease.aspx?id=4720#" target="_blank">sondage d&#8217;Ipsos</a> mentionnait que, pour la première fois, le nombre d&#8217;heures consacrées à internet en une semaine dépassait le nombre d&#8217;heures passées à regarder la télé. Plusieurs médias et blogues ont relayé la nouvelle en faisant tous la même <strong>erreur d&#8217;interprétation</strong>. Pouvez-vous trouver de quelle erreur il s&#8217;agit?</p>
<p><strong>Voici ce que dit l&#8217;étude originale : </strong></p>
<blockquote><p><em>Ipsos reports that for the first time ever in their tracking research,  the weekly Internet usage of online Canadians has moved ahead of the  number of hours spent watching television. [...] Overall, online Canadians  are now spending more than 18 hours a week online, compared to 16.9  hours watching television.</em></p></blockquote>
<p><span id="more-1955"></span><strong>Maintenant, voici des extraits de la nouvelle relayée par quelques médias : </strong></p>
<blockquote><p>Pour la première fois, les Canadiens passent plus de temps sur internet que devant leur téléviseur. (<a href="http://www.radio-canada.ca/nouvelles/societe/2010/03/22/003-sondage-tele-internet.shtml">Radio-Canada</a>)</p>
<p><span>Pour la première fois, les Canadiens passent plus  de temps à surfer le Web qu’à regarder la télévision, selon un récent  sondage. (<a href="http://fr.canoe.ca/techno/nouvelles/archives/2010/03/20100322-132214.html" target="_blank">Canoe</a>)<br />
</span></p>
<p>Pour la première fois, les Canadiens passent plus de temps sur internet   qu&#8217;à regarder la télévision, selon un sondage Ipsos Reid. (<a href="http://technaute.cyberpresse.ca/nouvelles/internet/201003/22/01-4263131-lusage-dinternet-depasse-la-tele.php" target="_blank">Cyberpresse</a>)</p>
<p><span> </span></p></blockquote>
<p><strong>Quelle est l&#8217;erreur commune dans ces trois extraits?</strong></p>
<p>Ils font tous référence aux «Canadiens» alors que l&#8217;étude mentionne explicitement qu&#8217;il s&#8217;agit des «internautes canadiens» (<em>online Canadians</em>). Qu&#8217;est-ce que ça change? Beaucoup de choses! En fait, il ne s&#8217;agit pas du tout de la même population. Si certains résultats de sondage obtenus d’un panel d&#8217;internautes sont comparables aux données de la population en  général, ce n&#8217;est certainement pas le cas des questions qui touchent de près ou de loin à l&#8217;utilisation des technologies et d&#8217;internet.</p>
<p>Si ce sondage avait été mené auprès de la population en général (incluant les personnes qui  n’utilisent pas internet – et qui ne sont donc PAS des internautes),  nous aurions nécessairement obtenu des données différentes (un nombre moyen d&#8217;heures passées sur internet plus faible). J&#8217;irais même jusqu&#8217;à parier que la télé est toujours au premier rang&#8230;</p>
<p>Je ne dis pas qu&#8217;il n&#8217;y a pas de changement important dans les habitudes d&#8217;utilisation des médias. C&#8217;est un fait maintes fois documenté. Toutefois, les articles publiés dans les médias sont trompeurs puisque le sondage d&#8217;Ipsos documente les habitudes des internautes et non pas celles des Canadiens.   <span> </span></p>
<p><span> </span></p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/internet-supplante-la-television-chez-les-canadiens-pas-sur/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Vrai ou faux? Mythes et réalités des sondages en ligne (#1)</title>
		<link>http://blogue.som.ca/vrai-ou-faux-mythes-et-realites-des-sondages-en-ligne-1/</link>
		<comments>http://blogue.som.ca/vrai-ou-faux-mythes-et-realites-des-sondages-en-ligne-1/#comments</comments>
		<pubDate>Wed, 08 Jul 2009 15:09:50 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[panel Web]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage web]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=245</guid>
		<description><![CDATA[Le 12 juin dernier, lors du colloque annuel de l&#8217;Association des statisticiennes et des statisticiens du Québec (ASSQ), M. Michel Saulnier, président du chapitre québécois de l&#8217;ARIM, faisait une présentation sur les «mythes et réalités» des sondages en ligne. Au cours de l&#8217;été, je reprendrai individuellement ces huit énoncés, que j&#8217;expliquerai à ma façon.
Vrai ou faux?
Les panels Internet [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2009/07/reseau2.gif"><img class="alignleft size-thumbnail wp-image-261" title="reseau2" src="http://blogue.som.ca/wp-content/uploads/2009/07/reseau2.gif" alt="" width="101" height="90" /></a>Le 12 juin dernier, lors du colloque annuel de <a href="http://www.association-assq.qc.ca/" target="_blank">l&#8217;Association des statisticiennes et des statisticiens du Québec</a> (ASSQ), M. Michel Saulnier, président du chapitre québécois de l&#8217;<a href="http://www.mria-arim.ca/ABOUTFRE/default.asp" target="_blank">ARIM</a>, faisait une présentation sur les «mythes et réalités» des sondages en ligne. Au cours de l&#8217;été, je reprendrai individuellement ces huit énoncés, que j&#8217;expliquerai à ma façon.</p>
<blockquote><p><strong>Vrai ou faux?</strong><br />
<strong>Les panels Internet livrent des résultats représentatifs de la population. </strong></p></blockquote>
<p><span id="more-245"></span></p>
<p><strong>Réponse :</strong> FAUX!</p>
<p><strong>Explication</strong><br />
Un panel Internet, aussi appelé <a href="http://www.som.ca/fr/solutions-web/panel-web">panel Web</a> ou panel d&#8217;internautes, est un groupe d&#8217;individus participant régulièrement à des sondages en ligne.</p>
<p>Même s&#8217;ils sont composés de dizaines de milliers d&#8217;individus et même si les individus qui le composent sont sélectionnés de façon aléatoire, les panels Internet NE PEUVENT PAS prétendre être représentatifs de l&#8217;ensemble de la population. Pourquoi? Parce que <strong>les panels laissent nécessairement de côté toutes les personnes qui n&#8217;utilisent pas Internet</strong>. Et il y en a encore beaucoup!</p>
<p>Certains argueront qu&#8217;en pondérant les données selon les caractéristiques de la population, on obtient des résultats représentatifs de cette dernière. Je vous confirme encore une fois que c&#8217;est faux, du moins en partie. <strong>Si certains résultats sont comparables aux données de la population en général, d&#8217;autres sont significativement différents.</strong> Les internautes possèdent des caractéristiques communes qui les différencient des autres. Par ailleurs, la pondération des données dans les sondages Web peut, au lieu de corriger le tir, amplifier les problèmes, selon M. Saulnier.</p>
<p>Que peut-on dire alors? <strong>Que les résultats sont représentatifs des internautes, tout simplement </strong>(pourvu que les répondants aient été sélectionnés de façon aléatoire).</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/vrai-ou-faux-mythes-et-realites-des-sondages-en-ligne-1/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Déterminer la taille d&#8217;un échantillon&#8230; sans y perdre son latin!</title>
		<link>http://blogue.som.ca/determiner-la-taille-dun-echantillon-sans-y-perdre-son-latin/</link>
		<comments>http://blogue.som.ca/determiner-la-taille-dun-echantillon-sans-y-perdre-son-latin/#comments</comments>
		<pubDate>Thu, 02 Jul 2009 15:01:16 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[méthode]]></category>
		<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=247</guid>
		<description><![CDATA[Combien d&#8217;individus devrais-je interroger, lors d&#8217;un sondage, pour obtenir des résultats représentatifs de la population à l&#8217;étude? En d&#8217;autres mots, quelle devrait être la taille de l&#8217;échantillon?
Ici, je vous épargne les équations mathématiques&#8230; Je voulais simplement vous faire découvrir quelques outils sur le Web qui peuvent calculer pour vous la taille requise d&#8217;un échantillon.
Attention cependant! Ces [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://blogue.som.ca/wp-content/uploads/2009/07/calculatrice2.jpg"><img class="alignright size-thumbnail wp-image-257" title="calculatrice2" src="http://blogue.som.ca/wp-content/uploads/2009/07/calculatrice2.jpg" alt="" width="137" height="185" /></a>Combien d&#8217;individus devrais-je interroger, lors d&#8217;un sondage, pour obtenir des résultats représentatifs de la population à l&#8217;étude? En d&#8217;autres mots, quelle devrait être la taille de l&#8217;échantillon?</p>
<p>Ici, je vous épargne les équations mathématiques&#8230; Je voulais simplement vous faire découvrir quelques <strong>outils sur le Web</strong> qui peuvent <strong>calculer pour vous la taille requise d&#8217;un échantillon</strong>.</p>
<p>Attention cependant! Ces outils sont utiles pour des <strong>échantillons aléatoires simples</strong> où chacun des individus de la population a une chance égale d&#8217;être sélectionné. Dès que le plan d&#8217;échantillonnage se complexifie, ne serait-ce qu&#8217;un peu, ils ne sont plus appropriés : c&#8217;est d&#8217;un expert dont vous aurez alors besoin!</p>
<p><span id="more-247"></span></p>
<p><strong>Comment ça fonctionne?<br />
</strong>La taille de l&#8217;échantillon est essentiellement conditionnée par la précision des résultats que l&#8217;on désire obtenir :</p>
<ul>
<li>Vous devez d&#8217;abord entrer la <a href="http://blogue.som.ca/a-propos-de-la-marge-derreur-dun-sondage/">marge d&#8217;erreur</a> que vous êtes prêts à accepter (ex. : 4 %).</li>
<li>Il faut ensuite préciser le <a href="http://fr.wikipedia.org/wiki/Niveau_de_confiance" target="_blank">niveau de confiance</a> dont vous avez besoin (on travaille presque toujours avec un niveau de confiance de 95 %, le fameux «19 fois sur 20»).</li>
<li>On vous demande également d&#8217;indiquer la taille de la population à l&#8217;étude. Toutefois, lorsque la taille de la population est de plusieurs milliers d&#8217;individus, celle-ci n&#8217;a que peu d&#8217;influence sur la taille de l&#8217;échantillon.</li>
</ul>
<p><strong>Quelques outils<br />
</strong>Il existe plusieurs outils pour calculer la taille d&#8217;un échantillon aléatoire simple (la plupart en langue anglaise, malheureusement). Ils sont plutôt équivalents, quoique certains vous proposent des options supplémentaires intéressantes (ex. : scénarios alternatifs selon différents niveaux de confiance, calcul de la marge d&#8217;erreur à partir de la taille de l&#8217;échantillon). Je vous donne des liens vers quelques-uns, mais une simple recherche sur Internet avec les mots clés «sample size calculator» vous en donnera certainement d&#8217;autres.</p>
<ul>
<li><a href="http://fr.gmi-mr.com/resources/sample-size-calculator.php" target="_blank">GMI</a> (en français)</li>
<li><a href="http://www.ezsurvey.com/samplesize.html" target="_blank">Raosoft</a> (en anglais)</li>
<li><a href="http://www.custominsight.com/articles/random-sample-calculator.asp" target="_blank">CustomInsight</a> (en anglais)</li>
<li><a href="http://www.macorr.com/ss_calculator.htm" target="_blank">MaCorr</a> (en anglais)</li>
</ul>
<p><strong>Billets sur des sujets apparentés :</strong></p>
<ul>
<li><a href="http://blogue.som.ca/representativite-dun-echantillon-clin-doeil-historique/">Représentativité d&#8217;un échantillon : clin d&#8217;oeil historique</a></li>
<li><a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/">L&#8217;ABC des méthodes d&#8217;échantillonnage (partie 1)</a></li>
<li><a href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-2/">L&#8217;ABC des méthodes d&#8217;échantillonnage (partie 2)</a></li>
<li><a href="http://blogue.som.ca/methodes-dechantillonnage-probabilistes-et-sondages-web/">Méthodes d&#8217;échantillonnage probabilistes et sondages Web</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/determiner-la-taille-dun-echantillon-sans-y-perdre-son-latin/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Méthodes d’échantillonnage probabilistes et sondages Web</title>
		<link>http://blogue.som.ca/methodes-dechantillonnage-probabilistes-et-sondages-web/</link>
		<comments>http://blogue.som.ca/methodes-dechantillonnage-probabilistes-et-sondages-web/#comments</comments>
		<pubDate>Tue, 29 Jul 2008 13:47:27 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage web]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=40</guid>
		<description><![CDATA[L’échantillonnage probabiliste pose de réels défis lorsqu’il est question de sondages Web, notamment :

La non-disponibilité des bases de sondage, c’est-à-dire de listes valables à partir desquelles sélectionner un échantillon aléatoire.
S’il est aujourd’hui facile de générer des numéros de téléphone aléatoires pour effectuer des sondages téléphoniques représentatifs, il en va autrement des adresses de courriels. Un [...]]]></description>
			<content:encoded><![CDATA[<p>L’<a title="L'ABC des méthodes d'échantillonnage (partie 1)" href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/" target="_self">échantillonnage probabiliste</a> pose de réels <strong>défis</strong> lorsqu’il est question de <a title="Les sondages en ligne de SOM" href="http://www.som.ca/fr/solutions-web/enquetes-sondages-web" target="_blank">sondages Web</a>, notamment :</p>
<ul>
<li>La non-disponibilité des bases de sondage, c’est-à-dire de listes valables à partir desquelles sélectionner un échantillon aléatoire.</li>
<li>S’il est aujourd’hui facile de générer des numéros de téléphone aléatoires pour effectuer des sondages téléphoniques représentatifs, il en va autrement des adresses de courriels. Un tel système ne peut que générer un nombre important d’adresses inexistantes ou inutilisées.</li>
<li>La difficulté d’établir avec certitude l’identité du répondant. Il est fort possible, par exemple, qu’une adresse de courriel soit utilisée par plusieurs personnes. Aussi, la personne qui répond au sondage n’est pas nécessairement celle qui a été invitée à le faire.</li>
<li>L’impossibilité de joindre les personnes qui n’ont pas accès à Internet.</li>
</ul>
<p>Bien qu’imparfaites, il existe des méthodes d’échantillonnage probabilistes pour le Web, par exemple :</p>
<ul><span id="more-40"></span></p>
<li>La sélection aléatoire d’un échantillon à partir d’une liste de courriels (à condition évidemment que la liste soit à jour et qu’elle couvre l’ensemble de la population à l’étude).</li>
<li>L’interception aléatoire de visiteurs sur un site Web (à condition d’avoir des données fiables sur le nombre total de visiteurs).</li>
<li>La constitution de <a title="Panel Or de SOM" href="http://www.som.ca/fr/solutions-web/panel-web" target="_blank">panels Web</a> – mon collègue <a title="Éric Lacroix, directeur de projet, SOM" href="http://www.som.ca/fr/entreprise/equipe/#eric-lacroix" target="_blank">Éric Lacroix</a> a déjà abordé la question de la représentativité des panels ici.</li>
</ul>
<p>Peu importe la méthode utilisée, il est important d’en connaître les limites et, surtout, d’en tenir compte dans la généralisation et la publication des résultats.</p>
<p>Source : <a title="Sampling and inference in web surveys, part I - Frames and sampling" href="http://www.websm.org/uploadi/editor/1133720576GUIDE_1_Sampling_and_inference_in_web_surveys_part1.pdf" target="_blank">Sampling and Inference in Web surveys, Part I &#8211; Frames and Sampling</a> (document PDF).</p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/methodes-dechantillonnage-probabilistes-et-sondages-web/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>L’ABC des méthodes d’échantillonnage (partie 2)</title>
		<link>http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-2/</link>
		<comments>http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-2/#comments</comments>
		<pubDate>Thu, 24 Jul 2008 19:11:52 +0000</pubDate>
		<dc:creator>Julie Fortin</dc:creator>
				<category><![CDATA[représentativité]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[échantillonnage]]></category>

		<guid isPermaLink="false">http://blogue.som.ca/?p=39</guid>
		<description><![CDATA[La semaine dernière, je mentionnais qu’il existe deux grandes familles d’échantillons : les échantillons probabilistes et les échantillons non probabilistes.
Les échantillons non probabilistes 
Les méthodes d’échantillonnage non probabilistes, contrairement aux précédentes, ne s’appuient pas sur le hasard pour sélectionner les individus d’une population. Les échantillons ainsi constitués ne sont donc pas probabilistes et, de ce [...]]]></description>
			<content:encoded><![CDATA[<p>La semaine dernière, je mentionnais qu’il existe deux grandes familles d’échantillons : les <a title="L'ABC des méthodes d'échantillonnage (partie 1)" href="http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-1/" target="_self"><strong>échantillons probabilistes</strong></a> et les <strong>échantillons non probabilistes</strong>.</p>
<p><strong>Les échantillons non probabilistes </strong><br />
Les méthodes d’échantillonnage non probabilistes, contrairement aux précédentes, ne s’appuient pas sur le hasard pour sélectionner les individus d’une population. Les échantillons ainsi constitués ne sont donc pas probabilistes et, de ce fait, on ne peut leur appliquer la notion de marge d&#8217;erreur statistique. Autrement dit, on ne connaît pas le niveau de précision des estimations ainsi produites. Ils présentent toutefois d’autres avantages, comme ceux d’être peu coûteux, rapides et faciles à utiliser.</p>
<p>Il faut bien voir également que ce ne sont pas tous les projets qui exigent des échantillons probabilistes; cela dépend des objectifs poursuivis. Ces méthodes sont fréquemment utilisées en recherche qualitative. Voici quelques exemples d’échantillons non probabilistes :</p>
<p><span id="more-39"></span></p>
<ul>
<li><a href="http://blogue.som.ca/wp-content/uploads/2008/07/istock_000005277789xsmallechantillonnage.jpg"><img class="alignright size-thumbnail wp-image-43" title="istock_000005277789xsmallechantillonnage" src="http://blogue.som.ca/wp-content/uploads/2008/07/istock_000005277789xsmallechantillonnage.jpg" alt="Échantillonnage" width="150" height="100" /></a><strong>L’échantillon accidentel.</strong> C’est la méthode des « premiers qui passent ». L’image type est le « vox pop »: on interroge les premières personnes qui se présentent à un endroit donné.</li>
<li><strong>L’éc</strong><strong>hantillon typique.</strong> Appelé aussi échantillonnage par choix raisonné, cette méthode consiste à sélectionner les cas « types », par exemple, les cas extrêmes ou les phénomènes rares.</li>
<li><strong>L’échantillon de volontaires.</strong> Seules les personnes qui se portent volontaires font partie de ce type d’échantillon. Certains panels Web sont constitués exclusivement de cette façon.</li>
<li><strong>L’échantillon « boule de neige ».</strong> Dans ce type d’échantillon, appelé aussi échantillon par réseau, les individus sont sélectionnés en fonction de leurs liens avec un « noyau » d’individus. On se base par exemple sur les réseaux sociaux, les amitiés, les relations d’affaires, etc. pour recruter de nouveaux sujets.</li>
<li><strong>L’échantillon par quotas.</strong> Il s’agit de sélectionner des individus de façon « accidentelle », mais en tentant d’atteindre des quotas préalablement définis en fonction des caractéristiques de la population à l’étude (ex. : 50 % d’hommes et 50 % de femmes, X % de jeunes, etc.).</li>
</ul>
<p><em>Sources</em><br />
<a href="http://www.puq.uquebec.ca/fr/repertoire_fiche.asp?titre=titres&amp;noproduit=d1243" target="_blank">Recherche sociale : de la problématique à la collecte des données</a><br />
<a href="http://www.cheneliere.ca/main+fr+01_500+FONDEMENTS_ET_ETAPES_DU_PROCESSUS_DE_RECHERCHE_.html?DivisionID=0&amp;ItemID=1476" target="_blank"> Fondements et étapes du processus de la recherche</a></p>
]]></content:encoded>
			<wfw:commentRss>http://blogue.som.ca/l-abc-des-methodes-d-echantillonnage-partie-2/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
