La pondération démystifiée
En regardant les Jeux olympiques de Tokyo, vous vous êtes sûrement réjoui de la performance exceptionnelle du Canadien Damian Warner à l’épreuve mythique du décathlon. Eh bien moi aussi! Mais au-delà des performances, je n’ai pas pu m’empêcher de me questionner sur la méthode de compilation des résultats. Déformation professionnelle oblige, je me suis demandé s’ils étaient pondérés!
Après vérification, je peux vous confirmer que non. En effet, chaque épreuve peut procurer un maximum de 1 000 points et le résultat final est obtenu en faisant la somme des résultats individuels à chacune des épreuves, pour un maximum théorique de 10 000 points. Cela revient à dire, dans le jargon des sondages, que chaque épreuve a le même poids, incluant bien entendu le lancer du poids!
C’est sûrement une bonne chose que les statisticiens ne s’en mêlent pas, eux qui viendraient potentiellement gâcher des années d’entraînement…
La pondération et son utilité
Dans la vie de tous les jours, la pondération est néanmoins très importante. En effet, elle permet de vous assurer que les résultats de votre étude correspondent le mieux possible aux caractéristiques de la population étudiée.
Petit exemple chiffré
Si seulement le quart des mille répondants à votre sondage auprès des 15 ans ou plus sont de sexe masculin (n : 250) parce qu’ils étaient occupés à regarder le décathlon, il faudra augmenter leur importance afin qu’ils représentent en réalité environ la moitié de l’échantillon. Pour ce faire, il s’agit d’accorder à chaque répondant masculin un poids de 14 400, ce qui, par multiplication, vous amènera au total d’environ 3,6 millions auquel vous souhaitez extrapoler (soit la population masculine du Québec de 15 ans ou plus en date de 2019).
Pour les répondantes, qui représentent l’autre moitié des Québécois de 15 ans ou plus, il vous faudra accorder un poids trois fois moins élevé (ou 4 800) que celui accordé aux hommes pour arriver aux 3,6 millions souhaités. En bref, si la participation au sondage est trois fois plus élevée pour les femmes que pour les hommes (alors qu’il y a autant de femmes que d’hommes dans la population), le poids accordé à ces dernières dans la pondération sera trois fois moindre que celui accordé aux hommes.
Une discipline olympique
Plus il y a de variables qui peuvent influencer les réponses à votre étude (ex. : âge, scolarité, région, etc.), plus la pondération se complexifie. On procède alors par de multiples itérations, jusqu’à ce que l’on obtienne des distributions acceptables pour l’ensemble des variables incluses dans la pondération. Souvent, on se rend jusqu’à une dizaine d’itérations, à la manière d’un décathlon. Ça peut vraiment être essoufflant!
Boucler la boucle
En juillet 2010, SOM publiait un blogue sur la pondération. C’est la moindre des choses de faire un petit rappel chaque décennie. Je vous invite donc à le consulter ici au besoin. La pondération est une discipline à la portée de tous, il s’agit seulement de s’entraîner un peu…