Guide du Recensement de la population, 2021
Chapitre 12 – Échantillonnage et pondération pour le questionnaire détaillé

Dans le cadre du Programme du Recensement de 2021, les ménages canadiens sont dénombrés à l'aide de deux principaux types de questionnaires : le questionnaire abrégé et le questionnaire détaillé. Le questionnaire détaillé comprend toutes les questions du questionnaire abrégé ainsi qu'un ensemble de questions supplémentaires visant à dresser un portrait complet de la population et des ménages canadiens. Le questionnaire détaillé est distribué à un échantillon de la population.

Les estimations produites à partir de réponses aux questions communes aux deux types de questionnaires sont obtenues d'un recensement de la population. En effet, tous les ménages contribuent alors à un chiffre donné. C'est le cas, par exemple, du chiffre de population pour un groupe d'âge donné.

Les estimations produites à partir de réponses à une ou plusieurs questions du questionnaire détaillé sont obtenues d’une enquête-échantillon. Dans ce cas, les ménages répondants de l’échantillon du questionnaire détaillé et les ménages non répondants imputés des unités de collecte dans les communautés des Premières Nations, les établissements métis, les régions inuites et d’autres régions éloignées contribuent à l'estimation (p. ex. l’estimation du taux de chômage ou celle de la population selon le plus haut niveau de scolarité atteint).

Sélection de l’échantillon du questionnaire détaillé du recensement

L’échantillon du questionnaire détaillé est sélectionné à partir de petites aires géographiques couvrant tout le Canada, appelées unités de collecte (UC). Celles-ci constituent les strates du plan d’échantillonnage. Il y a quatre types d’UC : listage/livraison, envoi par la poste, envoi par la poste et livraison à la porte, et communautés des Premières Nations, établissements métis, régions inuites et autres régions éloignées. Dans chaque UC (ou strate), la liste des logements est établie et un échantillon systématique de logements privés est tiré. Les logements collectifs sont exclus de ce tirage. Les ménages des logements privés sélectionnés dans l’échantillon reçoivent le questionnaire détaillé du recensement. Les autres ménages, c’est-à-dire ceux des logements privés qui ne font pas partie de l’échantillon du questionnaire détaillé ainsi que ceux des logements collectifs qui sont exclus de l’échantillonnage, reçoivent le questionnaire abrégé.

L’échantillon du questionnaire détaillé est réparti uniformément du point de vue géographique. Cette répartition permet d’obtenir des estimations fiables pour toutes les régions du pays et d’accorder la même importance relative à toutes les unités géographiques d’une taille de population donnée. Comme c’était le cas en 2016, un logement sur quatre a été sélectionné pour former l’échantillon du questionnaire détaillé du Recensement de 2021. Il y a une exception pour la fraction de sondage : tous les logements des UC de type communautés des Premières Nations, établissements métis, régions inuites et autres régions éloignées ont été sélectionnés dans l’échantillon du questionnaire détaillé.

Pondération de l’échantillon du questionnaire détaillé du recensement

Les estimations produites à partir des réponses finales au questionnaire détaillé sont pondérées afin qu’elles représentent la population canadienne vivant dans les logements privés. La pondération est le processus regroupant le calcul du poids de sondage et divers ajustements menant au poids final. Parmi ces ajustements, on compte un ajustement pour la couverture des logements occupés fondé sur les résultats de l’Enquête sur la classification des logements (ECL), un ajustement pour corriger la non-réponse totale des ménages échantillonnés et un calage des poids des ménages répondants à des totaux dérivés du recensement.

En premier lieu, un poids de sondage est attribué à chaque ménage de l’échantillon. Le poids de sondage d’un ménage est égal à l’inverse de sa probabilité de sélection dans l'échantillon. Dans les UC de type communautés des Premières Nations, établissements métis, régions inuites et autres régions éloignées, ce poids est donc égal à 1, et dans les autres types d’UC, il est égal à 4.

Les deux premiers ajustements aux poids sont liés au concept de non-réponse totale. Les ménages ayant répondu à au moins une question propre au questionnaire détaillé sont les « ménages répondants » au questionnaire détaillé. Les ménages sélectionnés n’ayant répondu qu’à des questions communes aux deux types de questionnaires et les ménages n’ayant répondu à aucune question sont définis comme étant les « ménages non répondants » au questionnaire détaillé.

Dans les UC de type communautés des Premières Nations, établissements métis, régions inuites et autres régions éloignées, la non-réponse totale au questionnaire détaillé est compensée par l’imputation. Les données des ménages qui n’ont répondu à aucune question sont imputées à l’aide de celles d’un ménage répondant. Tous les ménages privés de ces UC conservent leur poids de sondage de 1 aux fins d’estimation.

Dans certaines UC de type communautés des Premières Nations, établissements métis, régions inuites et autres régions éloignées, il est parfois impossible de mener à terme l’opération de listage des logements. Ces UC sont considérées comme étant partiellement dénombrées. L’étendue de la non-réponse est alors inconnue, et la population ne peut être adéquatement représentée statistiquement. Les comptes obtenus à partir du questionnaire abrégé de même que les estimations du questionnaire détaillé excluent les populations vivant dans les réserves et les établissements partiellement dénombrés.

Dans les autres types d’UC, la non-réponse totale au questionnaire détaillé est plutôt traitée par la repondération. Pour ce faire, plusieurs ajustements aux poids de sondage sont effectués. Seuls les ménages répondants au questionnaire détaillé se voient attribuer un poids non nul à la fin des étapes de pondération, ce qui signifie qu’ils sont les seuls à contribuer aux estimations du questionnaire détaillé.

Avant de procéder à l’imputation pour la non-réponse totale au recensement, le sous-dénombrement des logements occupés au moment du recensement est estimé à l’aide de l'ECL et est corrigé en modifiant l’occupation/inoccupation de certains logements. Une des sources d’erreurs de couverture du recensement est effectivement la mauvaise classification de certains logements le jour du recensement. Cette erreur peut se produire quand un logement occupé est classé comme étant inoccupé ou quand un logement inoccupé est classé comme étant occupé. L’objectif de l’ECL est de produire des estimations du nombre de ces erreurs de classification. Pour ce faire, un échantillon de logements privés pour lesquels aucun questionnaire du recensement n’a été retourné sont contactés, de l’information est recueillie sur leur occupation/inoccupation le jour du recensement et, si le logement était occupé, sur le nombre de résidents habituels. Les résultats de l’ECL guident l’imputation pour la non-réponse totale et pour le sous-dénombrement du recensement.

Les poids de sondage sont ensuite ajustés en trois étapes. Toutes ces étapes d’ajustements des poids sont effectuées par calage. Le calage consiste à modifier les poids de façon aussi minime que possible afin de faire concorder les estimations pondérées à des totaux connus. Ces étapes sont effectuées de manière indépendante dans chaque super aire de diffusion agrégéeNote 1 (SADA). Il s’agit d’un regroupement d’aires de diffusion agrégées (ADA) contiguës conçues pour atteindre une population entre 50 000 et 150 000 personnes.

Un premier calage est effectué afin que la couverture de l’échantillon du questionnaire détaillé soit la même que celle des logements privés du recensement. Un second calage est effectué, celui-ci tenant compte d’un modèle de régression logistique pour la propension à répondre, afin que les poids des logements échantillonnés non répondants soient redistribués aux logements répondants. Pour ces deux étapes, l’ensemble des contraintes de calage potentielles est identique. La sélection des contraintes est faite de manière à ce que le modèle de la deuxième étape explique bien la non-réponse. Cela vise à réduire un biais potentiel dû à la non-réponse. Enfin, un troisième calage est effectué. Celui-ci considère un ensemble de contraintes potentielles beaucoup plus détaillé. Cette étape a pour objectif d’améliorer la cohérence entre les estimations issues de l’échantillon et les totaux connus du recensement en plus de diminuer la variabilité des estimations du questionnaire détaillé.

Des différences peuvent exister entre les estimations pondérées du questionnaire détaillé et les chiffres du recensement pour les caractéristiques communes. C’est le cas, en particulier, si l’on s’intéresse à une région géographique dont les limites ne correspondent pas aux ADA et aux SADA. D’ailleurs, plus la région géographique est petite, plus grande est la probabilité que les estimations du questionnaire détaillé soient différentes des chiffres du recensement. Dans le cas où des différences existent, l’utilisateur devrait considérer les chiffres du Recensement de 2021 comme étant de meilleure qualité et les privilégier, car ils ne sont affectés ni par la variance d’échantillonnage du questionnaire détaillé ni par l’erreur de non-réponse légèrement plus élevée pour le questionnaire détaillé. Les estimations pour les caractéristiques communes du questionnaire détaillé devraient être utilisées comme information contextuelle au moment de l’analyse des données propres à ce questionnaire.

Comme c’était le cas en 2016, la variabilité des estimations du questionnaire détaillé est estimée à l’aide d’une méthode par répliques. Tous les ajustements décrits dans le présent chapitre sont également appliqués aux poids de répliques utilisés pour l’estimation de la variance.

De plus amples renseignements sur le processus de pondération et d’estimation seront disponibles dans le Rapport technique sur l’échantillonnage et la pondération, Recensement de la population, 2021, produit no 98-306-X.


Date de modification :