Rapport technique sur la couverture, Recensement de la population, 2016
7. Contre-vérification des dossiers

L’objectif premier de la Contre-vérification des dossiers est d’estimer le nombre de personnes faisant partie de la population cible du Recensement de 2016 qui n’ont pas été dénombrées par celui-ci aux échelons national, provincial et territorial. Un échantillon dont le nombre de personnes avoisine les 70 000 a été tiré de six bases de sondage indépendantes du Recensement de 2016. Les données des personnes choisies (PC) ont été appariées aux données fiscales et autres sources administratives afin d’obtenir des renseignements récents au sujet de leur résidence habituelle, de leurs adresses de contact, des membres de leur ménage et des groupes de personnes qui leur sont liés.

Un ensemble d’appariements automatisés complexes et de recherches manuelles ont été effectués pour trouver la PC dans la base de données des réponses (BDR) du Recensement de 2016. Les études sur la couverture du recensement, dont la Contre-vérification des dossiers, ont été réalisées d’après une version de la BDR rendue disponible vers le début du mois d’octobre 2016, (c’est-à-dire avant la fin du traitement du recensement). On nomme cette version la BDR-ECR, qui est antérieure à la BDR finale de 2016. Quelques différences mineures existent entre la BDR-ECR et les versions ultérieures des bases de données du recensement. La BDR-ECR, une base de données de personnes, comprend tous les enregistrements des personnes dénombrées, à l’exception de trois groupes d’enregistrements. Le premier concerne les enregistrements du recensement imputés dans le cadre des IME. Le deuxième se rapporte à tous les enregistrements du recensement qui ont été ajoutés tardivement, soit après le début du traitement de la CVD, mais cette situation ne s’est que peu présentée en 2016 contrairement aux deux cycles précédents. Le troisième groupe concerne les enregistrements du recensement communément appelés « dénombrements incomplets ». La section 7.4.6 fournit de plus amples détails sur les dénombrements incomplets.

Lorsque la recherche est infructueuse, une collecte multimodale est entreprise en vue de déterminer si la PC fait partie de la population cible, et pour obtenir des renseignements supplémentaires (notamment des adresses) qui aideraient à trouver la PC dans la BDR-ECR. À la fin de la recherche, chaque PC est classée hors champ (décédée, émigrée ou temporairement à l’extérieur du Canada), dénombrée ou omise. Un petit nombre de cas de non-réponse, composé en grande partie de personnes qui n’ont pas pu être dépistées au moyen de la collecte, doivent être traités et servent à rajuster les poids des répondants à l’aide d’un modèle de rajustement pour la non-réponse.

7.1 Échantillonnage

La base de sondage visant à couvrir la population cible de la CVD, qui inclut toutes les personnes qui auraient dû être dénombrées au Recensement de 2016, est formée à partir de six bases indépendantes du recensement. Les cinq premières sont utilisées pour la sélection d’un échantillon servant à l’estimation du sous-dénombrement dans les dix provinces tandis que les estimations pour les trois territoires sont calculées à l’aide des échantillons tirés de la dernière base de sondage seulement.

À l’échelon provincial, on commence par les personnes qui faisaient partie de la population cible du Recensement de 2011. Celles-ci comprennent toutes les personnes dénombrées au Recensement de 2011 et les personnes omises par le Recensement de 2011, représentées par la portion de l’échantillon de personnes choisies (PC) de la CVD de 2011 qui ont été classées comme omises. Afin de tenir compte des personnes qui se sont ajoutées à la population cible depuis le recensement précédent, on ajoute les naissances et les immigrants intercensitaires (c.-à-d. entre les recensements de 2011 et de 2016) et les résidents non permanents en date du jour du Recensement de 2016. Les sources de données de ces bases de sondage sont les suivantes :

Pour chacun des territoires, les fichiers de l’assurance-santé couvrant les personnes éligibles aux soins de santé le jour du recensement forment l’unique base de sondage. Bien que ces bases aient une excellente couverture, cette dernière n’est pas complète et un ajustement doit être effectué aux poids d’échantillonnage afin de pallier cette sous-couverture. Chaque base de sondage d’un territoire donné est indépendante des autres bases des territoires et ne sert qu’à faire l’estimation du sous-dénombrement de ce territoire donné. Les bases de sondage des territoires ne servent pas non plus à l’estimation du sous-dénombrement dans les provinces.

Aucune des cinq premières bases de sondage des provinces ne couvre les personnes émigrées ou à l’extérieur du Canada au cours du Recensement de 2011 qui n’ont pas rempli de questionnaire du recensement en 2011 et qui sont revenues durant la période intercensitaire (« Canadiens de retour dans une province »). Selon le questionnaire détaillé du Recensement de 2016, on estime cette population à 241 361 personnes. De même, on estime à 12 106 le nombre de personnes de retour des territoires dans les provinces. À ce nombre s’ajoutent 18 528 personnes provenant des réserves ou établissements indiens partiellement dénombrés en 2011 et dénombrés en 2016. De plus, les personnes nées après le Recensement de 2011 à l’extérieur du pays ou dans les territoires qui ont la citoyenneté canadienne et qui sont revenues dans une des dix provinces du Canada au jour du Recensement de 2016 ne sont pas couvertes par les cinq premières bases de sondage de la CVD. Selon le questionnaire détaillé du Recensement de 2016, on estime cette population à 17 243 personnes. Les estimations de l’erreur de couverture ne couvrent donc pas ces populations estimées à un total de 289 238 personnes.

Un problème qui se pose avec l’utilisation des bases de sondage multiples est la possibilité qu’une même personne soit incluse dans plus d’une base. Par exemple, une personne incluse dans la base des immigrants pouvait être détentrice d’un permis de travail et se trouver au Canada en mai 2011, et ainsi être dénombrable au Recensement de 2011. Elle serait donc à la fois dans la base des immigrants et dans celle du recensement si elle a été dénombrée, ou dans celle des personnes omises si elle a été omise. Ainsi, il est important de déterminer tous les cas de chevauchement de base, sinon les estimations produites risquent d’être trop élevées puisque les personnes peuvent être comptées deux fois dans les bases de sondage. Autant que possible, ce chevauchement est décelé lors de la construction des bases de sondage, mais une partie est également cernée plus tard à partir des renseignements fournis par les répondants.

Le plan d’échantillonnage varie d’une base à l’autre selon la nature de la liste utilisée. Pour la base du Recensement de 2011, on utilise un plan stratifié à un seul degré. La population est stratifiée selon la province de résidence, le sexe, l’âge et l’état matrimonial. Les personnes dénombrées dans les réserves indiennes au Recensement de 2011 forment des strates séparées. Cependant, avant de faire la stratification de la base, un couplage déterministe de celle-ci avec les données fiscales a été effectué. Environ 96 % des personnes ont été couplées. Les personnes déterminées comme décédées d’après les données fiscales ont été placées dans une strate à tirage complet de décès. Ensuite, la province de résidence la plus récente selon les données fiscales a été dérivée et utilisée pour stratifier la base selon la province (la province de sélection). Les personnes non liées aux données fiscales ou les personnes liées mais dont l’adresse était située à l’extérieur des 10 provinces ont été stratifiées selon leur province de recensement en 2011. Ensuite, pour chaque province de sélection, les personnes ont été réparties dans une des 13 strates suivantes selon le sexe, l’âge (au jour du Recensement de 2011) et l’état matrimonial :

La base des personnes omises est une base échantillonnale, car il n’existe pas de liste de toutes les personnes omises au Recensement de 2011. L’échantillon de cette base est constitué de tous les cas classés comme « omis » dans le cadre de la CVD de 2011. Quoique l’échantillon ne soit pas stratifié comme tel, une stratification implicite est inévitable puisque les cas omis en 2011 proviennent de bases et de strates différentes.

Pour construire la base de sondage des naissances, on a obtenu une copie des enregistrements de naissances intercensitaires des statistiques de l’état civil par l’intermédiaire du Système national d’acheminement, qui permet d’avoir accès à ces données plus rapidement. La base contient toutes les naissances entre le 10 mai 2011 et le 9 mai 2016 inclusivement. La base a ensuite été stratifiée selon la province de résidence de la mère.

On a construit la base de sondage des immigrants à partir des dossiers d’IRCC. La base des immigrants contient toutes les personnes immigrées au pays entre le 10 mai 2011 et le 9 mai 2016 inclusivement. On a soustrait de la base des immigrants de 2016 ceux qui étaient résidents non permanents au jour du Recensement de 2011, ceux-ci étant déjà couverts par la base du Recensement de 2011 ou la base des omis de 2011. Cette base a été stratifiée selon la province de destination des immigrants. Ensuite, les immigrants de toutes les provinces à l’exception des quatre provinces de l’Atlantique ont été séparés en deux strates selon leur date d’immigration. Les immigrants arrivés entre le 10 mai 2011 et le 9 mai 2015 ont formé la première strate, tandis que ceux arrivés entre le 10 mai 2015 et le 9 mai 2016 ont formé la seconde strate, ce qui s’explique par le fait que les immigrants arrivés depuis moins longtemps ont habituellement un taux d’omission plus élevé au recensement.

La base des résidents non permanents (détenteurs de permis et demandeurs du statut de réfugié) a été construite à partir des dossiers d’IRCC. Tout comme dans le cas des immigrants intercensitaires, ceux qui étaient résidents non permanents au jour du Recensement de 2011 ont été enlevés de la base des résidents non permanents pour 2016. La base a été stratifiée selon la province de destination des résidents non permanents. Étant donné qu’un nombre important de résidents non permanents n’avaient pas indiqué de province de destination (ayant un permis ouvert), ceux-ci ont été placés dans une strate nationale.

Dans les provinces, il a été décidé que la taille totale de l’échantillon de 2016 serait semblable à celle de la CVD de 2011. La répartition de l’échantillon a été effectuée en deux étapes.

Premièrement, l’échantillon national pour les provinces a été réparti entre celles-ci de façon à obtenir des erreurs-types du taux de sous-dénombrement semblables entre les provinces de taille semblable. On visait des erreurs-types plus petites pour les plus grandes provinces que pour les petites provinces car cela permettait d’obtenir une petite erreur-type à l’échelon national. Les erreurs-types visées pour le taux de sous-dénombrement variaient entre 0,31 % et 0,50 %.

Deuxièmement, les échantillons provinciaux ont été répartis entre les strates des provinces. A priori, la taille d’échantillon de la strate de la base des personnes omises en 2011 était déjà fixée, car toutes les personnes considérées comme des personnes omises dans le cadre de la CVD de 2011 ont été choisies. La taille d’échantillon restante dans chaque province a par la suite été répartie à l’aide de la méthode de répartition optimale, basée sur les taux historiques de sous-dénombrement, les taux historiques de non-réponse et la taille de la strate. Les fractions de sondage ne sont pas les mêmes dans chaque strate. Dans le but de rendre le plan de sondage plus efficace, on a eu recours à des fractions de sondage plus élevées pour les sous-groupes où l’on prévoyait un sous-dénombrement important ou un taux de dépistage plus faible. Par exemple, tout comme dans le cas de la CVD de 2011, on a attribué une probabilité de sélection plus grande aux hommes célibataires âgés de 18 à 29 ans en 2016, car on a observé, lors des CVD précédentes, que le sous-dénombrement est toujours plus important dans cette strate. En raison de l’intérêt accru pour les études sur les populations autochtones, la taille des échantillons dans les strates provinciales pour les personnes dénombrées au Recensement de 2011 dans les réserves indiennes est plus élevée que ce que le résultat de la répartition optimale suggère. Cependant, un ajustement à la baisse des tailles d’échantillons par rapport à la répartition optimale a été effectué pour les strates des résidents non permanents, afin de ne pas trop augmenter la taille de l’échantillon de la CVD qui nécessitait une collecte sur le terrain. Comparativement à celui de la CVD de 2011, l’échantillon des résidents non permanents a tout de même augmenté d’environ 1 000 personnes dans la CVD de 2016.

Il convient de souligner que la répartition résultante n’est qu’approximativement optimale étant donné que des hypothèses ont été avancées à propos de la taille de certaines populations, notamment le nombre prévu de naissances et d’immigrants intercensitaires au moment de faire la répartition. La taille réelle de l’échantillon provincial des naissances, des immigrants et des résidents non permanents n’est pas connue tant que tous les échantillons ne sont pas tirés. L’échantillon total final réparti était de 67 842 personnes choisies parmi les bases dans les provinces. Le tableau 7.1.1 présente la répartition finale de l’échantillon selon la strate pour toutes les provinces.

Tableau 7.1.1
Répartition de l’échantillon, bases de sondage et strates pour toutes les provinces
Sommaire du tableau
Le tableau montre les résultats de Répartition de l’échantillon. Les données sont présentées selon Bases de sondage (titres de rangée) et Strates pour chaque province et Nombre de personnes(figurant comme en-tête de colonne).
Bases de sondage Strates pour chaque province Nombre de personnes
Total Note ...: n'ayant pas lieu de figurer 67 872
Recensement de 2011 Femmes, 0 à 12 ans 3 135
Femmes, 13 à 24 ans 4 907
Femmes, 25 à 34 ans, mariéesTableau 7.1.1 Note 1 1 207
Femmes, 25 à 34 ans, non mariées 1 915
Femmes, 35 ans ou plus, mariéesTableau 7.1.1 Note 1 7 060
Femmes, 35 ans ou plus, non mariées 5 536
Hommes, 0 à 12 ans 3 549
Hommes, 13 à 24 ans 5 410
Hommes, 25 à 34 ans, mariésTableau 7.1.1 Note 1 1 350
Hommes, 25 à 34 ans, non mariés 2 723
Hommes, 35 ans ou plus, mariésTableau 7.1.1 Note 1 8 960
Hommes, 35 ans ou plus, non mariés 5 844
Vivant dans les réserves 2 067
Omis de 2011 Sans stratification additionnelle 4 745
Naissances Sans stratification additionnelle 4 026
Immigrants Entre le 10 mai 2011 et le 9 mai 2015Tableau 7.1.1 Note 2 2 198
Entre le 10 mai 2015 et le 9 mai 2016 760
Résidents non permanents Avec permis dans une province 2 345
Avec permis ouvert 135

La méthodologie d’échantillonnage pour les territoires était semblable à celle de 2011, à l’exception de quelques modifications. Ainsi, les bases de sondage des trois territoires ont été formées à partir de leur fichier d’assurance-santé respectif. Par la suite, les personnes comprises dans la base de sondage de chacun des territoires ont été appariées, à l’aide des systèmes développés aux fins du traitement de l’information (voir la section 7.2.1), à la base de données des réponses du Recensement de 2016 (BDR-ECR). Cette base excluait les dénombrements incomplets. Une vérification manuelle a également été effectuée pour confirmer que les cas appariés représentaient bien les mêmes personnes. Les personnes appariées dans leur territoire (dans le même territoire que dans la base de sondage) ont été classées comme étant dénombrées et un poids de 1 leur a été associé. Par la suite, les personnes appariées à l’extérieur de leur territoire ont formé une strate séparée. Puis, les personnes non appariées ont été séparées en six strates en fonction de l’âge et du sexe (voir le tableau 7.1.2).

En ce qui concerne la répartition de l’échantillon entre les territoires, la première étape consistait à déterminer l’échantillon total à allouer à chaque territoire afin d’atteindre une précision semblable et adéquate du sous-dénombrement. La précision obtenue à la CVD de 2011 différait grandement entre les territoires et était de qualité inférieure, notamment au Nunavut. En 2016, l’erreur-type visée pour le taux de sous-dénombrement s’est fixée à 0,6 % au Yukon et aux T.N.-O., et à 0,65 % au Nunavut. Par conséquent, en 2016, les tailles d’échantillons dans les territoires ont été augmentées au besoin pour obtenir la précision voulue. Ensuite, l’échantillon de chaque territoire a été réparti parmi les six strates (selon l’âge et le sexe) proportionnellement à leur taille puisqu’habituellement, le taux d’omissions ne varie pas énormément entre les strates. Un petit échantillon supplémentaire (variant entre 55 et 80 par territoire) a également été alloué à la strate des personnes appariées à l’extérieur de leur territoire. Cet échantillon a pour seul but de vérifier que ces personnes ne sont pas également dénombrées dans leur territoire, car le cas échéant, la primauté serait donnée à ce dénombrement pour la CVD. Cet échantillon supplémentaire n’a pas été envoyé à la collecte de la CVD étant donné que ces personnes ont déjà été trouvées dans la BDR-ECR.

Le tableau 7.1.2 présente la répartition selon la strate pour tous les territoires.

Tableau 7.1.2
Répartition de l’échantillon, strates par territoire
Sommaire du tableau
Le tableau montre les résultats de Répartition de l’échantillon. Les données sont présentées selon Strates (titres de rangée) et Yukon, T.-N.-O., Nunavut et Total(figurant comme en-tête de colonne).
Strates Yukon T.-N.-O. Nunavut Total
Appariées dans le territoire 30 040 30 160 25 220 85 420
Appariées hors du territoire 1 352 2 093 1 635 5 080
Échantillon de contrôle 55 80 65 200
Non appariées 560 805 1 030 2 395
Femmes, 0 à 17 ans 38 93 199 330
Femmes, 18 à 29 ans 61 85 107 253
Femmes, 30 ans ou plus 146 196 188 530
Hommes, 0 à 17 ans 39 98 203 340
Hommes, 18 à 29 ans 68 94 118 280
Hommes, 30 ans ou plus 208 239 215 662

Le tableau 7.1.3 présente la répartition de l’échantillon pour le Canada, les provinces et les territoires.

Tableau 7.1.3
Taille de l’échantillon pour le Canada, provinces et territoires
Sommaire du tableau
Le tableau montre les résultats de Taille de l’échantillon pour le Canada. Les données sont présentées selon Provinces et territoires (titres de rangée) et Nombre de
personnes(figurant comme en-tête de colonne).
Provinces et territoires Nombre de personnes
Canada 155 887
Toutes les provinces 67 872
Terre-Neuve-et-Labrador 4 558
Île-du-Prince-Édouard 4 365
Nouvelle-Écosse 6 084
Nouveau-Brunswick 3 858
Québec 7 766
Ontario 11 771
Manitoba 5 780
Saskatchewan 6 730
Alberta 7 022
Colombie-Britannique 9 803
RNP-CATableau 7.1.3 Note 1 135
Tous les territoires 88 015
Appariés dans le territoire 85 420
Non appariés dans le territoire 2 595
Yukon 30 655
Appariés dans le territoire 30 040
Non appariés dans le territoire 615
Territoires du Nord-Ouest 31 045
Appariés dans le territoire 30 160
Non appariés dans le territoire 885
Nunavut 26 315
Appariés dans le territoire 25 220
Non appariés dans le territoire 1 095

Une méthode d’échantillonnage systématique à l’intérieur des strates a été utilisée pour sélectionner les échantillons. Voici la liste des variables de tri utilisées pour obtenir un échantillon efficace (stratification implicite), classées selon la base de sondage :

Aucun échantillonnage n’était requis pour la base des omis de 2011, car tous les omis de la CVD de 2011 ont été sélectionnés dans l’échantillon de la CVD de 2016.

Après la sélection des échantillons provinciaux et territoriaux, ceux-ci doivent être préparés en vérifiant la qualité des renseignements pour les différentes variables d’intérêt, soit les variables géographiques et démographiques. On procède, par exemple, à la vérification de la qualité des noms et à la validation des dates de naissance. Les adresses sont normalisées afin de faciliter les activités de traitement ultérieures. Afin de mettre à jour les renseignements géographiques, en particulier pour les échantillons du recensement et des omis dont l’information date de 2011, ceux-ci sont appariés aux dossiers de l’Agence du revenu du Canada (ARC), dont ceux de l’impôt sur le revenu des particuliers de 2010 à 2015 et des prestations canadienne pour enfants de 2011 à 2016. À l’aide des fichiers de l’ARC et des données des statistiques de l’état civil, on vérifie également si des personnes sélectionnées sont décédées. Cette étape de préparation est très importante, car elle aide à déterminer les personnes qui sont dénombrées dans les bases du recensement et à communiquer avec les personnes non trouvées en vue de les interviewer.

7.2 Traitement et classification

7.2.1 Traitement

L’objectif du traitement est de fournir des renseignements sur la classification des PC en vue de l’estimation et de l’ajustement pour la non-réponse. Ainsi, le traitement vise à :

Les résultats du traitement ont été enregistrés dans une classification attribuée à chaque PC aux fins d’estimation et de totalisation (voir la section 7.4 et la section 9).

La majeure partie du travail de traitement a fait intervenir une recherche informatisée automatisée dans la version des études de couverture du recensement de la Base de données des réponses au Recensement de 2016 (BDR-ECR), afin de déterminer si la PC était dénombrée ou non.

Divers renseignements ont été utilisés pour cette recherche, notamment les noms et prénoms ainsi que les dates de naissance. Les numéros de téléphone et les adresses associées à la PC ou à des membres de son ménage ont également été utilisés. Des questionnaires où la personne aurait pu être dénombrée ont été relevés à partir de sources variées, incluant :

La première étape après la préparation de l’échantillon a été d’effectuer une recherche de chaque PC dans la BDR-ECR en traitant toutes les PC dont l’adresse figurait dans la base de sondage et les données fiscales. Deux résultats ont été obtenus. Lorsque les PC ont été trouvées, elles ont généralement été classées comme « dénombrées » et aucun autre traitement n’a été requis, à l’exception des PC identifiées ensuite au moyen des données des statistiques de l’état civil comme décédées avant le recensement. Les cas des PC non trouvées ont été envoyés en collecte. Pendant la collecte, la recherche dans la BDR-ECR s’est poursuivie. Lorsque les données de l’ITAO étaient disponibles, les chercheurs ont pu déterminer si chaque PC faisait ou non partie de la population cible du recensement. Dans l’affirmative, les données d’ITAO permettaient parfois d’approfondir les recherches.

La recherche des PC a été menée à la fois automatiquement et manuellement par du personnel de codage dirigé par des spécialistes du domaine. Un manuel de procédures très détaillées indiquant les étapes spécifiques de codage des résultats de recherche a été fourni au personnel de codage pour assurer l’uniformité du codage. Les recherches automatisées ont eu d’abord lieu. Un questionnaire du recensement existait pour les adresses obtenues grâce à une correspondance avec la BDR-ECR. On a calculé une mesure de similarité entre le questionnaire du recensement et les données de la Contre-vérification des dossiers. Lorsque cette mesure dépassait un seuil préétabli, on concluait automatiquement que la PC avait été dénombrée à cette adresse. Dans ces cas, ni cette adresse ni les autres adresses de la PC n’avaient à être traitées par le personnel de codage. Des programmes informatiques ont également déterminé lorsqu’une adresse était un double d’une autre. Ces adresses en double n’avaient pas non plus à être traitées.

Pour d’autres cas, on a eu recours à un couplage manuel à l’aide de l’Application de vérification interactive de Doclink (AVID), application créée spécifiquement pour cette opération. Le personnel de codage a utilisé en outre plusieurs outils dans le cadre de ce traitement, tels que des fichiers de référence géographique, des annuaires téléphoniques électroniques et le fichier des attributs des rues. Des questionnaires de recensement ou des unités de collecte de recensement suggérés correspondaient souvent à l’adresse utilisée à la première étape de la recherche. Le personnel pouvait également effectuer une recherche dans la BDR-ECR à l’aide de paramètres souples aux étapes ultérieures du traitement (recherche par nom, date de naissance, etc.) Les résultats de la recherche manuelle étaient alors modifiés manuellement par des corrections intégrées à l’AVID afin de limiter les erreurs. Un fichier comprenant les résultats de recherche a ensuite été produit. Les données de ce fichier ont été utilisées pour classer les PC.

7.2.2 Classification

Le traitement fournit les renseignements nécessaires en vue de déterminer si les PC sont :

Certaines PC figurent dans plus d’une catégorie. Nous en expliquerons les raisons plus en détail dans cette section.

7.2.2.1 Classification « population cible » ou « hors champ »

La « population cible du recensement » inclut le groupe de personnes dont il est question à la section 2.2. Une PC est considérée « hors champ » si elle ne fait pas partie de la population cible du recensement. Chaque PC classée comme « hors champ » se voit attribuer l’un des états suivants pour cette classification : décédée, émigrée ou représentée par une autre base de sondage. Pour qu’une personne soit classée comme étant décédée, elle doit apparaître dans les fichiers de mortalité des statistiques de l’état civil ou avoir été déclarée décédée sur les fichiers d’impôts ou lors d’une interview de collecte. Les personnes émigrées de façon permanente ou temporaire sont également déterminées au moyen d’une interview de collecte en fonction de certains critères et d’après les réponses qu’elles ont fournies relativement à leur lieu de résidence au jour du recensement, à la période de temps qu’elles ont passé à l’extérieur du Canada, à leur intention de revenir vivre au pays et à la raison pour laquelle elles étaient à l’extérieur du pays le jour du recensement. D’autres PC sont également classées comme « émigrées listées », qu’elles soient ou non des répondants lors de la collecte. Il s’agit des résidents non permanents (de la base des personnes omises et de la base du Recensement de 2011) qui n’avaient plus de permis en 2016 ni le statut d’immigrant depuis 2011.

Les PC classées comme « représentées par une autre base de sondage » comprennent notamment les cas sélectionnés dans une province, mais classés dans l’un des trois territoires. De même, les cas sélectionnés dans un territoire, mais classés dans une province ou un autre territoire sont eux aussi classés comme « représentés par une autre base de sondage ».

Les PC classées dans la population cible du recensement sont soit « dénombrées », soit « omises », soit « non classifiées » (voir la section 7.2.2.2). Une PC est considérée « dénombrée » si elle figure dans la BDR-ECR. La classification « omises » est attribuée aux PC dans la population cible du recensement qui ne sont pas dénombrées ou « non classifiées ».

7.2.2.2 Classification pour la non-réponse et le rajustement de non-réponse

L’attribution des classifications « listées » et « non classifiées » dépend de l’utilité des adresses fournies et des renseignements tirés de l’ITAO. Dans plusieurs cas, la collecte fournit des renseignements ainsi qu’une ou plusieurs adresses qui sont introuvables à partir d’autres sources. Dans d’autres cas, il est possible de trouver toutes les adresses et tous les renseignements obtenus au moyen de la collecte à partir d’autres sources.

Une PC est « listée » si elle a été classée sans le recours aux données provenant de l’ITAO; même si la collecte des données a été effectuée, les adresses et les renseignements obtenus au moyen de l’interview n’ont pas été requis.

Une personne est considérée comme « non classifiée » si on peut déterminer qu’elle fait partie de la population cible, mais pas si elle a été omise ou non. Cette situation survient lorsque le lieu de résidence le jour du recensement, tel que défini à la section 2.4, est connu, mais non identifié dans la BDR-ECR. Les personnes dont le lieu de résidence le jour du recensement n’est pas assez précis (p. ex. si seul le nom d’une grande ville est fourni comme lieu de résidence le jour du recensement) et les personnes sans domicile fixe ont été incluses dans cette catégorie.

Les PC pour lesquelles il est impossible de déterminer une ou plusieurs des caractéristiques de la liste présentée plus haut sont considérées comme des non-répondants. Il existe trois types de non-répondants :

7.2.2.3 Répartition de l’échantillon selon la classification

Le tableau 7.2 montre la répartition de l’échantillon selon la classification et la base de sondage. La classification est déterminée à partir de combinaisons spécifiques des caractéristiques de la liste présentée plus haut. Au départ, un échantillon total de 67 872 PC a été sélectionné dans les provinces. De ce nombre, 58 808 PC ont été classées comme « dénombrées », 4 821 comme « omises » et 2 268 comme des non-répondants, dont 357 ont été classées comme « non classifiés ». Les 1 975 autres PC ont été classées comme « hors champ », dont 857 « décès », 934 « émigrants » (permanents ou temporaires) et 184 pour d’autres raisons. Un rajustement pour la non-réponse a été effectué lors du processus d’estimation (voir section 7.4). Il est important de noter qu’aux fins de la classification — et, par conséquent, de l’estimation —, la définition d’un non-répondant diffère de la définition habituelle d’un non-répondant, selon laquelle la collecte de données est tentée, mais non terminée. Il en est ainsi parce que pour procéder à la classification, on utilise des données provenant de plusieurs sources, dont la collecte. Afin d’éviter toute confusion, la section 7.3 sur la collecte fait référence à la « collecte terminée » plutôt qu’à la « réponse ».

Les personnes dans les bases de sondage des territoires sont divisées entre la strate appariée et les strates non appariées. La strate appariée correspond au traitement initial des enregistrements des bases de sondage territoriales. On procède au traitement de ces cas de la même façon que l’on procède avec l’échantillon, soit dans l’application AVID en utilisant des procédures de traitement propres aux territoires. Des 121 892 personnes figurant dans la base de sondage des territoires, 85 420 PC ont été classées comme « dénombrées ». Un échantillon total de 2 595 PC a été sélectionné parmi les personnes non appariées. De cet échantillon, 655 PC ont été classées comme « dénombrées », tandis que 1 128 ont été classées comme « omises » et 441 comme des non-répondants; parmi ces derniers, 105 ont été classés comme « non classifiés ». Les 371 autres PC ont été classées comme « hors champ », dont 25 « décès », 15 « émigrants » (permanents ou temporaires) et 331 comme ayant été classées dans une province ou un autre territoire.

7.2.2.4 Implications de la classification

Les PC « dépistées » sont les PC pour lesquelles il est possible de déterminer si elles sont incluses dans la population cible du recensement ou non. À des fins d’estimation et de totalisation, les PC dépistées qui sont également classifiées sont les répondants. Puisque les noms, y compris ceux des membres du ménage, et les adresses sont disponibles dans la BDR-ECR, et que les outils pour consulter la base de données sont suffisamment puissants, il est possible de vérifier si une PC est dénombrée à une adresse, même si l’adresse fournie est vague.

L’utilité de savoir si une PC est dénombrée va de soi. Les PC qui font partie de la population cible du recensement et qui ne sont pas dénombrées, et donc classées comme « omises », sont la base de l’estimation du sous-dénombrement. On voulait également classer les PC en se fondant sur les caractéristiques mentionnées précédemment afin de choisir les répondants les plus appropriés pour représenter les non-répondants.

Enfin, sauf pour les PC non classifiées, on a aussi déterminé l’adresse au jour du recensement (lieu de résidence habituel) de chaque PC dans la population cible du recensement. Cette adresse représente celle où, selon les directives du recensement, la PC devrait avoir été dénombrée. Si la PC a été dénombrée, l’adresse du dénombrement sera considérée comme l’adresse au jour du recensement, en dépit d’autres renseignements fournis qui pourraient laisser croire que les directives du recensement n’ont pas été bien comprises.

Pour obtenir de plus amples renseignements sur le traitement et la classification, consultez Parenteau (2017).

Tableau 7.2
Classification des personnes choisies, bases de sondage pour le Canada
Sommaire du tableau
Le tableau montre les résultats de Classification des personnes choisies. Les données sont présentées selon Classification (titres de rangée) et Strates provinciales, Strates territoriales, Total, Recensement
de 2011, Omis, Naissances, Immigrants, Résidents non
permanents, Strate appariée et Strates
non appariées, calculées selon nombre et % unités de mesure (figurant comme en-tête de colonne).
Classification Strates provinciales Strates territoriales Total
Recensement
de 2011
Omis Naissances Immigrants Résidents non
permanents
Strate appariée Strates
non appariées
nombre % nombre % nombre % nombre % nombre % nombre % nombre % nombre %
Total 53 663 100,0 4 745 100,0 4 026 100,0 2 958 100,0 2 480 100,0 85 420 100,0 2 595 100,0 155 887 100,0
Dénombrées 48 462 90,3 3 278 69,1 3 575 88,8 2 287 77,3 1 206 48,6 85 420 100,0 655 25,2 144 883 92,9
Listées 48 244 89,9 3 257 68,6 3 573 88,7 2 279 77,0 1 183 47,7 85 420 100,0 628 24,2 144 584 92,7
Non listées 218 0,4 21 0,4 2 0,0 8 0,3 23 0,9 0 0,0 27 1,0 299 0,2
Omises 2 906 5,4 710 15,0 290 7,2 339 11,5 576 23,2 0 0,0 1 128 43,5 5 949 3,8
Listées 416 0,8 81 1,7 42 1,0 31 1,0 39 1,6 0 0,0 333 12,8 942 0,6
Non listées 2 490 4,6 629 13,3 248 6,2 308 10,4 537 21,7 0 0,0 795 30,6 5 007 3,2
Hors cible 1 158 2,2 471 9,9 45 1,1 175 5,9 126 5,1 0 0,0 371 14,3 2 346 1,5
Listées 781 1,5 328 6,9 21 0,5 81 2,7 13 0,5 0 0,0 264 10,2 1 488 1,0
Non listées 377 0,7 143 3,0 24 0,6 94 3,2 113 4,6 0 0,0 107 4,1 858 0,6
Non-réponse 1 137 2,1 286 6,0 116 2,9 157 5,3 572 23,1 0 0,0 441 17,0 2 709 1,7
Dépistées non classifiées 196 0,4 55 1,2 24 0,6 11 0,4 71 2,9 0 0,0 105 4,0 462 0,3
Identifiées non dépistées 933 1,7 231 4,9 92 2,3 146 4,9 499 20,1 0 0,0 336 12,9 2 237 1,4
Non identifiées 8 0,0 0 0,0 0 0,0 0 0,0 2 0,1 0 0,0 0 0,0 10 0,0

7.3  Collecte

7.3.1 Environnement

Le personnel du bureau central d’Ottawa a travaillé étroitement avec le personnel de cinq bureaux régionaux (BR) de Statistique Canada pour recueillir les données à l’étape d’enquête de la CVD. Il s’agissait des bureaux régionaux de Halifax, Sherbrooke, Sturgeon Falls, Winnipeg et Edmonton. Les suggestions et recommandations formulées par les bureaux régionaux après la CVD de 2011 ont été prises en compte dans la conception et le déroulement de l’enquête de 2016. Le bureau central a fourni une application ITAO répondant aux besoins de l’enquête et conviviale pour les intervieweurs et les répondants.

Des échantillons ont été attribués aux bureaux régionaux en tentant de déterminer au mieux la résidence de la PC au cours de la période de collecte. Une fois un cas attribué à un bureau régional, il n’était jamais transféré à un autre BR, même s’il était déterminé que la PC avait déménagé hors de la région de collecte du BR. Le tableau 7.3.1 présente les régions de collecte du BR et le nombre de cas de l’enquête.

Tableau 7.3.1
Couverture géographique relevant des bureaux régionaux
Sommaire du tableau
Le tableau montre les résultats de Couverture géographique relevant des bureaux régionaux. Les données sont présentées selon Bureaux régionaux (titres de rangée) et Couverture et Nombre de
cas(figurant comme en-tête de colonne).
Bureaux régionaux Couverture Nombre de cas
Total Canada 15 584
Halifax Terre-Neuve-et-Labrador, Île-du-Prince-Édouard, Nouvelle-Écosse 2 707
Sherbrooke Nouveau-Brunswick, Québec, Manitoba 3 148
Sturgeon Falls Ontario, Saskatchewan 3 715
Winnipeg Alberta, Yukon, Territoires du Nord-Ouest, Nunavut 3 691
Edmonton Colombie-Britannique 2 323

La taille de l’échantillon de la CVD était de 155 887 (la section 7.1 décrit le plan de sondage). On a tenté de trouver ces cas dans la BDR-ECR au cours du traitement de précollecte. Les cas trouvés ont été classés comme « dénombrés » et n’ont pas eu à être envoyés en collecte. Cependant, un sous-échantillon de ces cas a été envoyé en collecte aux fins de calcul de l’ajustement pour la non-réponse (détaillé à la section 7.4). Les cas non trouvés dans la BDR-ECR ont été envoyés en collecte. Le nombre total de cas envoyés à la collecte (la taille de l’échantillon de la collecte) a été de 15 584 : 6 533 cas de sous-échantillons et 9 951 cas réguliers (non trouvés dans la BDR-ECR).

Le questionnaire de l’enquête de la CVD était disponible en trois versions : répondant (la PC répond pour elle-même), procuration (une personne interposée ou répondant substitut répond pour la PC) et décédé (pour les PC décédées avant le jour du recensement). Le contenu du questionnaire visait surtout à déterminer si la PC faisait partie du champ de l’enquête pour le recensement et à recueillir les adresses où la PC avait vécu (et donc où elle aurait pu être dénombrée) le jour du recensement ou à cette époque. Le nom et les données démographiques ont également été recueillis pour tous les membres du ménage en date du jour du recensement. Par définition, la collecte avait lieu par répondant substitut pour les PC âgées de moins de 18 ans ou les personnes présumées décédées. On a aussi eu recours à des répondants substituts lorsque la PC n’était pas disponible pendant la période de collecte ou lorsqu’elle était difficile à joindre. Globalement, 28 % des cas remplis l’ont été par un répondant substitut approprié.

Dans le cas des PC décédées, il était important d’établir si cette personne était décédée avant, après ou le jour du recensement, puisque différents questionnaires papier et cheminements de l’application ITAO étaient alors utilisés, selon la date du décès. Dans certains cas, il a été déterminé avant la collecte que la PC était décédée avant le jour du recensement (p. ex. en faisant correspondre des dossiers fiscaux et des statistiques de l’état civil). Ces cas n’ont alors pas été envoyés en collecte. Cependant, en cas de doute, le cas était envoyé avec un indicateur signalant que la PC était « présumée décédée ».

Il était impératif que la PC pertinente (ou un répondant substitut pour cette personne) soit interrogée. L’objectif de l’enquête de la CVD est d’utiliser les données recueillies sur les PC pour tenter de retrouver ces dernières dans la BDR-ECR et de les classer comme dénombrées, manquantes au recensement ou hors du champ de l’enquête. Si des données sont recueillies sur la mauvaise personne, la classification correspondante obtenue est incorrecte. Les intervieweurs étaient chargés de vérifier que la personne interrogée était la PC pertinente au début de l’interview et le système d’ITAO a été conçu à cette fin. Si une interview était effectuée avec une autre personne que la PC (p. ex. une personne au nom et à la date de naissance similaires), le cas était retourné au bureau régional pour être effectué auprès de la bonne personne.

Bien que la CVD de 2016 soit une enquête plurimodale, le principal mode de collecte de données était par interview téléphonique assistée par ordinateur (ITAO). L’application d’ITAO a été conçue à partir d’un grand nombre des normes fixées pour l’ensemble des questionnaires d’ITAO utilisés à Statistique Canada. L’application consistait en divers modules intégrés reliés à une application de dépistage. Les cas ont été attribués aux intervieweurs en fonction de la langue et des cas exigeant un dépistage ou non.

Le mode de collecte secondaire était l’autodénombrement. Des questionnaires papier dans les deux langues officielles étaient mis à disposition des PC contactées par téléphone et demandant un questionnaire papier. Le bureau central a envoyé aux PC non contactées par téléphone par les bureaux régionaux et ayant une adresse postale valide un questionnaire papier contenant les diverses versions du questionnaire, une lettre de présentation expliquant l’enquête et les instructions pour choisir le questionnaire pertinent. Les instructions indiquant comment remplir les questionnaires papier figuraient sur la première page des questionnaires.

Le troisième mode de collecte était l’enregistrement sur questionnaire papier des réponses des PC par des intervieweurs sur le terrain. Cela s’est déroulé au milieu de la collecte dans des villes de l’ensemble du Canada comptant de nombreux cas incomplets et où des intervieweurs étaient disponibles dans les bureaux régionaux.

La saisie des données des questionnaires papier a ensuite été effectuée au bureau central à l’aide de l’application d’ITAO. Une importante coordination a été nécessaire pour opérationnaliser un système séquentiel plurimodal de collecte comme la CVD.

7.3.2 Opérations

Avant la collecte (du 3 au 6 janvier), des lettres de présentation ont été envoyées par la poste à tous les cas ayant une adresse postale valide. Ces lettres expliquaient la CVD et indiquaient à la PC (ou le répondant substitut) qu’elle avait été sélectionnée pour l’enquête. Un numéro de téléphone était fourni pour toute question ou lorsque le répondant exprimait souhaiter appeler le bureau régional pour répondre à l’enquête.

Une nouveauté pour la CVD de 2016 a été l’ajout d’une activité « éclair » de précollecte, dans le cadre de laquelle des questionnaires papier ont été envoyés à tous les cas sans numéro de téléphone valides, mais disposant d’une adresse postale valide. Cette initiative a permis de réduire le fardeau de dépistage au début de la collecte. Ces questionnaires ont été envoyés par la poste entre les 9 et 13 janvier. 

L’activité « éclair » au milieu de la collecte d’envoi par la poste des questionnaires papier à tous les cas incomplets ayant une adresse postale valide a eu lieu entre le 13 et le 20 avril. À ce moment de la collecte, tous les cas avaient été contactés (soit par appel téléphonique, tentative d’appel, dépistage ou tentative de dépistage); cette procédure a donc constitué un autre type de tentative de prise de contact avec les PC.

Les interviews sur le terrain ont eu lieu dans les villes comptant de nombreux cas incomplets et où des intervieweurs étaient disponibles dans les bureaux régionaux. Les interviews sur le terrain se sont déroulées entre le 17 mai et le 30 juin. Pour maximiser les réponses, un chevauchement important a été appliqué entre les cas faisant l’objet d’interviews sur le terrain et ceux faisant l’objet de l’activité « éclair » de milieu de collecte. Les interviews sur le terrain ont été envoyées près d’un mois après l’envoi par la poste des questionnaires de l’activité « éclair » et les cas de cette dernière ont été retirés des listes des intervieweurs sur le terrain à mesure qu’ils étaient effectués (soit par ITAO soit par questionnaire papier), afin que les répondants ne soient pas contactés deux fois.

La collecte des données a commencé dans tous les bureaux régionaux le 16 janvier 2017. À l’exception du bureau de Winnipeg, le dernier jour de collecte active a été le 30 juin et le dernier jour de collecte passive (lorsque les bureaux régionaux n’effectuaient plus d’appels pour terminer des cas, mais pouvaient le faire par téléphone si un répondant les appelait) a été le 15 juillet. Pour Winnipeg, la collecte active s’est terminée le 31 juillet et la collecte passive, le 31 août. Le bureau de Winnipeg a bénéficié d’une période de collecte étendue pour améliorer son taux de réponse. Il nécessitait davantage de temps pour dépister les cas et y répondre, puisqu’il devait traiter tout l’échantillon territorial, livré dans le système d’ITAO après le début de la collecte (en mars). Un total de 12 787 cas ont été traités pendant la collecte active; 65 pendant la collecte passive et 7 autres après la fin de la collecte (questionnaires papier reçus après le 31 août).

Les données d’enquête ont été envoyées par voie électronique au bureau central de cinq bureaux régionaux chaque soir après la fin de la période d’interviews. Chaque matin, le bureau central analysait la qualité des données pour vérifier l’exhaustivité et l’exactitude de chaque cas. Les cas où des champs clés étaient restés vides ou renfermaient des données ambiguës, ou encore lorsque les données recueillies correspondaient à une autre personne que la PC, étaient réactivés et retournés aux bureaux régionaux aux fins de suivi. Vingt-six cas ont été ainsi réactivés au cours de la CVD de 2016. Les cas passant avec succès l’analyse de qualité des données étaient compilés en lots aux fins de traitement de la façon décrite à la section 7.2.1.

La gestion de la qualité des activités de collecte comprenait la formation des gestionnaires régionaux de la collecte des données au bureau central, la surveillance de la formation des intervieweurs aux bureaux régionaux ainsi que la clarification de la formation et la discussion des questions particulières sur la qualité des données relatives aux cas terminés relevés par le bureau central. Un outil de communication fondé sur un système de billets a été utilisé pour centraliser et faciliter les communications entre le bureau central et les bureaux régionaux. Il permettait d’effectuer le suivi de toutes les questions ainsi que des problèmes et de veiller à ce qu’ils soient résolus rapidement. Les gestionnaires des bureaux régionaux ont attribué des ressources à l’enquête tout en respectant les besoins des autres enquêtes menées dans leur région. Les efforts soutenus afin d’interviewer les personnes ayant initialement refusé de participer à l’enquête ont permis d’améliorer les taux de réponse.

Le tableau 7.3.2 présente la répartition des cas que le bureau central a envoyés aux bureaux régionaux au fil du temps. La majorité des cas ont été envoyés au début de la collecte, le 16 janvier, et comprenaient des cas des bases de sondage du recensement, omis, relatifs aux naissances, aux immigrants et aux résidents non permanents. Les cas des bases de sondage territoriales ont été envoyés le 7 et le 14 mars. Le total corrigé représente le nombre de cas envoyés en collecte, à l’exception des cas supprimés de la collecte.

Tableau 7.3.2
Charge de travail des bureaux régionaux selon la date de l'envoi
Sommaire du tableau
Le tableau montre les résultats de Charge de travail des bureaux régionaux selon la date de l'envoi. Les données sont présentées selon Date de l'envoi en 2017 (titres de rangée) et Bureaux régionaux (figurant comme en-tête de colonne).
Date de l'envoi en 2017 Bureaux régionaux
Halifax Sherbrooke Sturgeon Falls Winnipeg Edmonton Total
16 janvier 2 799 3 289 3 860 1 831 2 351 14 130
7 février 8 14 20 5 16 63
10 février 0 1 0 0 0 1
7 mars 15 11 24 872 30 952
14 mars 2 4 8 1 157 12 1 183
25 mars 11 10 20 20 12 73
10 juillet 0 0 0 2 0 2
Nombre total de cas envoyés 2 835 3 329 3 932 3 887 2 421 16 404
Cas abandonnés par le bureau centralTableau 7.3.2 Note 1 128 181 217 196 98 820
Nombre total ajusté 2 707 3 148 3 715 3 691 2 323 15 584

Le bureau central a créé des rapports de gestion détaillés chaque jour et chaque semaine pour documenter les progrès de la collecte. Ces rapports présentaient le nombre de cas recueillis et les taux de réponse par code de résultat, bureau régional et strate.

7.3.3 Dépistage

Le dépistage est le processus de recherche des coordonnées d’une PC ou d’un répondant substitut répondant pour une PC. Il s’agit d’une étape essentielle de l’enquête de la CVD. Puisque les besoins en dépistage de la CVD sont supérieurs à ceux de toutes les autres enquêtes de Statistique Canada, ses besoins déterminent l’élaboration de l’application de dépistage utilisée pour toutes les enquêtes sociales.

Dans le cadre de la préparation de l’échantillon, les cas ont été couplés aux données fiscales et à d’autres données administratives pour fournir des coordonnées à jour des PC et des membres de leur ménage. Dans certains cas, les données initiales de l’ITAO étaient désuètes ou incomplètes, si bien qu’un dépistage était nécessaire.

Le bureau central a fourni des indices de dépistage à l’aide de plusieurs fichiers administratifs volumineux (notamment des fichiers de données fiscales, d’Immigration, Réfugiés et Citoyenneté Canada, des statistiques de l’état civil et de données de téléphones cellulaires) contenant des noms et des adresses ou des numéros de téléphone. Ces indices ont été chargés dans l’application de dépistage de l’ITAO avant la collecte et d’autres indices ont été envoyés aux bureaux régionaux à mesure de leur découverte lors du traitement au cours de la période de collecte.

Le dépistage a eu lieu pour les PC et les membres de leur ménage et a été étendu en dehors du Canada (des appels pouvaient être effectués et des messages envoyés à l’international). Les intervieweurs ont utilisé divers outils de dépistage; les plus populaires étant des recherches sur Internet avec Canada411.ca™ et Google ainsi que les renseignements disponibles au public sur des sites de médias sociaux.

Au début de la collecte des données, seuls 3,4 % des cas présentaient des coordonnées insuffisantes et devaient faire l’objet d’un dépistage. Du fait de la qualité et de la quantité des sources de dépistage mis à disposition par le bureau central, des numéros de téléphone fournis par le bureau central ont été utilisés pour 70 % des cas traités. Pour les 30 % restants, de nouveaux numéros de téléphone trouvés grâce aux efforts de dépistage des bureaux régionaux ont été utilisés.

7.3.4 Statistiques de collecte

De nombreuses statistiques ont fait l’objet d’une surveillance tout au long de la période de collecte de données et ont été analysées après la fin de la collecte.

Sur les 12 787 cas traités, 94,8 % l’ont été à l’aide du système d’ITAO : 91,3 % pour lesquels le bureau régional a contacté le répondant par téléphone et 3,5 % pour lesquels le répondant a contacté le bureau régional par téléphone. Les 5,2 % restants ont été traités par questionnaire papier : 2,5 % pour lesquels le répondant a demandé un questionnaire papier, 2,2 % pour lesquels le bureau central a envoyé par la poste le questionnaire et 0,5 % pour lesquels un intervieweur sur le terrain a rempli le questionnaire.

Le tableau 7.3.4.1 présente les taux d’achèvement provinciaux et territoriaux par type d’échantillon (régulier ou sous-échantillon d’ajustement pour la non-réponse). Le tableau montre ainsi que les taux d’achèvement étaient supérieurs pour les cas du sous-échantillon. On s’attendait à cela, puisque ces répondants avaient déjà démontré leur propension à répondre en remplissant leur questionnaire du recensement.

Tableau 7.3.4.1
Nombre de cas terminés, et taux d’achèvement selon le type d’échantillon, Canada, provinces et territoires
Sommaire du tableau
Le tableau montre les résultats de Nombre de cas terminés. Les données sont présentées selon Provinces et territoires (titres de rangée) et Échantillon régulier, Échantillon
pour l’ajustement de la non-réponse et Total(figurant comme en-tête de colonne).
Provinces et territoires Échantillon régulier Échantillon
pour l’ajustement de la non-réponse
Total
Nombre de cas envoyés Nombre de cas terminés Taux d’achèvement (%) Nombre de cas envoyés Nombre de cas terminés Taux d’achèvement (%) Nombre de cas envoyés Nombre de cas terminés Taux d’achèvement (%)
Canada 9 305 6 921 74,4 6 279 5 866 93,4 15 584 12 787 82,1
Terre-Neuve-et-Labrador 433 322 74,4 428 383 89,5 861 705 81,9
Île-du-Prince-Édouard 454 316 69,6 377 339 89,9 831 655 78,8
Nouvelle-Écosse 584 419 71,7 541 508 93,9 1 125 927 82,4
Nouveau-Brunswick 388 315 81,2 441 417 94,6 829 732 88,3
Québec 608 475 78,1 594 579 97,5 1 202 1 054 87,7
Ontario 1 415 1 052 74,3 800 760 95,0 2 215 1 812 81,8
Manitoba 609 468 76,8 555 528 95,1 1 164 996 85,6
Saskatchewan 758 590 77,8 547 525 96,0 1 305 1 115 85,4
Alberta 996 721 72,4 606 541 89,3 1 602 1 262 78,8
Colombie-Britannique 1 541 1 144 74,2 735 699 95,1 2 276 1 843 81,0
Yukon 444 325 73,2 208 191 91,8 652 516 79,1
Territoires du Nord-Ouest 450 349 77,6 211 195 92,4 661 544 82,3
Nunavut 527 387 73,4 218 187 85,8 745 574 77,0
RNP-CATableau 7.3.4.1 Note 1 98 38 38,8 18 14 77,8 116 52 44,8

Le tableau 7.3.4.2 indique les taux d’achèvement par base de sondage et type d’échantillon. Le faible taux de la base de sondage des résidents non permanents (RNP) était largement dû aux permis arrivant à expiration avant la collecte : 41 % possédaient un permis arrivant à expiration avant le début de la collecte et 15 %, pendant la collecte. De plus, du fait de la nature passagère des résidents non permanents en général, il est souvent difficile de trouver ces PC ou un répondant substitut adéquat. Cependant, le taux d’achèvement pour la base de sondage des RNP s’est amélioré, passant de 55,2 % en 2011 à 68,5 % en 2016.

Tableau 7.3.4.2
Nombre de cas terminés et taux d’achèvement, selon la base de sondage et le type d’échantillon, Canada
Sommaire du tableau
Le tableau montre les résultats de Nombre de cas terminés et taux d’achèvement. Les données sont présentées selon Bases de sondage (titres de rangée) et Échantillon régulier, Échantillon
pour l’ajustement de la non-réponse et Total(figurant comme en-tête de colonne).
Bases de sondage Échantillon régulier Échantillon
pour l’ajustement de la non-réponse
Total
Nombre de cas envoyés Nombre de cas terminés Taux d’achèvement (%) Nombre de cas envoyés Nombre de cas terminés Taux d’achèvement (%) Nombre de cas envoyés Nombre de cas terminés Taux d’achèvement (%)
Total 9 305 6 921 74,4 6 279 5 866 93,4 15 584 12 787 82,1
Recensement de 2011 4 558 3 492 76,6 4 430 4 185 94,5 8 988 7 677 85,4
Omis 1 104 877 79,4 415 378 91,1 1 519 1 255 82,6
Naissances 395 304 77,0 194 184 94,8 589 488 82,9
Immigrants 578 431 74,6 137 128 93,4 715 559 78,2
Résidents non permanents 1 249 756 60,5 466 418 89,7 1 715 1 174 68,5
Yukon 444 325 73,2 208 191 91,8 652 516 79,1
Territoires du Nord-Ouest 450 349 77,6 211 195 92,4 661 544 82,3
Nunavut 527 387 73,4 218 187 85,8 745 574 77,0

Le tableau 7.3.4.3 présente les taux d’achèvement par sexe et tranche d’âge. Le taux d’achèvement le plus bas correspondait aux hommes âgés de 30 à 44 ans, suivi des femmes de la même catégorie d’âge. Les taux d’achèvement les plus élevés correspondaient aux femmes âgées de 45 ans et plus, suivies des deux sexes âgés de 0 à 19 ans.

Tableau 7.3.4.3
Nombre de cas terminés et taux d'achèvement, selon le sexe et le groupe d’âge, Canada
Sommaire du tableau
Le tableau montre les résultats de Nombre de cas terminés et taux d'achèvement. Les données sont présentées selon Sexe et groupes d’âge (titres de rangée) et Échantillon régulier, Échantillon
pour l’ajustement de la non-réponse et Total(figurant comme en-tête de colonne).
Sexe et groupes d’âge Échantillon régulier Échantillon
pour l’ajustement de la non-réponse
Total
Nombre de cas envoyés Nombre de cas terminés Taux d’achèvement (%) Nombre de cas envoyés Nombre de cas terminés Taux d’achèvement (%) Nombre de cas envoyés Nombre de cas terminés Taux d’achèvement (%)
Les deux sexes 9 301 6 921 74,4 6 279 5 866 93,4 15 580 12 787 82,1
0 à 19 ans 1 077 839 77,9 804 762 94,8 1 881 1 601 85,1
20 à 29 ans 2 084 1 529 73,4 1 475 1 392 94,4 3 559 2 921 82,1
30 à 44 ans 3 808 2 739 71,9 2 216 2 025 91,4 6 024 4 764 79,1
45 ans et plus 2 332 1 814 77,8 1 784 1 687 94,6 4 116 3 501 85,1
Hommes 5 429 3 997 73,6 3 121 2 918 93,5 8 550 6 915 80,9
0 à 19 ans 590 459 77,8 390 376 96,4 980 835 85,2
20 à 29 ans 1 138 835 73,4 757 709 93,7 1 895 1 544 81,5
30 à 44 ans 2 306 1 649 71,5 1 105 1 017 92,0 3 411 2 666 78,2
45 ans et plus 1 395 1 054 75,6 869 816 93,9 2 264 1 870 82,6
Femmes 3 872 2 924 75,5 3 158 2 948 93,4 7 030 5 872 83,5
0 à 19 ans 487 380 78,0 414 386 93,2 901 766 85,0
20 à 29 ans 946 694 73,4 718 683 95,1 1 664 1 377 82,8
30 à 44 ans 1 502 1 090 72,6 1 111 1 008 90,7 2 613 2 098 80,3
45 ans et plus 937 760 81,1 915 871 95,2 1 852 1 631 88,1

7.4 Estimation

L’estimation de la CVD s’est divisée en deux parties. D’abord, on a effectué la pondération des personnes choisies (PC), puis on a calculé le sous-dénombrement du recensement. La pondération est le processus comprenant la détermination des poids d’échantillonnage initiaux des PC ainsi que tous les ajustements subséquents effectués à ces poids initiaux menant à la création des poids finaux des PC. La pondération comprend plusieurs étapes qui sont décrites aux sections 7.4.1 à 7.4.5. La méthodologie du calcul du sous-dénombrement du recensement est décrite à la section 7.4.7.

7.4.1 Calcul du poids initial

Le poids initial d’une PC de la base des personnes omises de 2011 correspond au poids final qui lui a été attribué lors de la CVD de 2011 au moment où la PC a été classée comme « omise ». Pour les PC des autres bases de sondage, les poids initiaux ont été attribués en fonction de l’inverse des probabilités de sélection dans l’échantillon.

7.4.2 Rajustement pour la non-réponse

Pour réduire les biais statistiques, les poids initiaux des répondants devaient être rajustés pour tenir compte de la non-réponse. Le poids des personnes pour lesquelles une classification n’a pu être établie (les non-répondants) a été redistribué parmi les personnes pour lesquelles une classification a été établie (les répondants). Il existe trois types de non-réponse. Il y a d’abord les personnes non identifiées (seulement 10 PC). Les poids initiaux des personnes non identifiées sont transférés aux personnes identifiées dans chaque strate d’échantillonnage.

Le deuxième type de non-réponse concerne les personnes non dépistées (2 237 PC). L’ajustement consiste à former des groupes homogènes de réponse (GHR) parmi les personnes non listées (les personnes listées étant les personnes classifiées sans l’aide de la collecte de la CVD) et de transférer les poids des personnes non dépistées aux personnes dépistées non listées à l’intérieur des GHR. La méthodologie de formation des GHR de la CVD de 2016 a été modifiée par rapport à celle des CVD précédentes. Pour les CVD de 2001, de 2006 et de 2011, les GHR ont été formés à partir du concept de mobilité (mobile et non mobile) et les facteurs d’ajustement dépendaient de la propension à répondre d’un sous-échantillon de personnes listées non mobiles. À la CVD de 2016, le concept de mobilité et le sous-échantillon n’ont pas été utilisés pour l’ajustement des personnes non dépistées.

La première étape de la création des GHR consiste à rassembler les personnes non listées en groupes principaux d’après leur propension estimée à être dans la population cible. Les groupes ont été formés en fonction de l’analyse de la corrélation entre plusieurs indicateurs fiscaux, notamment ceux pour 2015 et 2016, et la classification finale des personnes dépistées non listées. Jusqu’à six groupes principaux ont été créés selon la base de sondage. Ces groupes principaux sont aussi fortement corrélés à la propension à répondre. La deuxième étape de la création des GHR consiste à grouper les personnes non listées selon leur propension à répondre dans chacun des domaines, où un domaine est défini par le croisement d’une base de sondage avec un groupe principal. Dans chaque domaine, l’analyse de la propension à répondre a été faite au moyen d’un modèle de régression logistique à l’échelle nationale (ainsi que régionale quand les données le permettaient) et de l’analyse de tableaux de fréquences croisées à plusieurs niveaux. Dans le cas des modèles, plusieurs variables auxiliaires disponibles tant pour les personnes dépistées que non dépistées ont été utilisées, à savoir les variables disponibles dans les bases de sondage (p. ex. âge, sexe, relation avec les autres membres du ménage, pays d’origine et type de résident non permanent), les variables disponibles dans les données fiscales pour les personnes liées (p. ex. présence ou non dans certains fichiers, fréquence de changement d’adresse depuis 2011 et type d’adresse), les variables reliées aux renseignements relatifs aux coordonnées (p. ex. nombre et sources de numéros de téléphone, disponibilité d’une adresse et lien de la dernière adresse connue avec le recensement de 2016) ainsi que quelques autres variables. Ainsi, les variables auxiliaires significativement corrélées avec la propension à répondre ont été déterminées et utilisées pour former les GHR. Dans la plupart des domaines, les GHR ont été formés à l’intérieur de la province ou du territoire de sélection. Ainsi, l’ajustement consistait à transférer le poids des personnes non dépistées aux personnes dépistées non listées à l’intérieur de chaque GHR.

Le troisième ajustement pour la non-réponse est celui des personnes non classifiées. Une personne non classifiée est une personne qui avait sa résidence principale dans une province ou un territoire donné le jour du recensement (donc dans la population cible du recensement), mais dont on ne sait pas avec certitude si elle a été omise ou dénombrée. Suivant le même principe que pour les personnes non dépistées, des groupes homogènes de personnes classifiées ont été formés à l’intérieur de chaque base de sondage et province de classification. L’ajustement consistait à transférer le poids des personnes non classifiées aux personnes classifiées non listées à l’intérieur de chaque groupe homogène.

7.4.3 Calage des poids de la base du Recensement de 2011

Dans le cas de la base du Recensement de 2011, un calage aux personnes dénombrées et aux personnes décédées a été effectué afin d’ajuster dans le cas où un échantillon provincial contiendrait trop ou trop peu de personnes dénombrées ou décédées. Ce calage est une nouveauté pour la CVD de 2016. Plusieurs couplages de la base du Recensement de 2011 ont été effectués afin de définir des groupes de calage et des totaux de contrôle. D’abord, un couplage automatisé déterministe appliqué aux fichiers de mortalité des statistiques de l’état civil a permis de déterminer les totaux de contrôle par province pour le groupe de calage des personnes décédées. Ensuite, un couplage automatisé déterministe appliqué à la BDR-ECR de 2016 a permis de déterminer les totaux de contrôle par province pour le groupe de calage des personnes dénombrées. Puis, une mise à jour des renseignements provenant des données fiscales a été effectuée pour les personnes liées à ces données à la suite du couplage automatisé déterministe effectué avant la stratification de cette base. Cela a permis de former trois autres groupes de calage selon le statut des personnes dans les données fiscales et d’obtenir les totaux de contrôle pour ces groupes. De même, la province de résidence la plus récente indiquée dans les données fiscales a servi à définir la province de calage. En tout, 50 groupes de calage ont été formés (cinq dans chaque province) et 50 totaux de contrôle ont été calculés. Le calage a été effectué à l’aide d’une méthode de ratissage aux marges en utilisant les 50 totaux de contrôle décrit ci-dessus pour la première marge, de même que 36 groupes de calage selon l’âge et le sexe comme deuxième marge. Pour ce faire, le système généralisé d’estimation (G-Est) de Statistique Canada a été utilisé.

7.4.4 Rajustement par post-stratification pour les territoires

Après avoir rajusté les poids initiaux, on a observé que l’estimation de personnes dénombrées dans les territoires était traditionnellement inférieure au chiffre comparable du recensement. Cette situation est attribuable à une sous-couverture de la population cible du recensement dans les fichiers d’assurance santé. Pour pallier cette sous-couverture, les poids des PC sélectionnées dans les territoires ont été rajustés afin que l’estimation du nombre de personnes dénombrées égale le chiffre comparable du recensement pour ce territoire. Les ajustements ont été effectués pour six groupes de calage (selon l’âge et le sexe) dans chaque territoire. Lors des CVD précédentes, il y avait un seul groupe de calage par territoire.

7.4.5 Ajustement pour le surdénombrement dans la base du Recensement de 2011

Les poids des PC de la base du Recensement de 2011 qui ont été dénombrées plus d’une fois en 2011 ont pour leur part été rajustés à la baisse pour tenir compte du fait que ces personnes avaient plus d’une chance d’être sélectionnées.

7.4.6 Distribution pondérée selon la classification

Le tableau 7.4.6 présente la distribution pondérée des PC selon la classification et la base de sondage. On rappelle les définitions données à la section 7.2. Seules les PC trouvées dans la base de données de la BDR-ECR ont été classées comme « dénombrées ». Les personnes de la population cible qui ne sont pas dans la BDR-ECR ont été classées comme « omises ». Les PC restantes ont été classées comme « hors champ » (p. ex. décédées ou émigrées).

Tableau 7.4.6
Classification pondérée des personnes choisies, bases de sondage pour le Canada
Sommaire du tableau
Le tableau montre les résultats de Classification pondérée des personnes choisies. Les données sont présentées selon Classification (titres de rangée) et Strates provinciales, Strates territoriales, Total, Nombre de cas envoyés, Taux d’achèvement (%), Nombre de cas terminés et Bases des territoires, calculées selon nombre et % unités de mesure (figurant comme en-tête de colonne).
Classification Strates provinciales Strates territoriales Total
Recensement de 2011 Omis de 2011 Naissances Immigrants Résidents non permanents Bases des territoires
nombre % nombre % nombre % nombre % nombre % nombre % nombre %
Total 31 290 865 100,0 2 807 753 100,0 1 895 007 100,0 1 094 930 100,0 668 685 100,0 128 008 100,0 37 885 248 100,0
Dénombrées 27 950 130 89,3 1 885 586 67,2 1 731 465 91,4 837 599 76,5 330 735 49,5 98 275 76,8 32 833 790 86,7
Listées 27 776 637 88,8 1 872 192 66,7 1 729 645 91,3 832 592 76,0 316 387 47,3 97 772 76,4 32 625 224 86,1
Non listées 173 493 0,6 13 394 0,5 1 820 0,1 5 007 0,5 14 349 2,1 503 0,4 208 566 0,6
Omises 1 721 477 5,5 554 838 19,8 125 932 6,6 159 895 14,6 271 952 40,7 21 565 16,8 2 855 660 7,5
Listées 212 428 0,7 46 563 1,7 20 207 1,1 9 920 0,9 9 856 1,5 4 785 3,7 303 759 0,8
Non listées 1 509 049 4,8 508 275 18,1 105 725 5,6 149 975 13,7 262 096 39,2 16 780 13,1 2 551 901 6,7
Hors champ 1 619 258 5,2 367 329 13,1 37 610 2,0 97 436 8,9 65 998 9,9 8 168 6,4 2 195 798 5,8
Listées 1 252 754 4,0 224 800 8,0 8 963 0,5 34 087 3,1 4 389 0,7 6 126 4,8 1 531 119 4,0
Non listées 366 504 1,2 142 529 5,1 28 647 1,5 63 349 5,8 61 609 9,2 2 042 1,6 664 679 1,8

7.4.7 Calcul du sous-dénombrement du recensement

Définissons maintenant que :

C MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaaceWGnbGbaKaaaaa@3E02@
=
chiffre publié du recensement du nombre de personnes dans la population cible
S ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaaceWGnbGbaKaaaaa@3E02@
=
estimation du sous-dénombrement
Cette cellule est vide
=
estimation du nombre de personnes non incluses en C MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaacaWGdbaaaa@3DE8@ mais qui auraient dû l’être
M ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaaceWGnbGbaKaaaaa@3E02@
=
estimation du nombre de personnes de la population visée par la CVD qui n’ont pas été dénombrées
Cette cellule est vide
=
somme du poids final des personnes considérées comme omises
X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaacaWGybaaaa@3DFD@
=
nombre de personnes incluses en C MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaacaWGdbaaaa@3DE8@ qui ne peuvent pas, dans le cadre de la CVD, être déterminées avec certitude comme des personnes dénombrées.

On estime le sous-dénombrement de la population du recensement par le nombre (pondéré) de personnes omises moins le nombre de personnes exclues de la BDR-ECR :

S ^ = M ^ X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaaceWGtbGbaKaacqGH9aqpceWGnbGb aKaacqGHsislcaWGybaaaa@41BA@

X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaacaWGdbaaaa@3DE8@ a trois composantes : les imputations (provenant des IME de l’ECL), les dénombrements incomplets et les dénombrements tardifs.

L’adresse de la PC le jour du recensement désigne un logement pour lequel un dénombrement a été imputé. C’est le cas, notamment, des logements non répondants pour lesquels les données d’un autre logement ont été utilisées dans le cadre de l’IME.

Certains dénombrements figurant dans la base de données du recensement ont été jugés trop peu complets pour être utilisés aux fins de la CVD afin de déterminer si une PC était une personne dénombrée. Le dénombrement est généralement incomplet en pareil cas à cause de données manquantes ou non valides en ce qui a trait à la date de naissance ou au nom (p. ex. « ? », « M. », « Inconnu » ou « Personne 1 »). Lorsque la PC a fait l’objet d’un tel dénombrement, elle est considérée comme une personne « omise ». C’est ce qu’on appelle un « dénombrement incomplet de la CVD ».

Le Recensement de 2016 a donné lieu à deux nouveaux types de dénombrements incomplets. D’abord, il y a l’imputation des données de personnes vivant dans certains types de logements collectifs (p. ex. motels, hôtels et terrains de camping), car dans ces logements collectifs, seul le nombre de résidents habituels a été recueilli au recensement (pas de noms ni de dates de naissance). Puis, en raison des feux de forêt en Alberta durant le recensement, les renseignements des personnes pour certains logements de la subdivision de recensement de Wood Buffalo ont été dérivés de données administratives. Afin d’évaluer correctement les erreurs de couverture, ces enregistrements ont dû être considérés comme des dénombrements incomplets.

En 2016, les dénombrements tardifs se sont limités aux personnes dénombrées dans un seul logement (collectif au Québec), car ces personnes n’apparaissaient pas dans la BDR du recensement de laquelle les données ont été extraites en vue de la création de la base de données des études sur la couverture du recensement.

À l’échelle nationale, X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaacaWGdbaaaa@3DE8@ représente un peu moins de la moitié de M ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaaceWGnbGbaKaaaaa@3E02@ . La valeur de X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaacaWGybaaaa@3DFD@ a diminué par rapport à 2011 en raison d’une réduction du nombre de personnes imputées dans le cadre de l’IME et de la quasi-élimination des dénombrements tardifs. Le nombre de dénombrements incomplets est semblable à celui de 2011, malgré l’ajout de deux nouveaux types de dénombrements incomplets.

Le tableau 7.4.7 présente les chiffres nationaux des différentes composantes de l’estimation du sous-dénombrement de la population, notamment les chiffres pour les trois composantes du terme X.

Tableau 7.4.7
Composantes de l’estimation du sous-dénombrement de la population pour le Canada
Sommaire du tableau
Le tableau montre les résultats de Composantes de l’estimation du sous-dénombrement de la population pour le Canada. Les données sont présentées selon Composantes (titres de rangée) et Nombre de
personnes(figurant comme en-tête de colonne).
ComposantesTableau 7.4.7 Note 1 Nombre de
personnes
Estimation de M 2 855 660
X total 1 298 599
X du nombre de personnes imputées 737 936
X des dénombrements tardifs 521
X des dénombrements incomplets selon la CVD 560 142
Estimation de S 1 557 061

Enfin, le calcul de la variance des estimations du sous-dénombrement est le suivant :

v ( S ^ ) = v ( M ^ X ) = v ( M ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaacaWG2bGaaiikaiqadofagaqcaiaa cMcacqGH9aqpcaWG2bWaaeWaaeaaceWGnbGbaKaacqGHsislcaWGyb aacaGLOaGaayzkaaGaeyypa0JaamODamaabmaabaGabmytayaajaaa caGLOaGaayzkaaaaaa@4AFE@

v( M ^ )= MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Jc9qqqrpepC0xbbL8F4rqqrFfFv0dg9Wqpe0dar pepeuf0xe9q8qiYRWFGCk9vi=dbvc9s8vr0db9Ff0dbbG8Fq0Jfr=x fr=xfbpdbaqaaeGaciGaaiaabeqaamaabaabaaGcbaGaamODaiaacI caceWGnbGbaKaacaGGPaGaeyypa0daaa@3922@ estimation de la variance de M ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfKttLearuGrYvMBJHgitnMCPbhDG0evam XvP5wqSXMqHnxAJn0BKvguHDwzZbqegqvATv2CG4uz3bIuV1wyUbqe dmvETj2BSbqegm0B1jxALjhiov2DaebbnrfifHhDYfgasaacH8rrpk 0dbbf9q8WrFfeuY=Hhbbf9v8vrpy0dd9qqpae9q8qqvqFr0dXdHiVc =bYP0xH8peuj0lXxfrpe0=vqpeeaY=brpwe9Fve9Fve8meaacaGacm GadaWaaiqacaabaiaafaaakeaaceWGnbGbaKaaaaa@3E02@ selon le plan de la CVD.

Le calcul de la variance a été fait à l’aide de la méthode classique du rééchantillonnage bootstrap. Pour ce faire, des poids de 500 répliques bootstrap ont été produits.

Date de modification :