Rapport technique sur la couverture, Recensement de la population, 2016
7. Contre-vérification des dossiers

L’objectif premier de la Contre-vérification des dossiers est d’estimer le nombre de personnes faisant partie de la population cible du Recensement de 2016 qui n’ont pas été dénombrées par celui-ci aux échelons national, provincial et territorial. Un échantillon dont le nombre de personnes avoisine les 70 000 a été tiré de six bases de sondage indépendantes du Recensement de 2016. Les données des personnes choisies (PC) ont été appariées aux données fiscales et autres sources administratives afin d’obtenir des renseignements récents au sujet de leur résidence habituelle, de leurs adresses de contact, des membres de leur ménage et des groupes de personnes qui leur sont liés.

Un ensemble d’appariements automatisés complexes et de recherches manuelles ont été effectués pour trouver la PC dans la base de données des réponses (BDR) du Recensement de 2016. Les études sur la couverture du recensement, dont la Contre-vérification des dossiers, ont été réalisées d’après une version de la BDR rendue disponible vers le début du mois d’octobre 2016, (c’est-à-dire avant la fin du traitement du recensement). On nomme cette version la BDR-ECR, qui est antérieure à la BDR finale de 2016. Quelques différences mineures existent entre la BDR-ECR et les versions ultérieures des bases de données du recensement. La BDR-ECR, une base de données de personnes, comprend tous les enregistrements des personnes dénombrées, à l’exception de trois groupes d’enregistrements. Le premier concerne les enregistrements du recensement imputés dans le cadre des IME. Le deuxième se rapporte à tous les enregistrements du recensement qui ont été ajoutés tardivement, soit après le début du traitement de la CVD, mais cette situation ne s’est que peu présentée en 2016 contrairement aux deux cycles précédents. Le troisième groupe concerne les enregistrements du recensement communément appelés « dénombrements incomplets ». La section 7.4.6 fournit de plus amples détails sur les dénombrements incomplets.

Lorsque la recherche est infructueuse, une collecte multimodale est entreprise en vue de déterminer si la PC fait partie de la population cible, et pour obtenir des renseignements supplémentaires (notamment des adresses) qui aideraient à trouver la PC dans la BDR-ECR. À la fin de la recherche, chaque PC est classée hors champ (décédée, émigrée ou temporairement à l’extérieur du Canada), dénombrée ou omise. Un petit nombre de cas de non-réponse, composé en grande partie de personnes qui n’ont pas pu être dépistées au moyen de la collecte, doivent être traités et servent à rajuster les poids des répondants à l’aide d’un modèle de rajustement pour la non-réponse.

7.1 Échantillonnage

La base de sondage visant à couvrir la population cible de la CVD, qui inclut toutes les personnes qui auraient dû être dénombrées au Recensement de 2016, est formée à partir de six bases indépendantes du recensement. Les cinq premières sont utilisées pour la sélection d’un échantillon servant à l’estimation du sous-dénombrement dans les dix provinces tandis que les estimations pour les trois territoires sont calculées à l’aide des échantillons tirés de la dernière base de sondage seulement.

À l’échelon provincial, on commence par les personnes qui faisaient partie de la population cible du Recensement de 2011. Celles-ci comprennent toutes les personnes dénombrées au Recensement de 2011 et les personnes omises par le Recensement de 2011, représentées par la portion de l’échantillon de personnes choisies (PC) de la CVD de 2011 qui ont été classées comme omises. Afin de tenir compte des personnes qui se sont ajoutées à la population cible depuis le recensement précédent, on ajoute les naissances et les immigrants intercensitaires (c.-à-d. entre les recensements de 2011 et de 2016) et les résidents non permanents en date du jour du Recensement de 2016. Les sources de données de ces bases de sondage sont les suivantes :

Base du recensement : Personnes dénombrées par le Recensement de 2011 et apparaissant dans la BDR-ECR de 2011.
Base des omis : Il n’existe pas de liste exhaustive des personnes omises. Toutefois, il existe un échantillon représentatif de ces personnes; il s’agit de l’échantillon de PC de la CVD de 2011 classées comme omises. Elles sont toutes incluses dans l’échantillon de 2016 avec leur poids de 2011.
Base des naissances : Données des statistiques de l’état civil sur les naissances intercensitaires. Comme le fichier final des statistiques de l’état civil sur les naissances n’est disponible que tardivement, l’échantillon des naissances de la CVD est tiré d’un mélange de fichiers préliminaires et finaux ainsi que de données brutes des statistiques de l’état civil.
Base des immigrants : Données administratives provenant d’Immigration, Réfugiés et Citoyenneté Canada (IRCC) au sujet des immigrants arrivés au Canada pendant la période intercensitaire.
Base des résidents non permanents : Données administratives provenant d’IRCC sur les personnes qui demandent le statut de réfugié le jour du recensement et sur celles qui ont obtenu un permis de travail ou d’étude au Canada qui couvre le jour du recensement.

Pour chacun des territoires, les fichiers de l’assurance-santé couvrant les personnes éligibles aux soins de santé le jour du recensement forment l’unique base de sondage. Bien que ces bases aient une excellente couverture, cette dernière n’est pas complète et un ajustement doit être effectué aux poids d’échantillonnage afin de pallier cette sous-couverture. Chaque base de sondage d’un territoire donné est indépendante des autres bases des territoires et ne sert qu’à faire l’estimation du sous-dénombrement de ce territoire donné. Les bases de sondage des territoires ne servent pas non plus à l’estimation du sous-dénombrement dans les provinces.

Aucune des cinq premières bases de sondage des provinces ne couvre les personnes émigrées ou à l’extérieur du Canada au cours du Recensement de 2011 qui n’ont pas rempli de questionnaire du recensement en 2011 et qui sont revenues durant la période intercensitaire (« Canadiens de retour dans une province »). Selon le questionnaire détaillé du Recensement de 2016, on estime cette population à 241 361 personnes. De même, on estime à 12 106 le nombre de personnes de retour des territoires dans les provinces. À ce nombre s’ajoutent 18 528 personnes provenant des réserves ou établissements indiens partiellement dénombrés en 2011 et dénombrés en 2016. De plus, les personnes nées après le Recensement de 2011 à l’extérieur du pays ou dans les territoires qui ont la citoyenneté canadienne et qui sont revenues dans une des dix provinces du Canada au jour du Recensement de 2016 ne sont pas couvertes par les cinq premières bases de sondage de la CVD. Selon le questionnaire détaillé du Recensement de 2016, on estime cette population à 17 243 personnes. Les estimations de l’erreur de couverture ne couvrent donc pas ces populations estimées à un total de 289 238 personnes.

Un problème qui se pose avec l’utilisation des bases de sondage multiples est la possibilité qu’une même personne soit incluse dans plus d’une base. Par exemple, une personne incluse dans la base des immigrants pouvait être détentrice d’un permis de travail et se trouver au Canada en mai 2011, et ainsi être dénombrable au Recensement de 2011. Elle serait donc à la fois dans la base des immigrants et dans celle du recensement si elle a été dénombrée, ou dans celle des personnes omises si elle a été omise. Ainsi, il est important de déterminer tous les cas de chevauchement de base, sinon les estimations produites risquent d’être trop élevées puisque les personnes peuvent être comptées deux fois dans les bases de sondage. Autant que possible, ce chevauchement est décelé lors de la construction des bases de sondage, mais une partie est également cernée plus tard à partir des renseignements fournis par les répondants.

Le plan d’échantillonnage varie d’une base à l’autre selon la nature de la liste utilisée. Pour la base du Recensement de 2011, on utilise un plan stratifié à un seul degré. La population est stratifiée selon la province de résidence, le sexe, l’âge et l’état matrimonial. Les personnes dénombrées dans les réserves indiennes au Recensement de 2011 forment des strates séparées. Cependant, avant de faire la stratification de la base, un couplage déterministe de celle-ci avec les données fiscales a été effectué. Environ 96 % des personnes ont été couplées. Les personnes déterminées comme décédées d’après les données fiscales ont été placées dans une strate à tirage complet de décès. Ensuite, la province de résidence la plus récente selon les données fiscales a été dérivée et utilisée pour stratifier la base selon la province (la province de sélection). Les personnes non liées aux données fiscales ou les personnes liées mais dont l’adresse était située à l’extérieur des 10 provinces ont été stratifiées selon leur province de recensement en 2011. Ensuite, pour chaque province de sélection, les personnes ont été réparties dans une des 13 strates suivantes selon le sexe, l’âge (au jour du Recensement de 2011) et l’état matrimonial :

Réserves indiennes (tous âges et sexes);
Femmes, 0 à 12 ans;
Femmes, 13 à 24 ans;
Femmes, 25 à 34 ans, mariées*;
Femmes, 25 à 34 ans, non mariées (y compris les conjointes de fait);
Femmes, 35 ans et plus, mariées*;
Femmes, 35 ans et plus, non mariées (y compris les conjointes de fait);
Hommes, 0 à 12 ans;
Hommes, 13 à 24 ans;
Hommes, 25 à 34 ans, mariés*;
Hommes, 25 à 34 ans, non mariés (y compris les conjoints de fait);
Hommes, 35 ans et plus, mariés*;
Hommes, 35 ans et plus, non mariés (y compris les conjoints de fait).
*Pour le Québec, marié(e) inclut les conjoints et les conjointes de fait.

La base des personnes omises est une base échantillonnale, car il n’existe pas de liste de toutes les personnes omises au Recensement de 2011. L’échantillon de cette base est constitué de tous les cas classés comme « omis » dans le cadre de la CVD de 2011. Quoique l’échantillon ne soit pas stratifié comme tel, une stratification implicite est inévitable puisque les cas omis en 2011 proviennent de bases et de strates différentes.

Pour construire la base de sondage des naissances, on a obtenu une copie des enregistrements de naissances intercensitaires des statistiques de l’état civil par l’intermédiaire du Système national d’acheminement, qui permet d’avoir accès à ces données plus rapidement. La base contient toutes les naissances entre le 10 mai 2011 et le 9 mai 2016 inclusivement. La base a ensuite été stratifiée selon la province de résidence de la mère.

On a construit la base de sondage des immigrants à partir des dossiers d’IRCC. La base des immigrants contient toutes les personnes immigrées au pays entre le 10 mai 2011 et le 9 mai 2016 inclusivement. On a soustrait de la base des immigrants de 2016 ceux qui étaient résidents non permanents au jour du Recensement de 2011, ceux-ci étant déjà couverts par la base du Recensement de 2011 ou la base des omis de 2011. Cette base a été stratifiée selon la province de destination des immigrants. Ensuite, les immigrants de toutes les provinces à l’exception des quatre provinces de l’Atlantique ont été séparés en deux strates selon leur date d’immigration. Les immigrants arrivés entre le 10 mai 2011 et le 9 mai 2015 ont formé la première strate, tandis que ceux arrivés entre le 10 mai 2015 et le 9 mai 2016 ont formé la seconde strate, ce qui s’explique par le fait que les immigrants arrivés depuis moins longtemps ont habituellement un taux d’omission plus élevé au recensement.

La base des résidents non permanents (détenteurs de permis et demandeurs du statut de réfugié) a été construite à partir des dossiers d’IRCC. Tout comme dans le cas des immigrants intercensitaires, ceux qui étaient résidents non permanents au jour du Recensement de 2011 ont été enlevés de la base des résidents non permanents pour 2016. La base a été stratifiée selon la province de destination des résidents non permanents. Étant donné qu’un nombre important de résidents non permanents n’avaient pas indiqué de province de destination (ayant un permis ouvert), ceux-ci ont été placés dans une strate nationale.

Dans les provinces, il a été décidé que la taille totale de l’échantillon de 2016 serait semblable à celle de la CVD de 2011. La répartition de l’échantillon a été effectuée en deux étapes.

Premièrement, l’échantillon national pour les provinces a été réparti entre celles-ci de façon à obtenir des erreurs-types du taux de sous-dénombrement semblables entre les provinces de taille semblable. On visait des erreurs-types plus petites pour les plus grandes provinces que pour les petites provinces car cela permettait d’obtenir une petite erreur-type à l’échelon national. Les erreurs-types visées pour le taux de sous-dénombrement variaient entre 0,31 % et 0,50 %.

Deuxièmement, les échantillons provinciaux ont été répartis entre les strates des provinces. A priori, la taille d’échantillon de la strate de la base des personnes omises en 2011 était déjà fixée, car toutes les personnes considérées comme des personnes omises dans le cadre de la CVD de 2011 ont été choisies. La taille d’échantillon restante dans chaque province a par la suite été répartie à l’aide de la méthode de répartition optimale, basée sur les taux historiques de sous-dénombrement, les taux historiques de non-réponse et la taille de la strate. Les fractions de sondage ne sont pas les mêmes dans chaque strate. Dans le but de rendre le plan de sondage plus efficace, on a eu recours à des fractions de sondage plus élevées pour les sous-groupes où l’on prévoyait un sous-dénombrement important ou un taux de dépistage plus faible. Par exemple, tout comme dans le cas de la CVD de 2011, on a attribué une probabilité de sélection plus grande aux hommes célibataires âgés de 18 à 29 ans en 2016, car on a observé, lors des CVD précédentes, que le sous-dénombrement est toujours plus important dans cette strate. En raison de l’intérêt accru pour les études sur les populations autochtones, la taille des échantillons dans les strates provinciales pour les personnes dénombrées au Recensement de 2011 dans les réserves indiennes est plus élevée que ce que le résultat de la répartition optimale suggère. Cependant, un ajustement à la baisse des tailles d’échantillons par rapport à la répartition optimale a été effectué pour les strates des résidents non permanents, afin de ne pas trop augmenter la taille de l’échantillon de la CVD qui nécessitait une collecte sur le terrain. Comparativement à celui de la CVD de 2011, l’échantillon des résidents non permanents a tout de même augmenté d’environ 1 000 personnes dans la CVD de 2016.

Il convient de souligner que la répartition résultante n’est qu’approximativement optimale étant donné que des hypothèses ont été avancées à propos de la taille de certaines populations, notamment le nombre prévu de naissances et d’immigrants intercensitaires au moment de faire la répartition. La taille réelle de l’échantillon provincial des naissances, des immigrants et des résidents non permanents n’est pas connue tant que tous les échantillons ne sont pas tirés. L’échantillon total final réparti était de 67 842 personnes choisies parmi les bases dans les provinces. Le tableau 7.1.1 présente la répartition finale de l’échantillon selon la strate pour toutes les provinces.

Tableau 7.1.1
Répartition de l’échantillon, bases de sondage et strates pour toutes les provinces
Sommaire du tableau
Le tableau montre les résultats de Répartition de l’échantillon. Les données sont présentées selon Bases de sondage (titres de rangée) et Strates pour chaque province et Nombre de personnes(figurant comme en-tête de colonne).
Bases de sondage	Strates pour chaque province	Nombre de personnes
Total	Note ...: n'ayant pas lieu de figurer	67 872
Recensement de 2011	Femmes, 0 à 12 ans	3 135
	Femmes, 13 à 24 ans	4 907
	Femmes, 25 à 34 ans, mariées^{Tableau 7.1.1 Note 1}	1 207
	Femmes, 25 à 34 ans, non mariées	1 915
	Femmes, 35 ans ou plus, mariées^{Tableau 7.1.1 Note 1}	7 060
	Femmes, 35 ans ou plus, non mariées	5 536
	Hommes, 0 à 12 ans	3 549
	Hommes, 13 à 24 ans	5 410
	Hommes, 25 à 34 ans, mariés^{Tableau 7.1.1 Note 1}	1 350
	Hommes, 25 à 34 ans, non mariés	2 723
	Hommes, 35 ans ou plus, mariés^{Tableau 7.1.1 Note 1}	8 960
	Hommes, 35 ans ou plus, non mariés	5 844
	Vivant dans les réserves	2 067
Omis de 2011	Sans stratification additionnelle	4 745
Naissances	Sans stratification additionnelle	4 026
Immigrants	Entre le 10 mai 2011 et le 9 mai 2015^{Tableau 7.1.1 Note 2}	2 198
Immigrants	Entre le 10 mai 2015 et le 9 mai 2016	760
Résidents non permanents	Avec permis dans une province	2 345
Résidents non permanents	Avec permis ouvert	135
... n'ayant pas lieu de figurer Note 1 Les personnes vivant en union libre sont incluses dans la strate de catégorie « marié » pour le Québec seulement. Retour à la référence de note 1 referrer Note 2 Il y avait seulement une strate dans les quatre provinces suivantes : Terre-Neuve-et-Labrador, Ïle-du-Prince-Édouard, Nouvelle-Écosse et Nouveau-Brunswick. Retour à la référence de note 2 referrer Source : Statistique Canada, Contre-vérification des dossiers de 2016.

La méthodologie d’échantillonnage pour les territoires était semblable à celle de 2011, à l’exception de quelques modifications. Ainsi, les bases de sondage des trois territoires ont été formées à partir de leur fichier d’assurance-santé respectif. Par la suite, les personnes comprises dans la base de sondage de chacun des territoires ont été appariées, à l’aide des systèmes développés aux fins du traitement de l’information (voir la section 7.2.1), à la base de données des réponses du Recensement de 2016 (BDR-ECR). Cette base excluait les dénombrements incomplets. Une vérification manuelle a également été effectuée pour confirmer que les cas appariés représentaient bien les mêmes personnes. Les personnes appariées dans leur territoire (dans le même territoire que dans la base de sondage) ont été classées comme étant dénombrées et un poids de 1 leur a été associé. Par la suite, les personnes appariées à l’extérieur de leur territoire ont formé une strate séparée. Puis, les personnes non appariées ont été séparées en six strates en fonction de l’âge et du sexe (voir le tableau 7.1.2).

En ce qui concerne la répartition de l’échantillon entre les territoires, la première étape consistait à déterminer l’échantillon total à allouer à chaque territoire afin d’atteindre une précision semblable et adéquate du sous-dénombrement. La précision obtenue à la CVD de 2011 différait grandement entre les territoires et était de qualité inférieure, notamment au Nunavut. En 2016, l’erreur-type visée pour le taux de sous-dénombrement s’est fixée à 0,6 % au Yukon et aux T.N.-O., et à 0,65 % au Nunavut. Par conséquent, en 2016, les tailles d’échantillons dans les territoires ont été augmentées au besoin pour obtenir la précision voulue. Ensuite, l’échantillon de chaque territoire a été réparti parmi les six strates (selon l’âge et le sexe) proportionnellement à leur taille puisqu’habituellement, le taux d’omissions ne varie pas énormément entre les strates. Un petit échantillon supplémentaire (variant entre 55 et 80 par territoire) a également été alloué à la strate des personnes appariées à l’extérieur de leur territoire. Cet échantillon a pour seul but de vérifier que ces personnes ne sont pas également dénombrées dans leur territoire, car le cas échéant, la primauté serait donnée à ce dénombrement pour la CVD. Cet échantillon supplémentaire n’a pas été envoyé à la collecte de la CVD étant donné que ces personnes ont déjà été trouvées dans la BDR-ECR.

Le tableau 7.1.2 présente la répartition selon la strate pour tous les territoires.

Tableau 7.1.2
Répartition de l’échantillon, strates par territoire
Sommaire du tableau
Le tableau montre les résultats de Répartition de l’échantillon. Les données sont présentées selon Strates (titres de rangée) et Yukon, T.-N.-O., Nunavut et Total(figurant comme en-tête de colonne).
Strates	Yukon	T.-N.-O.	Nunavut	Total
Appariées dans le territoire	30 040	30 160	25 220	85 420
Appariées hors du territoire	1 352	2 093	1 635	5 080
Échantillon de contrôle	55	80	65	200
Non appariées	560	805	1 030	2 395
Femmes, 0 à 17 ans	38	93	199	330
Femmes, 18 à 29 ans	61	85	107	253
Femmes, 30 ans ou plus	146	196	188	530
Hommes, 0 à 17 ans	39	98	203	340
Hommes, 18 à 29 ans	68	94	118	280
Hommes, 30 ans ou plus	208	239	215	662
Source : Statistique Canada, Contre-vérification des dossiers de 2016.

Le tableau 7.1.3 présente la répartition de l’échantillon pour le Canada, les provinces et les territoires.

Tableau 7.1.3
Taille de l’échantillon pour le Canada, provinces et territoires
Sommaire du tableau
Le tableau montre les résultats de Taille de l’échantillon pour le Canada. Les données sont présentées selon Provinces et territoires (titres de rangée) et Nombre de
personnes(figurant comme en-tête de colonne).
Provinces et territoires	Nombre de personnes
Canada	155 887
Toutes les provinces	67 872
Terre-Neuve-et-Labrador	4 558
Île-du-Prince-Édouard	4 365
Nouvelle-Écosse	6 084
Nouveau-Brunswick	3 858
Québec	7 766
Ontario	11 771
Manitoba	5 780
Saskatchewan	6 730
Alberta	7 022
Colombie-Britannique	9 803
RNP-CA^{Tableau 7.1.3 Note 1}	135
Tous les territoires	88 015
Appariés dans le territoire	85 420
Non appariés dans le territoire	2 595
Yukon	30 655
Appariés dans le territoire	30 040
Non appariés dans le territoire	615
Territoires du Nord-Ouest	31 045
Appariés dans le territoire	30 160
Non appariés dans le territoire	885
Nunavut	26 315
Appariés dans le territoire	25 220
Non appariés dans le territoire	1 095
Note 1 Résidents non permanents - Canada (permis ouvert). Retour à la référence de note 1 referrer Source : Statistique Canada, Contre-vérification des dossiers de 2016.

Une méthode d’échantillonnage systématique à l’intérieur des strates a été utilisée pour sélectionner les échantillons. Voici la liste des variables de tri utilisées pour obtenir un échantillon efficace (stratification implicite), classées selon la base de sondage :

Base du Recensement de 2011 : logement privé ou collectif, sexe, âge et région géographique;
Base des naissances : année de naissance et âge de la mère;
Base des immigrants : année d’immigration et âge;
Base des résidents non permanents : type de permis, sexe et âge;
Base des territoires : région géographique et âge.

Aucun échantillonnage n’était requis pour la base des omis de 2011, car tous les omis de la CVD de 2011 ont été sélectionnés dans l’échantillon de la CVD de 2016.

Après la sélection des échantillons provinciaux et territoriaux, ceux-ci doivent être préparés en vérifiant la qualité des renseignements pour les différentes variables d’intérêt, soit les variables géographiques et démographiques. On procède, par exemple, à la vérification de la qualité des noms et à la validation des dates de naissance. Les adresses sont normalisées afin de faciliter les activités de traitement ultérieures. Afin de mettre à jour les renseignements géographiques, en particulier pour les échantillons du recensement et des omis dont l’information date de 2011, ceux-ci sont appariés aux dossiers de l’Agence du revenu du Canada (ARC), dont ceux de l’impôt sur le revenu des particuliers de 2010 à 2015 et des prestations canadienne pour enfants de 2011 à 2016. À l’aide des fichiers de l’ARC et des données des statistiques de l’état civil, on vérifie également si des personnes sélectionnées sont décédées. Cette étape de préparation est très importante, car elle aide à déterminer les personnes qui sont dénombrées dans les bases du recensement et à communiquer avec les personnes non trouvées en vue de les interviewer.

7.2 Traitement et classification

7.2.1 Traitement

L’objectif du traitement est de fournir des renseignements sur la classification des PC en vue de l’estimation et de l’ajustement pour la non-réponse. Ainsi, le traitement vise à :

déterminer si les PC sont dénombrées au sein de la base de données des réponses au recensement;
déterminer si les PC font partie de la population cible du recensement;
fournir davantage de renseignements sur l’ajustement pour la non-réponse.

Les résultats du traitement ont été enregistrés dans une classification attribuée à chaque PC aux fins d’estimation et de totalisation (voir la section 7.4 et la section 9).

La majeure partie du travail de traitement a fait intervenir une recherche informatisée automatisée dans la version des études de couverture du recensement de la Base de données des réponses au Recensement de 2016 (BDR-ECR), afin de déterminer si la PC était dénombrée ou non.

Divers renseignements ont été utilisés pour cette recherche, notamment les noms et prénoms ainsi que les dates de naissance. Les numéros de téléphone et les adresses associées à la PC ou à des membres de son ménage ont également été utilisés. Des questionnaires où la personne aurait pu être dénombrée ont été relevés à partir de sources variées, incluant :

des appariements avec la BDR-ECR, en utilisant la date de naissance et le sexe de la PC et des membres de son ménage, ou le nom, le code postal ou le numéro de téléphone de la PC;
les adresses de sélection provenant de la base de sondage;
des mises à jour des adresses provenant de dossiers fiscaux;
des renseignements de l’interview téléphonique assistée par ordinateur (ITAO) (voir la section 7.3).

La première étape après la préparation de l’échantillon a été d’effectuer une recherche de chaque PC dans la BDR-ECR en traitant toutes les PC dont l’adresse figurait dans la base de sondage et les données fiscales. Deux résultats ont été obtenus. Lorsque les PC ont été trouvées, elles ont généralement été classées comme « dénombrées » et aucun autre traitement n’a été requis, à l’exception des PC identifiées ensuite au moyen des données des statistiques de l’état civil comme décédées avant le recensement. Les cas des PC non trouvées ont été envoyés en collecte. Pendant la collecte, la recherche dans la BDR-ECR s’est poursuivie. Lorsque les données de l’ITAO étaient disponibles, les chercheurs ont pu déterminer si chaque PC faisait ou non partie de la population cible du recensement. Dans l’affirmative, les données d’ITAO permettaient parfois d’approfondir les recherches.

La recherche des PC a été menée à la fois automatiquement et manuellement par du personnel de codage dirigé par des spécialistes du domaine. Un manuel de procédures très détaillées indiquant les étapes spécifiques de codage des résultats de recherche a été fourni au personnel de codage pour assurer l’uniformité du codage. Les recherches automatisées ont eu d’abord lieu. Un questionnaire du recensement existait pour les adresses obtenues grâce à une correspondance avec la BDR-ECR. On a calculé une mesure de similarité entre le questionnaire du recensement et les données de la Contre-vérification des dossiers. Lorsque cette mesure dépassait un seuil préétabli, on concluait automatiquement que la PC avait été dénombrée à cette adresse. Dans ces cas, ni cette adresse ni les autres adresses de la PC n’avaient à être traitées par le personnel de codage. Des programmes informatiques ont également déterminé lorsqu’une adresse était un double d’une autre. Ces adresses en double n’avaient pas non plus à être traitées.

Pour d’autres cas, on a eu recours à un couplage manuel à l’aide de l’Application de vérification interactive de Doclink (AVID), application créée spécifiquement pour cette opération. Le personnel de codage a utilisé en outre plusieurs outils dans le cadre de ce traitement, tels que des fichiers de référence géographique, des annuaires téléphoniques électroniques et le fichier des attributs des rues. Des questionnaires de recensement ou des unités de collecte de recensement suggérés correspondaient souvent à l’adresse utilisée à la première étape de la recherche. Le personnel pouvait également effectuer une recherche dans la BDR-ECR à l’aide de paramètres souples aux étapes ultérieures du traitement (recherche par nom, date de naissance, etc.) Les résultats de la recherche manuelle étaient alors modifiés manuellement par des corrections intégrées à l’AVID afin de limiter les erreurs. Un fichier comprenant les résultats de recherche a ensuite été produit. Les données de ce fichier ont été utilisées pour classer les PC.

7.2.2 Classification

Le traitement fournit les renseignements nécessaires en vue de déterminer si les PC sont :

incluses dans la « population cible du recensement » ou « hors champ » (non incluses);
« classifiées » ou « non classifiées »;
« listées » ou « non listées »;
« identifiables » ou « non identifiables »;
« dénombrées »;
« omises ».

Certaines PC figurent dans plus d’une catégorie. Nous en expliquerons les raisons plus en détail dans cette section.

7.2.2.1 Classification « population cible » ou « hors champ »

La « population cible du recensement » inclut le groupe de personnes dont il est question à la section 2.2. Une PC est considérée « hors champ » si elle ne fait pas partie de la population cible du recensement. Chaque PC classée comme « hors champ » se voit attribuer l’un des états suivants pour cette classification : décédée, émigrée ou représentée par une autre base de sondage. Pour qu’une personne soit classée comme étant décédée, elle doit apparaître dans les fichiers de mortalité des statistiques de l’état civil ou avoir été déclarée décédée sur les fichiers d’impôts ou lors d’une interview de collecte. Les personnes émigrées de façon permanente ou temporaire sont également déterminées au moyen d’une interview de collecte en fonction de certains critères et d’après les réponses qu’elles ont fournies relativement à leur lieu de résidence au jour du recensement, à la période de temps qu’elles ont passé à l’extérieur du Canada, à leur intention de revenir vivre au pays et à la raison pour laquelle elles étaient à l’extérieur du pays le jour du recensement. D’autres PC sont également classées comme « émigrées listées », qu’elles soient ou non des répondants lors de la collecte. Il s’agit des résidents non permanents (de la base des personnes omises et de la base du Recensement de 2011) qui n’avaient plus de permis en 2016 ni le statut d’immigrant depuis 2011.

Les PC classées comme « représentées par une autre base de sondage » comprennent notamment les cas sélectionnés dans une province, mais classés dans l’un des trois territoires. De même, les cas sélectionnés dans un territoire, mais classés dans une province ou un autre territoire sont eux aussi classés comme « représentés par une autre base de sondage ».

Les PC classées dans la population cible du recensement sont soit « dénombrées », soit « omises », soit « non classifiées » (voir la section 7.2.2.2). Une PC est considérée « dénombrée » si elle figure dans la BDR-ECR. La classification « omises » est attribuée aux PC dans la population cible du recensement qui ne sont pas dénombrées ou « non classifiées ».

7.2.2.2 Classification pour la non-réponse et le rajustement de non-réponse

L’attribution des classifications « listées » et « non classifiées » dépend de l’utilité des adresses fournies et des renseignements tirés de l’ITAO. Dans plusieurs cas, la collecte fournit des renseignements ainsi qu’une ou plusieurs adresses qui sont introuvables à partir d’autres sources. Dans d’autres cas, il est possible de trouver toutes les adresses et tous les renseignements obtenus au moyen de la collecte à partir d’autres sources.

Une PC est « listée » si elle a été classée sans le recours aux données provenant de l’ITAO; même si la collecte des données a été effectuée, les adresses et les renseignements obtenus au moyen de l’interview n’ont pas été requis.

Une personne est considérée comme « non classifiée » si on peut déterminer qu’elle fait partie de la population cible, mais pas si elle a été omise ou non. Cette situation survient lorsque le lieu de résidence le jour du recensement, tel que défini à la section 2.4, est connu, mais non identifié dans la BDR-ECR. Les personnes dont le lieu de résidence le jour du recensement n’est pas assez précis (p. ex. si seul le nom d’une grande ville est fourni comme lieu de résidence le jour du recensement) et les personnes sans domicile fixe ont été incluses dans cette catégorie.

Les PC pour lesquelles il est impossible de déterminer une ou plusieurs des caractéristiques de la liste présentée plus haut sont considérées comme des non-répondants. Il existe trois types de non-répondants :

Une PC est « non identifiée » lorsqu’il est impossible de déterminer si elle est listée ou non. Autrement dit, comme les renseignements disponibles sur la PC sont incomplets, il est impossible de procéder ni à son appariement avec la BDR-ECR ni à la collecte de ses renseignements au moyen d’une interview.
Une PC est « non dépistée » lorsqu’il est impossible de déterminer si elle est incluse ou non dans la population cible du recensement.
Une PC « non classifiée » est considérée comme un cas de non-réponse partielle. En effet, on sait que la personne fait partie de la population cible, mais on ignore si elle est omise ou dénombrée.

7.2.2.3 Répartition de l’échantillon selon la classification

Le tableau 7.2 montre la répartition de l’échantillon selon la classification et la base de sondage. La classification est déterminée à partir de combinaisons spécifiques des caractéristiques de la liste présentée plus haut. Au départ, un échantillon total de 67 872 PC a été sélectionné dans les provinces. De ce nombre, 58 808 PC ont été classées comme « dénombrées », 4 821 comme « omises » et 2 268 comme des non-répondants, dont 357 ont été classées comme « non classifiés ». Les 1 975 autres PC ont été classées comme « hors champ », dont 857 « décès », 934 « émigrants » (permanents ou temporaires) et 184 pour d’autres raisons. Un rajustement pour la non-réponse a été effectué lors du processus d’estimation (voir section 7.4). Il est important de noter qu’aux fins de la classification — et, par conséquent, de l’estimation —, la définition d’un non-répondant diffère de la définition habituelle d’un non-répondant, selon laquelle la collecte de données est tentée, mais non terminée. Il en est ainsi parce que pour procéder à la classification, on utilise des données provenant de plusieurs sources, dont la collecte. Afin d’éviter toute confusion, la section 7.3 sur la collecte fait référence à la « collecte terminée » plutôt qu’à la « réponse ».

Les personnes dans les bases de sondage des territoires sont divisées entre la strate appariée et les strates non appariées. La strate appariée correspond au traitement initial des enregistrements des bases de sondage territoriales. On procède au traitement de ces cas de la même façon que l’on procède avec l’échantillon, soit dans l’application AVID en utilisant des procédures de traitement propres aux territoires. Des 121 892 personnes figurant dans la base de sondage des territoires, 85 420 PC ont été classées comme « dénombrées ». Un échantillon total de 2 595 PC a été sélectionné parmi les personnes non appariées. De cet échantillon, 655 PC ont été classées comme « dénombrées », tandis que 1 128 ont été classées comme « omises » et 441 comme des non-répondants; parmi ces derniers, 105 ont été classés comme « non classifiés ». Les 371 autres PC ont été classées comme « hors champ », dont 25 « décès », 15 « émigrants » (permanents ou temporaires) et 331 comme ayant été classées dans une province ou un autre territoire.

7.2.2.4 Implications de la classification

Les PC « dépistées » sont les PC pour lesquelles il est possible de déterminer si elles sont incluses dans la population cible du recensement ou non. À des fins d’estimation et de totalisation, les PC dépistées qui sont également classifiées sont les répondants. Puisque les noms, y compris ceux des membres du ménage, et les adresses sont disponibles dans la BDR-ECR, et que les outils pour consulter la base de données sont suffisamment puissants, il est possible de vérifier si une PC est dénombrée à une adresse, même si l’adresse fournie est vague.

L’utilité de savoir si une PC est dénombrée va de soi. Les PC qui font partie de la population cible du recensement et qui ne sont pas dénombrées, et donc classées comme « omises », sont la base de l’estimation du sous-dénombrement. On voulait également classer les PC en se fondant sur les caractéristiques mentionnées précédemment afin de choisir les répondants les plus appropriés pour représenter les non-répondants.

Enfin, sauf pour les PC non classifiées, on a aussi déterminé l’adresse au jour du recensement (lieu de résidence habituel) de chaque PC dans la population cible du recensement. Cette adresse représente celle où, selon les directives du recensement, la PC devrait avoir été dénombrée. Si la PC a été dénombrée, l’adresse du dénombrement sera considérée comme l’adresse au jour du recensement, en dépit d’autres renseignements fournis qui pourraient laisser croire que les directives du recensement n’ont pas été bien comprises.

Pour obtenir de plus amples renseignements sur le traitement et la classification, consultez Parenteau (2017).

Tableau 7.2
Classification des personnes choisies, bases de sondage pour le Canada
Sommaire du tableau
Le tableau montre les résultats de Classification des personnes choisies. Les données sont présentées selon Classification (titres de rangée) et Strates provinciales, Strates territoriales, Total, Recensement
de 2011, Omis, Naissances, Immigrants, Résidents non
permanents, Strate appariée et Strates
non appariées, calculées selon nombre et % unités de mesure (figurant comme en-tête de colonne).
Classification	Strates provinciales										Strates territoriales				Total
	Recensement de 2011		Omis		Naissances		Immigrants		Résidents non permanents		Strate appariée		Strates non appariées		Total
	nombre	%	nombre	%	nombre	%	nombre	%	nombre	%	nombre	%	nombre	%	nombre	%
Total	53 663	100,0	4 745	100,0	4 026	100,0	2 958	100,0	2 480	100,0	85 420	100,0	2 595	100,0	155 887	100,0
Dénombrées	48 462	90,3	3 278	69,1	3 575	88,8	2 287	77,3	1 206	48,6	85 420	100,0	655	25,2	144 883	92,9
Listées	48 244	89,9	3 257	68,6	3 573	88,7	2 279	77,0	1 183	47,7	85 420	100,0	628	24,2	144 584	92,7
Non listées	218	0,4	21	0,4	2	0,0	8	0,3	23	0,9	0	0,0	27	1,0	299	0,2
Omises	2 906	5,4	710	15,0	290	7,2	339	11,5	576	23,2	0	0,0	1 128	43,5	5 949	3,8
Listées	416	0,8	81	1,7	42	1,0	31	1,0	39	1,6	0	0,0	333	12,8	942	0,6
Non listées	2 490	4,6	629	13,3	248	6,2	308	10,4	537	21,7	0	0,0	795	30,6	5 007	3,2
Hors cible	1 158	2,2	471	9,9	45	1,1	175	5,9	126	5,1	0	0,0	371	14,3	2 346	1,5
Listées	781	1,5	328	6,9	21	0,5	81	2,7	13	0,5	0	0,0	264	10,2	1 488	1,0
Non listées	377	0,7	143	3,0	24	0,6	94	3,2	113	4,6	0	0,0	107	4,1	858	0,6
Non-réponse	1 137	2,1	286	6,0	116	2,9	157	5,3	572	23,1	0	0,0	441	17,0	2 709	1,7
Dépistées non classifiées	196	0,4	55	1,2	24	0,6	11	0,4	71	2,9	0	0,0	105	4,0	462	0,3
Identifiées non dépistées	933	1,7	231	4,9	92	2,3	146	4,9	499	20,1	0	0,0	336	12,9	2 237	1,4
Non identifiées	8	0,0	0	0,0	0	0,0	0	0,0	2	0,1	0	0,0	0	0,0	10	0,0
Source : Statistique Canada, Contre-vérification des dossiers de 2016.

7.3 Collecte

7.3.1 Environnement

Le personnel du bureau central d’Ottawa a travaillé étroitement avec le personnel de cinq bureaux régionaux (BR) de Statistique Canada pour recueillir les données à l’étape d’enquête de la CVD. Il s’agissait des bureaux régionaux de Halifax, Sherbrooke, Sturgeon Falls, Winnipeg et Edmonton. Les suggestions et recommandations formulées par les bureaux régionaux après la CVD de 2011 ont été prises en compte dans la conception et le déroulement de l’enquête de 2016. Le bureau central a fourni une application ITAO répondant aux besoins de l’enquête et conviviale pour les intervieweurs et les répondants.

Des échantillons ont été attribués aux bureaux régionaux en tentant de déterminer au mieux la résidence de la PC au cours de la période de collecte. Une fois un cas attribué à un bureau régional, il n’était jamais transféré à un autre BR, même s’il était déterminé que la PC avait déménagé hors de la région de collecte du BR. Le tableau 7.3.1 présente les régions de collecte du BR et le nombre de cas de l’enquête.

Tableau 7.3.1
Couverture géographique relevant des bureaux régionaux
Sommaire du tableau
Le tableau montre les résultats de Couverture géographique relevant des bureaux régionaux. Les données sont présentées selon Bureaux régionaux (titres de rangée) et Couverture et Nombre de
cas(figurant comme en-tête de colonne).
Bureaux régionaux	Couverture	Nombre de cas
Total	Canada	15 584
Halifax	Terre-Neuve-et-Labrador, Île-du-Prince-Édouard, Nouvelle-Écosse	2 707
Sherbrooke	Nouveau-Brunswick, Québec, Manitoba	3 148
Sturgeon Falls	Ontario, Saskatchewan	3 715
Winnipeg	Alberta, Yukon, Territoires du Nord-Ouest, Nunavut	3 691
Edmonton	Colombie-Britannique	2 323
Source : Statistique Canada, Contre-vérification des dossiers de 2016.

La taille de l’échantillon de la CVD était de 155 887 (la section 7.1 décrit le plan de sondage). On a tenté de trouver ces cas dans la BDR-ECR au cours du traitement de précollecte. Les cas trouvés ont été classés comme « dénombrés » et n’ont pas eu à être envoyés en collecte. Cependant, un sous-échantillon de ces cas a été envoyé en collecte aux fins de calcul de l’ajustement pour la non-réponse (détaillé à la section 7.4). Les cas non trouvés dans la BDR-ECR ont été envoyés en collecte. Le nombre total de cas envoyés à la collecte (la taille de l’échantillon de la collecte) a été de 15 584 : 6 533 cas de sous-échantillons et 9 951 cas réguliers (non trouvés dans la BDR-ECR).

Le questionnaire de l’enquête de la CVD était disponible en trois versions : répondant (la PC répond pour elle-même), procuration (une personne interposée ou répondant substitut répond pour la PC) et décédé (pour les PC décédées avant le jour du recensement). Le contenu du questionnaire visait surtout à déterminer si la PC faisait partie du champ de l’enquête pour le recensement et à recueillir les adresses où la PC avait vécu (et donc où elle aurait pu être dénombrée) le jour du recensement ou à cette époque. Le nom et les données démographiques ont également été recueillis pour tous les membres du ménage en date du jour du recensement. Par définition, la collecte avait lieu par répondant substitut pour les PC âgées de moins de 18 ans ou les personnes présumées décédées. On a aussi eu recours à des répondants substituts lorsque la PC n’était pas disponible pendant la période de collecte ou lorsqu’elle était difficile à joindre. Globalement, 28 % des cas remplis l’ont été par un répondant substitut approprié.

Dans le cas des PC décédées, il était important d’établir si cette personne était décédée avant, après ou le jour du recensement, puisque différents questionnaires papier et cheminements de l’application ITAO étaient alors utilisés, selon la date du décès. Dans certains cas, il a été déterminé avant la collecte que la PC était décédée avant le jour du recensement (p. ex. en faisant correspondre des dossiers fiscaux et des statistiques de l’état civil). Ces cas n’ont alors pas été envoyés en collecte. Cependant, en cas de doute, le cas était envoyé avec un indicateur signalant que la PC était « présumée décédée ».

Il était impératif que la PC pertinente (ou un répondant substitut pour cette personne) soit interrogée. L’objectif de l’enquête de la CVD est d’utiliser les données recueillies sur les PC pour tenter de retrouver ces dernières dans la BDR-ECR et de les classer comme dénombrées, manquantes au recensement ou hors du champ de l’enquête. Si des données sont recueillies sur la mauvaise personne, la classification correspondante obtenue est incorrecte. Les intervieweurs étaient chargés de vérifier que la personne interrogée était la PC pertinente au début de l’interview et le système d’ITAO a été conçu à cette fin. Si une interview était effectuée avec une autre personne que la PC (p. ex. une personne au nom et à la date de naissance similaires), le cas était retourné au bureau régional pour être effectué auprès de la bonne personne.

Bien que la CVD de 2016 soit une enquête plurimodale, le principal mode de collecte de données était par interview téléphonique assistée par ordinateur (ITAO). L’application d’ITAO a été conçue à partir d’un grand nombre des normes fixées pour l’ensemble des questionnaires d’ITAO utilisés à Statistique Canada. L’application consistait en divers modules intégrés reliés à une application de dépistage. Les cas ont été attribués aux intervieweurs en fonction de la langue et des cas exigeant un dépistage ou non.

Le mode de collecte secondaire était l’autodénombrement. Des questionnaires papier dans les deux langues officielles étaient mis à disposition des PC contactées par téléphone et demandant un questionnaire papier. Le bureau central a envoyé aux PC non contactées par téléphone par les bureaux régionaux et ayant une adresse postale valide un questionnaire papier contenant les diverses versions du questionnaire, une lettre de présentation expliquant l’enquête et les instructions pour choisir le questionnaire pertinent. Les instructions indiquant comment remplir les questionnaires papier figuraient sur la première page des questionnaires.

Le troisième mode de collecte était l’enregistrement sur questionnaire papier des réponses des PC par des intervieweurs sur le terrain. Cela s’est déroulé au milieu de la collecte dans des villes de l’ensemble du Canada comptant de nombreux cas incomplets et où des intervieweurs étaient disponibles dans les bureaux régionaux.

La saisie des données des questionnaires papier a ensuite été effectuée au bureau central à l’aide de l’application d’ITAO. Une importante coordination a été nécessaire pour opérationnaliser un système séquentiel plurimodal de collecte comme la CVD.

7.3.2 Opérations

Avant la collecte (du 3 au 6 janvier), des lettres de présentation ont été envoyées par la poste à tous les cas ayant une adresse postale valide. Ces lettres expliquaient la CVD et indiquaient à la PC (ou le répondant substitut) qu’elle avait été sélectionnée pour l’enquête. Un numéro de téléphone était fourni pour toute question ou lorsque le répondant exprimait souhaiter appeler le bureau régional pour répondre à l’enquête.

Une nouveauté pour la CVD de 2016 a été l’ajout d’une activité « éclair » de précollecte, dans le cadre de laquelle des questionnaires papier ont été envoyés à tous les cas sans numéro de téléphone valides, mais disposant d’une adresse postale valide. Cette initiative a permis de réduire le fardeau de dépistage au début de la collecte. Ces questionnaires ont été envoyés par la poste entre les 9 et 13 janvier.

L’activité « éclair » au milieu de la collecte d’envoi par la poste des questionnaires papier à tous les cas incomplets ayant une adresse postale valide a eu lieu entre le 13 et le 20 avril. À ce moment de la collecte, tous les cas avaient été contactés (soit par appel téléphonique, tentative d’appel, dépistage ou tentative de dépistage); cette procédure a donc constitué un autre type de tentative de prise de contact avec les PC.

Les interviews sur le terrain ont eu lieu dans les villes comptant de nombreux cas incomplets et où des intervieweurs étaient disponibles dans les bureaux régionaux. Les interviews sur le terrain se sont déroulées entre le 17 mai et le 30 juin. Pour maximiser les réponses, un chevauchement important a été appliqué entre les cas faisant l’objet d’interviews sur le terrain et ceux faisant l’objet de l’activité « éclair » de milieu de collecte. Les interviews sur le terrain ont été envoyées près d’un mois après l’envoi par la poste des questionnaires de l’activité « éclair » et les cas de cette dernière ont été retirés des listes des intervieweurs sur le terrain à mesure qu’ils étaient effectués (soit par ITAO soit par questionnaire papier), afin que les répondants ne soient pas contactés deux fois.

La collecte des données a commencé dans tous les bureaux régionaux le 16 janvier 2017. À l’exception du bureau de Winnipeg, le dernier jour de collecte active a été le 30 juin et le dernier jour de collecte passive (lorsque les bureaux régionaux n’effectuaient plus d’appels pour terminer des cas, mais pouvaient le faire par téléphone si un répondant les appelait) a été le 15 juillet. Pour Winnipeg, la collecte active s’est terminée le 31 juillet et la collecte passive, le 31 août. Le bureau de Winnipeg a bénéficié d’une période de collecte étendue pour améliorer son taux de réponse. Il nécessitait davantage de temps pour dépister les cas et y répondre, puisqu’il devait traiter tout l’échantillon territorial, livré dans le système d’ITAO après le début de la collecte (en mars). Un total de 12 787 cas ont été traités pendant la collecte active; 65 pendant la collecte passive et 7 autres après la fin de la collecte (questionnaires papier reçus après le 31 août).

Les données d’enquête ont été envoyées par voie électronique au bureau central de cinq bureaux régionaux chaque soir après la fin de la période d’interviews. Chaque matin, le bureau central analysait la qualité des données pour vérifier l’exhaustivité et l’exactitude de chaque cas. Les cas où des champs clés étaient restés vides ou renfermaient des données ambiguës, ou encore lorsque les données recueillies correspondaient à une autre personne que la PC, étaient réactivés et retournés aux bureaux régionaux aux fins de suivi. Vingt-six cas ont été ainsi réactivés au cours de la CVD de 2016. Les cas passant avec succès l’analyse de qualité des données étaient compilés en lots aux fins de traitement de la façon décrite à la section 7.2.1.

La gestion de la qualité des activités de collecte comprenait la formation des gestionnaires régionaux de la collecte des données au bureau central, la surveillance de la formation des intervieweurs aux bureaux régionaux ainsi que la clarification de la formation et la discussion des questions particulières sur la qualité des données relatives aux cas terminés relevés par le bureau central. Un outil de communication fondé sur un système de billets a été utilisé pour centraliser et faciliter les communications entre le bureau central et les bureaux régionaux. Il permettait d’effectuer le suivi de toutes les questions ainsi que des problèmes et de veiller à ce qu’ils soient résolus rapidement. Les gestionnaires des bureaux régionaux ont attribué des ressources à l’enquête tout en respectant les besoins des autres enquêtes menées dans leur région. Les efforts soutenus afin d’interviewer les personnes ayant initialement refusé de participer à l’enquête ont permis d’améliorer les taux de réponse.

Le tableau 7.3.2 présente la répartition des cas que le bureau central a envoyés aux bureaux régionaux au fil du temps. La majorité des cas ont été envoyés au début de la collecte, le 16 janvier, et comprenaient des cas des bases de sondage du recensement, omis, relatifs aux naissances, aux immigrants et aux résidents non permanents. Les cas des bases de sondage territoriales ont été envoyés le 7 et le 14 mars. Le total corrigé représente le nombre de cas envoyés en collecte, à l’exception des cas supprimés de la collecte.

Tableau 7.3.2
Charge de travail des bureaux régionaux selon la date de l'envoi
Sommaire du tableau
Le tableau montre les résultats de Charge de travail des bureaux régionaux selon la date de l'envoi. Les données sont présentées selon Date de l'envoi en 2017 (titres de rangée) et Bureaux régionaux (figurant comme en-tête de colonne).
Date de l'envoi en 2017	Bureaux régionaux
Date de l'envoi en 2017	Halifax	Sherbrooke	Sturgeon Falls	Winnipeg	Edmonton	Total
16 janvier	2 799	3 289	3 860	1 831	2 351	14 130
7 février	8	14	20	5	16	63
10 février	0	1	0	0	0	1
7 mars	15	11	24	872	30	952
14 mars	2	4	8	1 157	12	1 183
25 mars	11	10	20	20	12	73
10 juillet	0	0	0	2	0	2
Nombre total de cas envoyés	2 835	3 329	3 932	3 887	2 421	16 404
Cas abandonnés par le bureau central^{Tableau 7.3.2 Note 1}	128	181	217	196	98	820
Nombre total ajusté	2 707	3 148	3 715	3 691	2 323	15 584
Note 1 On peut mettre fin à la collecte puisque la personne choisie a été classée par le traitement comme étant dénombrée ou hors champs. Retour à la référence de note 1 referrer Source : Statistique Canada, Contre-vérification des dossiers de 2016.

Le bureau central a créé des rapports de gestion détaillés chaque jour et chaque semaine pour documenter les progrès de la collecte. Ces rapports présentaient le nombre de cas recueillis et les taux de réponse par code de résultat, bureau régional et strate.

7.3.3 Dépistage

Le dépistage est le processus de recherche des coordonnées d’une PC ou d’un répondant substitut répondant pour une PC. Il s’agit d’une étape essentielle de l’enquête de la CVD. Puisque les besoins en dépistage de la CVD sont supérieurs à ceux de toutes les autres enquêtes de Statistique Canada, ses besoins déterminent l’élaboration de l’application de dépistage utilisée pour toutes les enquêtes sociales.

Dans le cadre de la préparation de l’échantillon, les cas ont été couplés aux données fiscales et à d’autres données administratives pour fournir des coordonnées à jour des PC et des membres de leur ménage. Dans certains cas, les données initiales de l’ITAO étaient désuètes ou incomplètes, si bien qu’un dépistage était nécessaire.

Le bureau central a fourni des indices de dépistage à l’aide de plusieurs fichiers administratifs volumineux (notamment des fichiers de données fiscales, d’Immigration, Réfugiés et Citoyenneté Canada, des statistiques de l’état civil et de données de téléphones cellulaires) contenant des noms et des adresses ou des numéros de téléphone. Ces indices ont été chargés dans l’application de dépistage de l’ITAO avant la collecte et d’autres indices ont été envoyés aux bureaux régionaux à mesure de leur découverte lors du traitement au cours de la période de collecte.

Le dépistage a eu lieu pour les PC et les membres de leur ménage et a été étendu en dehors du Canada (des appels pouvaient être effectués et des messages envoyés à l’international). Les intervieweurs ont utilisé divers outils de dépistage; les plus populaires étant des recherches sur Internet avec Canada411.ca™ et Google ainsi que les renseignements disponibles au public sur des sites de médias sociaux.

Au début de la collecte des données, seuls 3,4 % des cas présentaient des coordonnées insuffisantes et devaient faire l’objet d’un dépistage. Du fait de la qualité et de la quantité des sources de dépistage mis à disposition par le bureau central, des numéros de téléphone fournis par le bureau central ont été utilisés pour 70 % des cas traités. Pour les 30 % restants, de nouveaux numéros de téléphone trouvés grâce aux efforts de dépistage des bureaux régionaux ont été utilisés.

7.3.4 Statistiques de collecte

De nombreuses statistiques ont fait l’objet d’une surveillance tout au long de la période de collecte de données et ont été analysées après la fin de la collecte.

Sur les 12 787 cas traités, 94,8 % l’ont été à l’aide du système d’ITAO : 91,3 % pour lesquels le bureau régional a contacté le répondant par téléphone et 3,5 % pour lesquels le répondant a contacté le bureau régional par téléphone. Les 5,2 % restants ont été traités par questionnaire papier : 2,5 % pour lesquels le répondant a demandé un questionnaire papier, 2,2 % pour lesquels le bureau central a envoyé par la poste le questionnaire et 0,5 % pour lesquels un intervieweur sur le terrain a rempli le questionnaire.

Le tableau 7.3.4.1 présente les taux d’achèvement provinciaux et territoriaux par type d’échantillon (régulier ou sous-échantillon d’ajustement pour la non-réponse). Le tableau montre ainsi que les taux d’achèvement étaient supérieurs pour les cas du sous-échantillon. On s’attendait à cela, puisque ces répondants avaient déjà démontré leur propension à répondre en remplissant leur questionnaire du recensement.

Tableau 7.3.4.1
Nombre de cas terminés, et taux d’achèvement selon le type d’échantillon, Canada, provinces et territoires
Sommaire du tableau
Le tableau montre les résultats de Nombre de cas terminés. Les données sont présentées selon Provinces et territoires (titres de rangée) et Échantillon régulier, Échantillon
pour l’ajustement de la non-réponse et Total(figurant comme en-tête de colonne).
Provinces et territoires	Échantillon régulier			Échantillon pour l’ajustement de la non-réponse			Total
Provinces et territoires	Nombre de cas envoyés	Nombre de cas terminés	Taux d’achèvement (%)	Nombre de cas envoyés	Nombre de cas terminés	Taux d’achèvement (%)	Nombre de cas envoyés	Nombre de cas terminés	Taux d’achèvement (%)
Canada	9 305	6 921	74,4	6 279	5 866	93,4	15 584	12 787	82,1
Terre-Neuve-et-Labrador	433	322	74,4	428	383	89,5	861	705	81,9
Île-du-Prince-Édouard	454	316	69,6	377	339	89,9	831	655	78,8
Nouvelle-Écosse	584	419	71,7	541	508	93,9	1 125	927	82,4
Nouveau-Brunswick	388	315	81,2	441	417	94,6	829	732	88,3
Québec	608	475	78,1	594	579	97,5	1 202	1 054	87,7
Ontario	1 415	1 052	74,3	800	760	95,0	2 215	1 812	81,8
Manitoba	609	468	76,8	555	528	95,1	1 164	996	85,6
Saskatchewan	758	590	77,8	547	525	96,0	1 305	1 115	85,4
Alberta	996	721	72,4	606	541	89,3	1 602	1 262	78,8
Colombie-Britannique	1 541	1 144	74,2	735	699	95,1	2 276	1 843	81,0
Yukon	444	325	73,2	208	191	91,8	652	516	79,1
Territoires du Nord-Ouest	450	349	77,6	211	195	92,4	661	544	82,3
Nunavut	527	387	73,4	218	187	85,8	745	574	77,0
RNP-CA^{Tableau 7.3.4.1 Note 1}	98	38	38,8	18	14	77,8	116	52	44,8
Note 1 Résidents non permanents - Canada (permis ouvert). Retour à la référence de note 1 referrer Source : Statistique Canada, Contre-vérification des dossiers de 2016.

Le tableau 7.3.4.2 indique les taux d’achèvement par base de sondage et type d’échantillon. Le faible taux de la base de sondage des résidents non permanents (RNP) était largement dû aux permis arrivant à expiration avant la collecte : 41 % possédaient un permis arrivant à expiration avant le début de la collecte et 15 %, pendant la collecte. De plus, du fait de la nature passagère des résidents non permanents en général, il est souvent difficile de trouver ces PC ou un répondant substitut adéquat. Cependant, le taux d’achèvement pour la base de sondage des RNP s’est amélioré, passant de 55,2 % en 2011 à 68,5 % en 2016.

Tableau 7.3.4.2
Nombre de cas terminés et taux d’achèvement, selon la base de sondage et le type d’échantillon, Canada
Sommaire du tableau
Le tableau montre les résultats de Nombre de cas terminés et taux d’achèvement. Les données sont présentées selon Bases de sondage (titres de rangée) et Échantillon régulier, Échantillon
pour l’ajustement de la non-réponse et Total(figurant comme en-tête de colonne).
Bases de sondage	Échantillon régulier			Échantillon pour l’ajustement de la non-réponse			Total
Bases de sondage	Nombre de cas envoyés	Nombre de cas terminés	Taux d’achèvement (%)	Nombre de cas envoyés	Nombre de cas terminés	Taux d’achèvement (%)	Nombre de cas envoyés	Nombre de cas terminés	Taux d’achèvement (%)
Total	9 305	6 921	74,4	6 279	5 866	93,4	15 584	12 787	82,1
Recensement de 2011	4 558	3 492	76,6	4 430	4 185	94,5	8 988	7 677	85,4
Omis	1 104	877	79,4	415	378	91,1	1 519	1 255	82,6
Naissances	395	304	77,0	194	184	94,8	589	488	82,9
Immigrants	578	431	74,6	137	128	93,4	715	559	78,2
Résidents non permanents	1 249	756	60,5	466	418	89,7	1 715	1 174	68,5
Yukon	444	325	73,2	208	191	91,8	652	516	79,1
Territoires du Nord-Ouest	450	349	77,6	211	195	92,4	661	544	82,3
Nunavut	527	387	73,4	218	187	85,8	745	574	77,0
Source : Statistique Canada, Contre-vérification des dossiers de 2016.

Le tableau 7.3.4.3 présente les taux d’achèvement par sexe et tranche d’âge. Le taux d’achèvement le plus bas correspondait aux hommes âgés de 30 à 44 ans, suivi des femmes de la même catégorie d’âge. Les taux d’achèvement les plus élevés correspondaient aux femmes âgées de 45 ans et plus, suivies des deux sexes âgés de 0 à 19 ans.

Tableau 7.3.4.3
Nombre de cas terminés et taux d'achèvement, selon le sexe et le groupe d’âge, Canada
Sommaire du tableau
Le tableau montre les résultats de Nombre de cas terminés et taux d'achèvement. Les données sont présentées selon Sexe et groupes d’âge (titres de rangée) et Échantillon régulier, Échantillon
pour l’ajustement de la non-réponse et Total(figurant comme en-tête de colonne).
Sexe et groupes d’âge	Échantillon régulier			Échantillon pour l’ajustement de la non-réponse			Total
Sexe et groupes d’âge	Nombre de cas envoyés	Nombre de cas terminés	Taux d’achèvement (%)	Nombre de cas envoyés	Nombre de cas terminés	Taux d’achèvement (%)	Nombre de cas envoyés	Nombre de cas terminés	Taux d’achèvement (%)
Les deux sexes	9 301	6 921	74,4	6 279	5 866	93,4	15 580	12 787	82,1
0 à 19 ans	1 077	839	77,9	804	762	94,8	1 881	1 601	85,1
20 à 29 ans	2 084	1 529	73,4	1 475	1 392	94,4	3 559	2 921	82,1
30 à 44 ans	3 808	2 739	71,9	2 216	2 025	91,4	6 024	4 764	79,1
45 ans et plus	2 332	1 814	77,8	1 784	1 687	94,6	4 116	3 501	85,1
Hommes	5 429	3 997	73,6	3 121	2 918	93,5	8 550	6 915	80,9
0 à 19 ans	590	459	77,8	390	376	96,4	980	835	85,2
20 à 29 ans	1 138	835	73,4	757	709	93,7	1 895	1 544	81,5
30 à 44 ans	2 306	1 649	71,5	1 105	1 017	92,0	3 411	2 666	78,2
45 ans et plus	1 395	1 054	75,6	869	816	93,9	2 264	1 870	82,6
Femmes	3 872	2 924	75,5	3 158	2 948	93,4	7 030	5 872	83,5
0 à 19 ans	487	380	78,0	414	386	93,2	901	766	85,0
20 à 29 ans	946	694	73,4	718	683	95,1	1 664	1 377	82,8
30 à 44 ans	1 502	1 090	72,6	1 111	1 008	90,7	2 613	2 098	80,3
45 ans et plus	937	760	81,1	915	871	95,2	1 852	1 631	88,1
Note : Ce tableau exclut quatre cas pour lesquels le sexe était inconnu. Source : Statistique Canada, Contre-vérification des dossiers de 2016.

7.4 Estimation

L’estimation de la CVD s’est divisée en deux parties. D’abord, on a effectué la pondération des personnes choisies (PC), puis on a calculé le sous-dénombrement du recensement. La pondération est le processus comprenant la détermination des poids d’échantillonnage initiaux des PC ainsi que tous les ajustements subséquents effectués à ces poids initiaux menant à la création des poids finaux des PC. La pondération comprend plusieurs étapes qui sont décrites aux sections 7.4.1 à 7.4.5. La méthodologie du calcul du sous-dénombrement du recensement est décrite à la section 7.4.7.

7.4.1 Calcul du poids initial

Le poids initial d’une PC de la base des personnes omises de 2011 correspond au poids final qui lui a été attribué lors de la CVD de 2011 au moment où la PC a été classée comme « omise ». Pour les PC des autres bases de sondage, les poids initiaux ont été attribués en fonction de l’inverse des probabilités de sélection dans l’échantillon.

7.4.2 Rajustement pour la non-réponse

Pour réduire les biais statistiques, les poids initiaux des répondants devaient être rajustés pour tenir compte de la non-réponse. Le poids des personnes pour lesquelles une classification n’a pu être établie (les non-répondants) a été redistribué parmi les personnes pour lesquelles une classification a été établie (les répondants). Il existe trois types de non-réponse. Il y a d’abord les personnes non identifiées (seulement 10 PC). Les poids initiaux des personnes non identifiées sont transférés aux personnes identifiées dans chaque strate d’échantillonnage.

Le deuxième type de non-réponse concerne les personnes non dépistées (2 237 PC). L’ajustement consiste à former des groupes homogènes de réponse (GHR) parmi les personnes non listées (les personnes listées étant les personnes classifiées sans l’aide de la collecte de la CVD) et de transférer les poids des personnes non dépistées aux personnes dépistées non listées à l’intérieur des GHR. La méthodologie de formation des GHR de la CVD de 2016 a été modifiée par rapport à celle des CVD précédentes. Pour les CVD de 2001, de 2006 et de 2011, les GHR ont été formés à partir du concept de mobilité (mobile et non mobile) et les facteurs d’ajustement dépendaient de la propension à répondre d’un sous-échantillon de personnes listées non mobiles. À la CVD de 2016, le concept de mobilité et le sous-échantillon n’ont pas été utilisés pour l’ajustement des personnes non dépistées.

La première étape de la création des GHR consiste à rassembler les personnes non listées en groupes principaux d’après leur propension estimée à être dans la population cible. Les groupes ont été formés en fonction de l’analyse de la corrélation entre plusieurs indicateurs fiscaux, notamment ceux pour 2015 et 2016, et la classification finale des personnes dépistées non listées. Jusqu’à six groupes principaux ont été créés selon la base de sondage. Ces groupes principaux sont aussi fortement corrélés à la propension à répondre. La deuxième étape de la création des GHR consiste à grouper les personnes non listées selon leur propension à répondre dans chacun des domaines, où un domaine est défini par le croisement d’une base de sondage avec un groupe principal. Dans chaque domaine, l’analyse de la propension à répondre a été faite au moyen d’un modèle de régression logistique à l’échelle nationale (ainsi que régionale quand les données le permettaient) et de l’analyse de tableaux de fréquences croisées à plusieurs niveaux. Dans le cas des modèles, plusieurs variables auxiliaires disponibles tant pour les personnes dépistées que non dépistées ont été utilisées, à savoir les variables disponibles dans les bases de sondage (p. ex. âge, sexe, relation avec les autres membres du ménage, pays d’origine et type de résident non permanent), les variables disponibles dans les données fiscales pour les personnes liées (p. ex. présence ou non dans certains fichiers, fréquence de changement d’adresse depuis 2011 et type d’adresse), les variables reliées aux renseignements relatifs aux coordonnées (p. ex. nombre et sources de numéros de téléphone, disponibilité d’une adresse et lien de la dernière adresse connue avec le recensement de 2016) ainsi que quelques autres variables. Ainsi, les variables auxiliaires significativement corrélées avec la propension à répondre ont été déterminées et utilisées pour former les GHR. Dans la plupart des domaines, les GHR ont été formés à l’intérieur de la province ou du territoire de sélection. Ainsi, l’ajustement consistait à transférer le poids des personnes non dépistées aux personnes dépistées non listées à l’intérieur de chaque GHR.

Le troisième ajustement pour la non-réponse est celui des personnes non classifiées. Une personne non classifiée est une personne qui avait sa résidence principale dans une province ou un territoire donné le jour du recensement (donc dans la population cible du recensement), mais dont on ne sait pas avec certitude si elle a été omise ou dénombrée. Suivant le même principe que pour les personnes non dépistées, des groupes homogènes de personnes classifiées ont été formés à l’intérieur de chaque base de sondage et province de classification. L’ajustement consistait à transférer le poids des personnes non classifiées aux personnes classifiées non listées à l’intérieur de chaque groupe homogène.

7.4.3 Calage des poids de la base du Recensement de 2011

Dans le cas de la base du Recensement de 2011, un calage aux personnes dénombrées et aux personnes décédées a été effectué afin d’ajuster dans le cas où un échantillon provincial contiendrait trop ou trop peu de personnes dénombrées ou décédées. Ce calage est une nouveauté pour la CVD de 2016. Plusieurs couplages de la base du Recensement de 2011 ont été effectués afin de définir des groupes de calage et des totaux de contrôle. D’abord, un couplage automatisé déterministe appliqué aux fichiers de mortalité des statistiques de l’état civil a permis de déterminer les totaux de contrôle par province pour le groupe de calage des personnes décédées. Ensuite, un couplage automatisé déterministe appliqué à la BDR-ECR de 2016 a permis de déterminer les totaux de contrôle par province pour le groupe de calage des personnes dénombrées. Puis, une mise à jour des renseignements provenant des données fiscales a été effectuée pour les personnes liées à ces données à la suite du couplage automatisé déterministe effectué avant la stratification de cette base. Cela a permis de former trois autres groupes de calage selon le statut des personnes dans les données fiscales et d’obtenir les totaux de contrôle pour ces groupes. De même, la province de résidence la plus récente indiquée dans les données fiscales a servi à définir la province de calage. En tout, 50 groupes de calage ont été formés (cinq dans chaque province) et 50 totaux de contrôle ont été calculés. Le calage a été effectué à l’aide d’une méthode de ratissage aux marges en utilisant les 50 totaux de contrôle décrit ci-dessus pour la première marge, de même que 36 groupes de calage selon l’âge et le sexe comme deuxième marge. Pour ce faire, le système généralisé d’estimation (G-Est) de Statistique Canada a été utilisé.

7.4.4 Rajustement par post-stratification pour les territoires

Après avoir rajusté les poids initiaux, on a observé que l’estimation de personnes dénombrées dans les territoires était traditionnellement inférieure au chiffre comparable du recensement. Cette situation est attribuable à une sous-couverture de la population cible du recensement dans les fichiers d’assurance santé. Pour pallier cette sous-couverture, les poids des PC sélectionnées dans les territoires ont été rajustés afin que l’estimation du nombre de personnes dénombrées égale le chiffre comparable du recensement pour ce territoire. Les ajustements ont été effectués pour six groupes de calage (selon l’âge et le sexe) dans chaque territoire. Lors des CVD précédentes, il y avait un seul groupe de calage par territoire.

7.4.5 Ajustement pour le surdénombrement dans la base du Recensement de 2011

Les poids des PC de la base du Recensement de 2011 qui ont été dénombrées plus d’une fois en 2011 ont pour leur part été rajustés à la baisse pour tenir compte du fait que ces personnes avaient plus d’une chance d’être sélectionnées.

7.4.6 Distribution pondérée selon la classification

Le tableau 7.4.6 présente la distribution pondérée des PC selon la classification et la base de sondage. On rappelle les définitions données à la section 7.2. Seules les PC trouvées dans la base de données de la BDR-ECR ont été classées comme « dénombrées ». Les personnes de la population cible qui ne sont pas dans la BDR-ECR ont été classées comme « omises ». Les PC restantes ont été classées comme « hors champ » (p. ex. décédées ou émigrées).

Tableau 7.4.6
Classification pondérée des personnes choisies, bases de sondage pour le Canada
Sommaire du tableau
Le tableau montre les résultats de Classification pondérée des personnes choisies. Les données sont présentées selon Classification (titres de rangée) et Strates provinciales, Strates territoriales, Total, Nombre de cas envoyés, Taux d’achèvement (%), Nombre de cas terminés et Bases des territoires, calculées selon nombre et % unités de mesure (figurant comme en-tête de colonne).
Classification	Strates provinciales										Strates territoriales		Total
	Recensement de 2011		Omis de 2011		Naissances		Immigrants		Résidents non permanents		Bases des territoires		Total
	nombre	%	nombre	%	nombre	%	nombre	%	nombre	%	nombre	%	nombre	%
Total	31 290 865	100,0	2 807 753	100,0	1 895 007	100,0	1 094 930	100,0	668 685	100,0	128 008	100,0	37 885 248	100,0
Dénombrées	27 950 130	89,3	1 885 586	67,2	1 731 465	91,4	837 599	76,5	330 735	49,5	98 275	76,8	32 833 790	86,7
Listées	27 776 637	88,8	1 872 192	66,7	1 729 645	91,3	832 592	76,0	316 387	47,3	97 772	76,4	32 625 224	86,1
Non listées	173 493	0,6	13 394	0,5	1 820	0,1	5 007	0,5	14 349	2,1	503	0,4	208 566	0,6
Omises	1 721 477	5,5	554 838	19,8	125 932	6,6	159 895	14,6	271 952	40,7	21 565	16,8	2 855 660	7,5
Listées	212 428	0,7	46 563	1,7	20 207	1,1	9 920	0,9	9 856	1,5	4 785	3,7	303 759	0,8
Non listées	1 509 049	4,8	508 275	18,1	105 725	5,6	149 975	13,7	262 096	39,2	16 780	13,1	2 551 901	6,7
Hors champ	1 619 258	5,2	367 329	13,1	37 610	2,0	97 436	8,9	65 998	9,9	8 168	6,4	2 195 798	5,8
Listées	1 252 754	4,0	224 800	8,0	8 963	0,5	34 087	3,1	4 389	0,7	6 126	4,8	1 531 119	4,0
Non listées	366 504	1,2	142 529	5,1	28 647	1,5	63 349	5,8	61 609	9,2	2 042	1,6	664 679	1,8
Source : Statistique Canada, Contre-vérification des dossiers de 2016.

7.4.7 Calcul du sous-dénombrement du recensement

Définissons maintenant que :

C

chiffre publié du recensement du nombre de personnes dans la population cible

\hat{S}

estimation du sous-dénombrement

Cette cellule est vide

estimation du nombre de personnes non incluses en

C

mais qui auraient dû l’être

\hat{M}

estimation du nombre de personnes de la population visée par la CVD qui n’ont pas été dénombrées

Cette cellule est vide

somme du poids final des personnes considérées comme omises

X

nombre de personnes incluses en

C

qui ne peuvent pas, dans le cadre de la CVD, être déterminées avec certitude comme des personnes dénombrées.

On estime le sous-dénombrement de la population du recensement par le nombre (pondéré) de personnes omises moins le nombre de personnes exclues de la BDR-ECR :

$\hat{S} = \hat{M} - X$

$X$ a trois composantes : les imputations (provenant des IME de l’ECL), les dénombrements incomplets et les dénombrements tardifs.

L’adresse de la PC le jour du recensement désigne un logement pour lequel un dénombrement a été imputé. C’est le cas, notamment, des logements non répondants pour lesquels les données d’un autre logement ont été utilisées dans le cadre de l’IME.

Certains dénombrements figurant dans la base de données du recensement ont été jugés trop peu complets pour être utilisés aux fins de la CVD afin de déterminer si une PC était une personne dénombrée. Le dénombrement est généralement incomplet en pareil cas à cause de données manquantes ou non valides en ce qui a trait à la date de naissance ou au nom (p. ex. « ? », « M. », « Inconnu » ou « Personne 1 »). Lorsque la PC a fait l’objet d’un tel dénombrement, elle est considérée comme une personne « omise ». C’est ce qu’on appelle un « dénombrement incomplet de la CVD ».

Le Recensement de 2016 a donné lieu à deux nouveaux types de dénombrements incomplets. D’abord, il y a l’imputation des données de personnes vivant dans certains types de logements collectifs (p. ex. motels, hôtels et terrains de camping), car dans ces logements collectifs, seul le nombre de résidents habituels a été recueilli au recensement (pas de noms ni de dates de naissance). Puis, en raison des feux de forêt en Alberta durant le recensement, les renseignements des personnes pour certains logements de la subdivision de recensement de Wood Buffalo ont été dérivés de données administratives. Afin d’évaluer correctement les erreurs de couverture, ces enregistrements ont dû être considérés comme des dénombrements incomplets.

En 2016, les dénombrements tardifs se sont limités aux personnes dénombrées dans un seul logement (collectif au Québec), car ces personnes n’apparaissaient pas dans la BDR du recensement de laquelle les données ont été extraites en vue de la création de la base de données des études sur la couverture du recensement.

À l’échelle nationale, $X$ représente un peu moins de la moitié de $\hat{M}$ . La valeur de $X$ a diminué par rapport à 2011 en raison d’une réduction du nombre de personnes imputées dans le cadre de l’IME et de la quasi-élimination des dénombrements tardifs. Le nombre de dénombrements incomplets est semblable à celui de 2011, malgré l’ajout de deux nouveaux types de dénombrements incomplets.

Le tableau 7.4.7 présente les chiffres nationaux des différentes composantes de l’estimation du sous-dénombrement de la population, notamment les chiffres pour les trois composantes du terme X.

Tableau 7.4.7
Composantes de l’estimation du sous-dénombrement de la population pour le Canada
Sommaire du tableau
Le tableau montre les résultats de Composantes de l’estimation du sous-dénombrement de la population pour le Canada. Les données sont présentées selon Composantes (titres de rangée) et Nombre de
personnes(figurant comme en-tête de colonne).
Composantes^{Tableau 7.4.7 Note 1}	Nombre de personnes
Estimation de M	2 855 660
X total	1 298 599
X du nombre de personnes imputées	737 936
X des dénombrements tardifs	521
X des dénombrements incomplets selon la CVD	560 142
Estimation de S	1 557 061
Note 1 M : nombre de personnes de la population visée par la CVD qui n'ont pas été dénombrées; X : nombre de personnes qui sont incluses dans le chiffre publié du recensement mais qui ne peuvent pas être identifiées avec certitude dans le cadre de la CVD en tant que personnes dénombrées; CVD : contre-vérification des dossiers; S : sous-dénombrement. Retour à la référence de note 1 referrer Source : Statistique Canada, Études de couverture du Recensement de 2016.

Enfin, le calcul de la variance des estimations du sous-dénombrement est le suivant :

$v (\hat{S}) = v (\hat{M} - X) = v (\hat{M})$

$v (\hat{M}) =$ estimation de la variance de $\hat{M}$ selon le plan de la CVD.

Le calcul de la variance a été fait à l’aide de la méthode classique du rééchantillonnage bootstrap. Pour ce faire, des poids de 500 répliques bootstrap ont été produits.

Date de modification :: 2019-11-07

Sélection de la langue

Recherche et menus

Recherche

Rapport technique sur la couverture, Recensement de la population, 2016
7. Contre-vérification des dossiers

7.1 Échantillonnage

7.2 Traitement et classification

7.2.1 Traitement

7.2.2 Classification

7.2.2.1 Classification « population cible » ou « hors champ »

7.2.2.2 Classification pour la non-réponse et le rajustement de non-réponse

7.2.2.3 Répartition de l’échantillon selon la classification

7.2.2.4 Implications de la classification

7.3 Collecte

7.3.1 Environnement

7.3.2 Opérations

7.3.3 Dépistage

7.3.4 Statistiques de collecte

7.4 Estimation

7.4.1 Calcul du poids initial

7.4.2 Rajustement pour la non-réponse

7.4.3 Calage des poids de la base du Recensement de 2011

7.4.4 Rajustement par post-stratification pour les territoires

7.4.5 Ajustement pour le surdénombrement dans la base du Recensement de 2011

7.4.6 Distribution pondérée selon la classification

7.4.7 Calcul du sous-dénombrement du recensement

Rapport technique sur la couverture, Recensement de la population, 2016 7. Contre-vérification des dossiers

7.1 Échantillonnage

7.2 Traitement et classification

7.2.1 Traitement

7.2.2 Classification

7.2.2.1 Classification « population cible » ou « hors champ »

7.2.2.2 Classification pour la non-réponse et le rajustement de non-réponse

7.2.2.3 Répartition de l’échantillon selon la classification

7.2.2.4 Implications de la classification

7.3 Collecte

7.3.1 Environnement

7.3.2 Opérations

7.3.3 Dépistage

7.3.4 Statistiques de collecte

7.4 Estimation

7.4.1 Calcul du poids initial

7.4.2 Rajustement pour la non-réponse

7.4.3 Calage des poids de la base du Recensement de 2011

7.4.4 Rajustement par post-stratification pour les territoires

7.4.5 Ajustement pour le surdénombrement dans la base du Recensement de 2011

7.4.6 Distribution pondérée selon la classification

7.4.7 Calcul du sous-dénombrement du recensement

Note de reconnaissance

Normes de service à la clientèle

Droit d'auteur

Rapport technique sur la couverture, Recensement de la population, 2016
7. Contre-vérification des dossiers