Rapport technique sur la couverture, Recensement de la population, 2016
3. Erreur de couverture de la population

3.1 Sources

La collecte et le traitement des données du recensement sont assujettis à des normes de qualité rigoureuses, mais il est très difficile d'éliminer toutes les erreurs possibles. Il existe deux types d'erreurs de couverture de la population. Le sous-dénombrement de la population désigne l'exclusion de personnes qui auraient dû être dénombrées, alors que le surdénombrement de la population désigne l'inclusion de personnes dénombrées plus d'une fois (généralement deux fois). Le surdénombrement comprend aussi les personnes dénombrées qui n'auraient pas dû l’être. Toutefois, on ne mesure pas ce type d'erreur, car il est jugé négligeable.

Le sous-dénombrement peut survenir au cours de la première étape du recensement si la liste des logements utilisée pour l'univers des logements est incomplète. Ce risque est plus élevé notamment si un logement est en voie de construction. En revanche, il peut y avoir un surdénombrement si un logement est dénombré à deux reprises.

Il y a également des risques d'erreur de couverture à l'étape de la collecte des données sur le terrain. Les erreurs commises par les répondants sont à l'origine des erreurs de couverture lorsque la personne qui remplit le questionnaire du recensement omet une personne dont le lieu habituel de résidence est le logement en question d'après les règles du recensement; il y a alors sous-dénombrement. La personne peut également inclure une personne dont le lieu habituel de résidence n'est pas le logement en question; il y a alors surdénombrement si la personne a déjà été dénombrée à son lieu habituel de résidence ou à un autre endroit. Il est généralement facile de déterminer le lieu habituel de résidence d'une personne. Cependant, tel que mentionné dans la section précédente, le processus est parfois plus complexe et des règles spéciales ont été créées pour définir le lieu habituel de résidence d'une personne. Le questionnaire du recensement fait état de ces règles, mais, comme elles sont nombreuses, il peut y avoir des problèmes de compréhension. Les erreurs de couverture peuvent survenir lorsque les règles ne sont pas consultées ou lorsqu'elles sont appliquées de façon inappropriée. La notion de jour du recensement comme date de référence pour déterminer le lieu habituel de résidence peut également être mal comprise, donnant lieu à des erreurs de couverture.

Les erreurs de couverture peuvent également être commises à n'importe quel moment au cours de l'étape de traitement, lorsque les renseignements indiqués dans les dossiers des personnes ou des ménages sont entrés dans la base de données du recensement ou extraits de celle-ci. Les dossiers peuvent être annulés par erreur. Les questionnaires peuvent être associés à un dossier erroné ou retournés trop tard pour être inclus.

Le risque de sous-dénombrement des sans-abri est élevé, et ce, même si des mesures sont prises pour assurer le dénombrement de cette partie de la population. D'autres situations peuvent également entraîner des erreurs de couverture. Ainsi, le cas des jeunes adultes qui ont récemment quitté le domicile familial peut donner lieu à un sous-dénombrement parce que leurs colocataires et leurs parents ne les inscrivent pas dans le questionnaire du recensement, ou à un surdénombrement parce que leur nom est inscrit dans deux questionnaires du recensement. Les personnes qui ont un deuxième lieu de résidence en raison de leur emploi peuvent également être à l'origine d'erreurs de couverture.

Les utilisateurs devraient également savoir dans quelle mesure les réserves indiennes et les établissements indiens ont participé au Recensement de 2016. Dans certains cas, le dénombrement n’a pas été permis par la communauté ou il a été interrompu avant d'être terminé. Ces régions géographiques sont considérées comme des réserves et établissements indiens partiellement dénombrés (14 au total en 2016). Il n'y a pas de données pour 2016 dans le cas des réserves et établissements indiens partiellement dénombrés, et ceux-ci ne sont pas inclus dans les totaux. Des problèmes semblables sont survenus au cours de recensements antérieurs. Ainsi, lors du Recensement de 2006, 22 réserves et établissements indiens ont été partiellement dénombrés alors que 31 l'ont été lors du Recensement de 2011; 20 de ces derniers ont participé au Recensement de 2016.

L'estimation de la population dans le cas des 14 réserves et établissements indiens partiellement dénombrés est une estimation fondée sur un modèle. Cependant, comme il n'y a pas de source fiable permettant de vérifier les hypothèses utilisées dans le cas de ce modèle, l'estimation établie doit être utilisée avec circonspection. Pour plus de renseignements, voir la section 12.2.

3.2 Contrôle

Les sources possibles d'erreurs de couverture ont été définies au cours de l'étape de planification du Recensement de 2016 et les mesures suivantes ont été prises pour réduire les risques connexes :

Les limites des unités de collecte (UC) ont été soigneusement définies et configurées, de façon à ce qu'aucune des régions géographiques ne soit omise ou incluse deux fois.
Les secteurs de listage/livraison : Le manuel de l'agent recenseur renfermait des instructions quant à la façon de dénombrer une UC tout en minimisant les risques d'oublier des logements. Le nombre total de logements selon le Recensement de 2011 a été communiqué aux chargés des opérations sur le terrain afin de les aider à déceler les modifications notables. Par ailleurs, les opérations de listage donnant lieu à une différence marquée du nombre de logements par rapport à celui du Recensement de 2011 ont donné lieu à une vérification de la liste. Enfin, des procédures précises de contrôle qualitatif ont été appliquées à l'UC afin d'évaluer puis de corriger les modifications apportées à la liste.
Les secteurs d'envoi par la poste : L'envoi par la poste a été effectué en fonction d'une liste d'adresses provenant du Registre des adresses de Statistique Canada. Cette liste était mise à jour régulièrement et des activités de listage ont eu lieu, principalement là où une plus forte croissance était observée. Les activités de listage ont eu lieu en continu, mais de façon plus intensive dans les deux années précédant le recensement. Les opérations de listage ont mené à la vérification de près de 30 % des adresses dans les secteurs d'envoi par la poste. Le travail des agents recenseurs a fait l'objet d'un contrôle qualitatif. Les logements collectifs devant être vérifiés par le personnel sur le terrain ont été identifiés avant l'étape de la collecte pour faire en sorte que, s'ils étaient occupés, ils soient identifiés et compris dans le recensement.
Des procédures spéciales ont été établies pour assurer le dénombrement des personnes ayant de la difficulté à répondre (p. ex. les personnes qui ne maîtrisent ni le français ni l'anglais ou qui sont analphabètes) et pour assurer le dénombrement des personnes se trouvant dans des quartiers particuliers des grandes villes où la réponse ou la couverture était plus faible dans le passé.
Des procédures spéciales ont été définies pour assurer le dénombrement de la population vivant dans les réserves indiennes.
Des messages publicitaires informaient les Canadiens à propos du recensement et indiquaient ce qu'ils devaient faire s'ils n'avaient pas reçu de questionnaire.
L'Assistance téléphonique du recensement (ATR) était offerte pour obtenir une réponse aux questions à propos du recensement, y compris à propos de la couverture.
Le questionnaire comprenait une partie intitulée « Qui inscrire », ce qui permettait aux répondants de déterminer les personnes qui devaient être incluses. De plus, près de 70 % des réponses au Recensement de 2016 ont été obtenues par Internet, et le questionnaire électronique comprenait des questions de vérification supplémentaires lorsque les répondants déclaraient un logement inoccupé ou inexistant, ou s'ils avaient de la difficulté à déterminer si une personne devait être incluse ou non.
Dans le questionnaire, on demandait aux répondants d'indiquer s'il y avait des personnes qui n’avaient pas été inscrites parce qu’ils n’étaient pas certains qu’il fallait les inclure. Le questionnaire électronique guidait les répondants pour prendre la bonne décision. Dans les autres cas, un suivi téléphonique était effectué par la suite auprès des répondants pour déterminer si les personnes en question devaient être inscrites ou non dans le questionnaire.
Le suivi téléphonique a été effectué après l'examen des questionnaires en cas d'incohérence quant à la couverture ou pour vérifier la situation des ménages, y compris les questionnaires ne concernant que des résidents étrangers ou des personnes présentes temporairement.
Le suivi des cas de non-réponse comportait une vérification de la couverture des logements.

Ces procédures ainsi qu'une formation appropriée du personnel, des vérifications supervisées et des contrôles qualitatifs durant les étapes de collecte et de traitement ont permis de réduire le nombre d'erreurs de couverture.

3.3 Définitions

La présente section porte sur la définition algébrique des erreurs de couverture. La lettre $P$ représente le total ou le nombre « réel » de personnes visées par le Recensement de la population. La lettre $C$ représente le chiffre du recensement tel qu'il a été publié pour cette population visée. L'erreur associée à l'utilisation de $C$ plutôt que $P$ est la suivante :

$N = P - C$

Cette erreur, désignée au moyen de la lettre $N$ , représente l'erreur de couverture nette de la population.

La lettre $S$ représente le sous-dénombrement de la population, c'est-à-dire le nombre de personnes non incluses dans, $C$ mais qui auraient dû l'être.

Le chiffre du recensement $C$ comporte deux éléments, soit :

$C = D + I$

où :

$D$ est le nombre de personnes dénombrées, c'est-à-dire le nombre de personnes inscrites dans un questionnaire du recensement.

$I$ est le nombre de personnes imputées, c'est-à-dire une estimation du nombre de personnes omises parce que leur logement a été classé comme occupé, mais non répondant ou qu'il était classé à tort comme inoccupé, donc pour lequel aucun suivi n'a été fait. Pour plus de renseignements à propos de l'imputation de ménages entiers (IME), voir la section 3.6 du Rapport technique sur l'échantillonnage et la pondération, Recensement de la population, 2016, nº 98-306-X au catalogue.

Le sous-dénombrement par rapport au chiffre publié du recensement $C$ est donc ce qui reste des personnes dont le nom aurait dû être inscrit dans un questionnaire du recensement et qui n'ont pas été prises en compte par l'IME. Autrement dit, le sous-dénombrement n'inclut pas l'estimation du nombre de personnes qui n'ont pas été dénombrées soit parce qu'un questionnaire du recensement n'a pas été retourné pour le logement (logement non répondant), soit parce que le logement n'a pas reçu de questionnaire puisqu'il a été classé à tort comme un logement inoccupé (erreur de classification).

Le concept de sous-dénombrement avant l'IME existe aussi. C'est ce qu'on appelle le sous-dénombrement de la collecte du Recensement de la population. Pour plus de renseignements, voir la section 12.1.

La lettre $R$ désigne le surdénombrement de la population, c'est-à-dire le nombre de dénombrements en trop inclus dans $C$ , mais qui n'auraient pas dû être inclus.

$R$ comporte deux éléments. Le premier vise les dénombrements en trop des personnes dénombrées plus d'une fois. Les études sur la couverture mettent l'accent sur ce type de dénombrements en trop. Le deuxième désigne les personnes dénombrées, mais qui ne faisaient pas partie de la population visée par le recensement. Par exemple, les étrangers en visite au Canada et dont le nom figure dans un questionnaire du recensement en tant que résidents habituels d'un logement ne devraient pas être inclus dans $C$ . C'est le cas également des personnes fictives. Le nombre de personnes dénombrées alors qu'elles ne font pas partie de la population visée par le recensement est généralement très peu élevé, selon les études précédentes, et peut être négligé. Les études sur la couverture du recensement n'évaluent donc pas cet élément des erreurs de couverture.

Étant donné que la lettre $S$ désigne les personnes non dénombrées qui devraient être incluses dans $C$ et que la lettre $R$ désigne les dénombrements qui ne devraient pas être inclus dans $C$ , l'écart entre $P$ et $C$ correspond à $S$ moins $R$ , c'est-à-dire :

$N = S - R$

Le nombre réel de personnes dans la population visée par le recensement est alors le suivant :

$P = C + N = C + S - R$

En pratique, pour des raisons de coût et d'actualité des données produites, on établit une estimation de $P$ , dénotée $\hat{P}$ , fondée sur des études par échantillon, où :

$\hat{P} = C + \hat{N} = C + \hat{S} - \hat{R}$

$\hat{S}$ est une estimation du nombre de personnes non incluses dans $C$ , mais qui auraient dû l'être et $\hat{R}$ est une estimation du nombre de personnes incluses dans $C$ , mais qui n'auraient pas dû l'être. On peut supposer que le surdénombrement des personnes incluses dans $C$ alors qu'elles ne font pas partie de la population visée par le recensement est égal à zéro, car il est négligeable. $\hat{R}$ se limite donc à une estimation du nombre de dénombrements en trop parmi les doublons. Les études de couverture du recensement visent à établir les quantités $\hat{S}$ et $\hat{R}$ .

En bref, la population réelle $P$ est formée du chiffre du recensement $C$ et du sous-dénombrement net $N$ . On parle ici de sous-dénombrement net car $S$ est généralement plus grand que $R$ dans le contexte du recensement actuel au Canada. Toutefois, l'inverse est possible et $N$ serait alors négatif. La variable $C$ correspond à $D$ plus le nombre de personnes ajoutées lors de l'IME, et cette imputation $I$ vise des personnes habitant des logements non répondants ou des logements occupés classés à tort comme des logements inoccupés.

Les erreurs de couverture de la population du recensement peuvent généralement être exprimées en fonction de taux relatifs à la population réelle : le taux de sous-dénombrement $T_{S}$ est $S$ exprimé en un pourcentage de $P$ . Le taux de surdénombrement $T_{R}$ est $R$ exprimé en un pourcentage de $P$ . Le taux de sous-dénombrement net $T_{N}$ correspond à la différence entre $S$ et $R$ , exprimée en un pourcentage de la population visée par le recensement. Ces trois taux peuvent être estimés au moyen des quantités ${\hat{T}}_{S}$ , ${\hat{T}}_{R}$ et ${\hat{T}}_{N}$ , comme suit :

${\hat{T}}_{S} = 100 * \frac{\hat{S}}{\hat{P}} = 100 * \frac{\hat{S}}{C + \hat{N}}$

${\hat{T}}_{R} = 100 * \frac{\hat{R}}{\hat{P}} = 100 * \frac{\hat{R}}{C + \hat{N}}$

${\hat{T}}_{N} = 100 * \frac{\hat{N}}{\hat{P}} = 100 * (\frac{\hat{S} - \hat{R}}{C + \hat{N}})$

Un taux de sous-dénombrement net positif indique que le taux de sous-dénombrement est plus élevé que le taux de surdénombrement, autrement dit, que le nombre de personnes non incluses dans les chiffres publiés du recensement $C$ est plus élevé que le nombre de personnes dénombrées en trop. C'est généralement le cas pour tous les recensements du Canada. Cependant, un taux de sous-dénombrement net négatif est parfois observé pour certains domaines d'intérêt.

3.4 Évaluation

Deux études postcensitaires ont été réalisées en vue d'établir une estimation des erreurs de couverture de la population du Recensement de 2016. Il s'agit de la Contre-vérification des dossiers (CVD), permettant de mesurer le sous-dénombrement de la population, et de l'Étude sur le surdénombrement du recensement (ESR), permettant de mesurer le surdénombrement de la population. Tel que mentionné précédemment, l'Enquête sur la classification des logements (ECL) ne contribue pas à l’estimation des erreurs de couverture du recensement puisque les chiffres du recensement sont déjà ajustés pour tenir compte des résultats de l’ECL.

La CVD et l'ESR ont été réalisées après les opérations de collecte sur le terrain et de traitement du recensement. Les estimations provisoires des erreurs de couverture de la population du Recensement de 2016 ont été publiées le 29 mars 2018. Les estimations définitives ont été publiées le 27 septembre 2018, après un exercice approfondi de validation effectué en collaboration avec la Division de la démographie et les coordonnateurs statistiques provinciaux et territoriaux. Ces données ont été publiées en même temps que les nouvelles estimations de population officielles tenant compte de la mise à jour de la population de base à la suite du Recensement de 2016. Les chiffres de population du recensement ajustés en fonction du sous-dénombrement net de la population constituaient les estimations à jour de la population de base.

La méthodologie utilisée pour les deux études sur la couverture est décrite brièvement comme suit :

Contre-vérification des dossiers (CVD)

Dans le cadre de la CVD, on a prélevé un échantillon aléatoire de personnes couvrant la population cible du Recensement de 2016 à partir de bases de sondage indépendantes de ce recensement. Ces bases sont décrites à la section 7.1. L'échantillon de la CVD de 2016 était formé de 67 872 personnes dans le cas des provinces et de 2 595 personnes dans le cas des territoires. On a examiné ensuite la base de données du Recensement de 2016 pour déterminer si ces personnes avaient été dénombrées.

On a également effectué, au besoin, des interviews, dont la majorité ont été des interviews téléphoniques assistées par ordinateur (ITAO), à partir des bureaux régionaux (BR) afin de recueillir des renseignements pouvant servir à des recherches supplémentaires dans la base de données du Recensement de 2016. On a complété une interview dans 82,1 % des 15 584 cas transmis aux BR. Le poids d'échantillonnage a été ajusté afin de tenir compte des cas de non-réponse. Plus précisément, le poids d'échantillonnage total des non-répondants a été réparti entre des groupes de répondants ressemblant le plus possible aux non-répondants quant à leur probabilité de réponse.

L'estimation du sous-dénombrement de la population est établie en fonction du nombre de personnes faisant partie de l'échantillon de la CVD qui sont considérées comme des personnes « omises ». Ces personnes faisaient partie de la population cible du Recensement de 2016, mais il n'y a aucune preuve de dénombrement dans la base de données des réponses du Recensement de 2016. À l'échelle nationale, 4 821 personnes de l'échantillon de la CVD ont été classées comme des personnes omises dans les provinces, et 1 128, dans les territoires.

Étude sur le surdénombrement du recensement (ESR)

Le surdénombrement a été établi en effectuant un appariement de la base de données finale du Recensement de 2016 à elle-même, suivi d'un appariement entre la base de données finale du Recensement de 2016 et une liste de personnes qui auraient dû être dénombrées d'après des sources de données administratives. Pour les appariements, on a eu recours au couplage probabiliste. Le couplage probabiliste permet d'établir des appariements qui ne sont pas tout à fait exacts. Un échantillon de doublons potentiels a été sélectionné pour chacun des couplages, puis les caractéristiques démographiques et les noms ont été examinés afin de déterminer les cas de surdénombrement véritables.

Date de modification :: 2019-10-16

Sélection de la langue

Recherche et menus

Recherche

Rapport technique sur la couverture, Recensement de la population, 2016
3. Erreur de couverture de la population

3.1 Sources

3.2 Contrôle

3.3 Définitions

3.4 Évaluation

Rapport technique sur la couverture, Recensement de la population, 2016 3. Erreur de couverture de la population

3.1 Sources

3.2 Contrôle

3.3 Définitions

3.4 Évaluation

Note de reconnaissance

Normes de service à la clientèle

Droit d'auteur

Rapport technique sur la couverture, Recensement de la population, 2016
3. Erreur de couverture de la population