3.1 Sources
La collecte et le traitement des données du
recensement sont assujettis à des normes de qualité rigoureuses, mais il est
très difficile d'éliminer toutes les erreurs possibles. Il existe deux types
d'erreurs de couverture de la population. Le sous-dénombrement de la population
désigne l'exclusion de personnes qui auraient dû être dénombrées, alors que le
surdénombrement de la population désigne l'inclusion de personnes dénombrées
plus d'une fois (généralement deux fois). Le surdénombrement comprend aussi les
personnes dénombrées qui n'auraient pas dû l’être. Toutefois, on ne mesure pas
ce type d'erreur, car il est jugé négligeable.
Le sous-dénombrement peut survenir au cours de la
première étape du recensement si la liste des logements utilisée pour l'univers
des logements est incomplète. Ce risque est
plus élevé notamment si un logement est en voie de construction. En revanche,
il peut y avoir un surdénombrement si un logement est dénombré à deux reprises.
Il y a également des risques d'erreur de couverture à
l'étape de la collecte des données sur le terrain. Les erreurs commises par les
répondants sont à l'origine des erreurs de couverture lorsque la personne qui
remplit le questionnaire du recensement omet une personne dont le lieu habituel
de résidence est le logement en question d'après les règles du recensement; il
y a alors sous-dénombrement. La personne peut également inclure une personne
dont le lieu habituel de résidence n'est pas le logement en question; il y a
alors surdénombrement si la personne a déjà été dénombrée à son lieu habituel
de résidence ou à un autre endroit. Il est généralement facile de déterminer le
lieu habituel de résidence d'une personne. Cependant, tel que mentionné dans la
section précédente, le processus est parfois plus complexe et des règles
spéciales ont été créées pour définir le lieu habituel de résidence d'une
personne. Le questionnaire du recensement fait état de ces règles, mais, comme
elles sont nombreuses, il peut y avoir des problèmes de compréhension. Les
erreurs de couverture peuvent survenir lorsque les règles ne sont pas
consultées ou lorsqu'elles sont appliquées de façon inappropriée. La notion de
jour du recensement comme date de référence pour déterminer le lieu habituel de
résidence peut également être mal comprise, donnant lieu à des erreurs de
couverture.
Les erreurs de couverture peuvent également être
commises à n'importe quel moment au cours de l'étape de traitement, lorsque les
renseignements indiqués dans les dossiers des personnes ou des ménages sont
entrés dans la base de données du recensement ou extraits de celle-ci. Les
dossiers peuvent être annulés par erreur. Les questionnaires peuvent être
associés à un dossier erroné ou retournés trop tard pour être inclus.
Le risque de sous-dénombrement des sans-abri est
élevé, et ce, même si des mesures sont prises pour assurer le dénombrement de
cette partie de la population. D'autres situations peuvent également entraîner
des erreurs de couverture. Ainsi, le cas des jeunes adultes qui ont récemment
quitté le domicile familial peut donner lieu à un sous-dénombrement parce que
leurs colocataires et leurs parents ne les inscrivent pas dans le questionnaire
du recensement, ou à un surdénombrement parce que leur nom est inscrit dans
deux questionnaires du recensement. Les personnes qui ont un deuxième lieu de
résidence en raison de leur emploi peuvent également être à l'origine d'erreurs
de couverture.
Les utilisateurs
devraient également savoir dans quelle mesure les réserves indiennes et les
établissements indiens ont participé au Recensement de 2016. Dans certains cas,
le dénombrement n’a pas été permis par la communauté ou il a été interrompu
avant d'être terminé. Ces régions géographiques sont considérées comme des
réserves et établissements indiens partiellement dénombrés (14 au total en
2016). Il n'y a pas de données pour 2016 dans le cas des réserves et
établissements indiens partiellement dénombrés, et ceux-ci ne sont pas inclus
dans les totaux. Des problèmes semblables sont survenus au cours de
recensements antérieurs. Ainsi, lors du Recensement de 2006, 22 réserves
et établissements indiens ont été partiellement dénombrés alors que 31 l'ont
été lors du Recensement de 2011; 20 de ces derniers ont participé au
Recensement de 2016.
L'estimation de la population dans le cas des
14 réserves et établissements indiens partiellement dénombrés est une
estimation fondée sur un modèle. Cependant, comme il n'y a pas de source fiable
permettant de vérifier les hypothèses utilisées dans le cas de ce modèle,
l'estimation établie doit être utilisée avec circonspection. Pour plus de renseignements, voir la section 12.2.
3.2 Contrôle
Les sources possibles d'erreurs de couverture ont été définies
au cours de l'étape de planification du Recensement de 2016 et les mesures
suivantes ont été prises pour réduire les risques connexes :
- Les limites des unités de collecte (UC) ont été soigneusement définies et configurées, de façon à ce
qu'aucune des régions géographiques ne soit omise ou incluse deux fois.
- Les secteurs de
listage/livraison : Le manuel de l'agent recenseur renfermait des
instructions quant à la façon de dénombrer une UC tout en minimisant les
risques d'oublier des logements. Le nombre total de logements selon le
Recensement de 2011 a été communiqué aux chargés des opérations sur le terrain
afin de les aider à déceler les modifications notables. Par ailleurs, les
opérations de listage donnant lieu à une différence marquée du nombre de
logements par rapport à celui du Recensement de 2011 ont donné lieu à une
vérification de la liste. Enfin, des procédures précises de contrôle qualitatif
ont été appliquées à l'UC afin d'évaluer puis de corriger les modifications
apportées à la liste.
- Les secteurs d'envoi par
la poste : L'envoi par la poste a été effectué en fonction d'une liste
d'adresses provenant du Registre des adresses de Statistique Canada. Cette
liste était mise à jour régulièrement et des activités de listage ont eu lieu,
principalement là où une plus forte croissance était observée. Les activités de
listage ont eu lieu en continu, mais de façon plus intensive dans les deux
années précédant le recensement. Les opérations de listage ont mené à la
vérification de près de 30 % des adresses dans les secteurs d'envoi par la
poste. Le travail des agents recenseurs a fait l'objet d'un contrôle
qualitatif. Les logements collectifs devant
être vérifiés par le personnel sur le terrain ont été identifiés avant l'étape
de la collecte pour faire en sorte que, s'ils étaient occupés, ils soient
identifiés et compris dans le recensement.
- Des procédures spéciales
ont été établies pour assurer le dénombrement des personnes ayant de la
difficulté à répondre (p. ex. les personnes qui ne maîtrisent ni le français ni
l'anglais ou qui sont analphabètes) et pour assurer le dénombrement des
personnes se trouvant dans des quartiers particuliers des grandes villes où la
réponse ou la couverture était plus faible dans le passé.
- Des procédures spéciales
ont été définies pour assurer le dénombrement de la population vivant dans les
réserves indiennes.
- Des messages
publicitaires informaient les Canadiens à propos du recensement et indiquaient
ce qu'ils devaient faire s'ils n'avaient pas reçu de questionnaire.
- L'Assistance téléphonique du recensement (ATR) était offerte
pour obtenir une réponse aux questions à propos du recensement, y compris à
propos de la couverture.
- Le questionnaire
comprenait une partie intitulée « Qui inscrire », ce qui permettait
aux répondants de déterminer les personnes qui devaient être incluses. De plus,
près de 70 % des réponses au Recensement de 2016 ont été obtenues par
Internet, et le questionnaire électronique comprenait des questions de
vérification supplémentaires lorsque les répondants déclaraient un logement
inoccupé ou inexistant, ou s'ils avaient de la difficulté à déterminer si une
personne devait être incluse ou non.
- Dans le questionnaire, on
demandait aux répondants d'indiquer s'il y avait des personnes qui n’avaient
pas été inscrites parce qu’ils n’étaient pas certains qu’il fallait les
inclure. Le questionnaire électronique guidait les répondants pour prendre la
bonne décision. Dans les autres cas, un suivi téléphonique était effectué par
la suite auprès des répondants pour déterminer si les personnes en question
devaient être inscrites ou non dans le questionnaire.
- Le suivi téléphonique a
été effectué après l'examen des questionnaires en cas d'incohérence quant à la
couverture ou pour vérifier la situation des ménages, y compris les
questionnaires ne concernant que des résidents étrangers ou des personnes
présentes temporairement.
- Le suivi des cas de
non-réponse comportait une vérification de la couverture des logements.
Ces procédures ainsi qu'une formation appropriée du
personnel, des vérifications supervisées et des contrôles qualitatifs durant
les étapes de collecte et de traitement ont permis de réduire le nombre
d'erreurs de couverture.
3.3 Définitions
La présente section porte sur la définition algébrique
des erreurs de couverture. La lettre représente
le total ou le nombre « réel » de personnes visées par le Recensement
de la population. La lettre
représente le chiffre du recensement tel qu'il a été
publié pour cette population visée. L'erreur associée à l'utilisation de
plutôt que
est la
suivante :
Cette erreur, désignée au moyen de la lettre , représente l'erreur
de couverture nette de la population.
La lettre représente
le sous-dénombrement de la population,
c'est-à-dire le nombre de personnes non incluses dans,
mais qui auraient
dû l'être.
Le chiffre du recensement
comporte deux
éléments, soit :
où :
est le nombre de
personnes dénombrées, c'est-à-dire le nombre de personnes inscrites dans un
questionnaire du recensement.
est le nombre de
personnes imputées, c'est-à-dire une estimation du nombre de personnes omises
parce que leur logement a été classé comme occupé, mais non répondant ou qu'il
était classé à tort comme inoccupé, donc pour lequel aucun suivi n'a été fait. Pour plus de renseignements à propos de
l'imputation de ménages entiers (IME), voir la section
3.6 du Rapport technique sur l'échantillonnage
et la pondération, Recensement de la population, 2016, nº 98-306-X au catalogue.
Le sous-dénombrement par rapport au chiffre publié du
recensement est donc ce qui reste
des personnes dont le nom aurait dû être inscrit dans un questionnaire du
recensement et qui n'ont pas été prises en compte par l'IME. Autrement dit, le
sous-dénombrement n'inclut pas l'estimation du nombre de personnes qui n'ont
pas été dénombrées soit parce qu'un questionnaire du recensement n'a pas été
retourné pour le logement (logement non répondant), soit parce que le logement
n'a pas reçu de questionnaire puisqu'il a été classé à tort comme un logement
inoccupé (erreur de classification).
Le concept de sous-dénombrement avant l'IME existe
aussi. C'est ce qu'on appelle le sous-dénombrement de la collecte du
Recensement de la population. Pour plus de renseignements, voir la section 12.1.
La lettre désigne le surdénombrement de la population,
c'est-à-dire le nombre de dénombrements en trop inclus dans , mais qui n'auraient pas dû être inclus.
comporte deux
éléments. Le premier vise les dénombrements en trop des personnes dénombrées
plus d'une fois. Les études sur la couverture mettent l'accent sur ce type de
dénombrements en trop. Le deuxième désigne les personnes dénombrées, mais qui
ne faisaient pas partie de la population visée par le recensement. Par exemple,
les étrangers en visite au Canada et dont le nom figure dans un questionnaire
du recensement en tant que résidents habituels d'un logement ne devraient pas
être inclus dans
. C'est le cas
également des personnes fictives. Le nombre de personnes dénombrées alors
qu'elles ne font pas partie de la population visée par le recensement est
généralement très peu élevé, selon les études précédentes, et peut être
négligé. Les études sur la couverture du recensement n'évaluent donc pas cet
élément des erreurs de couverture.
Étant donné que la lettre désigne les
personnes non dénombrées qui devraient être incluses dans
et que la lettre
désigne les dénombrements qui ne devraient pas être
inclus dans
, l'écart entre
et
correspond à
moins
, c'est-à-dire :
Le nombre réel de personnes dans la population visée
par le recensement est alors le suivant :
En pratique, pour des raisons de coût et d'actualité
des données produites, on établit une estimation de
, dénotée
, fondée sur des études par
échantillon, où :
est une estimation du nombre de personnes non incluses dans
, mais qui auraient
dû l'être et
est une estimation du nombre de personnes incluses dans , mais qui n'auraient pas dû l'être. On peut supposer
que le surdénombrement des personnes incluses dans
alors qu'elles ne
font pas partie de la population visée par le recensement est égal à zéro, car
il est négligeable.
se limite donc à une estimation du nombre de dénombrements en trop parmi
les doublons. Les études de couverture du recensement visent à établir les
quantités
et
.
En bref, la population réelle
est formée du chiffre du
recensement
et du sous-dénombrement net
. On parle ici de sous-dénombrement net car est généralement plus grand que dans le contexte du recensement actuel
au Canada. Toutefois, l'inverse est possible et serait alors négatif. La variable
correspond à
plus le nombre de personnes
ajoutées lors de l'IME, et cette imputation
vise des personnes habitant des logements non répondants ou des logements
occupés classés à tort comme des logements inoccupés.
Les erreurs de couverture de la population du
recensement peuvent généralement être exprimées en fonction de taux relatifs à
la population réelle : le taux de sous-dénombrement
est
exprimé en un
pourcentage de
. Le taux de
surdénombrement
est
exprimé en un
pourcentage de
. Le taux de
sous-dénombrement net
correspond à la
différence entre
et
, exprimée en un
pourcentage de la population visée par le recensement. Ces trois taux peuvent
être estimés au moyen des quantités
,
et
, comme suit :
Un taux de
sous-dénombrement net positif indique que le taux de sous-dénombrement est plus
élevé que le taux de surdénombrement, autrement dit, que le nombre de personnes
non incluses dans les chiffres publiés du recensement
est plus élevé que le
nombre de personnes dénombrées en trop. C'est généralement le cas pour tous les
recensements du Canada. Cependant, un taux de sous-dénombrement net négatif est
parfois observé pour certains domaines d'intérêt.
3.4 Évaluation
Deux études postcensitaires
ont été réalisées en vue d'établir une estimation des erreurs de couverture de
la population du Recensement de 2016. Il s'agit de la Contre-vérification des dossiers (CVD), permettant de
mesurer le sous-dénombrement de la population, et de l'Étude sur le surdénombrement du recensement (ESR),
permettant de mesurer le surdénombrement de la population. Tel que mentionné
précédemment, l'Enquête sur la classification des logements (ECL) ne contribue
pas à l’estimation des erreurs de couverture du recensement puisque les
chiffres du recensement sont déjà ajustés pour tenir compte des résultats de
l’ECL.
La CVD et l'ESR ont été réalisées après les opérations de collecte sur le terrain et de
traitement du recensement. Les estimations provisoires des erreurs de
couverture de la population du Recensement de 2016 ont été publiées le
29 mars 2018. Les estimations définitives ont été publiées le
27 septembre 2018, après un exercice approfondi de validation
effectué en collaboration avec la Division de la démographie et les
coordonnateurs statistiques provinciaux et territoriaux. Ces données ont été
publiées en même temps que les nouvelles estimations de population officielles
tenant compte de la mise à jour de la population de base à la suite du
Recensement de 2016. Les chiffres de population du recensement ajustés en
fonction du sous-dénombrement net de la population constituaient les
estimations à jour de la population de base.
La méthodologie utilisée
pour les deux études sur la couverture est décrite brièvement comme suit :
Contre-vérification des dossiers (CVD)
Dans le cadre de la
CVD, on
a prélevé un échantillon aléatoire de personnes couvrant la population cible du
Recensement de 2016 à partir de bases de sondage indépendantes de ce
recensement. Ces bases sont décrites à la section 7.1. L'échantillon de la
CVD
de 2016 était formé de
67 872 personnes dans le cas des provinces et de 2 595 personnes
dans le cas des territoires. On a examiné ensuite la base de données du
Recensement de 2016 pour déterminer si ces personnes avaient été dénombrées.
On a également effectué, au besoin, des interviews,
dont la majorité ont été des interviews téléphoniques assistées par ordinateur
(ITAO), à partir des bureaux régionaux (BR) afin de recueillir des
renseignements pouvant servir à des recherches supplémentaires dans la base de
données du Recensement de 2016. On a complété une interview dans 82,1 %
des 15 584 cas transmis aux BR. Le poids d'échantillonnage a été ajusté
afin de tenir compte des cas de non-réponse. Plus précisément, le poids
d'échantillonnage total des non-répondants a été réparti entre des groupes de
répondants ressemblant le plus possible aux non-répondants quant à leur
probabilité de réponse.
L'estimation du sous-dénombrement de la population est
établie en fonction du nombre de personnes faisant partie de l'échantillon de
la
CVD
qui sont considérées comme
des personnes « omises ». Ces personnes faisaient partie de la
population cible du Recensement de 2016, mais il n'y a aucune preuve de
dénombrement dans la base de données des réponses du Recensement de 2016. À
l'échelle nationale, 4 821 personnes de l'échantillon de la
CVD
ont été classées comme des personnes omises
dans les provinces, et 1 128, dans les territoires.
Étude sur le surdénombrement du recensement (ESR)
Le surdénombrement a été établi en effectuant un
appariement de la base de données finale du Recensement de 2016 à elle-même,
suivi d'un appariement entre la base de données finale du Recensement de 2016
et une liste de personnes qui auraient dû être dénombrées d'après des sources
de données administratives. Pour les appariements, on a eu recours au couplage
probabiliste. Le couplage probabiliste permet d'établir des appariements qui ne
sont pas tout à fait exacts. Un échantillon de doublons potentiels a été
sélectionné pour chacun des couplages, puis les caractéristiques démographiques
et les noms ont été examinés afin de déterminer les cas de surdénombrement
véritables.