Rapport technique sur l'échantillonnage et la pondération, Recensement de la population, 2016
Annexe D – Wood Buffalo
Introduction
Le 1er mai 2016, un incendie de forêt s'est déclaré dans le sud-ouest de Fort McMurray, en Alberta. Le 3 mai, il a ravagé la région, détruisant bon nombre de maisons et d'immeubles et causant la plus importante évacuation de résidents en raison des feux de forêt de l'histoire de l'Alberta. Statistique Canada a alors décidé de suspendre la collecte des données du recensement (appelée la « collecte des données sur le terrain ») dans les zones évacuées. Plusieurs réponses avaient alors déjà été reçues des zones évacuées.
Statistique Canada a appliqué un ensemble de mesures pour veiller à ce que les résidents de la subdivision de recensement (SDR) de Wood Buffalo (appelée specialized municipality of Wood Buffalo ou Wood Buffalo) soient inclus dans le Recensement de la population de 2016. Les données des zones évacuées ont été tirées d'une combinaison de sources : la collecte directe de données sur le terrain et les sources de données administratives. Statistique Canada a travaillé en étroite collaboration avec les autorités provinciales et locales en Alberta afin d'obtenir un accès aux dossiers administratifs pour aider à valider les données dérivées des sources de données administratives disponibles à Statistique Canada.
La présente annexe fournit des détails supplémentaires sur la méthodologie utilisée dans la SDR de Wood Buffalo à la suite de l'incendie. Elle couvre en particulier les procédures de pondération et d'estimation. De plus amples détails sur les procédures de collecte se trouvent dans l'annexe 1.4 du Guide du Recensement de la population, 2016, no 98-304-X au catalogue.
Date de référence
En ce qui concerne le Recensement de 2016, la date de référence pour la déclaration des données était le 10 mai 2016. Pour les résidents des zones évacuées lors de l'incendie, la date de référence était le 1er mai 2016. On considère que cette nouvelle date représentait mieux la situation dans la SDR de Wood Buffalo. Par conséquent, un léger écart pouvait exister dans les réponses reçues entre le début de l'incendie et la reprise de la collecte des données sur le terrain en août. On considère ce problème comme mineur.
Données administratives
Dans la mesure du possible et lorsqu'aucune réponse directe n'avait été reçue pour un logement donné, des données provenant de diverses sources de données administratives ont été utilisées selon une date de référence se rapprochant le plus possible de mai 2016, pour les variables comme le nom, la date de naissance, le sexe et l'état matrimonial.
Comme les fichiers de données administratives n'avaient pas le même contenu en matière de langues que celui recueilli dans le questionnaire du recensement, des couplages de données ont été effectués entre les sources administratives et la base de données du Recensement de 2011. En ce qui concerne les couplages réussis, les réponses de 2011 aux questions sur la langue ont servi de substituts pour les questions sur la langue du Recensement de 2016. Les réponses aux questions du recensement pour lesquelles aucun renseignement comparable ne pouvait être tiré des fichiers de données administratives, comme le lien avec la Personne 1 et l'union libre, ont été dérivées au cours du traitement des données.
Collecte des données
En août 2016, la collecte des données a repris à Wood Buffalo, et des agents recenseurs ont fait du porte-à-porte pour remplir des questionnaires du recensement. Les efforts étaient axés sur la collecte des données pour les logements faisant partie de l'échantillon du questionnaire détaillé (un logement sur quatre). Pour améliorer davantage la qualité des données, la collecte des données sur le terrain a été effectuée pour les logements dans les secteurs pour lesquels aucune donnée administrative n'était disponible ainsi que pour les logements collectifs. Dans les secteurs où les agents recenseurs avaient préparé une liste des logements et livré des documents du recensement (secteurs de listage/livraison), les données étaient recueillies sur le terrain pour tous les logements.
Traitement
Si une réponse au recensement avait été obtenue des résidents d'un logement, les données de ces répondants avaient la préséance sur toutes données administratives disponibles. Pour les cas restants, pendant le traitement des données et aux fins du calcul des taux de réponse, les données provenant de sources administratives étaient considérées comme des réponses dans la même mesure qu'une réponse directe obtenue par des méthodes de collecte traditionnelles. Les procédures décrites au chapitre 3 ont été appliquées aux données reçues directement des répondants comme aux données provenant de sources administratives.
Qualité des données
Pour les chiffres de population et des logements, les données de la SDR de Wood Buffalo ont été soumises aux mêmes évaluations de la qualité que l'ensemble des données du recensement. Statistique Canada a réalisé une activité supplémentaire préalable à la validation après avoir combiné les données recueillies sur le terrain et les données de sources administratives. Cette étape supplémentaire a été effectuée pour attester que les méthodes de rechange conçues pour cette situation exceptionnelle permettaient d'obtenir des résultats satisfaisants.
Estimation
Pour éviter que l'ajustement de calage n'entraîne un biais dans les estimations, les données de l'échantillon et les données du recensement devaient être comparables sur le plan conceptuel. À Wood Buffalo, le taux de réponse de collecte pour le questionnaire abrégé (2A) était plus faible que celui pour le questionnaire détaillé (2A-L). Cet écart s'explique par l'objectif qui consistait, dans la mesure du possible, à remplir les questionnaires 2A à l'aide de sources de données administratives et à remplir les questionnaires 2A-L à l'aide de données de collecte.
Dans le cas du questionnaire 2A, 27 % des données provenaient de réponses directes, 67 % provenaient de sources de données administratives et 6 % provenaient de l'Enquête sur la classification des logements (ECL) [voir le chapitre 2]. Dans le cas du questionnaire 2A-L, 79 % des données provenaient de réponses directes, 8 % provenaient de sources administratives du questionnaire 2A, 6 % provenaient d'une combinaison de sources administratives du questionnaire 2A et de questionnaires 2A-L imputés, 6 % provenaient de questionnaires imputés 2A au moyen de l'ECL, et 1 %, uniquement de réponses au questionnaire 2A.
Certains concepts du recensement sont plus difficiles à obtenir de sources de données administratives, notamment ceux qui ont trait à la famille, à l'état matrimonial, à l'union libre et au revenu du ménage. Par conséquent, la différence de la contribution des sources de données administratives au questionnaire 2A et au questionnaire 2A-L a entraîné, comme on s'y attendait, des différences importantes entre les chiffres du recensement et les estimations de l'échantillon (avant l'ajustement des poids).
Lorsque des vérifications de la pondération ont été effectuées, on a constaté que la distribution de la pondération était atypique ou bimodale pour Wood Buffalo. On attribue cette situation au fait qu'il y avait davantage de ménages de taille 1 que prévu dans la base de données administratives (une base de données établie par Statistique Canada à l'aide de sources administratives utilisées pour remplir le questionnaire 2A) par rapport aux données provenant du questionnaire détaillé du recensement.
Des écarts considérables ont également été constatés entre les caractéristiques tirées du Registre des Indiens et les données administratives sur l'immigration couplées aux données du recensement. Dans ces cas, les différences étaient en partie dues au fait que ces données peuvent être couplées beaucoup plus facilement à la base de données administratives qu'aux questionnaires retournés, le Registre des Indiens et les données administratives sur l'immigration ayant servi à l'établissement de la base de données administratives.
Pour résoudre ces problèmes, certaines contraintes ont été désactivées pour Wood Buffalo afin d'éviter d'introduire un biais dans les estimations. Les contraintes désactivées portent sur les caractéristiques relatives à la famille, à l'état matrimonial, à l'union libre, à la taille du ménage et au revenu du ménage, et sur les caractéristiques tirées du Registre des Indiens et des données administratives sur l'immigration couplées aux dossiers du recensement.
Le tableau suivant montre les différences entre les chiffres du recensement et les estimations établies selon le questionnaire détaillé pour les caractéristiques qui présentent de grands écarts. Il est à noter que les chiffres du recensement provenaient largement de sources administratives. C'est particulièrement le cas en ce qui a trait aux variables liées au questionnaire 2A-L, comme l'année d'immigration, où les « chiffres du recensement » étaient en fait strictement des données administratives.
Variable/contrainte | Description | Chiffres du recensement (provenant surtout de sources administratives) | Estimations (2A-L) | Différence relative (%) | Différence |
---|---|---|---|---|---|
ADULTCF | Adultes faisant partie d'une famille de recensement | 32 505 | 35 215 | -8,34 | -2 710 |
COMLAW_YE | Personnes vivant en union libre | 5 986 | 7 754 | -29,53 | -1 768 |
COMLAWNO_SEP | Personnes séparées et ne vivant pas en union libre | 1 678 | 1 080 | 35,63 | 598 |
HHINC_P25 | Ménages dont le revenu annuel est inférieur ou égal au 25e percentile de l'ADA | 6 341 | 5 466 | 13,79 | 875 |
LIM_YE | Personnes faisant partie d'une famille économique à faible revenu | 3 134 | 2 462 | 21,44 | 672 |
LONEPAR | Parents seuls | 2 547 | 2 113 | 17,05 | 434 |
NOCLDFAM | Familles de recensement sans enfants | 6 167 | 7 034 | -14,05 | -867 |
NOINEFAM | Personnes dans un ménage ne faisant pas partie d'une famille économique | 13 714 | 10 202 | 25,61 | 3 512 |
NOTINFAM | Personnes ne faisant pas partie d'une famille de recensement | 17 342 | 12 875 | 25,76 | 4 467 |
HHSIZE1 | Ménages de 1 personne | 5 879 | 4 646 | 20,98 | 1 233 |
HHSIZEGE6 | Ménages de 6 personnes et plus | 1 450 | 1 096 | 24,40 | 354 |
IR_LINK_YE | Personnes qui ont pu être appariées au Registre des Indiens | 2 261 | 1 853 | 18,05 | 408 |
YRIMG1_1981 | Personnes dont l'année d'immigration est entre 1981 et 1990 | 634 | 548 | 13,55 | 86 |
YRIMG1_1991 | Personnes dont l'année d'immigration est entre 1991 et 2000 | 1 934 | 1 612 | 16,65 | 322 |
YRIMG1_2001 | Personnes dont l'année d'immigration est entre 2001 et 2010 | 5 692 | 5 092 | 10,54 | 600 |
ADA = Aire de diffusion agrégée. Source : Statistique Canada, échantillon du questionnaire détaillé du Recensement de 2016. |
Ce tableau présente les contraintes ayant été utilisées dans le processus de calage pour Wood Buffalo et celles qui en ont été exclues. Une valeur de « Oui » signifie que la variable a été utilisée dans le processus, tandis qu'une valeur de « Non » indique que la variable en a été exclue.
Variable/contrainte | Exclues à Wood Buffalo |
---|---|
ADULTCF | Non |
AGE00_14 | Oui |
AGE14 | Oui |
AGE15_24 | Oui |
AGE19 | Oui |
AGE24 | Oui |
AGE25_34 | Oui |
AGE29 | Oui |
AGE34 | Oui |
AGE35_44 | Oui |
AGE39 | Oui |
AGE4 | Oui |
AGE44 | Oui |
AGE45_54 | Oui |
AGE49 | Oui |
AGE54 | Oui |
AGE55_64 | Oui |
AGE59 | Oui |
AGE64 | Oui |
AGE65PL | Oui |
AGE74 | Oui |
AGE75PL | Oui |
AGE9 | Oui |
APTLT5 | Oui |
CHILD | Non |
CHILDFAM | Non |
COMLAW_YE | Non |
COMLAWNO_DIV | Non |
COMLAWNO_OTHERS | Non |
COMLAWNO_SEP | Non |
COMLAWNO_SINGLE | Non |
COMLAWNO_WID | Non |
COMLAWYE_MARRIED | Non |
COUPLE | Non |
EMPIN_GT50 | Oui |
EMPIN_LE50 | Oui |
EMPIN_P0 | Oui |
EMPIN_P100 | Oui |
EMPIN_P25 | Oui |
EMPIN_P50 | Oui |
EMPIN_P75 | Oui |
FEMALE | Oui |
FEMALEGE15 | Oui |
FEMALELT15 | Oui |
HHADACSD (ADA) | Oui |
HHINC_GT50 | Non |
HHINC_LE50 | Non |
HHINC_P100 | Non |
HHINC_P25 | Non |
HHINC_P50 | Non |
HHINC_P75 | Non |
HHSIZE1 | Non |
HHSIZE2 | Non |
HHSIZE3 | Non |
HHSIZE4 | Non |
HHSIZE5 | Non |
HHSIZEGE5 | Non |
HHSIZEGE6 | Non |
INEFAM | Non |
IR_LINK_NO | Non |
IR_LINK_YE | Non |
LIM_NO | Non |
LIM_YE | Non |
LONEPAR | Non |
MALE | Oui |
MALEGE15 | Oui |
MALELT15 | Oui |
MARRIED | Oui |
NOCLDFAM | Non |
NOINEFAM | Non |
NOTINFAM | Non |
OLN_BI | Oui |
OLN_EN | Oui |
OLN_FR | Oui |
OLN_NO | Oui |
POBG2_1 | Non |
POBG2_10 | Non |
POBG2_11 | Non |
POBG2_12 | Non |
POBG2_13 | Non |
POBG2_14 | Non |
POBG2_15 | Non |
POBG2_16 | Non |
POBG2_17 | Non |
POBG2_18 | Non |
POBG2_19 | Non |
POBG2_2 | Non |
POBG2_20 | Non |
POBG2_21 | Non |
POBG2_22 | Non |
POBG2_23 | Non |
POBG2_24 | Non |
POBG2_25 | Non |
POBG2_26 | Non |
POBG2_27 | Non |
POBG2_28 | Non |
POBG2_29 | Non |
POBG2_3 | Non |
POBG2_30 | Non |
POBG2_31 | Non |
POBG2_32 | Non |
POBG2_33 | Non |
POBG2_34 | Non |
POBG2_35 | Non |
POBG2_36 | Non |
POBG2_37 | Non |
POBG2_38 | Non |
POBG2_39 | Non |
POBG2_4 | Non |
POBG2_40 | Non |
POBG2_41 | Non |
POBG2_42 | Non |
POBG2_43 | Non |
POBG2_44 | Non |
POBG2_45 | Non |
POBG2_46 | Non |
POBG2_47 | Non |
POBG2_48 | Non |
POBG2_49 | Non |
POBG2_5 | Non |
POBG2_50 | Non |
POBG2_51 | Non |
POBG2_54 | Non |
POBG2_55 | Non |
POBG2_56 | Non |
POBG2_57 | Non |
POBG2_58 | Non |
POBG2_59 | Non |
POBG2_6 | Non |
POBG2_60 | Non |
POBG2_61 | Non |
POBG2_62 | Non |
POBG2_63 | Non |
POBG2_64 | Non |
POBG2_65 | Non |
POBG2_66 | Non |
POBG2_67 | Non |
POBG2_68 | Non |
POBG2_69 | Non |
POBG2_7 | Non |
POBG2_70 | Non |
POBG2_71 | Non |
POBG2_8 | Non |
POBG2_9 | Non |
POBG3_1 | Non |
POBG3_10 | Non |
POBG3_12 | Non |
POBG3_14 | Non |
POBG3_15 | Non |
POBG3_16 | Non |
POBG3_17 | Non |
POBG3_18 | Non |
POBG3_19 | Non |
POBG3_2 | Non |
POBG3_20 | Non |
POBG3_21 | Non |
POBG3_22 | Non |
POBG3_3 | Non |
POBG3_4 | Non |
POBG3_5 | Non |
POBG3_6 | Non |
POBG3_7 | Non |
POBG3_8 | Non |
POBG3_9 | Non |
PPADACSD (ADA) | Oui |
SNGLDET | Oui |
TOTCFAM | Non |
TOTHHLD | Oui |
TOTPERS | Oui |
TPERGE15 | Oui |
TPERLT15 | Oui |
YRIMD_1900 | Non |
YRIMD_1981 | Non |
YRIMD_1986 | Non |
YRIMD_1991 | Non |
YRIMD_1996 | Non |
YRIMD_2001 | Non |
YRIMD_2006 | Non |
YRIMD_2011 | Non |
YRIMG1_1900 | Non |
YRIMG1_1981 | Non |
YRIMG1_1991 | Non |
YRIMG1_2001 | Non |
YRIMG1_2011 | Non |
Notes : Oui indique que la variable a été utilisée au cours du processus. Non indique que la variable a été exclue du processus. |
- Date de modification :