Brosser un portrait du Canada : le Recensement de la population de 2021
6. Traitement des données

Passer au texte

Début du texte

Statistique Canada s’engage à veiller à ce que des données de grande qualité sur les collectivités canadiennes d’un océan à l’autre soient facilement accessibles, disponibles dans une gamme de supports et publiées dans les plus brefs délais.

Pour y parvenir, les millions de questionnaires du recensement reçus par voie électronique et par courrier sont assujettis à une série d’étapes de traitement soigneusement conçues et étroitement surveillées. La conception statistique, l’assurance de la qualité et la validation sous-tendent chaque étape de collecte, de traitement et d’analyse des données.

Réception et enregistrement des questionnaires

Postes Canada assure l’enregistrement initial des questionnaires papier remplis en numérisant les codes à barres par la fenêtre transparente des enveloppes-réponses. Il importe de noter que les employés de Postes Canada n’ont pas accès aux réponses indiquées dans ces questionnaires. Cette étape importante permet de veiller à ce que les employés du recensement puissent effectuer un suivi en temps opportun auprès des ménages non répondants.

Les questionnaires scellés sont envoyés au Centre des opérations des données (COD) de Statistique Canada, où l’enregistrement est complété.

Les questionnaires soumis en ligne par des répondants ou remplis par téléphone avec l’aide d’un téléphoniste de l’Assistance téléphonique du recensement sont enregistrés automatiquement dans le système de traitement.

Préparation des questionnaires papier

Les questionnaires papier sont retirés des enveloppes par des employés de Statistique Canada et préparés aux fins de numérisation.

Découpage : Les livrets des questionnaires sont séparés en feuilles individuelles et mis en lots en vue de leur numérisation.

Transcription : Les réponses des questionnaires qui ne satisfont pas aux exigences de la numérisation sont retranscrites dans un nouveau questionnaire du même genre, puis les questionnaires sont numérisés.

Numérisation : Au moyen de lecteurs ultrarapides, les questionnaires sont convertis en images numériques.

Saisie des données

Saisie automatisée des données : Les technologies de reconnaissance optique des marques et de reconnaissance optique des caractères sont utilisées pour extraire les données des répondants.

Une saisie au clavier est effectuée lorsque le système de reconnaissance automatisée détecte des incohérences dans les réponses. Par exemple, des incohérences peuvent survenir si l’écriture de la personne est difficile à déchiffrer.

Assurance de la qualité : L’organisme effectue un contrôle de la qualité rigoureux des questionnaires papier afin d’atteindre les objectifs de qualité préétablis :

Contrôle de la saisie des données : Si la technologie de saisie automatisée des données décèle des incohérences dans les données, les réponses sont envoyées à un employé du recensement pour vérification et correction. Toute différence dans les réponses est envoyée à l’arbitrage pour décision définitive afin d’assurer la qualité de saisie.

Vérification à la sortie : Une fois que les données des questionnaires papier sont traitées, ces derniers sont retirés du système. La vérification à la sortie est un processus d’assurance de la qualité visant à vérifier que les images et les données saisies sont de qualité suffisante et que le questionnaire papier n’est plus nécessaire pour la saisie au clavier.

Contrôles

Un processus interactif de contrôle manuel et/ou automatisé est effectué afin de déterminer et de résoudre les problèmes et les incohérences possibles au fur et à mesure que les questionnaires papier sont saisis et que les questionnaires en ligne sont reçus. Le contrôle d’intégralité automatisé demande une vérification de l’intégralité et de la cohérence.

Contenu vide et minimum : Un questionnaire qui ne comporte aucune information ou dont le nombre de questions répondues n’est pas suffisant est retourné afin que l’on puisse procéder à la collecte des données pour le suivi des cas de non-réponse par les employés du recensement.

Contrôles de couverture : Le nombre de résidents habituels dans chaque ménage (ou logement collectif) est déterminé, et le type de logement collectif est confirmé ou reclassé.

Suivi des questionnaires rejetés au contrôle

Cette étape de traitement permet de déterminer les questions du questionnaire abrégé qui nécessitent des précisions quant à la couverture ou au contenu. La vérification de la couverture fait en sorte que les incohérences possibles concernant les personnes incluses dans un ménage sont résolues. Au besoin, les opérateurs des centres d’appels régionaux communiquent avec les ménages pour s’assurer que les personnes appropriées sont dénombrées et pour obtenir les renseignements manquants. Les données sont retournées au COD, puis réintégrées dans le système aux fins de traitement subséquent (p. ex. le codage).

Codage

Durant le processus de codage, les réponses écrites sont converties en codes numériques avant d’être totalisées. Un code numérique est attribué aux réponses écrites provenant de fichiers de référence, d’ensembles de codes et de classifications types de Statistique Canada. Les premières étapes du codage sont automatisées. Pour le processus automatisé d’appariement, les fichiers de référence sont créés à l’aide des véritables réponses aux recensements antérieurs et sont mis à jour à l’aide de nouveaux codes pour le recensement actuel. Des codeurs ayant reçu une formation particulière de même que des experts s’occupent des cas qui ne peuvent pas faire l’objet d’un codage automatique.

En 2016, plus de 67,8 millions de réponses écrites ont été codées. Parmi ces réponses, environ 87 % ont été codées automatiquement.

Chargement des données

Une fois que les données ont passé toutes les étapes de traitement au COD, elles sont chargées dans la base de données des réponses. Les données sont chargées en trois phases :

Contrôle et imputation

Inévitablement, les données recueillies dans le cadre d’une enquête ou d’un recensement donnent lieu à des omissions ou des incohérences. Ces erreurs peuvent être attribuables au fait que le répondant a sauté une question ou à des erreurs survenues lors du traitement. Le contrôle final vise à détecter les erreurs, alors que l’imputation permet de les corriger.

À l’étape du contrôle et de l’imputation, les réponses non valides ou manquantes sont ajustées et les données sont corrigées. Les méthodes d’imputation de Statistique Canada correspondent aux normes statistiques reconnues à l’échelle internationale pour les applications d’imputation de grande envergure, comme un recensement.

Dans le cadre de la recherche de Statistique Canada, l’organisme envisage d’utiliser davantage de données administratives dans ses processus d’imputation.

Accès aux dossiers du recensement

L’accès aux dossiers historiques du recensement fait l’objet de discussions publiques depuis de nombreuses décennies et a suscité un intérêt considérable de la part des généalogistes, des historiens et des archivistes.

En 2005, à la suite de vastes activités de mobilisation auprès des Canadiens, le gouvernement du Canada a modifié la Loi sur la statistique afin d’éliminer les ambiguïtés concernant le caractère de confidentialité des dossiers des recensements antérieurs, tout en assurant la diffusion des dossiers des recensements à venir.

La Loi sur la statistique a été modifiée pour permettre la diffusion des dossiers historiques du recensement de 1911 à 2001. De plus, les renseignements qui seront obtenus lors de chaque recensement après 2021 devront être divulgués à Bibliothèque et Archives Canada (BAC) dans les 92 années suivant la tenue de la collecte du recensement (p. ex. les dossiers du Recensement de 2001 seront divulgués en 2093).

En ce qui concerne les recensements de 2006, 2011 et 2016, les Canadiens pouvaient choisir si leurs dossiers du recensement étaient diffusés publiquement après 92 ans. On a demandé à la personne qui répondait au questionnaire du recensement de consulter tous les membres du ménage inclus dans le questionnaire avant de répondre à la question sur le consentement.

Il relève de BAC de rendre disponibles les dossiers du recensement. Cette décision concorde avec l’engagement de Statistique Canada à fournir des données ouvertes et accessibles. Les chercheurs, les historiens et les généalogistes ont besoin de ces renseignements pour pouvoir effectuer des recherches et aider les Canadiens à mieux comprendre leur passé.

Tous les dossiers du recensement, jusqu’au Recensement de 1916 inclusivement, sont accessibles en ligne ou sous forme de copies microfilmées auprès de BAC. Les dossiers du Recensement de 1921 ont également été diffusés au public (au moyen du site www.ancestry.ca, par BAC).

Conservation des dossiers du recensement

Statistique Canada, en consultation avec BAC, détermine les meilleurs moyens de conserver les dossiers du recensement.

Des copies microfilmées des questionnaires des recensements de 1921 à 2001 sont conservées par Statistique Canada.

Les données des recensements de 2006, 2011 et 2016, ainsi que de l’Enquête nationale auprès des ménages de 2011 (qui a remplacé le questionnaire détaillé du recensement en 2011) n’ont pas été microfilmées. Les questionnaires papier ont été convertis en images numériques, et une base de données d’archives comprenant toutes les réponses (y compris celles soumises par Internet) a été créée. Les questionnaires papier originaux ont été déchiquetés et détruits.

En 2021, conformément aux lignes directrices en matière de sécurité du gouvernement, les questionnaires papier originaux du Recensement de la population seront déchiquetés une fois le traitement des données terminé.

Date de modification :