SEARCH

SEARCH BY CITATION

Keywords:

  • Capture-recapture;
  • discrete covariate;
  • erroneous enumeration;
  • kernel smoothing;
  • model bias;
  • population size estimation

Résumé

Nous étudions des méthodes paramétriques et non paramétriques d'évaluation de la précision et de la couverture d'un recensement fondé sur un double système d'enquêtes. Deux approches paramétriques, la post-stratification et la régression logistique, sont considérées; ces approches ont été ou seront mises en pratique dans le cadre du double système d'enquêtes utilisé pour le recensement des Etats-Unis. Nous montrons que ces méthodes sont généralement biaisées lorsque le modèle sur lequel elles se fondent est incorrectement spécifié. Nous étudions ensuite une approche de post-stratification locale fondée sur un estimateur à noyau des fonctions d'énumération du recensement. Nous illustrons le fait que cette approche non paramétrique évite les risques liés aux erreurs de spécification des modèles utilisés, et converge sous des conditions assez générales. Les performances des estimateurs qui en résultent sont évaluées de façon numérique à partir de simulations et d'une analyse empirique fondée sur les résultats de l'enquête post-censitaire du recensement des Etats-Unis de 2000.

Summary

We study parametric and non-parametric approaches for assessing the accuracy and coverage of a population census based on dual system surveys. The two parametric approaches being considered are post-stratification and logistic regression, which have been or will be implemented for the US Census dual system surveys. We show that the parametric model-based approaches are generally biased unless the model is correctly specified. We then study a local post-stratification approach based on a non-parametric kernel estimate of the Census enumeration functions. We illustrate that the non-parametric approach avoids the risk of model mis-specification and is consistent under relatively weak conditions. The performances of these estimators are evaluated numerically via simulation studies and an empirical analysis based on the 2000 US Census post-enumeration survey data.