Three Factors to Signal Non-Response Bias With Applications to Categorical Auxiliary Variables

Authors


Summary

Non-response causes bias in survey estimates. The unknown bias can be reduced, for example as in this paper by the use of a calibration estimator built on powerful auxiliary information. Still, some bias will always remain. A bias reduction indicator is proposed and expressed as a product of three factors reflecting familiar statistical ideas. These factors provide a useful perspective on the components that constitute non-response bias in estimates. To illustrate the indicator, we focus on the important case with information defined by one or more categorical auxiliary variables, each expressed by two or more properties or traits. Together, the auxiliary variables may represent a large number of traits, more or less important for bias reduction. An examination of the three factors of the bias reduction indicator brings the insight that the ultimate auxiliary vector for calibration need not or should not contain all available traits; some are unimportant or detrimental to bias reduction. The question becomes one of selection of traits, not of complete auxiliary variables. Empirical examples are given, and a stepwise procedure for selecting important traits is proposed.

Résumé

La nonréponse est la cause d’un biais inconnu dans les estimations d’une enquête par sondage. Il est possible de réduire ce biais, sinon entièrement au moins dans une mesure importante, en utilisant un estimateur par calage, basé sur un vecteur auxiliaire efficace. Un indicateur de réduction de biais est proposé. Une analyse montre qu’il est composé de trois facteurs, correspondant chacun à une notion statistique simple et intuitive. L’article examine en plus de détail le cas particulier important où les variables auxiliaires sont catégoriques, chacune comportant plusieurs modalités ou caractéristiques. Le nombre total de caractéristiques peut ainsi être élevé. Une conséquence de la factorisation est que le vecteur auxiliaire ultimement retenu ne contiendra pas nécessairement toutes les caractéristiques disponibles. Certaines d’entre elles risquent plutôt de nuire à l’objectif d’une réduction du biais. Les conclusions sont illustrées par des exemples empiriques, et une procédure de sélection par étapes est proposée.

Ancillary