Proper and Improper Multiple Imputation

Authors

  • Søren Feodor Nielsen

    1. Department of Applied Mathematics and Statistics, University of Copenhagen, Universitetsparken 5, DK-2100 København Ø, Denmark
    Search for more papers by this author

Summary

Multiple imputation has become viewed as a general solution to missing data problems in statistics. However, in order to lead to consistent asymptotically normal estimators, correct variance estimators and valid tests, the imputations must be proper. So far it seems that only Bayesian multiple imputation, i.e. using a Bayesian predictive distribution to generate the imputations, or approximately Bayesian multiple imputations has been shown to lead to proper imputations in some settings. In this paper, we shall see that Bayesian multiple imputation does not generally lead to proper multiple imputations. Furthermore, it will be argued that for general statistical use, Bayesian multiple imputation is inefficient even when it is proper.

Résumé

On a pris l'habitude de considérer l'imputation multiple comme une solution générale au problème des données manquantes en statistique. Cependant, afin d'obtenir des estimateurs cohérents et asymptotiquement normaux, des estimations correctes de la variance et des tests valides, il faut que les imputations soient approprées. Jusqu'alors, il semble que c'est seulement dans le cas de l'imputation multiple bayésienne, c'está-dire utilisant une distribution prédictive bayésienne pour générer les imputations, ou de ses approximations, que l'on a montré que l'on obtenait des imputations appropriées dans certains cas particuliers. Dans cet article, on montre qu'en général l'imputation multiples bayésienne ne conduit pas à des imputations multiples appropriées. De plus, on argumente l'idée selon laquelle, de manière générale, l'imputation multiple bayésienne est inefficace mêeme si elle approprée.

Ancillary