SEARCH

SEARCH BY CITATION

Keywords:

  • Distribution estimation;
  • exponential tilting;
  • non-ignorable missing;
  • nonparametric regression;
  • Quantile estimation
  • MSC 2010: Primary 62F12;
  • secondary 62F35

Abstract

This paper considers several robust estimators for distribution functions and quantiles of a response variable when some responses may not be observed under the non-ignorable missing data mechanism. Based on a particular semiparametric regression model for non-ignorable missing response, we propose a nonparametric/semiparametric estimation method and an augmented inverse probability weighted imputation method to estimate the distribution function and quantiles of a response variable. Under some regularity conditions, we derive asymptotic properties of the proposed distribution function and quantile estimators. Two empirical log-likelihood functions are also defined to construct confidence intervals for distribution function of a response variable. Simulation studies show that our proposed methods are robust. In particular, the semiparametric estimator is more efficient than the nonparametric estimator, and the inverse probability weighted imputation estimator is bias-corrected. The Canadian Journal of Statistics 41: 575–595; 2013 © 2013 Statistical Society of Canada

Résumé

Cet article porte sur l'estimation robuste de la fonction de répartition et des quantiles d'une variable réponse lorsque certaines réponses ne sont pas observables dans le cadre d'un mécanisme de données manquantes non ignorables. En se basant sur un modèle de régression semi-paramétrique particulier adapté aux données manquantes non ignorables, les auteurs proposent une méthode d'estimation non paramétrique ou semi-paramétrique, ainsi qu'une méthode d'imputation pondérée par la probabilité inverse augmentée pour l'estimation de la fonction de répartition et des quantiles d'une variable réponse. Sous certaines conditions de régularité, les auteurs obtiennent des propriétés asymptotiques pour les estimateurs de la fonction de répartition et des quantiles proposés. Ils définissent également deux fonctions de log-vraisemblance empiriques permettant de construire des intervalles de confiance pour la fonction de répartition d'une variable réponse. À l'aide d’études de simulations, les auteurs montrent que les méthodes proposées sont robustes. Il s'avère par ailleurs que l'estimateur semi-paramétrique est plus efficace que l'estimateur non paramétrique, et que l'estimateur pondéré par la probabilité inverse augmentée comporte une correction pour le biais. La revue canadienne de statistique 41: 575–595; 2013 © 2013 Société statistique du Canada