SEARCH

SEARCH BY CITATION

Keywords:

  • Covariate-missing;
  • length biased sampling;
  • likelihood;
  • missing at random;
  • misspecification;
  • robustness
  • Primary 62E20;
  • secondary 62M10

Abstract

It is well known that the score function is the optimal estimating function among all regular unbiased estimating functions (Godambe, 1960). In the presence of incomplete data such as missing data or length biased sampling data, Horvitz and Thompson's (1952) method is an effective way of eliminating the possible bias induced by using complete data only. In this article, we show that the inverse weighted Horvitz and Thompson score estimating function is not optimal in the presence of incomplete data. By using Godambe's estimating function theory, we can identify the optimal estimating function in this situation. In the case of the accelerated failure time model with length bias sampling data, the optimal estimating function can produce an unbiased estimator for the slope parameter even when the underlying density function is misspecified. Simulation studies show that the estimate derived from the optimal estimating function can be substantially better than the estimate derived from the inverse weighted score estimating function. The Canadian Journal of Statistics 39: 510–518; 2011 © 2011 Statistical Society of Canada

Il est hien connu que la fonction score est la fonction d'estimation optimale parmi toutes les fonctions d'estimation sans biais régulières (Godambe, 1960). En présence de données incomplètes telles que des données manqnantes on ayant un biais éehantillonnal du à la longueur, la méthode d'Horvitz et Thompson (1952) est une façon efficace d'éliminer le biais potentiellement induit par l'utilisation de seulement les données completes. Dans cet article, nous montrons que la fonction d'estimation score inverse d'Horvitz-Thompson pondérée n'est pas optimale en présence de données incomplètes. En utilisant la théorie de Godambe sur les fonctions d'estimation, nous pouvons identifier la fonction d'estimation optimale dans cette situation. Dans le cas des modèles à temps de panne accélérés avec des données ayant un biais échantillonnal du à la longueur, la fonction d'estimation optimale peut conduire à un estimateur sans biais pour la pente même si la densité sous-jacente est mal spécifiée. Des études de simulations montrent que les estimés obtenus à partir de la fonction d'estimation optimale peuvent être substantiellement meilleurs que ceux obtenus à partir de l'inverser de la fonction d'estimation score pondérée. La revue canadienne de statistique 39:510–518;2011 © 2011 Société statistique du Canada