SEARCH

SEARCH BY CITATION

Keywords:

  • Bootstrap;
  • censored data;
  • constrained NPMLE;
  • Kaplan–Meier estimator;
  • maximum constrained NPMLE;
  • order restriction;
  • MSC 2010: Primary 62N02;
  • secondary 62G30

Abstract

This paper considers estimators of survivor functions subject to a stochastic ordering constraint based on right censored data. We present the constrained nonparametric maximum likelihood estimator (C-NPMLE) of the survivor functions in one-and two-sample settings where the survivor distributions could be discrete or continuous and discuss the non-uniqueness of the estimators. We also present a computationally efficient algorithm to obtain the C-NPMLE. To address the possibility of non-uniqueness of the C-NPMLE of equation image when equation image, we consider the maximum C-NPMLE (MC-NPMLE) of equation image. In the one-sample case with arbitrary upper bound survivor function equation image, we present a novel and efficient algorithm for finding the MC-NPMLE of equation image. Dykstra (1982) also considered constrained nonparametric maximum likelihood estimation for such problems, however, as we show, Dykstra's method has an error and does not always give the C-NPMLE. We corrected this error and simulation shows improvement in efficiency compared to Dykstra's estimator. Confidence intervals based on bootstrap methods are proposed and consistency of the estimators is proved. Data from a study on larynx cancer are analysed to illustrate the method. The Canadian Journal of Statistics 40: 22–39; 2012 © 2012 Statistical Society of Canada

Cet article considère les estimateurs des fonctions de survie basés sur les données censurées à droite soumises à une contrainte d'ordonnancement stochastique. Nous présentons un estimateur du maximum de vraisemblance non paramétrique contraint (C-NPMLE) des fonctions de survie dans le contexte d'un ou de deux échantillons lorsque la distribution de survie peut être discrète ou continue. De plus, nous discutons de la non-identifiabilité des estimateurs. Nous proposons aussi un algorithme, efficace au plan des calculs, pour obtenir le C-NPMLE. Pour considérer la possibilité de la non-identifiabilité du C-NPMLE de equation image lorsque equation image, nous considérons le C-NPMLE maximum (MC-NPMLE) de equation image. Lorsque nous avons qu'un seul échantillon et une borne supérieure arbitraire equation image pour la fonction de survie, nous présentons un algorithme nouveau et efficace pour trouver le MC-NPMLE de equation image. Dykstra (1982) a aussi considéré l'estimation par maximum de vraisemblance non paramétrique pour de tels problèmes, mais, comme nous le démontrons, il y a une erreur dans la méthode de Dykstra et elle ne conduit pas toujours à un C-NPMLE. Nous corrigeons cette erreur et des simulations montrent une amélioration de l'efficacité par rapport à l'estimateur de Dykstra. Des intervalles de confiance basés sur des méthodes de rééchantillonnage sont proposés et nous démontrons la cohérence de nos estimateurs. Notre méthode est illustrée à l'aide de données provenant d'une étude sur le cancer du larynx. La revue canadienne de statistique 40: 22–39; 2012 © 2012 Société statistique du Canada