Fitting regression models with response-biased samples



This paper extends the work in Lawless, Kalbfleisch, & Wild (1999) on fitting regression models with response-biased samples, that is, samples where some or all the covariates are missing for some units and the probability that this happens depends in part on the value of the reponse of that unit. In general, the resulting likelihood depends on the distribution of the covariates but we are only interested in methods that do not involve modelling this distribution. We look at a variety of methods based on estimating equations, at the relationship of these methods to semi-parametric efficient methods in cases where such methods exist, and show ways of obtaining efficiency gains that can sometimes be dramatic. The Canadian Journal of Statistics 39: 519–536; 2011 © 2011 Statistical Society of Canada


Cet article généralise les travaux de Lawless, Kalbfleisch et Wild (1999) sur l'ajustement de modèles de régression pour des échantillons avec biais dû a la réponse, c'est-à-dire des échantillons pour lesquels quelques ou toutes les covariables sont manquantes pour quelques unites et la probabilité que cela se produise dépend de la valeur de la variable réponse de ces unités. En général, la vraisemblance résultante depend de la distribution des covariables, mais nous sommes uniquement intéressés aux méthodes qui n'impliquent pas la modélisation de cette distribution. Nous considérons une variété de méthodes basées sur les équations d'estimation et à la relation entre ces méthodes et les méthodes semi-paramétriques efficaces lorsque celles-ci existent. Nous montrons des façons d'obtenir des gains d'efficacité qui peuvent parfois être très importants. La revue canadienne de statistique 39:519–536;2011 © 2011 Société statistique du Canada