SEARCH

SEARCH BY CITATION

Keywords:

  • Conditional likelihood;
  • efficiency;
  • empirical distribution;
  • influence function;
  • log-odds ratio;
  • missing data;
  • MSC 2000: Primary 62G05;
  • secondary 62-07

Abstract

Matched case–control designs are commonly used in epidemiological studies for estimating the effect of exposure variables on the risk of a disease by controlling the effect of confounding variables. Due to retrospective nature of the study, information on a covariate could be missing for some subjects. A straightforward application of the conditional logistic likelihood for analyzing matched case–control data with the partially missing covariate may yield inefficient estimators of the parameters. A robust method has been proposed to handle this problem using an estimated conditional score approach when the missingness mechanism does not depend on the disease status. Within the conditional logistic likelihood framework, an empirical procedure is used to estimate the odds of the disease for the subjects with missing covariate values. The asymptotic distribution and the asymptotic variance of the estimator when the matching variables and the completely observed covariates are categorical. The finite sample performance of the proposed estimator is assessed through a simulation study. Finally, the proposed method has been applied to analyze two matched case–control studies. The Canadian Journal of Statistics 38: 680–697; 2010 © 2010 Statistical Society of Canada

Des designs cas-contrôle appariés sont souvent utilisés dans des études épidémiologiques afin d'estimer l'effet des variables d'exposition sur le risque d'une maladie en contrôlant l'effet des variables parasites. Par la nature rétrospective de l'étude, l'information sur les covariables peut être manquante chez certains sujets. L'application directe de la vraisemblance logistique conditionnelle pour analyser les données cas-contrôle appariées avec des covariables manquantes partiellement peut conduire à des estimations inefficaces des paramètres. L'auteur propose une méthode robuste pour traiter ce problème en utilisant une approche par score conditionnel estimé lorsque le mécanisme responsable des valeurs manquantes ne dépend pas du statut de la maladie. Dans le cadre de la vraisemblance logistique conditionnelle, il utilise une procédure empirique pour estimer les cotes de la maladie pour les sujets ayant des valeurs de covariables manquantes. L'auteur obtient aussi la distribution et la variance asymptotiques de l'estimateur lorsque les variables d'appariement et les covariables complètement observées sont catégorielles. La performance pour de petits échantillons de l'estimateur proposé est évaluée à l'aide d'une étude de simulations. Finalement, il applique la méthode proposée à l'analyse de deux études cas-contrôle appariés. La revue canadienne de statistique 38: 680–697; 2010 © 2010 Société statistique du Canada