SEARCH

SEARCH BY CITATION

Keywords:

  • Bootstrap;
  • covariate-adjusted ROC curve;
  • density ratio model;
  • diagnostic test;
  • logistic regression model;
  • semiparametric likelihood;
  • sensitivity;
  • specificity
  • Primary 60G05;
  • secondary 60G09, 60P10

Abstract

In medical diagnostic testing problems, the covariate adjusted receiver operating characteristic (ROC) curves have been discussed recently for achieving the best separation between disease and control. Due to various restrictions such as cost, the availability of patients, and ethical issues quite frequently only limited information is available. As a result, we are unlikely to have a large enough overall sample size to support reliable direct estimations of ROCs for all the underlying covariates of interest. For example, some genetic factors are less commonly observable compared with others. To get an accurate covariate adjusted ROC estimation, novel statistical methods are needed to effectively utilize the limited information. Therefore, it is desirable to use indirect estimates that borrow strength by employing values of the variables of interest from neighbouring covariates. In this paper we discuss two semiparametric exponential tilting models, where the density functions from different covariate levels share a common baseline density, and the parameters in the exponential tilting component reflect the difference among the covariates. With the proposed models, the estimated covariate adjusted ROC is much smoother and more efficient than the nonparametric counterpart without borrowing information from neighbouring covariates. A simulation study and a real data application are reported. The Canadian Journal of Statistics 40: 569–587; 2012 © 2012 Statistical Society of Canada

Pour les problèmes de diagnostics médicaux, il a été montré récemment que la courbe d'efficacité du récepteur (ROC) ajustée pour les covariables permet d'obtenir la meilleure séparation entre la maladie et le contrôle. Ë cause de différentes restrictions telles que le coût, la disponibilité des patients et des raisons éthiques, seule une information partielle est disponible. Conséquemment, il y a peu de chance d'avoir suffisamment d'observations pour estimer la ROC directement pour toutes les covariables d'intérêt. Par exemple, certains facteurs génétiques sont moins fréquemment observés que d'autres. Pour obtenir une estimation précise de la ROC ajustée pour les covariables, plusieurs nouvelles méthodes statistiques sont nécessaires afin d'utiliser efficacement l'information partielle. Il est donc souhaitable d'utiliser des estimateurs indirects qui utilisent l'information contenue dans les variables d'intérêt des covariables avoisinantes. Dans cet article, nous présentons deux modèles semi-paramétriques de nivellement exponentiel. Pour ces modèles, les fonctions de densités des différents niveaux des covariables partagent la même densité de base et les paramètres des composantes du nivellement exponentiel représentent la différence entre les covariables. Avec les modèles proposés, la ROC ajustée pour les covariables estimées est beaucoup plus lisse et plus efficace que sa contrepartie non paramétrique qui n'utilise pas l'information des covariables avoisinantes. Une étude de simulation et une application de vraies données sont aussi discutées. La revue canadienne de statistique 40: 569–587; 2012 © 2012 Société statistique du Canada