SEARCH

SEARCH BY CITATION

Keywords:

  • Generalized linear model;
  • SCAD penalty;
  • ROC curve;
  • selection and combination of biomarker;
  • MSC 2010: Primary 62H30;
  • secondary 62P10

Abstract

Based on the SCAD penalty and the area under the ROC curve (AUC), we propose a new method for selecting and combining biomarkers for disease classification and prediction. The proposed estimator for the combination of the biomarkers has an oracle property; that is, the estimated combination of the biomarkers performs as well as it would have been if the biomarkers significantly associated with the outcome had been known in advance, in terms of discriminative power. The proposed estimator is computationally feasible, n1/2-consistent and asymptotically normal. Simulation studies show that the proposed method performs better than existing methods. We illustrate the proposed methodology in the acoustic startle response study. The Canadian Journal of Statistics 39: 324–343; 2011 © 2011 Statistical Society of Canada

En nous basant sur une pénalité des écarts absolus avec coupure lisse (SCAD) et l'aire sous la courbe d'efficacité du récepteur (AUC), nous proposons une nouvelle méthode pour sélectionner et combiner les biomarqueurs pour la classification de maladies et leur prédiction. L'estimateur proposé pour la combinaison de biomarqueurs possède des propriétés d'oracle, c'est-à-dire que la combinaison estimée de biomarqueurs performe aussi bien, en terme de puissance discriminante, que si les biomarqueurs associés significativement avec le résultat avaient été connus à l'avance. L'estimateur proposé est calculable en pratique, convergent en ordre de racine de n et asymptotiquement normal. Des études de simulation montrent que l'estimateur proposé performe mieux que les méthodes déjà existantes. Nous illustrons cette méthodologie à l'aide d'une étude sur le réflexe de sursaut auditif. La revue canadienne de statistique 39: 324–343; 2011 © 2011 Société statistique du Canada