SEARCH

SEARCH BY CITATION

Keywords:

  • Censoring;
  • evidential analysis;
  • law of likelihood;
  • likelihood paradigm;
  • missing data;
  • partial identification

Summary

According to the law of likelihood, statistical evidence is represented by likelihood functions and its strength measured by likelihood ratios. This point of view has led to a likelihood paradigm for interpreting statistical evidence, which carefully distinguishes evidence about a parameter from error probabilities and personal belief. Like other paradigms of statistics, the likelihood paradigm faces challenges when data are observed incompletely, due to non-response or censoring, for instance. Standard methods to generate likelihood functions in such circumstances generally require assumptions about the mechanism that governs the incomplete observation of data, assumptions that usually rely on external information and cannot be validated with the observed data. Without reliable external information, the use of untestable assumptions driven by convenience could potentially compromise the interpretability of the resulting likelihood as an objective representation of the observed evidence. This paper proposes a profile likelihood approach for representing and interpreting statistical evidence with incomplete data without imposing untestable assumptions. The proposed approach is based on partial identification and is illustrated with several statistical problems involving missing data or censored data. Numerical examples based on real data are presented to demonstrate the feasibility of the approach.

Résumé

Selon la loi des vraisemblances, les preuves statistiques sont représentées par des fonctions de vraisemblance et leur solidité est mesurée par des rapports de vraisemblance. Ce point de vue a conduit à un paradigme de la vraisemblance destinéà interpréter les preuves statistiques et qui fait soigneusement la distinction entre les preuves d'un paramètre et les probabilités d'erreur, ainsi que les croyances personnelles. Comme c'est le cas pour d'autres paradigmes de statistiques, le paradigme de la vraisemblance est confrontéà des défis en cas d'observation incomplète de données en raison de l'absence de réponses ou de censure, par exemple. Les méthodes classiques destinées à générer des fonctions de vraisemblance dans de telles circonstances, exigent généralement des suppositions sur le mécanisme régissant l'observation incomplète de données, suppositions qui reposent habituellement sur des informations extérieures ne pouvant pas être validées par les données observées. Sans informations externes fiables, l'usage de suppositions non vérifiables entraînées par la commodité pourrait potentiellement compromettre l'interprétation de la vraisemblance qui en résulte, en tant que représentation objective des preuves observées. Cet article propose une approche de vraisemblance de profil pour représenter et interpréter des preuves statistiques avec des données incomplètes, sans imposer de suppositions non vérifiables. L'approche proposée repose sur une identification partielle et elle est illustrée au moyen de plusieurs problèmes statistiques mettant en jeu des données manquantes ou censurées. Des exemples numériques reposant sur des données réelles sont présentés, afin de démontrer la faisabilité de l'approche.