SEARCH

SEARCH BY CITATION

Keywords:

  • Randomized trials;
  • confidence intervals;
  • coverage probability;
  • potential outcomes;
  • treatment-unit additivity

Summary

In the classical theory of randomized trials (RTs), the treatment effect is defined as a mean difference of potential outcomes. To achieve nominal coverage probability for confidence intervals (CIs) on treatment effects in RTs, certain assumptions are necessary. Specifically, one must either make assumptions about the joint distribution of potential outcomes or enroll subjects in the trial by random sampling of the target population on which the treatment effect is defined. In practice, no such sampling usually takes place and assumptions about the joint distribution of potential outcomes cannot be verified based on observed data. Furthermore, the most common of these assumptions, such as treatment-unit additivity (TUA) or independence are biologically implausible in most RTs involving human subjects. Hence, it is not usually possible to construct CIs on treatment effects with nominal coverage probability. However, for any joint distribution of potential outcomes, the standard estimator of the variance of the difference of two independent sample means produces CIs with asymptotic coverage at least at the nominal level. This interpretation of CIs as conservative bounds may not always hold in conventional regression models applied to RT data.

Résumé

Dans la théorie classique des expériences randomisées (Randomized Trials ou RTs), l'effet-traitement est défini comme une différence entre réponses potentielles. Pour que les intervalles de confiance sur ces effets-traitements atteignent la probabilité de couverture nominale, des hypothèses sont nécessaires. Soit ces hypothèses portent sur la loi jointe des réponses potentielles, soit elles concernent la façon dont sont sélectionnés, par échantillonnage de populations-cibles, les sujets participant à l'expérience. En pratique, de tels échantillonnages sont fictifs, et les hypothèses sur les lois jointes de réponses potentielles ne peuvent être testées sur base d'observations. En outre, les plus répandues de ces hypothèses, telle l'hypothèse d'additivité traitement-sujet (treatment-unit additivity ou TUA), sont biologiquement peu plausibles dans les expériences faisant intervenir des sujets humains. Il est donc en général impossible de construire pour les effets-traitements des intervalles de confiance dont le taux de couverture égale le niveau de confiance nominal. L'estimateur standard de la variance de la différence de deux moyennes empiriques indépendantes fournit des intervalles de confiance dont le niveau de couverture est au moins égal au niveau nominal. Cette interprétation conservative des intervalles de confiance n'est toutefois pas toujours correcte pour les modèles de régression conventionnels dans le cadre d'observations provenant d'expériences randomisées.