On Average Predictive Comparisons and Interactions

Authors


Summary

In a regression context, consider the difference in expected outcome associated with a particular difference in one of the input variables. If the true regression relationship involves interactions, then this predictive comparison can depend on the values of the other input variables. Therefore, one may wish to consider an average predictive comparison as a target of inference, where the averaging is with respect to the population distribution of the input variables. We consider inferences about such targets, with emphasis on inferential performance when the regression model is misspecified. Particularly, in light of the difficulties in dealing with interaction terms in regression models, we examine inferences about average predictive comparisons when additive models are fitted to relationships truly involving pairwise interaction terms. We identify some circumstances where such inferences are consistent despite the model misspecification, notably when the input variables are independent, or have a multivariate normal distribution.

Résumé

Dans un contexte de régression, considérons la différence de la valeur espérée de la variable d'intérêt, associée à une différence donnée d'une des variables d'entrée. Si la relation de régression véritable implique des termes d'interaction, alors cette comparaison prédictive peut dépendre de la valeur des autres variables d'entrée. Ainsi, il peut être souhaitable de considérer la comparaison prédictive moyenne comme objet d'inférence, où la moyenne est calculée sur la distribution des variables d'entrée dans la population. Nous nous intéressons à ce contexte d'inférence, et plus particulièrement à la performance inférentielle lorsque le modèle de régression est mal spécifié. À la lumière des difficultés existantes de traiter les termes d'interaction dans les modèles de régression, nous examinons l'inférence sur les comparaisons prédictives moyennes lorsque des modèles additifs sont ajustés, alors que les vraies relations impliquent des termes d'interaction deux-à-deux. Nous identifions quelques situations où l'inférence est convergente malgré la mauvaise spécification du modèle, notamment lorsque les variables d'entrée sont indépendantes ou possèdent une loi normale multivariée.

Ancillary