Get access

Parametric and semiparametric hypotheses in the linear model

Authors


Abstract

The independent additive errors linear model consists of a structure for the mean and a separate structure for the error distribution. The error structure may be parametric or it may be semiparametric. Under alternative values of the mean structure, the best fitting additive errors model has an error distribution which can be represented as the convolution of the actual error distribution and the marginal distribution of a misspecification term. The model misspecification term results from the covariates' distribution. Conditions are developed to distinguish when the semiparametric model yields sharper inference than the parametric model and vice versa. The main conditions concern the actual error distribution and the covariates' distribution. The theoretical results explain a paradoxical finding in semiparametric Bayesian modelling, where the posterior distribution under a semiparametric model is found to be more concentrated than is the posterior distribution under a corresponding parametric model. The paradox is illustrated on a set of allometric data. The Canadian Journal of Statistics 39: 165–180; 2011 ©2011 Statistical Society of Canada

Abstract

Le modèle linéaire avec des erreurs additives et indépendantes consiste en une structure pour la moyenne et une structure séparée pour la distribution des erreurs. Cette dernière structure peut être paramétrique ou semi-paramétrique. Sous des valeurs alternatives de la structure sur la moyenne, le modèle pour les erreurs additives ayant le meilleur ajustement peut être écrit comme la convolution de la vraie distribution des erreurs et de la distribution marginale du terme représentant l'inexactitude du modèle. Celui-ci provient de la distribution des covariables. Des conditions, sous lesquelles un modèle semi-paramétrique conduit à une meilleure inférence que le modèle paramétrique, sont établies. Le cas contraire est aussi considéré. Les principales conditions concernent la vraie distribution des erreurs et celle des covariables. Les résultats théoriques expliquent le paradoxe trouvé avec la modélisation semi-paramétrique où la distribution a posteriori est plus concentrée sous un modèle semi-paramétrique que sous le modèle paramétrique correspondant. Le paradoxe est illustré à l'aide d'un jeu de données allométriques. La revue canadienne de statistique 39: 165–180; 2011 © 2011 Société statistique du Canada

Ancillary