SEARCH

SEARCH BY CITATION

Keywords:

  • Asymptotically linear estimator;
  • empirical process;
  • multiplier central limit theorem;
  • multivariate t distribution;
  • MSC 2010: Primary 62H15;
  • secondary 62F03

Abstract

The process comparing the empirical cumulative distribution function of the sample with a parametric estimate of the cumulative distribution function is known as the empirical process with estimated parameters and has been extensively employed in the literature for goodness-of-fit testing. The simplest way to carry out such goodness-of-fit tests, especially in a multivariate setting, is to use a parametric bootstrap. Although very easy to implement, the parametric bootstrap can become very computationally expensive as the sample size, the number of parameters, or the dimension of the data increase. An alternative resampling technique based on a fast weighted bootstrap is proposed in this paper, and is studied both theoretically and empirically. The outcome of this work is a generic and computationally efficient multiplier goodness-of-fit procedure that can be used as a large-sample alternative to the parametric bootstrap. In order to approximately determine how large the sample size needs to be for the parametric and weighted bootstraps to have roughly equivalent powers, extensive Monte Carlo experiments are carried out in dimension one, two and three, and for models containing up to nine parameters. The computational gains resulting from the use of the proposed multiplier goodness-of-fit procedure are illustrated on trivariate financial data. A by-product of this work is a fast large-sample goodness-of-fit procedure for the bivariate and trivariate t distribution whose degrees of freedom are fixed. The Canadian Journal of Statistics 40: 480–500; 2012 © 2012 Statistical Society of Canada

Le processus comparant la fonction de répartition empirique avec une estimation paramétrique de la fonction de répartition est connu sous le nom de processus empirique avec paramètres estimés. La façon la plus simple de calculer une valeur P approchée pour des tests d'adéquation fondés sur ce processus consiste à utiliser un rééchantillonnage paramétrique. Bien que conceptuellement simple à mettre en œuvre, le rééchantillonnage paramétrique peut devenir très coûteux en temps de calcul lorsque la taille de l'échantillon, le nombre de paramètres ou la dimension des données augmentent. L'objectif de cet article est d'étudier, à la fois théoriquement et empiriquement, une procédure alternative fondée sur un rééchantillonnage pondéré, peu gourmande en temps de calcul et pouvant se substituer au rééchantillonnage paramétrique dans le cas d'échantillons de grande taille. Des simulations de Monte Carlo en dimensions une, deux et trois, et pour des familles de modèles contenant jusqu'à neuf paramètres, ont été effectuées afin de déterminer approximativement la taille d'échantillon à partir de laquelle le rééchantillonnage paramétrique et le rééchantillonnage pondéré conduisent à des tests de puissances similaires. Les avantages en terme de temps de calcul de la procédure proposée sont illustrés sur des données financières trivariées. Une conséquence partielle de ce travail est un test rapide d'adéquation à une distribution de Student bivariée ou trivariée dont le nombre de degrés de liberté est fixé. La revue canadienne de statistique 40: 480–500; 2012 © 2012 Société statistique du Canada