SEARCH

SEARCH BY CITATION

Keywords:

  • Bootstrap weight;
  • estimating equation;
  • generalized regression estimator;
  • pseudo-population;
  • variance estimation;
  • weighted bootstrap

Résumé 

Nous étudions la technique du bootstrap généralisé pour des plans de sondage généraux. Nous nous concentrons principalement sur l’estimation bootstrap de la variance mais nous étudions également les propriétés empiriques des intervalles de confiance bootstrap obtenus en utilisant la méthode des percentiles. Le bootstrap généralisé consiste à générer aléatoirement des poids bootstrap de telle sorte que les deux (ou plus) premiers moments selon le plan de l’erreur d’échantillonnage soient approchés par leurs moments correspondants selon le mécanisme bootstrap. On peut voir la plupart des méthodes bootstrap dans la littérature comme étant des cas particuliers du bootstrap généralisé. Nous discutons de considérations telles que le choix de la distribution utilisée pour générer les poids bootstrap, le choix du nombre de répliques bootstrap et la présence possible de poids bootstrap négatifs. Nous décrivons d’abord le bootstrap généralisé pour l’estimateur linéaire de Horvitz-Thompson et considérons ensuite les estimateurs non linéaires tels que ceux définis au moyen d’équations d’estimation. Nous développons également deux façons d’appliquer le bootstrap à l’estimateur par la régression généralisée du total d’une population. Nous étudions plus en profondeur le cas de l’échantillonnage de Poisson qui est souvent utilisé pour sélectionner des échantillons dans les enquêtes sur les indices de prix effectuées par les agences statistiques nationales dans le monde. Pour l’échantillonnage de Poisson, nous considérons une approche par pseudo-population et montrons que les poids bootstrap qui en résultent capturent les trois premiers moments sous le plan de l’erreur d’échantillonnage. Nous utilisons une étude par simulation et un exemple avec des données d’enquêtes réelles pour illustrer la théorie.

Summary 

We study the generalized bootstrap technique under general sampling designs. We focus mainly on bootstrap variance estimation but we also investigate the empirical properties of bootstrap confidence intervals obtained using the percentile method. Generalized bootstrap consists of randomly generating bootstrap weights so that the first two (or more) design moments of the sampling error are tracked by the corresponding bootstrap moments. Most bootstrap methods in the literature can be viewed as special cases. We discuss issues such as the choice of the distribution used to generate bootstrap weights, the choice of the number of bootstrap replicates, and the potential occurrence of negative bootstrap weights. We first describe the generalized bootstrap for the linear Horvitz-Thompson estimator and then consider non-linear estimators such as those defined through estimating equations. We also develop two ways of bootstrapping the generalized regression estimator of a population total. We study in greater depth the case of Poisson sampling, which is often used to select samples in Price Index surveys conducted by national statistical agencies around the world. For Poisson sampling, we consider a pseudo-population approach and show that the resulting bootstrap weights capture the first three design moments of the sampling error. A simulation study and an example with real survey data are used to illustrate the theory.