SEARCH

SEARCH BY CITATION

Keywords:

  • Bridge sampling;
  • control variate;
  • importance sampling;
  • Markov chain Monte Carlo;
  • normalizing constant;
  • path sampling;
  • MSC 2010: Primary 62G05;
  • secondary 62E20

Abstract

A computational problem in many fields is to estimate simultaneously multiple integrals and expectations, assuming that the data are generated by some Monte Carlo algorithm. Consider two scenarios in which draws are simulated from multiple distributions but the normalizing constants of those distributions may be known or unknown. For each scenario, existing estimators can be classified as using individual samples separately or using all the samples jointly. The latter pooled-sample estimators are statistically more efficient but computationally more costly to evaluate than the separate-sample estimators. We develop a cluster-sample approach to obtain computationally effective estimators, after draws are generated for each scenario. We divide all the samples into mutually exclusive clusters and combine samples from each cluster separately. Furthermore, we exploit a relationship between estimators based on samples from different clusters to achieve variance reduction. The resulting estimators, compared with the pooled-sample estimators, typically yield similar statistical efficiency but have reduced computational cost. We illustrate the value of the new approach by two examples for an Ising model and a censored Gaussian random field. The Canadian Journal of Statistics 41: 151–173; 2013 © 2012 Statistical Society of Canada

Un problème informatique dans plusieurs domaines est l'estimation simultanée d'intégrales multiples et d'espérances, en faisant le présupposé que les données sont générées à partir d'un algorithme de Monte-Carlo. Considérons deux scénarios où les valeurs sont simulées à partir de plusieurs distributions, mais pour lesquelles les constantes de normalisation peuvent être connues ou non. Pour chaque scénario, les estimateurs existants peuvent être regroupés selon qu'ils utilisent les échantillons individuels de façon séparée ou qu'ils utilisent tous les échantillons simultanément. Ces derniers combinant tous les échantillons sont statistiquement plus efficaces, mais ils sont plus coûteux à évaluer numériquement que les estimateurs basés sur des échantillons individuels. Nous développons une approche par grappe d'échantillons pour obtenir des estimateurs efficaces, en terme de coût de calcul, une fois les échantillons obtenus pour chacun des scénarios. Nous divisons tous les échantillons en grappes mutuellement exclusives et nous combinons les échantillons de chaque grappe séparément. De plus, nous exploitons la relation entre les estimateurs basés sur les échantillons des différentes grappes afin de réduire la variance. Si nous les comparons aux estimateurs combinant tous les échantillons, ces derniers ont habituellement une efficacité statistique similaire, mais à une fraction du coût de calcul. Nous illustrons les avantages de cette nouvelle approche à l'aide de deux exemples sur un modèle d'Ising et sur un champ aléatoire gaussien censuré. La revue canadienne de statistique 41: 151–173; 2013 © 2012 Société statistique du Canada