Data-driven choice of the smoothing parametrization for kernel density estimators

Authors


Abstract

There are several levels of sophistication when specifying the bandwidth matrix H to be used in a multivariate kernel density estimator, including H to be a positive multiple of the identity matrix, a diagonal matrix with positive elements or, in its most general form, a symmetric positive-definite matrix. In this paper, the author proposes a data-based method for choosing the smoothing parametrization to be used in the kernel density estimator. The procedure is fully illustrated by a simulation study and some real data examples. The Canadian Journal of Statistics © 2009 Statistical Society of Canada

Abstract

Il y a plusieurs niveaux de raffinement possible lorsque nous devons spécifier la matrice de la largeur de fenêtre, H, à utiliser dans un estimateur par le noyau d'une densité multidimensionnelle. Les choix possibles pour H sont : un multiple positif de la matrice identité, une matrice diagonale avec des entrées positives ou, dans la forme plus générale, une matrice symétrique définie positive. Dans cet article, nous proposons une méthode adaptative pour choisir la paramétrisation de lissage à utiliser dans l'estimateur par le noyau. La méthode est illustrée à l'aide d'une étude de simulation et quelques vrais jeux de données. La revue canadienne de statistique © 2009 Société statistique du Canada

Ancillary