A spline-based semiparametric sieve likelihood method for over-dispersed panel count data

Authors


Abstract

In this article we study a Gamma-Frailty inhomogeneous Poisson process model for analysing over-dispersed panel count data. A cubic B-spline function is used to approximate the logarithm of the baseline mean function in the semiparametric proportional mean model. The regression parameters and spline coefficients are jointly estimated by maximizing a spline-based sieve pseudo-likelihood and by replacing the nuisance over-dispersion parameter with its moment estimate. The asymptotic properties of the proposed maximum pseudo likelihood estimator, including its consistency, convergence rate and the asymptotic normality of the estimated regression parameters, are thoroughly studied using modern empirical process theory. A spline-based least-squares standard error estimator is developed to facilitate robust inference for the regression parameters. Simulation studies are conducted to investigate finite sample performance of the proposed method and robustness of the Gamma-Frailty inhomogeneous Poisson process model. Finally, for illustration, the method is used to analyse data from an observational study of sexually transmitted infection (STI) in young women. The Canadian Journal of Statistics 42: 217–245; 2014 © 2014 Statistical Society of Canada

Résumé

Dans cet article, les auteurs étudient un modèle pour des données de dénombrement surdispersées en panel basé sur un processus de Poisson inhomogène à fragilité gamma. Ils utilisent une B-spline cubique pour approximer le logarithme de la fonction de référence dans le modèle semiparamétrique à moyennes proportionnelles. Les paramètres de régression et les coefficients des splines sont estimés conjointement en maximisant la pseudo-vraisemblance en tamis et en remplaçant le paramètre nuisible de surdispersion par son estimateur des moments. Les propriétés asymptotiques de l'estimateur au maximum de pseudo-vraisemblance proposé, y compris sa convergence, son taux de convergence et la normalité asymptotique des paramètres de régression estimés, sont examinés en détail à l'aide de la théorie moderne des processus empiriques. Les auteurs développent un estimateur aux moindres carrés de l’écart-type fondé sur les splines qui facilite l'inférence robuste des paramètres de régression. Ils procèdent à des études de simulation pour examiner la performance de la méthode proposée avec un échantillon fini, ainsi que la robustesse du modèle de Poisson inhomogène à fragilité gamma. Ils illustrent également leur méthode par l'analyse de données provenant d'une étude d'observation portant sur les infections transmissibles sexuellement (ITS) chez les jeunes femmes. La revue canadienne de statistique 42: 217–245; 2014 © 2014 Société statistique du Canada

Ancillary