SEARCH

SEARCH BY CITATION

Keywords:

  • Bayesian paradigm;
  • generalized dynamic models;
  • mixture models;
  • zero inflation

Summary

We review generalized dynamic models for time series of count data. Usually temporal counts are modelled as following a Poisson distribution, and a transformation of the mean depends on parameters which evolve smoothly with time. We generalize the usual dynamic Poisson model by considering continuous mixtures of the Poisson distribution. We consider Poisson-gamma and Poisson-log-normal mixture models. These models have a parameter for each time t which captures possible extra-variation present in the data. If the time interval between observations is short, many observed zeros might result. We also propose zero inflated versions of the models mentioned above. In epidemiology, when a count is equal to zero, one does not know if the disease is present or not. Our model has a parameter which provides the probability of presence of the disease given no cases were observed. We rely on the Bayesian paradigm to obtain estimates of the parameters of interest, and discuss numerical methods to obtain samples from the resultant posterior distribution. We fit the proposed models to artificial data sets and also to a weekly time series of registered number of cases of dengue fever in a district of the city of Rio de Janeiro, Brazil, during 2001 and 2002.

Résumé

Nous passons en revue les modèles dynamiques généralisés pour les séries temporelles de données de comptages. Les données de comptages sont généralement modélisées sous la forme d'une loi de Poisson dont la moyenne, ou une de ses transformations, évolue de façon régulière dans le temps. Nous généralisons cette approche traditionnelle en l'étendant à des mélanges de lois de Poisson. Nous considérons en particulier des mélanges du type Poisson-gamma et Poisson-lognormal. Ces mélanges dépendent d'un paramètre qui varie selon la date d'observation. Si les intervalles entre les observations sont courts, de nombreuses observations prennent la valeur zéro. Nous proposons également des versions “zero inflated” des modèles décrits plus haut. En épidémiologie, lorsque la valeur zéro se présente, il est impossible de savoir si la maladie est présente ou non. Notre modèle comporte un paramètre qui fournit la probabilité pour que la maladie soit présente conditionnellement à l'absence de cas observés. Nous nous fondons sur le paradigme Bayésien pour obtenir des estimateurs des paramètres d'intérêt, et discutons les méthodes numériques permettant de construire des échantillons provenant de la loi a posteriori. Nous ajustons les modèles proposés à un ensemble de données artificielles ainsi qu'à la série observée du nombre de cas de dengue enregistrés dans un quartier de Rio de Janeiro entre 2001 et 2002.