Model-based clustering of longitudinal data

Authors


Abstract

A new family of mixture models for the model-based clustering of longitudinal data is introduced. The covariance structures of eight members of this new family of models are given and the associated maximum likelihood estimates for the parameters are derived via expectation–maximization (EM) algorithms. The Bayesian information criterion is used for model selection and a convergence criterion based on the Aitken acceleration is used to determine the convergence of these EM algorithms. This new family of models is applied to yeast sporulation time course data, where the models give good clustering performance. Further constraints are then imposed on the decomposition to allow a deeper investigation of the correlation structure of the yeast data. These constraints greatly extend this new family of models, with the addition of many parsimonious models. The Canadian Journal of Statistics 38:153–168; 2010 © 2010 Statistical Society of Canada

Abstract

Nous présentons une nouvelle famille de modèles de mélanges de regroupement, à l'aide de modèles, pour des données longitudinales. La structure de covariance de huit membres de cette nouvelle famille de modèles est donnée et les estimateurs du maximum de vraisemblance associés aux paramètres sont obtenus en utilisant les algorithmes espérance-maximisation (EM). Le critère d'information bayésien (BIC) est utilisé pour choisir le modèle et un critère de convergence basé sur l'accélération d'Aitken est utilisé pour déterminer la convergence de ces algorithmes EM. Cette nouvelle famille de modèles est appliquée sur les données de décours temporel de la sporulation de levures. Ces modèles sont performants pour faire les regroupements. Des contraintes additionnelles sont aussi imposées sur la décomposition afin d'examiner en plus de profondeur la structure de corrélation dans des données de levures. Ces contraintes généralisent grandement cette nouvelle famille de modèles avec l'ajout de modèles plus parcimonieux. La revue canadienne de statistique 38: 153–168; 2010 © 2010 Société statistique du Canada

Ancillary