Get access

The pseudo-GEE approach to the analysis of longitudinal surveys

Authors


Abstract

Longitudinal surveys have emerged in recent years as an important data collection tool for population studies where the primary interest is to examine population changes over time at the individual level. Longitudinal data are often analyzed through the generalized estimating equations (GEE) approach. The vast majority of existing literature on the GEE method; however, is developed under non-survey settings and are inappropriate for data collected through complex sampling designs. In this paper the authors develop a pseudo-GEE approach for the analysis of survey data. They show that survey weights must and can be appropriately accounted in the GEE method under a joint randomization framework. The consistency of the resulting pseudo-GEE estimators is established under the proposed framework. Linearization variance estimators are developed for the pseudo-GEE estimators when the finite population sampling fractions are small or negligible, a scenario often held for large-scale surveys. Finite sample performances of the proposed estimators are investigated through an extensive simulation study using data from the National Longitudinal Survey of Children and Youth. The results show that the pseudo-GEE estimators and the linearization variance estimators perform well under several sampling designs and for both continuous and binary responses. The Canadian Journal of Statistics 38: 540–554; 2010 © 2010 Statistical Society of Canada

Abstract

Les enquêtes longitudinales sont apparues récemment comme un moyen important de collecte d'observations pour les études sur les populations dont nous voulons étudier les changements dans le temps de la population au niveau des individus. Les données longitudinales sont souvent analysées en utilisant les équations d'estimation généralisées (GEE). Cependant, une grande partie des articles publiés sur la méthode GEE sont développés dans un cadre non échantillonnal et ils ne sont pas appropriés pour des données obtenues par des devis échantillonnaux complexes. Dans cet article, les auteurs développent une approche pseudo-GEE pour l'analyse des données d'enquête. Ils démontrent que les poids d'échantillonnage doivent et peuvent être considérés de façon adéquate dans une méthode GEE dans un contexte d'aléation conjointe. La convergence des estimateurs pseudo-GEE ainsi obtenus est démontrée dans le cadre proposé. Les estimateurs de la variance par linéarisation sont développés pour les estimateurs pseudo-GEE lorsque le taux d'échantillonnage de la population fini est petit ou négligeable, scénario qui se produit souvent pour les enquêtes de grande envergure. La performance pour de petits échantillons des estimateurs proposés est étudiée grâce à une étude de simulation exhaustive en utilisant des données provenant de l'enquête longitudinale nationale sur les enfants et les jeunes. Les résultats indiquent que les estimateurs pseudo-GEE et ceux de la variance par linéarisation se comportent très bien sous plusieurs devis échantillonnaux, et ce tant pour les réponses continues que binaires. La revue canadienne de statistique 38: 540–554; 2010 © 2010 Société statistique du Canada

Get access to the full text of this article

Ancillary