### Abstract

- Top of page
- Abstract
- Introduction
- Methods and results
- Discussion
- Acknowledgements
- References
- Supporting Information

**Objective ** To review methods for the statistical analysis of parasite and other skewed count data.

**Methods ** Statistical methods for skewed count data are described and compared, with reference to a 10-year period of *Tropical Medicine and International Health (TMIH)*. Two parasitological datasets are used for illustration.

**Results ** The review of *TMIH* found 90 articles, of which 89 used descriptive methods and 60 used inferential analysis. A lack of clarity is noted in identifying the measures of location, in particular the Williams and geometric means. The different measures are compared, emphasising the legitimacy of the arithmetic mean for the skewed data. In the published articles, the *t* test and related methods were often used on untransformed data, which is likely to be invalid. Several approaches to inferential analysis are described, emphasising (1) non-parametric methods, while noting that they are not simply comparisons of medians, and (2) generalised linear modelling, in particular with the negative binomial distribution. Additional methods, such as the bootstrap, with potential for greater use are described.

**Conclusions ** Clarity is recommended when describing transformations and measures of location. It is suggested that non-parametric methods and generalised linear models are likely to be sufficient for most analyses.

**Objectifs: ** Examiner les méthodes d’analyse statistique des données du parasite et de celles d’autres mesures faussées.

**Méthodes: ** Les méthodes statistiques pour les données de mesures faussées sont décrites et comparées, pour celles utilisées sur une période de dix ans dans le journal ‘*Tropical Medicine and International Health*’. Deux ensembles de données parasitologiques sont utilisés à titre d’illustration.

**Résultats: ** 90 articles ont été identifiés; 89 avec une analyse descriptive et 60 avec une analyse inférentielle. Un manque de clarté a été observé dans l’identification des mesures de localisation, en particulier dans la moyenne géométrique et dans celle de Williams. Les différentes mesures sont comparées, en insistant sur la légitimité de la moyenne arithmétique des données faussées. Dans les articles publiés, le test *t* et les méthodes associées ont été souvent utilisés sur des données non transformées, ce qui est susceptible de les rendre invalides. Plusieurs approches de l’analyse inférentielle sont décrites, mettant l’accent sur (1) des méthodes non paramétriques, tout en notant qu’elles ne sont pas simplement des comparaisons de médianes et (2) la modélisation linéaire généralisée, en particulier avec la loi de distribution binomiale négative. D’autres méthodes sont décrites, telles que celle d’amorçage ‘bootstrap’, qui a un potentiel d’utilisation plus grand.

**Conclusions: ** La clarté est recommandée lors de la description des transformations et des mesures de localisation. Il est suggéré que les méthodes non paramétriques et les modèles linéaires généralisés sont probablement suffisants pour la plupart des analyses.

**Objetivo: ** Revisar los métodos para el análisis estadístico del conteo parasitario y otros conteos con sesgo.

**Métodos: ** Se describen y comparan los métodos estadísticos utilizados para el análisis de datos de conteos con sesgo, haciendo referencia a aquellos utilizados durante un período de diez años en el *Tropical Medicine and International Health*. Se utilizaron dos grupos de datos parasitológicos como ejemplos ilustrativos.

**Resultados: ** Se identificaron 90 publicaciones, 89 con análisis descriptivo y 60 con análisis inferencial. Se observa una falta de claridad para identificar medidas de localización, en particular la media de geométrica y de Williams. Se compararon las diferentes medidas, haciendo énfasis en la legitimidad de la media aritmética para datos sesgados. En los artículos publicados se utilizaron a menudo la prueba *t* y métodos relacionados en datos sin transformar, lo cual probablemente sea inválido. Se describen varios enfoques del análisis inferencial, enfatizando (1) métodos no-paramétricos, teniendo en cuenta que no son solo comparaciones de las medias, (2) modelo lineal generalizado, en particular con distribución binomial negativa. Se describen métodos adicionales, tales como el *bootstrap*, con potencial para un mayor uso.

**Conclusiones: ** Se recomienda claridad para describir transformaciones y medidas de localización. Se sugiere que los métodos no paramétricos y los modelos lineales generalizados podrían ser suficientes para la mayoría de los análisis.