### Summary

**Objectives ** The proportion of tuberculosis cases in a population that are clustered (i.e. share identical strains of *Mycobacterium tuberculosis*) reflects ongoing *M. tuberculosis* transmission. It varies markedly, but it is unclear how much of this variation reflects measurable differences in study design, setting and the patient population. We aimed to assess the relative impact of these factors and develop a tool to improve interpretation of the proportion clustered from an individual study.

**Methods ** We systematically reviewed all population-based TB clustering studies that used IS6110 RFLP as their main DNA fingerprinting technique. Meta-regression was used to see how much of the variation in the proportion clustered between studies could be explained by variables describing study design, setting and population. We compared expected clustering, based on study design and setting, with that observed.

**Results ** Forty-six studies were included. Just four factors related to study design and setting–study duration, sampling fraction, handling of low band strains and tuberculosis incidence–explained 28% of the variation in the proportion clustered. Additionally including average patient age and proportion foreign born explained 60% of the variation in clustering for industrialized countries. Comparison of expected and observed proportions showed that for some studies the expected proportion clustered differed strongly from that observed.

**Conclusions ** We were able to account for much of the variation in the proportion clustered. The comparison of expected and observed clustering allows for a more valid comparison of studies and provides a tool for identifying outliers that warrant further investigation.

Revue systématique et méta-analyse des études d’épidémiologie moléculaire sur la tuberculose: développement d’un nouvel outil d’aide à l’interprétation

**Objectifs: ** La proportion de cas de tuberculose (TB) qui sont regroupés dans une population (i.e. par groupes qui partagent des souches identiques de *M. tuberculosis*), reflète une transmission en cours. Elle varie de façon importante, mais il n’est pas clair dans quelle mesure cette variation reflète des différences mesurables dans la conception des études, l’endroit et la population de patients. Nous avions pour but d’évaluer l’impact relatif de ces facteurs et de développer un outil pour améliorer l’interprétation des proportions groupées dans une étude donnée.

**Méthodes: ** Nous avons passé en revue systématiquement l’ensemble des études de populations sur le regroupement de la TB, basées sur le RFLP IS6110 comme principale technique d’établissement de l’empreinte génétique de l’ADN. Une méta-régression a été utilisée pour voir à quel point la variation dans des proportions regroupées entre les études pourrait être expliquée par des variables décrivant le concept de l’étude, l’endroit et la population. Nous avons comparé les regroupements attendus à ceux observés, basés sur la conception de l’étude et l’endroit.

**Résultats: ** 46 études ont été incluses. 4 facteurs seuls, liés à la conception de l’étude et l’endroit - durée de l’étude, fraction d’échantillonnage, manipulation de souches à faible nombre de bandes IS et incidence de TB - expliquaient 28% de la variation dans la proportion regroupée. En outre, l’inclusion de l’âge moyen des patients et la proportion de ceux nés à l’étranger, expliquait de 60% de la variation dans le regroupement pour les pays industrialisés. La comparaison des proportions attendues et observées a montré que, pour certaines études, la proportion attendue différait fortement de celle observée.

**Conclusions: ** Nous avons été capables de définir la plus grande partie de la variation dans la proportion regroupée. La comparaison du regroupement attendu à celui observé permet d’obtenir une comparaison plus valide des études et fournit un outil permettant d’identifier les points atypiques justifiant une investigation supplémentaire.

Revisión sistemática y meta-análisis de estudios de epidemiología molecular de la tuberculosis: desarrollo de una nueva herramienta para ayudar en la interpretación.

**Objetivos: ** La proporción de casos de tuberculosis en una población que está agrupada (es decir que comparte cepas idénticas de M. tuberculosis) refleja la transmisión en curso de M. tuberculosis. La variación es marcada, pero no está claro hasta que punto dicha variación refleja diferencias medibles en el diseño del estudio, el lugar de estudio y la población de pacientes. Nuestro objetivo era evaluar el impacto relativo de estos factores, y desarrollar una herramienta para mejorar la interpretación de la proporción agrupada en un estudio individual.

**Métodos: ** Hemos revisado sistemáticamente todos los estudios de grupos de TB basados en la población que utilizaron la RFLP IS6110 como su principal técnica de tipificación del ADN. Se utilizó una meta-regresión para ver cuanta variación en la proporción agrupada entre estudios podía explicarse mediante variables que describiesen el diseño del estudio, el lugar del estudio o la población. Se comparó la agrupación esperada, basada en el diseño y la ubicación del estudio, con aquella observada.

**Resultados: ** Se incluyeron 46 estudios. Solo 4 factores relacionados con el diseño y la ubicación del estudio – duración del estudio, fracción de muestreo, manejo de cepas con bandas bajas, e incidencia de tuberculosis – explicaban el 28% de la variación en la proporción agrupada. Adicionalmente, incluir la edad media de los pacientes y la proporción de extranjeros explicaba un 60% de la variación en la agrupación en países industrializados. La comparación de proporciones esperadas y observadas mostró que para algunos estudios la proporción esperada agrupada difería mucho de la observada.

**Conclusiones: ** Hemos podido explicar una buena parte de la variación en la proporción agrupada. La comparación de la agrupación esperada y observada permite realizar estudios de comparación más válidos y provee una herramienta para la identificación de marginales que justificarían investigaciones futuras.