Using alternative statistical formats for presenting risks and risk reductions

  • Comment
  • Review
  • Intervention

Authors


Abstract

Background

The success of evidence-based practice depends on the clear and effective communication of statistical information.

Objectives

To evaluate the effects of using alternative statistical presentations of the same risks and risk reductions on understanding, perception, persuasiveness and behaviour of health professionals, policy makers, and consumers.

Search methods

We searched Ovid MEDLINE (1966 to October 2007), EMBASE (1980 to October 2007), PsycLIT (1887 to October 2007), and the Cochrane Central Register of Controlled Trials (The Cochrane Library, 2007, Issue 3). We reviewed the reference lists of relevant articles, and contacted experts in the field.

Selection criteria

We included randomized and non-randomized controlled parallel and cross-over studies. We focused on four comparisons: a comparison of statistical presentations of a risk (eg frequencies versus percentages) and three comparisons of statistical presentation of risk reduction: relative risk reduction (RRR) versus absolute risk reduction (ARR), RRR versus number needed to treat (NNT), and ARR versus NNT.

Data collection and analysis

Two authors independently selected studies for inclusion, extracted data, and assessed risk of bias. We contacted investigators to obtain missing information. We graded the quality of evidence for each outcome using the GRADE approach. We standardized the outcome effects using adjusted standardized mean difference (SMD).

Main results

We included 35 studies reporting 83 comparisons. None of the studies involved policy makers. Studies of alternative formats for presenting risks focused on either diagnostic or screening tests. Participants (health professionals and consumers) understood natural frequencies better than percentages (SMD 0.69 (95% confidence interval (CI) 0.45 to 0.93)). In studies of alternative formats for presenting risk reductions of interventions, and compared with ARR, RRR had little or no difference in understanding (SMD 0.02 (95% CI -0.39 to 0.43)) but was perceived to be larger (SMD 0.41 (95% CI 0.03 to 0.79)) and more persuasive (SMD 0.66 (95% CI 0.51 to 0.81)). Compared with NNT, RRR was better understood (SMD 0.73 (95% CI 0.43 to 1.04)), was perceived to be larger (SMD 1.15 (95% CI 0.80 to 1.50)) and was more persuasive (SMD 0.65 (95% CI 0.51 to 0.80)). Compared with NNT, ARR was better understood (SMD 0.42 (95% CI 0.12 to 0.71)), was perceived to be larger (SMD 0.79 (95% CI 0.43 to 1.15)).There was little or no difference for persuasiveness (SMD 0.05 (95% CI -0.04 to 0.15)). The sensitivity analyses including only high quality comparisons showed consistent results for persuasiveness for all three comparisons. Overall there were no differences between health professionals and consumers. The overall quality of evidence was rated down to moderate because of the use of surrogate outcomes and/or heterogeneity. None of the comparisons assessed behaviour.

Authors' conclusions

Natural frequencies are probably better understood than percentages in the context of diagnostic or screening tests. For communicating risk reductions, relative risk reduction (RRR), compared with absolute risk reduction (ARR) and number needed to treat (NNT), may be perceived to be larger and is more likely to be persuasive. However, it is uncertain whether presenting RRR is likely to help people make decisions most consistent with their own values and, in fact, it could lead to misinterpretation. More research is needed to further explore this question.

Resumen

Antecedentes

Uso de formatos estadísticos alternativos para la presentación de riesgos y la reducción de riesgos

El éxito de la práctica basada en la evidencia depende de una comunicación clara y eficaz de la información estadística.

Objetivos

Evaluar los efectos del uso de presentaciones estadísticas alternativas de los mismos riesgos y las reducciones de riesgos para la comprensión, la percepción, la capacidad de persuasión y la conducta de los profesionales de la salud, los elaboradores de políticas y los usuarios.

Estrategia de búsqueda

Se hicieron búsquedas en Ovid MEDLINE (1966 hasta octubre 2007), EMBASE (1980 hasta octubre 2007), PsycLIT (1887 hasta octubre 2007), y en el Registro Cochrane Central de Ensayos Controlados (Cochrane Central Register of Controlled Trials) (The Cochrane Library, 2007, número 3). Se revisaron las listas de referencias de los artículos relevantes y se contactó con expertos en este tema.

Criterios de selección

Se incluyeron estudios aleatorios y no aleatorios controlados paralelos y cruzados. Nos centramos en cuatro comparaciones: una comparación de las presentaciones estadísticas de un riesgo (p.ej. frecuencias versus probabilidades) y tres comparaciones de la presentación estadística de reducción de riesgos: la reducción del riesgo relativo (RRR) versus reducción del riesgo absoluto (RRA), RRR versus número necesario a tratar (NNT) y RRA versus NNT.

Obtención y análisis de los datos

Dos autores seleccionaron de forma independiente los estudios para la inclusión, extrajeron los datos y evaluaron el riesgo de sesgo. Se estableció contacto con los investigadores para obtener la información que faltaba. Se calificó la calidad de las pruebas para cada resultado mediante el enfoque GRADE. Se estandarizaron los efectos de los resultados mediante el uso de la diferencia de medias estandarizada (DME) ajustada.

Resultados principales

Se incluyeron 35 estudios que informaban 83 comparaciones. Ninguno de los estudios incluyó elaboradores de políticas. Los participantes (profesionales de la salud y usuarios) comprendieron las frecuencias naturales mejor que las probabilidades (DME 0,69 [intervalo de confianza (IC) del 95%: 0,45 a 0,93]). Comparado con el RRA, el RRR presentó poca o ninguna diferencia en la comprensión (DME 0,02 [IC del 95%: −0,39 a 0,43]) pero se percibió de mayor tamaño (DME 0,41 [IC del 95%: 0,03 a 0,79]) y más convincente (DME 0,66 [IC del 95%: 0,51 a 0,81]). Comparado con el NNT, el RRR se comprendió mejor (DME 0,73 [IC del 95%: 0,43 a 1,04]), se percibió como más grande (DME 1,15 [IC del 95%: 0,80 a 1,50]) y fue más convincente (DME 0,65 [IC del 95%: 0,51 a 0,80]). Comparado con el NNT, el RRA se comprendió mejor (DME 0,42 [IC del 95%: 0,12 a 0,71]), se percibió como más grande (DME 0,79 [IC del 95%: 0,43 a 1.15]). Hubo poca o ninguna diferencia en la capacidad de persuasión (DME 0,05 [IC del 95%: −0,04 a 0,15]). Los análisis de sensibilidad que incluyeron sólo las comparaciones de alta calidad mostraron resultados coherentes de la capacidad de persuasión para las tres comparaciones. En general, no hubo diferencias entre los profesionales sanitarios y los usuarios. La calidad general de las pruebas se valoró como baja a intermedia debido al uso de resultados alternativos o a la heterogeneidad. Ninguna de las comparaciones evaluó el comportamiento.

Conclusiones de los autores

Las frecuencias naturales quizás se comprendan mejor que las probabilidades. La reducción del riesgo relativo (RRR), comparada con la reducción del riesgo absoluto (RRA) y el número necesario a tratar (NNT), puede percibirse como más grande y tiene mayor probabilidad de ser convincente. Sin embargo, no puede precisarse si la presentación de la RRR ayudaría a las personas a que tomen decisiones más compatibles con sus propios valores y, en realidad, podría llevar a una interpretación errónea. Se necesitan más estudios de investigación para explorar esta cuestión.

Traducción

Traducción realizada por el Centro Cochrane Iberoamericano

Résumé scientifique

Utilisation de formats statistiques alternatifs pour la présentation des risques et des réductions des risques

Contexte

Le succès des pratiques fondées sur des preuves dépend de la communication claire et efficace des informations statistiques.

Objectifs

Évaluer les effets de l'utilisation de présentations statistiques alternatives des mêmes risques et réductions des risques sur la compréhension, la perception, la persuasion et le comportement des professionnels de santé, des décideurs politiques et des usagers de soins.

Stratégie de recherche documentaire

Nous avons consulté Ovid MEDLINE (1966 à octobre 2007), EMBASE (1980 à octobre 2007), PsycLIT (1887 à octobre 2007) et le registre Cochrane central des essais contrôlés (Bibliothèque Cochrane, 2007, numéro 3). Nous avons examiné les références bibliographiques des articles pertinents et contacté des experts de ce domaine.

Critères de sélection

Nous avons inclus les études contrôlées randomisées et non randomisées en parallèle et croisées. Nous avons examiné quatre comparaisons : une comparaison des présentations statistiques d'un risque (ex. : fréquences versus pourcentages) et trois comparaisons de la présentation statistique de la réduction du risque : réduction relative du risque (RRR) versus réduction absolue du risque (RAR), RRR versus nombre de sujets à traiter (NST) et RAR versus NST.

Recueil et analyse des données

Deux auteurs ont sélectionné les études à inclure, extrait les données et évalué le risque de biais de manière indépendante. Nous avons contacté les investigateurs afin d'obtenir les informations manquantes. Nous avons attribué une note à la qualité des données pour chaque critère de jugement en utilisant la grille GRADE. Nous avons standardisé les effets de résultats à l'aide de la différence moyenne standardisée (DMS) ajustée.

Résultats principaux

Nous avons inclus 35 études documentant 83 comparaisons. Aucune des études ne portait sur des décideurs politiques. Les études évaluant des formats alternatifs pour la présentation des risques et examinant spécifiquement les examens de diagnostic ou de dépistage. Les participants (professionnels de santé et usagers de soins) comprenaient mieux les fréquences naturelles que les pourcentages (DMS de 0,69 (intervalle de confiance (IC) à 95 %, entre 0,45 et 0,93)). Dans les études examinant des formats alternatifs de présentation des réductions des risques associées aux interventions, et par rapport à la RAR, la RRR ne présentait que peu ou pas de différence en termes de compréhension (DMS de 0,02 (IC à 95 %, entre -0,39 et 0,43)) mais était perçue comme plus importante (DMS de 0,41 (IC à 95 %, entre 0,03 et 0,79)) et plus persuasive (DMS de 0,66 (IC à 95 %, entre 0,51 et 0,81)). Par rapport au NST, la RRR était mieux comprise (DMS de 0,73 (IC à 95 %, entre 0,43 et 1,04)), était perçue comme plus importante (DMS de 1,15 (IC à 95 %, entre 0,80 et 1,50)) et était plus persuasive (DMS de 0,65 (IC à 95 %, entre 0,51 et 0,80)). Par rapport au NST, la RAR était mieux comprise (DMS de 0,42 (IC à 95 %, entre 0,12 et 0,71)) et était perçue comme plus importante (DMS de 0,79 (IC à 95 %, entre 0,43 et 1,15)). Il n'existait que peu ou pas de différence en termes de persuasion (DMS de 0,05 (IC à 95 %, entre -0,04 et 0,15)). Les analyses de sensibilité incluant uniquement les comparaisons de haute qualité révélaient des résultats cohérents en termes de persuasion pour les trois comparaisons. Dans l'ensemble, aucune différence n'était observée entre les professionnels de santé et les usagers de soins. La qualité globale des preuves a été revue à la baisse et considérée comme moyenne en raison de l'utilisation de critères de substitution et/ou de la présence d'une hétérogénéité. Aucune des comparaisons n'évaluait le comportement.

Conclusions des auteurs

Les fréquences naturelles sont probablement mieux comprises que les pourcentages dans le contexte des examens de diagnostic ou de dépistage. Pour la communication des réductions des risques, la réduction relative du risque (RRR), par rapport à la réduction absolue du risque (RAR) et au nombre de sujets à traiter (NST), pourrait être perçue comme plus importante et est plus susceptible d'être persuasive. Néanmoins, on ignore si la présentation de la RRR est susceptible d'aider les patients à prendre des décisions plus conformes à leurs propres valeurs ou si elle pourrait au contraire fausser leur interprétation. Des recherches supplémentaires sont nécessaires afin d'étudier cette question de manière plus approfondie.

Plain language summary

Using different statistical formats for presenting health information

Examples illustrating the statistical terms used in this summary:

You read that a study found that an osteoporosis drug cuts the risk of having a hip fracture in the next three years by 50%.  Specifically, 10% of the untreated people had a hip fracture at three years, compared with 5% of the people who took the osteoporosis drug every day for three years.  Thus 5% (10% minus 5%) less people would suffer a hip fracture if they take the drug for 3 years. In other words, 20 patients need to take the osteoporosis drug over 3 years for an additional patient to avoid a hip fracture. "Cuts the risk of fracture by 50%" represents a relative risk reduction. "Five per cent less would suffer a fracture" represents an absolute risk reduction. "Twenty patients need to take the osteoporosis drug over 3 years for an additional patient to avoid a hip fracture" represents a number needed to treat.

You read that another study found that the risk of suffering a hip fracture over a three year period among people not taking any osteoporotic drug is 10%; another way of expressing this risk would be: 100 of 1000 people not taking any osteoporotic drug will suffer a hip fracture over a three year period. "10%" represents a percentage while "100 of 1000" represents a frequency.

Summary:

Health professionals and consumers may change their choices when the same risks and risk reductions are presented using alternative statistical formats. Based on the results of 35 studies reporting 83 comparisons, we found the risk of a health outcome is better understood when it is presented as a natural frequency rather than a percentage for diagnostic and screening tests. For interventions, and on average, people perceive risk reductions to be larger and are more persuaded to adopt a health intervention when its effect is presented in relative terms (eg using relative risk reduction which represents a proportional reduction) rather than in absolute terms (eg using absolute risk reduction which represents a simple difference). We found no differences between health professionals and consumers. The implications for clinical and public health practice are limited by the lack of research on how these alternative presentations affect actual behaviour. However, there are strong logical arguments for not reporting relative values alone, as they do not allow a fair comparison of benefits and harms as absolute values do.

Please refer to the Cochrane Collaboration Glossary for further explanations of the statistical terms used in this review.

Résumé simplifié

Utilisation d'autres formats statistiques pour la présentation des informations de santé

Exemples illustrant les termes statistiques utilisés dans ce résumé :

Vous lisez dans une étude qu'un médicament contre l'ostéoporose réduit de 50 % le risque de fracture de la hanche au cours des trois années suivantes. En l'occurrence, 10 % des patients non traités étaient victimes d'une fracture de la hanche à trois ans, contre 5 % des patients qui avaient pris le médicament contre l'ostéoporose tous les jours pendant trois ans. Cela signifie que 5 % de patients en moins (10 % moins 5 %) seraient victimes d'une fracture de la hanche s'ils prenaient le médicament pendant trois ans. En d'autres termes, il faudrait que 20 patients prennent le médicament contre l'ostéoporose pendant 3 ans pour prévenir une fracture de la hanche chez un patient supplémentaire. La réduction de 50 % du risque de fracture représente une réduction relative du risque. Le fait que 5 % de patients en moins soient victimes d'une fracture représente une réduction absolue du risque. Les vingt patients devant prendre le médicament contre l'ostéoporose pendant 3 ans pour prévenir une fracture de la hanche chez un patient supplémentaire représentent le nombre de sujets à traiter.

Vous lisez dans une autre étude que le risque d'être victime d'une fracture de la hanche au cours d'une période de trois ans chez les sujets ne prenant aucun médicament ostéoporotique est de 10 %. Cela équivaudrait à dire que 100 personnes sur 1 000 ne prenant aucun médicament ostéoporotique seront victimes d'une fracture de la hanche au cours d'une période de trois ans. 10 % représente un pourcentage, tandis que 100 sur 1 000 représente une fréquence.

Résumé:

L'utilisation d'autres formats statistiques pour présenter les mêmes risques et réductions des risques pourrait influencer les décisions des professionnels et des usagers de soins. Sur la base des résultats de 35 études rapportant 83 comparaisons, nous avons observé que le risque associé à un résultat clinique est mieux compris lorsqu'il est présenté sous forme de fréquence naturelle plutôt que de pourcentage pour les examens de diagnostic et de dépistage. Pour les interventions, les gens perçoivent (en moyenne) les réductions des risques comme plus importantes qu'elles ne le sont et sont plus facilement convaincus d'accepter une intervention lorsque ses effets sont présentés en termes relatifs (ex. : en utilisant la réduction relative du risque, qui représente une réduction proportionnelle) plutôt qu'en termes absolus (ex. : en utilisant la réduction absolue du risque, qui représente une simple différence). Nous n'avons identifié aucune différence entre les professionnels de santé et les usagers de soins. Les implications de ces résultats dans la pratique clinique et la santé publique sont limitées par l'absence de recherches concernant la manière dont ces présentations alternatives affectent le comportement réel. Néanmoins, il existe des arguments logiques défavorables à la présentation des valeurs relatives seules, car elles ne permettent pas de comparer les effets bénéfiques et délétères de manière équitable, contrairement aux valeurs absolues.

Veuillez consulter le Glossaire de la Collaboration Cochrane pour plus d'informations concernant les termes statistiques utilisés dans cette revue.

Notes de traduction

Traduit par: French Cochrane Centre 1st June, 2013
Traduction financée par: Pour la France : Minist�re de la Sant�. Pour le Canada : Instituts de recherche en sant� du Canada, minist�re de la Sant� du Qu�bec, Fonds de recherche de Qu�bec-Sant� et Institut national d'excellence en sant� et en services sociaux.

Laički sažetak

Korištenje različitih statističkih formata za predstavljanje rizika i smanjenja rizika

Ovaj primjer prikazuje što su to statistički termini koji se koriste u ovom sažetku:

Čitate da je određena studija našla da je lijek za osteoporozu smanjio rizik od prijeloma kuka u sljedeće tri godine za 50%.  Preciznije, 10% neliječenih osoba zadobilo je prijelom kuka kroz sljedeće tri godine u usporedbi s 5% osoba koji su uzimali lijek za osteoporozu svakog dana tijekom te tri godine.  Stoga bi 5% ljudi (10% minus 5%) manje zadobilo prijelom kuka ako bi uzimali lijek 3 godine. Drugim riječima, 20 pacijenata treba uzimati lijek za osteoporozu kroz 3 godine da bi jedan dodatni pacijent izbjegao prijelom kuka. "Smanjuje rizikd or prijeloma za 50%" je statistički izraz koji predstavlja smanjenje relativnog rizika. "Pet posto ljudi manje bi zadobilo prijelom" je statistički izraz koji predstavlja smanjenje apsolutnog rizika. "Dvadeset osoba treba uzimati lijek za osteoporozu tijekom 3 godine da bi jedan dodatni pacijent izbjegao prijelom kuka" je statistički izraz koji predstavlja broj pacijenata koji treba liječiti (engl. number needed to treat, NNT).

Čitate da je druga studija utvrdila da je rizik od prijeloma kuka kroz tri godine među ljudima koji nisu uzimali lijek za osteoporozu 10%; drugi način prikazivanja tog rizika bio bi: 100 od 1000 ljudi koji ne uzimaju lijek za osteoporozu zadobit će prijelom rizika tijekom 3 godine. "10%" predstavlja postotak , dok "100 od 1000" predstavlja frekvenciju (učestalost).

Sažetak:

Zdravstveni radnici i laici mogu donijeti drugačije odluke ako im se isti rizik i smanjenje rizika predstave koristeći drugačije statističke formate. Temeljem rezultata 35 sudija u kojima je opisano 83 usporedbi, ovaj Cochrane sustavni pregled je utvrdio da se rizik od nekog zdravstvenog ishoda najbolje razumije ako se predstavi kao prirodna frekvencija nego kao postotak, ako se radi o dijagnostičkim pretragama i testovima probira (ranog otkrivanja bolesti). Kad se radi o intervencijama, u prosjeku ljudi smatraju da je smanjenje rizika veće i lakše ih je nagovoriti da prihvate neku zdravstvenu intervenciju kad se efekt prikazuje u relativnim pojmovima (npr. koristeći relativno smanjenje rizika koje predstavlja proporcionalno smanjenje) nego u apsolutnim pojmovima (npr. koristeći apsolutno smanjenje rizika koje predstavlja jednostavnu razliku). Nisu pronađene razlike između zdravstvenih radnika i laika u tom pogledu.Značaj ovih rezultat za kliničke i javnozdravstvene prakse je ograničen manjkom istraživanja o tome kako te različite prezentacije statističkih pojmova mogu utjecati na stvarno ponašanje. Međutim, rezultati ukazuju na jak logički argument da se rizik ne bi trebao prikazivati samo kao relativne vrijednosti jer te relativne vrijednosti ne dopuštaju korektne usporedbe korisnih učinaka i štetnih posljedica kao apsolutne vrijednosti.

Pogledajte Cochrane rječnik za daljnja objašnjenja statističkih pojmova korištenih u ovom sustavnom pregledu.

Bilješke prijevoda

Hrvatski Cochrane
Prevela: Livia Puljak
Ovaj sažetak preveden je u okviru volonterskog projekta prevođenja Cochrane sažetaka. Uključite se u projekt i pomozite nam u prevođenju brojnih preostalih Cochrane sažetaka koji su još uvijek dostupni samo na engleskom jeziku. Kontakt: cochrane_croatia@mefst.hr

Ancillary