Red flags to screen for vertebral fracture in patients presenting with low-back pain

  • Review
  • Diagnostic

Authors


Abstract

Background

Low-back pain (LBP) is a common condition seen in primary care. A principal aim during a clinical examination is to identify patients with a higher likelihood of underlying serious pathology, such as vertebral fracture, who may require additional investigation and specific treatment. All 'evidence-based' clinical practice guidelines recommend the use of red flags to screen for serious causes of back pain. However, it remains unclear if the diagnostic accuracy of red flags is sufficient to support this recommendation.

Objectives

To assess the diagnostic accuracy of red flags obtained in a clinical history or physical examination to screen for vertebral fracture in patients presenting with LBP.

Search methods

Electronic databases were searched for primary studies between the earliest date and 7 March 2012. Forward and backward citation searching of eligible studies was also conducted.

Selection criteria

Studies were considered if they compared the results of any aspect of the history or test conducted in the physical examination of patients presenting for LBP or examination of the lumbar spine, with a reference standard (diagnostic imaging). The selection criteria were independently applied by two review authors.

Data collection and analysis

Three review authors independently conducted 'Risk of bias' assessment and data extraction. Risk of bias was assessed using the 11-item QUADAS tool. Characteristics of studies, patients, index tests and reference standards were extracted. Where available, raw data were used to calculate sensitivity and specificity with 95% confidence intervals (CI). Due to the heterogeneity of studies and tests, statistical pooling was not appropriate and the analysis for the review was descriptive only. Likelihood ratios for each test were calculated and used as an indication of clinical usefulness.

Main results

Eight studies set in primary (four), secondary (one) and tertiary care (accident and emergency = three) were included in the review. Overall, the risk of bias of studies was moderate with high risk of selection and verification bias the predominant flaws. Reporting of index and reference tests was poor. The prevalence of vertebral fracture in accident and emergency settings ranged from 6.5% to 11% and in primary care from 0.7% to 4.5%. There were 29 groups of index tests investigated however, only two featured in more than two studies. Descriptive analyses revealed that three red flags in primary care were potentially useful with meaningful positive likelihood ratios (LR+) but mostly imprecise estimates (significant trauma, older age, corticosteroid use; LR+ point estimate ranging 3.42 to 12.85, 3.69 to 9.39, 3.97 to 48.50 respectively). One red flag in tertiary care appeared informative (contusion/abrasion; LR+ 31.09, 95% CI 18.25 to 52.96). The results of combined tests appeared more informative than individual red flags with LR+ estimates generally greater in magnitude and precision.

Authors' conclusions

The available evidence does not support the use of many red flags to specifically screen for vertebral fracture in patients presenting for LBP. Based on evidence from single studies, few individual red flags appear informative as most have poor diagnostic accuracy as indicated by imprecise estimates of likelihood ratios. When combinations of red flags were used the performance appeared to improve. From the limited evidence, the findings give rise to a weak recommendation that a combination of a small subset of red flags may be useful to screen for vertebral fracture. It should also be noted that many red flags have high false positive rates; and if acted upon uncritically there would be consequences for the cost of management and outcomes of patients with LBP. Further research should focus on appropriate sets of red flags and adequate reporting of both index and reference tests.

Résumé scientifique

Signes d'alerte (« red flags ») dans le dépistage d'une fracture vertébrale chez des patients souffrant d'une lombalgie

Contexte

Une lombalgie est une affection couramment soignée en médecine générale. Lors d'un examen clinique, l'un des objectifs principaux consiste à identifier les patients les plus susceptibles de présenter une pathologie grave sous-jacente, comme une fracture vertébrale, pouvant nécessiter des recherches supplémentaires et un traitement spécifique. Toutes les recommandations de la pratique clinique « basées sur des preuves » prônent l'utilisation de signes d'alerte (« red flags ») pour dépister des causes graves de lombalgie. Toutefois, nous ignorons si l'exactitude du diagnostic des signes d'alerte (« red flags ») suffit pour appuyer cette recommandation.

Objectifs

Évaluer l'exactitude du diagnostic des signes d'alerte (« red flags ») obtenus grâce à des antécédents cliniques ou un examen physique pour dépister une facture vertébrale chez des patients souffrant d'une lombalgie.

Stratégie de recherche documentaire

Les études originales ont fait l'objet de recherches dans des bases de données électroniques de la date la plus ancienne jusqu'au 7 mars 2012. Des recherches ascendantes et descendantes de références bibliographiques ont également été effectuées dans les études éligibles.

Critères de sélection

Les études étaient prises en compte à condition de comparer les résultats de n'importe quel aspect des antécédents ou des tests réalisés dans le cadre de l'examen physique de patients souffrant d'une lombalgie ou de l'examen de la colonne lombaire à une norme de référence (imagerie de diagnostic). Deux auteurs de la revue ont indépendamment appliqué ces critères de sélection.

Recueil et analyse des données

Trois auteurs de la revue ont évalué les « risques de biais » et extrait des données de manière indépendante. Les risques de biais étaient évalués à l'aide de l'outil QUADAS composé de 11 éléments. Les caractéristiques des études, des patients, des tests d'indice et des normes de référence ont été extraites. Lorsque des données brutes étaient disponibles, elles permettaient de calculer la sensibilité et la spécificité avec des intervalles de confiance (IC) à 95 %. En raison de l'hétérogénéité des études et des tests, la combinaison statistique n'était pas appropriée et l'analyse de la revue était uniquement descriptive. Les rapports de vraisemblance de chaque test étaient calculés et utilisés afin d'indiquer l'utilité clinique.

Résultats principaux

Huit études réalisées en soins primaires (quatre), secondaires (une) et tertiaires (accident et urgence = trois) étaient incluses dans la revue. Dans l'ensemble, les risques de biais des études étaient modérés avec des risques élevés de biais de sélection et de vérification influençant les défauts prédominants. La notification des tests d'indice et de référence était médiocre. La prévalence d'une fracture vertébrale dans des contextes d'accident et d'urgence variait de 6,5 % à 11 % et dans la médecine générale de 0,7 % à 4,5 %. Toutefois, parmi les 29 groupes de tests d'indice ayant fait l'objet d'examens, seuls deux étaient mentionnés dans plus de deux études. Des analyses descriptives révélaient que trois signes d'alerte (« red flags ») en soins primaires étaient potentiellement utiles avec des rapports de vraisemblance significativement positifs (RV+), mais leurs estimations étaient imprécises (traumatisme significatif, âge avancé, administration de corticostéroïdes ; l'estimation ponctuelle des RV+ étant comprise entre 3,42 et 12,85, 3,69 et 9,39, 3,97 et 48,50, respectivement). Un signe d'alerte (« red flag ») en soins tertiaires semblait informatif (contusion/abrasion ; RV+ 31,09, IC à 95 % 18,25 à 52,96). Les résultats des tests combinés semblaient plus informatifs que les signes d'alerte (« red flags ») individuels avec des estimations de RV+ généralement meilleures en termes d'ampleur et de précision.

Conclusions des auteurs

Les preuves disponibles ne recommandent pas l'utilisation de plusieurs signes d'alerte (« red flags ») pour dépister spécifiquement une fracture vertébrale chez des patients souffrant d'une lombalgie. D'après les preuves issues d'études uniques, peu de signes d'alerte (« red flags ») individuels semblent informatifs car la précision du diagnostic de la majorité d'entre eux est médiocre, comme indiqué par les estimations imprécises des rapports de vraisemblance. Lorsque ces signes d'alerte (« red flags ») étaient combinés, les performances semblaient s'améliorer. Selon des preuves limitées, les résultats permettent d'émettre une recommandation peu efficace selon laquelle la combinaison d'un petit sous-ensemble de signes d'alerte (« red flags ») peut se révéler utile pour le dépistage d'une fracture vertébrale. Il convient également de noter que de nombreux signes d'alerte (« red flags ») affichent des taux de faux positifs élevés et si des mesures étaient systématiquement prises à leur égard, il y aurait des conséquences au niveau des coûts de la prise en charge et des résultats chez les patients souffrant d'une lombalgie. D'autres recherches doivent privilégier des ensembles de signes d'alerte (« red flags ») appropriés et une notification adéquate des tests d'indice et de référence.

Zusammenfassung

Merkmale uns Symptome (red flags), die Untersuchungen auf eine Wirbelsäulenfraktur indizieren, bei Patienten mit Schmerzen im unteren Rücken

Hintergrund

Schmerzen im unteren Rücken sind ein weit verbreitetes Krankheitsbild in der Primärversorgung. Ein Hauptziel bei der klinischen Untersuchung ist es, Patienten mit zugrundeliegender schweren Pathologie, wie z. B. Wirbelsäulenfrakturen, zu identifizieren, welche zusätzliche Untersuchung und spezifische Behandlung erfordern können. Alle evidenzbasierten, klinischen Leitlinien empfehlen die Verwendung von Merkmalen und Symptomen (red flags) zur Untersuchung von schwerwiegenden Ursachen von Rückenschmerzen. Es bleibt jedoch unklar, ob die diagnostische Genauigkeit der Merkmale und Symptome ausreicht, um diese Empfehlung zu unterstützen.

Ziele

Ziel ist es, die Genauigkeit der Diagnostik von Merkmalen und Symptomen, die in der Anamnese oder der klinischen Untersuchung erlangt wurden, zur Untersuchung von Wirbelsäulenfrakturen bei Patienten mit Schmerzen im unteren Rücken zu überprüfen.

Literatursuche

Elektronischen Datenbanken wurden von ihrem Beginn an bis zum 7. März 2012 nach Primärstudien durchsucht. Referenzen und Zitationen der eingeschlossenen Studien wurden ebenfalls untersucht.

Auswahlkriterien

Es wurden diejenigen Studien berücksichtigt, welche die Ergebnisse verschiedener Aspekte der Anamnese oder der körperlichen Untersuchung bei Patienten mit Schmerzen im unteren Rücken mit dem Goldstandard (Bildgebung) verglichen. Die Auswahlkriterien wurden unabhängig von zwei Review-Autoren angewendet.

Datenerhebung und -analyse

Drei Autoren bewerteten unabhängig das Risiko für Bias und extrahierten Studiendaten. Das Risiko für Bias wurde anhand des 11-Punkte QUADAS Tool bewertet. Studieneigenschaften, Patienten, Index Tests und Referenzstandards wurden extrahiert. Soweit vorhanden, wurden Rohdaten zur Berechnung der Sensitivität und Spezifität mit einem 95 %-Konfidenzintervall (KI) verwendet. Aufgrund der Heterogenität der Studien und Tests war kein statistisches pooling angebracht und die Analyse für dieses Review war deskriptiv. Es wurden Likelihood-Ratios für jeden Test berechnet und als Hinweis für seine klinische Brauchbarkeit verwendet.

Wesentliche Ergebnisse

Insgesamt wurden acht Studien eingeschlossen, vier aus dem Bereich der Primärversorgung, eine aus dem Bereich der fachärztlichen Versorgung und drei aus der weiterführenden Versorgung (Notaufnahme). Insgesamt war das Risiko für Bias der Studien moderat, wobei das Risiko für Selektionsbias und Verifikationsbias die wesentlichen Fehler waren. Die Berichterstattung über Index- und Referenztestung wurde schlecht berichtet. Die Prävalenz der Wirbelsäulenfraktur im Unfall- und Notfallsetting lag zwischen 6,5 % und 11 % und in der Primärversorgung zwischen 0,7 % und 4,5 %. Es wurden 29 Index-Test untersucht, davon jedoch nur zwei in mehr als zwei Studien. Die deskriptiven Analysen zeigten, dass drei Merkmale und/oder Symptome in der Primärversorgung potenziell nützlich sein können. Diese zeigten eine bedeutsame, positive Likelihood ratio (LR+) , jedoch meist ungenaue Schätzer (signifikantes Trauma, höheres Alter, Gebrauch von Kortikosteroiden; LR+ Punktschätzer von jeweils 3,42 bis 12,85, 3,69 bis 9,39, 3,97 bis 48,50). Ein Warnsignal in der tertiären Versorgung erschien wichtig (Prellung/Kratzer; LR + 31,09, 95%-kI 18,25 bis 52,96). Die Ergebnisse von kombinierten Testungen waren informativer als mit einzelnen Merkmalen und/oder Symptomen. In der Regel hatten dann LR+ Schätzungen eine größere Stärke und Präzision.

Schlussfolgerungen der Autoren

Die verfügbare Evidenz weist nicht darauf hin, dass es sinnvoll ist möglichst viele Merkmale und Symptome zur Untersuchung von Wirbelsäulenfrakturen bei Patienten mit Schmerzen im unteren Rücken anzuwenden. Basierend auf der Evidenz von einzelnen Studien, erscheinen wenige aber dafür zuverlässige Merkmale und Symptome sinnvoller, da die meisten eine geringe diagnostische Genauigkeit aufwiesen. Das zeigte sich durch die ungenauen Schätzer der Likelihood Ratios. Wurden Kombinationen von Merkmalen und/oder Symptomen verwendet, schien sich auch der Nutzen zu verbessern. Die Ergebnisse der begrenzt-vorhandenen Evidenz führen zu einer schwachen Empfehlung, dass eine Kombination von wenigen Merkmalen und Symptomen nützlich sein könnte, um auf Wirbelsäulenfrakturen hin zu untersuchen. Anzumerken ist, dass viele Merkmale und Symptome hohe, falsch positive Ergebnisse haben; und wenn hier kritiklos agiert wird, hätte das Konsequenzen für die Behandlungskosten und die Endpunkte bei Patienten mit Schmerzen im unteren Rücken. Weitere Forschung sollte sich auf entsprechende Zusammensetzungen von Merkmalen und/oder Symptomen sowie angemessene Berichterstattung über Index- und Referenz-Tests konzentrieren.

Plain language summary

Physician use of red flags to screen for fractured vertebrae for patients with new back pain

This review describes the understanding of a common practice for checking for spinal injuries when patients come to a family practice doctor, back pain clinic or emergency room with new back pain.  Doctors usually ask a few questions and examine the back to check for the possibility of a spinal fracture.  The reason for this check for fractures is that the treatment is different for common back pain and fractures.  Fractures are usually diagnosed with an x-ray, then treated with rest, a back brace and pain relievers.  Common back pain is treated with exercise, chiropractic manipulation, and pain relievers; x-rays, computed tomography (CT) and magnetic resonance imaging scans are not useful for diagnosis.  Fractures are rare, being the cause of back pain in the range of 1% to 4.5% of new back pain visits to family doctors.

Eight studies including several thousand patients described 29 different questions and physical exam tests that have been used to look for spinal fractures.  Most of the 29 were not accurate.  The best four questions asked about use of steroids (which can cause weak bones), the patient’s age (age above 74 increases the risk of fractures) and recent trauma such as a fall.  Using a combination of the best questions appears to improve the accuracy.  For example, women above age 74 are more likely to have a fracture when they come to the physician complaining of back pain.  In the emergency room, the best indication of a spinal fracture was a bruise or scrape on the painful area of the back.

Fractures are rare and generally do not require emergency treatment, even if red flags exist clinicians and patients can watch and wait.  During the waiting period, patients should avoid treatments like exercise and manipulation that are not recommended for spinal fractures.

The worst effects of low quality red flag screening are overtreatment and undertreatment.  If the tests are not accurate, patients without a fracture may get an x-ray or CT scan that they don’t need—unnecessary exposure to x-rays, extra worry for the patient and extra cost.  At the other extreme (and much less common), it might be possible to miss a real fracture, and cause the patient to have extra time without the best treatment.

Most of the studies were of low or moderate quality, so more research is needed to identify the best combination of questions and examination methods.

Résumé simplifié

Utilisation médicale de signes d'alerte (« red flags ») dans le dépistage de vertèbres fracturées chez des patients souffrant d'une nouvelle lombalgie

La présente revue explique les connaissances d'une pratique courante consistant à diagnostiquer des lésions médullaires lorsque des patients se rendent chez leur médecin de famille, dans une clinique spécialisée dans le traitement des douleurs lombaires ou aux urgences pour une nouvelle lombalgie. Les médecins posent généralement quelques questions et examinent le dos pour diagnostiquer la présence d'une éventuelle fracture médullaire. On effectue le dépistage de fractures en raison des différences de traitement pour les lombalgies communes et pour les fractures lombaires. Ces dernières sont généralement diagnostiquées par radiographie, le traitement consiste alors à se reposer, à porter un corset et à prendre des antidouleurs. Une lombalgie commune se traite par la pratique d'un exercice, la manipulation chiropratique et la prise d'antidouleurs ; des radiographies, une tomographie informatisée (TI) et des examens d'imagerie par résonance magnétique sont inutiles pour son diagnostic. Les fractures sont rares puisqu'elles sont à l'origine de lombalgies dans seulement 1 à 4,5 % des visites chez le médecin de famille pour une nouvelle lombalgie.

Huit études, incluant plusieurs milliers de patients, étaient composées de 29 questions et tests d'examen physique différents utilisés pour le dépistage de fractures médullaires. La majorité de ces 29 questions étaient imprécises. Les quatre meilleures questions concernaient l'administration de stéroïdes (susceptibles de fragiliser les os), l'âge du patient (une personne âgée de plus de 74 ans est davantage exposée à des risques de fractures) et les traumatismes récents, par exemple, une chute. Une combinaison des questions les plus pertinentes semble améliorer la précision. Par exemple, les femmes âgées de plus de 74 ans sont plus sujettes à souffrir d'une fracture lorsqu'elles se rendent chez leur médecin pour des douleurs lombaires. Aux urgences, le meilleur moyen de diagnostiquer une fracture médullaire est la présence d'ecchymoses ou d'écorchures sur la zone dorsale douloureuse.

Les fractures sont rares et ne nécessitent généralement aucun traitement d'urgence, même en la présence de signes d'alerte (« red flags »), les cliniciens et les patients peuvent surveiller et attendre. Pendant la période d'attente, les patients doivent éviter des traitements, tels que des exercices et la manipulation qui sont déconseillés dans le cas de fractures médullaires.

Les pires effets d'un mauvais dépistage des signes d'alerte (« red flags ») sont le sur-traitement et le sous-traitement. Si les tests sont imprécis, les patients ne présentant aucune fracture peuvent passer une radiographie ou une TI dont ils n'ont pas besoin ; une exposition inutile aux rayons x, une inquiétude et des coûts supplémentaires pour le patient. En revanche (dans des cas beaucoup plus rares), il est possible qu'une fracture avérée ne soit pas dépistée et que le patient reste un certain temps sans bénéficier du meilleur traitement.

La majorité des études étaient de qualité faible à modérée, d'autres recherches sont donc nécessaires pour identifier la meilleure combinaison de questions et de méthodes d'examen.

Notes de traduction

Translated by: French Cochrane Centre

Translation supported by: Minist�re du Travail, de l'Emploi et de la Sant� Fran�ais

Laienverständliche Zusammenfassung

Die Nutzung von Merkmalen uns Symptomen (red flags) durch Ärzte zur Untersuchung von gebrochenen Wirbeln bei Patienten mit neu aufgetretenem Rückenschmerz

Dieser Review beschreibt das Verständnis einer gängigen Praxis zur Untersuchung von spinalen Verletzungen, wenn Patienten in eine Hausarztpraxis, Schmerzklinik oder in eine Notaufnahme mit neu aufgetretenem Rückenschmerz kommen.  Für gewöhnlich erheben Ärzte eine Anamnese und untersuchen den Rücken, um eine Wirbelsäulenfraktur auszuschließen.  Der Grund für diese Überprüfung auf Frakturen ist, dass sich die Behandlung einer Fraktur von der Behandlung von gewöhnlichen Rückenschmerzen unterscheidet.  Frakturen werden in der Regel anhand einer Röntgenaufnahme diagnostiziert, dann mit der Verordnung von Ruhe, einer Rückenstütze und Schmerzmitteln behandelt.  Gewöhnliche Schmerzen im Rücken werden mit Bewegung, Chiropraxis und Schmerzmitteln behandelt; Röntgen, Computertomographie (CT) und Magnetresonanz-Tomographie Scans eignen sich hier nicht für die Diagnose.  Frakturen sind selten, sie sind nur in einem bis 4,5 % der Fälle die Ursache von Rückenschmerzen, bei Patienten, die mit neu aufgetretenen Rückenschmerzen in die Hausarztpraxis kommen.

Acht Studien mit mehreren tausend Patienten haben 29 verschiedene Fragen und Techniken der körperlichen Untersuchungen beschrieben, welche verwendet wurden, um nach Wirbelsäulenfrakturen zu suchen.  Die meisten der 29 Studien waren nicht genau.  Die besten vier Fragen handelten von der Verwendung von Steroiden (die Einnahme von Steroiden kann zu schwachen Knochen führen), dem Alter des Patienten (Alter über 74 erhöht das Risiko von Knochenbrüchen) und der Frage nach vorausgegangenen Traumata, wie beispielsweise Stürzen.  Eine Kombination der besten Testfragen scheint die Genauigkeit zu verbessern.  Beispielsweise leiden Frauen über 74 Jahre, welche beim Arzt über Rückenschmerzen klagen eher an einer Fraktur.  In der Notaufnahme stellte eine Prellung oder ein Kratzer an der schmerzenden Stelle des Rückens den besten Hinweis auf eine spinale Fraktur da.

Frakturen sind selten und erfordern in der Regel keine Notfallbehandlung. Selbst wenn Warnsignale vorhanden sind, können Ärzte und Patienten abwarten und beobachten.  Während des Abwartens sollten Patienten Behandlungen in Form von Bewegung und Manipulation vermeiden, welche nicht für Wirbelsäulenfrakturen empfohlen werden.

Die schlimmsten Auswirkungen durch das Screening aufgrund von Merkmalen und Symptomen schlechterer Qualität sind Überbehandlung und Unterbehandlung.  Wenn die Tests nicht genau sind, erhalten Patienten ohne Bruch eine Röntgen- oder CT-Aufnahme, welche sie nicht benötigen und werden unnötigen Belastungen durch Röntgenstrahlen ausgesetzt. Weiterhin bedeutet das unnötige Verunsicherung für den Patienten sowie insgesamt höhere Kosten.  Das andere, mögliche (weitaus seltenere) Extrem, ist dass eine tatsächliche Fraktur übersehen wird und der Patient nicht gleich die beste Therapie erhält.

Die meisten Studien waren von niedriger oder moderater Qualität, sodass weitere Untersuchungen erforderlich sind, um die beste Kombination aus Fragen und Untersuchungsmethoden zu identifizieren.

Anmerkungen zur Übersetzung

M. Schmidt, freigegeben durch Cochrane Deutschland

Ancillary