Introducción
La prevalencia de apendicitis aguda a lo largo de la vida se encuentra en un 7-8%1. Con el crecimiento de la expectativa de vida también ha aumentado la prevalencia de la apendicitis aguda en la población mayor de 65 años2,3. En este grupo de pacientes, la prevalencia es similar a la de la población general, pero la tasa de perforación es mayor (35% vs. 13%)4. Además, es bien sabido que con la edad incrementa la ocurrencia de patologías abdominales de tipo inflamatorio, vascular y oncológico, entre otras, y el número de adultos mayores ocupa una proporción significativa de los pacientes que consultan a los servicios de urgencias5. La apendicitis aguda continúa siendo una causa de dolor abdominal agudo cercana al 15% y representa la segunda causa de dolor abdominal luego de la enfermedad biliar4. Por estas razones, es recomendable que en todos los pacientes se estratifique la probabilidad de apendicitis aguda para orientar el diagnóstico y el tratamiento6. En general, quienes presentan alta probabilidad de apendicitis deben ser operados, quienes presentan baja probabilidad deben ser observados ambulatoriamente y quienes se encuentran en una zona gris, o de incertidumbre diagnóstica, deben ser estudiados con técnicas de imagen, idealmente con tomografía computarizada contrastada abdominal. Este tipo de estratificación se realiza mediante escalas diagnósticas que combinan síntomas, hallazgos de la exploración física y pruebas bioquímicas. Las más recomendadas son la de Alvarado y la Appendicitis Inflammatory Response (AIR)6. La escala de Alvarado, en particular, es aceptada entre la comunidad científica por el extenso cuerpo de evidencia empírica que la respalda desde la década de 19807. En su versión original, la escala fue desarrollada para evaluar la probabilidad de apendicitis aguda en la población general8. Sin embargo, el rendimiento de la escala de Alvarado no es completamente conocido en los adultos mayores. Estos pacientes representan una población especial, junto con los niños, las mujeres en embarazo y los pacientes con inmunosupresión. Por tal motivo, se recomienda una evaluación cuidadosa ante la posibilidad de otras patologías abdominales, así como por la coexistencia de enfermedades crónicas, uso medicamentos, fragilidad, cambios cognitivos y alteraciones en la funcionalidad, entre otros. Estas razones llevan a que muchos cirujanos e instituciones, como parte de la atención segura, evalúen a todos los adultos mayores con imágenes diagnósticas, independientemente del puntaje, o incluso sin aplicar ninguna escala diagnóstica. No obstante, en la práctica diaria es habitual que los adultos mayores continúen estratificándose con escalas de la misma forma que la población general. Frente a esta controversia en el abordaje diagnóstico del adulto mayor con dolor abdominal agudo, el objetivo de este estudio fue revisar la evidencia disponible sobre el rendimiento de la escala de Alvarado en la probabilidad de apendicitis aguda en esta población.
Método
Se realizó una revisión sistemática de la literatura de pruebas diagnósticas, de acuerdo con la declaración PRISMA (Preferid Reporting Items for Systematic reviews and Meta- Analyses)9. Este estudio fue aprobado por la Comisión de Investigación de la Facultad de Medicina de la Universidad de La Sabana (MEDEsp-41-2020).
Selección de los estudios
Los criterios de inclusión fueron ser estudios originales publicados en inglés o español que evaluaran el rendimiento diagnóstico de la escala de Alvarado (individual o en comparación con otras escalas) en adultos mayores de 65 años con sospecha clínica o diagnóstico de apendicitis aguda. Para este propósito se seleccionaron ensayos clínicos, estudios de cohorte prospectiva y retrospectiva, y series de casos, publicados desde enero de 1986 hasta diciembre de 2022. Se excluyeron revisiones narrativas de la literatura, cartas al editor, resúmenes, pósteres y presentaciones en congresos.
La búsqueda se realizó en las bases de datos PubMed, Scopus, LILACS, Cochrane y BIREME. Se utilizaron los siguientes términos clave en inglés: "Alvarado scale", "Alvarado score", "acute apendicitis", "elderly", "older adults", "diagnostic scale", "predictive scale" y "appendectomy". Se utilizaron los siguientes términos clave en español: "escala de Alvarado", "puntaje de Alvarado", "apendicitis aguda", "ancianos", "adultos mayores", "escala diagnóstica", "escala predictiva" y "apendicectomía". La búsqueda también incluyó referencias cruzadas. Los títulos y los resúmenes de todos los artículos fueron evaluados independientemente por cada autor y luego seleccionados en consenso.
Desenlaces
- Primarios: características operativas de la escala de Alvarado. Se evaluaron los puntos de corte ideales, los valores de la curva ROC (Receiver Operating Characteristics), la sensibilidad, la especificidad, el valor predictivo positivo, el valor predictivo negativo, la razón de verosimilitud positiva, la razón de verosimilitud negativa, la exactitud diagnóstica y la capacidad discriminativa.
- Secundarios: morbilidad, mortalidad, readmisión, estancia hospitalaria y costos.
Extracción de los datos de los estudios
Se obtuvieron los siguientes datos demográficos de cada estudio: autor, año de publicación, país, diseño del estudio, objetivo, método, población, sexo, edad, tiempo de evolución de los síntomas, promedio en la escala de Alvarado, distribución de la población en la escala de Alvarado, estudio histopatológico y uso de pruebas diagnósticas complementarias. Luego se realizó la extracción de los datos correspondientes a los desenlaces propuestos.
Evaluación de la calidad de la evidencia
Se realizó por consenso entre los dos autores de la revisión siguiendo los criterios ROBINS-I (Risk Of Bias In Non-randomized Studies - of Interventions)10.
En cada estudio se identificaron los siguientes tipos de sesgos: confusión, selección de los participantes en el estudio, clasificación de las intervenciones, desviaciones de las intervenciones previstas, falta de datos, medición de los resultados y selección del resultado informado.
Análisis estadístico
Se calcularon las estadísticas descriptivas para las variables demográficas. Las variables continuas se expresaron en promedios, desviaciones estándar y rangos. Las variables categóricas se expresaron en frecuencias y porcentajes. De acuerdo con los resultados de evaluación de la calidad metodológica, en caso de identificar homogeneidad en los estudios, se planeó un análisis estadístico agregado de los datos (metaanálisis).
Resultados
Características de los estudios y aspectos demográficos
Cuatro estudios cumplieron los criterios para ser incluidos en la revisión sistemática de la literatura11-14. El diagrama de flujo para la selección de los estudios se presenta en la figura 1. Dos estudios (50%) fueron realizados en Turquía11,12 y los otros dos en los Estados Unidos de América13,14. Todos son de diseño retrospectivo; dos de ellos corresponden a estudios de cohorte y los otros dos a series de casos. Dos estudios comparan el rendimiento de la escala de Alvarado frente a las escalas de Raja Isteri Pengiran Anak Saleha Appendicitis (RIPASA)11 y Lintula12. En todos los estudios, el computo del puntaje de la escala de Alvarado fue realizado retrospectivamente.
Los estudios seleccionados incluyen un total de 480 pacientes. El porcentaje de mujeres varió entre el 42% y el 58.3%. En dos estudios, el diagnóstico de apendicitis aguda fue realizado por tomografía computarizada en más del 95% de los pacientes13,14. Otros aspectos demográficos de la población se muestran en la tabla 1.
Autores | País/año | Diseño | Objetivo | Métodos | Población | Edad (años) | Mujeres (%) | Tiempo de evolución (días) | Promedio escala | Distribución escala | IMC | Comorbilidad (%) | Patología positiva (%) | Imágenes diagnósticas (%) |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Tekyol et al.11 | Turquía, 2022 | Cohorte retrospectiva (2018-2021) | Evaluar la precisión diagnóstica de RIPASA y Alvarado en adultos mayores operados por apendicitis aguda | Los investigadores identificaron pacientes > 65 años operados (con o sin confirmación patológica) Calcularon retrospectivamente Alvarado y RIPASA | 86 | 71.2 ± 5.9 | 53.5 | ND | 3.48-5.29 | ND | ND | ND | 75.6 | ND |
Deiters et al.13 | EE.UU., 2019 | Serie de casos retrospectiva (2012-2016) | Determinar la utilidad de la escala de Alvarado para identificar apendicitis aguda complicada vs. no complicada | Los investigadores identificaron pacientes > 65 años operados y con diagnóstico patológico Calcularon retrospectivamente Alvarado | 100 complicada | 72.9 ± 6.9 | 49 | 2.70 ± 3.41 | 6.96 ± 1.99 | ≥ 7: 61.8% | 28.5 ± 6.3 | 26.2 | 100 | 99,1% (TC) |
106 no complicada | 73.0 ± 6.7 | 42 | 2.09 ± 3.08 | 6.72 ± 1.85 | ≥ 7: 63.2% | 28.7 ± 5.3 | 31.6 | |||||||
Shchatsko et al.14 | EE.UU., 2017 | Serie de casos retrospectiva (2000-2010) | Evaluar la utilidad de la escala de Alvarado en la predicción de la apendicitis aguda en adultos > 65 años | Los investigadores identificaron reportes patológicos Calcularon retrospectivamente Alvarado Compararon la distribución en los puntajes de la escala con los de la cohorte de Alvarado (1986) | 96 | 73.7 ± 1.5 | 58.3 | 2.8 ± 0.8 | 6.9 ± 0.33 | 1-4: 3.7% 5-8: 86,6% 9-10: 9.7% | ND | ND | 100 | 97.9% (TC) |
Konan et al.12 | Turquía, 2011 | Serie de casos retrospectiva (fecha ND) | Evaluar el rendimiento de las escalas de Alvarado y Lintula en pacientes > 65 años | A pacientes con diagnóstico patológico se les calculó retrospectivamente Alvarado y Lintula Luego fueron comparados con un grupo de pacientes con dolor abdominal no específico | 41 apendicitis 41 dolor abdominal | 69 | 43 | ND | ND | ND | ND | ND | 100 | ND |
IMC: índice de masa corporal; ND: no descrito; RIPASA: Raja Isteri Pengiran Anak Saleha Appendicitis; TC: tomografía computarizada.
La evaluación de la calidad metodológica de los estudios se encuentra en la figura 2. En general, los estudios incluidos demostraron un alto riesgo de sesgos y heterogeneidad metodológica, que limitan conducir un análisis estadístico agregado (metaanálisis).
Características diagnósticas operativas de la escala de Alvarado
Dos estudios reportaron la curva ROC de la escala de Alvarado, en comparación con otras escalas. El valor de la curva ROC de la escala de Alvarado, con un punto de corte > 4, en comparación con la de RIPASA, fue 0.799 versus 0.88611. Con un punto de corte > 5, en comparación con la escala de Lintula, el valor de la curva ROC fue 0.969 versus 0.9212. La exactitud diagnóstica solo fue reportada por un estudio y correspondió al 88.7%12. Otras características operativas se encuentran descritas en la tabla 2.
Autores | Escala | Puntos de corte ideales | ROC global (IC95%) | Índice Youden | Sensibilidad (IC95%) | Especificidad (IC95%) | VPP | VPN | RVP | RVN | Exactitud | Capacidad para diferenciar apendicitis complicada de no complicada |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Tekyol et al.11 | Alvarado | > 4 | 0.799 (0.698-0.877) | 0.549 | 69.2 (56.6-80.1) | 85.7 (63.7-97.0) | 93.7 | 47.4 | 4.85 | 0.36 | ND | ND |
RIPASA | > 8 | 0.886 (0.799-0.944) | 0.642 | 78.5 (66.5-87.7) | 85.7 (63.7-97.0) | 94.4 | 56.2 | 5.49 | 0.25 | ND | ND | |
Deiters et al.13 | Alvarado | ND | ND | ND | ND | ND | ND | ND | ND | ND | Alvarado ≥ 7 Complicada 61.8 No complicada 63.2 No diferencia entre pacientes < 70 años, 71-75 años o > 76 años con apendicitis complicada y no complicada | |
Shchatsko et al.14 | ND | ND | ND | ND | ND | ND | ND | ND | ND | ND | ND | Alvarado 5-8 se correlacionó mas frecuentemente con apendicitis aguda, independientemente del tipo patológico Con respecto al estudio original (1986) se encontraron diferencias en la distribución de los puntajes entre 5-6 (37.8% vs. 15%; p = 0.001) y 9-10 (9.7% vs. 32.1%; p = 0.001) |
Konan et al.12 | Alvarado | 5 | 0,969 (0,94-0,998) | ND | 87.8 | 89.7 | 90.0 | 87.5 | ND | ND | 88.7 | ND |
Lintula | 12 | 0,928 (0,874-0,982) | ND | 87.8 | 87.2 | 88 | 87 | ND | ND | 87,5 | ND |
IC95%: intervalo de confianza del 95%; ND: no descrito; RIPASA: Raja Isteri Pengiran Anak Saleha Appendicitis; ROC: Receiver Operating Characteristics; RVN: razón de verosimilitud negativa; RVP: razón de verosimilitud positiva; VPN: valor predictivo negativo; VPP: valor predictivo positivo.
Con respecto a la capacidad de discriminación de la escala, independientemente de la gravedad de la apendicitis aguda, un estudio reportó que la distribución de los pacientes fue similar cuando el puntaje fue ≥ 7 (complicada = 61.8, no complicada = 63.2; p no significativa)13. No obstante, las características diagnósticas operativas de la escala con respecto a la gravedad de la apendicitis no fueron reportadas en ningún estudio.
Desenlaces secundarios
De acuerdo con la información disponible en dos estudios, la tasa de complicaciones varió entre el 22% y el 37%13,14. Las tasas de reoperación y de mortalidad reportadas en un estudio fueron del 1.2% y el 5.3%, respectivamente14. La tasa de apendicectomía negativa fue reportada en un estudio (24.4%)11. Ningún estudio incluye información relacionada con los costos. Asimismo, ningún estudio informó sobre el comportamiento de los desenlaces secundarios en función del puntaje en la escala de Alvarado. En la tabla 3 se muestran otros hallazgos.
Autores | Abordaje quirúrgico | Complicaciones | Mortalidad | Estancia hospitalaria | Reoperación | Apendicetomía negativa (%) | Costos |
---|---|---|---|---|---|---|---|
Tekyol et al.11 | ND | ND | ND | ND | ND | 24,4 | ND |
Deiters et al.13 | Laparoscópico: 88.8% Conversión: 8.8% | Apendicitis complicada: 37% | 1 | 5.34 ± 5.56 | ND | - | ND |
Apendicitis no complicada: 22% | 0 | 3.12 ± 2.86 | |||||
Shchatsko et al.14 | ND | 33 | 1.2 | 5.88 ± 1.02 | 5,3 | - | ND |
Konan et al.12 | ND | ND | ND | ND | ND | - | ND |
ND: no descrito.
Discusión
Los resultados de la presente revisión indican que existe un número limitado de estudios originales, de pobre calidad metodológica, sobre la utilidad de la escala de Alvarado en la predicción de apendicitis aguda en el adulto mayor. Dos estudios comparan el rendimiento diagnóstico frente a las escalas de RIPASA y Lintula, respectivamente; en estos el valor de la curva ROC de la escala de Alvarado fue inferior al de la RIPASA y prácticamente igual al de la Lintula.
Esta es la primera revisión sistemática de la literatura que ofrece una síntesis clara y estructurada de la información disponible sobre este tema. Estudios previos dan cuenta del aceptable rendimiento diagnóstico de la escala en pacientes pediátricos, embarazadas y población general, y soportan su uso en la práctica clínica6,15,16. Con respecto a los hallazgos, esta revisión identifica varias limitaciones de la evidencia disponible, que en su conjunto dan cuenta de los sesgos de estudios publicados en las dos décadas anteriores, las cuales ofrecen oportunidades de nuevos estudios. A continuación, se enumeran algunas de las limitaciones más importantes, así como algunas propuestas para la agenda de investigación:
- Todos los estudios primarios disponibles sobre el rendimiento diagnóstico y las características operativas de la escala de Alvarado en adultos mayores son de diseño retrospectivo. La validación de pruebas diagnósticas con base en diseños retrospectivos representa una amenaza para la confiabilidad de los resultados17. Los nuevos estudios deben enfocarse en la validación prospectiva de la escala.
- El principal criterio de validez de una prueba diagnóstica es su capacidad para clasificar correctamente si un paciente tiene la enfermedad (sensibilidad) o no la tiene (especificidad). Es frecuente una «sobreestimación» del resultado de la prueba diagnóstica en estudios cuando se conoce previamente el desenlace y se asignan de esta forma componentes de la prueba a los enfermos18. En todos los estudios incluidos en esta revisión, el cómputo del puntaje de Alvarado se realizó a posteriori sobre datos disponibles en registros clínicos. Por la naturaleza del diseño de investigación, algunos hallazgos clínicos en la exploración física (por ejemplo, el signo de Blumberg) pueden ser difíciles de evaluar de forma retrospectiva, a menos que estén adecuadamente consignados en la historia clínica, y ser interpretados como positivos. En estrecha relación con el diseño prospectivo, es necesario que en los nuevos estudios el cálculo del puntaje de la escala se realice en tiempo real con base en los hallazgos clínicos observados por el examinador.
- En tres de los cuatro estudios incluidos en esta revisión, la población correspondió a sujetos que presentaron apendicitis aguda confirmada por estudio histopatológico, considerado el método de referencia. Por lo tanto, estos estudios cuentan con un importante sesgo de medición relacionado con la exclusión de sujetos no enfermos, es decir, sin apendicitis aguda. Debido a ello, el cómputo de la sensibilidad y la especificidad podría sobre- o subestimarse. Aunque el método de referencia es crucial en cualquier estudio de pruebas diagnósticas, los nuevos estudios deben incluir pacientes con dolor abdominal agudo con y sin apendicitis aguda. Con este tipo de población, la sensibilidad y la especificidad podrían ser confiables. Además, este tipo de análisis permitiría conocer el comportamiento de los falsos positivos (por ejemplo, qué otras patologías abdominales se encuentran en la población). Este sesgo también afecta otras características operativas de la escala; por ejemplo, el computo de la razón de verosimilitud positiva, entendida como la razón entre la tasa de verdaderos positivos y la tasa de falsos positivos, e igualmente la razón de verosimilitud negativa.
- Los estudios incluidos en esta revisión informan pobremente sobre el espectro de gravedad de la enfermedad en la población. El comportamiento de la escala debe tenerse en cuenta en pacientes con apendicitis complicada y no complicada. Aunque dos estudios informan sobre la gravedad de la apendicitis, no reportan las características operativas de la escala en cada grupo. Estos estudios únicamente ofrecen porcentajes sobre la positividad de la escala por encima de determinados puntos de corte en individuos con diferentes tipos de apendicitis. Un estudio adecuadamente diseñado debería incluir pacientes con diferente gravedad de la apendicitis e informar sobre las características operativas en cada uno de ellos.
- La comparación disponible sobre la validez predictiva de la escala de Alvarado con otras escalas es limitada. Dos estudios fueron realizados con las escalas RIPASA y Lintula. Existen limitaciones metodológicas en estos estudios propias del cálculo retrospectivo de los puntajes. Adicionalmente, la escala de Lintula fue diseñada para la población pediátrica19. Es necesario conducir estudios que comparen la validez predictiva frente a escalas de uso creciente y adecuado rendimiento diagnóstico en adultos, como AIR20, RIPASA21 y Diagnostic Score22. Llamativamente, no existen estudios que evalúen el rendimiento de estas últimas escalas en población geriátrica.
- Las limitaciones anteriores afectan la estimación de los puntos de corte óptimos de la escala con los cuales se obtienen las mejores sensibilidad y especificidad. En los estudios incluidos, los cálculos de estas características operativas fueron realizados basándose en los puntos de corte de la escala para la población general. Adicionalmente, los adultos mayores con sospecha de apendicitis aguda presentan comorbilidad cercana al 44%, así como otras patologías abdominales concomitantes cercanas al 85%, que podrían afectar los puntos de corte y el rendimiento de la escala5. En la práctica, estos aspectos indican la necesidad de explorar cuidadosamente al paciente y no atenerse únicamente a los ítems de la escala. Si bien la escala de Alvarado puede tener utilidad en el tamizaje, es necesario que los nuevos estudios ajusten dinámicamente los puntos de corte para mejorar las características operativas de la prueba.
- En tres estudios incluidos en la revisión, el diagnóstico de apendicitis aguda fue confirmado por técnicas de imagen. Aunque el diseño de los estudios fue retrospectivo y el puntaje de la escala no contribuyó a orientar la solicitud de pruebas diagnósticas, los nuevos estudios deben tener en cuenta este aspecto.
- Aunque dos estudios informan sobre la morbilidad, la mortalidad y la estancia hospitalaria de la población, se desconoce el impacto de la escala de Alvarado sobre estos indicadores. Los nuevos estudios deben analizar cuidadosamente el comportamiento de la escala de Alvarado en la reducción de la morbilidad asociada al tratamiento de la apendicitis aguda.
- Se desconoce el impacto de la escala de Alvarado en los costos directos e indirectos del cuidado clínico. Los nuevos estudios también deben considerar este aspecto.
- Los estudios disponibles incluidos en esta revisión fueron realizados en los Estados Unidos de América y en Turquía. Se desconoce el rendimiento de la escala en otros contextos de asistencia clínica (por ejemplo, Europa y Latinoamérica).
Conclusión
El dolor abdominal agudo es un reto diagnóstico en el adulto mayor. De acuerdo con los aspectos mencionados, y pese a algunas limitaciones propias de las revisiones sistemáticas de la literatura relacionadas con la cantidad y la calidad de los estudios, así como la falta de evaluación de literatura gris, la escala de Alvarado tiene una utilidad limitada en esta población. Una alta concurrencia de patologías que confunden el diagnóstico en estos pacientes, una mayor posibilidad de una respuesta inflamatoria modificada (ingesta crónica de medicamentos, condición de fragilidad, etc.) y la pertinencia de efectuar pruebas de alto rendimiento diagnóstico para otras condiciones inflamatorias intraabdominales (tomografía computarizada o resonancia magnética)23,24 limitan la utilidad de la escala de Alvarado como un elemento diagnóstico determinante de una conducta quirúrgica o expectante. La presente revisión sistemática de la literatura identifica algunos vacíos de conocimiento relacionados con este tema y contribuye con algunas propuestas para la investigación futura.