Abreviaturas y siglas
ECC, ensayo clínico controlado y aleatorizado
Antecedentes
Los estudios experimentales son un grupo de diseños de investigación que se usan generalmente para evaluar alguna medida terapéutica; sin embargo, con estos diseños también se evalúan otro tipo de intervenciones. Como intervención(es) en el área clínica nos referimos a la(s) acción(es) dirigida(s) a modificar uno o más condiciones de un paciente o sujeto sano, de manera individual o grupal.
Además de las intervenciones terapéuticas, existen las intervenciones preventivas y educativas. Las terapéuticas están dirigidas a mejorar, eliminar o a controlar un padecimiento o alguna sintomatología en particular, pudiendo ser farmacológicas, quirúrgicas, de rehabilitación y cambios en estilo de vida (alimentación, ejercicio, etcétera). En tanto, las preventivas tienen como propósito evitar la aparición de una enfermedad o el desarrollo de alguna complicación, como la vacunación y los cambios en el estilo de vida. Las intervenciones educativas pueden estar dirigidas a pacientes o a integrantes del equipo de salud y, en términos generales, con este tipo de intervenciones se pretende que las personas hagan cambios en sus conductas, hábitos o costumbres para mejorar la salud, mediante la adquisición de conocimientos. Por ejemplo, la intervención puede ser un taller para la implementación de guías en pasantes de medicina, cuyo objetivo es mejorar la calidad de atención de pacientes con asma en un primer nivel de atención.
El término eficacia es el que habitualmente se utiliza para determinar que una intervención sirve (por ejemplo, si albuterol mejora la capacidad respiratoria en pacientes asmáticos). Para establecer la eficacia de una intervención se debe realizar un estudio experimental (o ensayo clínico), en el cual a un grupo de pacientes se otorga dicha intervención (denominado grupo experimental) y se compara con otro grupo (denominado grupo control), al cual se le da un placebo o nada. Mientras que el término efectividad se utiliza para comprobar si existe diferencia en cuanto a la eficacia de dos (o más) intervenciones, es decir, son ensayos clínicos después de haber comprobado que las dos intervenciones sirven en estudios de eficacia (por ejemplo, beclometasona versus budesonida en el tratamiento de asma). Entonces, para demostrar la eficacia y efectividad de una intervención, en el grupo experimental debe existir mayor número de pacientes que se mejoran, en comparación al grupo control.
Si bien, el ensayo clínico controlado y aleatorizado (ECCA) es el diseño de investigación ideal para la evaluación de la eficacia y efectividad de las intervenciones, desde hace años se disponen de otros tipos de estudios experimentales que también pueden ayudar a comprobar la magnitud del efecto de las intervenciones, aunque con menor grado de validez. Estos estudios siguen teniendo vigencia, dado que no siempre es posible realizar ECCA. En este artículo se exponen las características de distintos diseños experimentales, incluyendo ventajas, desventajas y ejemplos.
Ensayo clínico controlado aleatorizado
Este diseño es el más riguroso para la evaluación de cualquier intervención; para llamarlo ECCA debe cumplir con cuatro características principales:
Utilizar un grupo control que permita la comparación del efecto de la intervención sobre los grupos.
La asignación de la intervención debe ser al azar (también llamado método de aleatorización) para evitar que la aplicación de la intervención dependa de los investigadores y, además, ayuda a que las características iniciales entre los grupos sean semejantes.
La medición de la(s) variable(s) de desenlace deben ser cegadas, lo cual evita sesgos de información.
Al término del estudio, la mayoría (≈ 90 %) de los participantes deben haber tenido una vigilancia completa durante todo el periodo del estudio.
El grupo control se refiere al grupo de sujetos que recibe una intervención para contrastar los resultados con el grupo experimental. En los ensayos clínicos, el uso de placebo es generalmente la intervención de control, la cual tiene una apariencia similar a la intervención en estudio, pero se trata de una sustancia inerte; se ha reportado que el uso de placebo puede provocar mejoría hasta en 40 % los pacientes en una amplia gama de condiciones clínicas, tales como dolor, asma, presión arterial alta e incluso infarto de miocardio. Cabe señalar que el grupo control no necesariamente debe ser un placebo pues en ocasiones lo más adecuado (y ético) es que sea el tratamiento estándar, es decir, la mejor alternativa terapéutica vigente en el momento de ejecutar el ensayo clínico.
En la Figura 1a se describe el proceso de un ECCA. Como se observa, para determinar la eficacia o efectividad de la intervención experimental, la variable de desenlace principal se debe medir antes y después de otorgar la intervención en los dos grupos. Si al terminar el estudio, los resultados favorecen al grupo experimental se considerará que la intervención es eficaz o efectiva.
Aleatorización
En los ECCA, la aleatorización se refiere a la probabilidad que tiene cada participante de asignarle a una u otra intervención, es decir, grupo experimental o grupo control. Así, se garantiza que el otorgamiento de la intervención no sea debido a la percepción del participante (por ejemplo, suponer que sirve el fármaco) o de los investigadores (por ejemplo, brindar el fármaco en estudio a los pacientes más graves). De hecho, desde hace años, la aleatorización es la que se considera la estrategia más importante para determinar si una intervención es eficaz o efectiva.
Además, la aleatorización tiene otra ventaja importante: balancear las posibles variables de confusión entre el grupo experimental y el control, las cuales pueden modificar los resultados de la investigación. Cuando se logra que la frecuencia y distribución de las diferentes variables sean similares entre los dos grupos, los resultados del estudio serán más confiables. De tal forma que si los resultados arrojan que el grupo experimental tuvo mayor beneficio se puede asumir que dicha intervención es la directamente responsable de modificar el curso de la enfermedad.
Existen diferentes tipos de aleatorización, los cuales no alteran la esencia de lo ya señalado y generalmente se utilizan para hacer más eficiente el estudio. La aleatorización simple es la forma más frecuente y puede realizarse de diversas maneras: echar una moneda al aire, haciendo una rifa o tómbola en la cual cada participante toma un papel que indica el grupo que corresponde. También puede ser mediante tablas de números aleatorios o con programas estadísticos.
Otra forma es la aleatorización por bloques, que consiste dividir el total de la muestra y hacer pequeños “sorteos” de aleatorización simple. Por ejemplo, si se pretende hacer una investigación con 100 participantes (50 por grupo), entonces se pueden hacer cinco bloques de 20, sorteando 10 para el grupo experimental y 10 para al control. La ventaja de esta modalidad es que al término de cada “bloque” siempre habrá un número igual de participantes de los dos grupos. En el caso de la aleatorización estratificada tiene por objetivo disminuir las variables de confusión; por ejemplo, puede ocurrir que haya diferencias de resultados entre hombres y mujeres, si es el caso, se deberán sortear un grupo experimental y otro control con cada estrato de hombres y de mujeres. De esta manera, al final habrá cuatro grupos. La desventaja principal de la aleatorización estratificada es el incremento del tamaño de muestra.
Cegamiento
Es una estrategia establecida por el investigador para que la evaluación de los resultados sea objetiva, particularmente cuando la variable de resultado principal se mide con datos que dependen de la percepción del paciente (como dolor, efectos adversos, calidad de vida, etcétera) o de la participación del equipo de salud (identificación de signos y síntomas, como dificultad respiratoria, medición de presión arterial que pueden modificarse, entre otras cosas, por la experiencia). Sin embargo, aun cuando la variable de desenlace se mida de manera dura (como los resultados de exámenes de laboratorio), lo ideal es que todo ensayo clínico siempre sea cegado.
Cuando los participantes del estudio desconocen (es decir, están cegados) la intervención que están recibiendo (por ejemplo, fármaco activo o placebo), entonces el efecto real de la intervención será obtenido al momento de hacer la evaluación de los resultados. El propósito del cegamiento en los investigadores es para evitar una interpretación errónea cuando se realice la evaluación de la(s) variable(s) desenlace en los participantes en el estudio; por ejemplo, es posible que al conocer los pacientes del grupo del fármaco activo se realice mayor número de tomas de la variable de resultado cuando no parece haber efecto terapéutico, o bien, puede ocurrir que en el grupo control se lleven a cabo otras maniobras (conocidas como cointervenciones), a fin de proteger a los pacientes, si se piensa que deberían recibir otro tratamiento.
Como puede haber combinaciones, existen dos tipos de estudios: ciego simple o doble ciego. Si el paciente o el investigador están cegados, será ciego simple; mientras que cuando ambos están cegados el estudio se considera doble ciego. Cuando no se lleva a cabo algún tipo de cegamiento, el diseño de investigación se deberá nombrar como ECCA abierto.
Vigilancia o seguimiento de participantes durante el estudio
El mejor ensayo clínico es aquel donde todos los participantes que se incluyeron al inicio del estudio lo terminan. Sin embargo, es común observar que, por diferentes razones, al final del estudio haya menor número de participantes. Las razones de las llamadas pérdidas durante el seguimiento pueden ser por fallecimiento, cambio de domicilio, falta de apego o abandono al tratamiento, eventos adversos graves, etcétera. Desde hace tiempo se considera que una pérdida no mayor de 10 % de participantes a lo largo de la ejecución del estudio puede no afectar los resultados, no obstante, siempre se deberá conocer las causas por las que los participantes decidieron o no les fue posible continuar hasta el término del estudio.
Cuando ocurren pérdidas, los análisis estadísticos se pueden hacer de dos formas: por protocolo o por intención a tratar. El primero se refiere a que serán incluidos en el análisis exclusivamente los sujetos que cumplieron los criterios de selección, en quienes se aplicó la intervención y hubo la vigilancia de acuerdo con lo planeado originalmente. Hacer el análisis de esta forma puede ser apropiado, pero se tiene que tomar en cuenta que generalmente los resultados hacen parecer a la intervención experimental mucho mejor de lo que es real. Por su parte, en el análisis por intención a tratar, a fin de evitar que las inferencias que se realizan cuando es por protocolo, se incluye a todos los participantes, independientemente de que no hayan completado el periodo de estudio. A los participantes que no completaron el estudio se les “asigna” el peor resultado posible de la variable de desenlace evaluada; de esta forma se podrá amortiguar lo observado en el análisis por protocolo. Si con el análisis de intención a tratar los resultados muestran ventajas de la intervención experimental sobre el grupo control, entonces las conclusiones apoyarán con mayor solidez que dicha intervención es efectiva.
Ensayo clínico aleatorizado factorial
En este diseño se evalúan más de dos intervenciones. Teóricamente el diseño puede expandir el número de intervenciones, sin embargo, en los ensayos clínicos usualmente este número siempre es bajo. Por ejemplo, si se desea probar la eficacia del medicamento A comparándolo con el medicamento B, pero tomando en cuenta dos diferentes dosis de cada medicamento (dosis X y dosis Y), entonces se requerirá conformar cuatro grupos:
Con el medicamento A y dosis X.
Con medicamento A y dosis Y.
Con medicamento B y dosis X.
Con medicamento B y dosis Y.
La utilidad de este tipo de diseño es analizar la interacción del efecto de más de dos intervenciones que se incluyen en el estudio. Como se observa en la Figura 1b, con excepción del número de intervenciones, no hay variación del resto del diseño de un ECCA simple.
Ensayo clínico aleatorizado cruzado
En el ECCA de diseño cruzado los dos grupos reciben dos tratamientos o intervenciones en diferentes momentos. Como se observa en la Figura 1c, el grupo 1 recibe el tratamiento A y el grupo 2 recibe el tratamiento B por un periodo de tiempo, posteriormente se hace un periodo de lavado, donde los grupos dejan de recibir los tratamientos a fin de que la segunda parte del estudio sea semejante al momento de inicio del estudio; es decir, sin el efecto terapéutico de algún fármaco.
Posteriormente, el grupo 1 recibe el tratamiento B y el grupo 2 recibe el tratamiento A por el mismo tiempo que habían recibido el tratamiento previo. Como se describe en la figura, la medición de la variable de desenlace se realiza antes y después de la aplicación de una u otra intervención.
Este tipo de diseño es particularmente útil cuando se quiere comprobar la posible diferencia entre dos tratamientos cuya eficacia se conoce. Asimismo, solamente pueden ser realizados en poblaciones con una enfermedad estable (como hipertensión arterial o asma), ya que al término de cada intervención los pacientes deberán regresar a su estado basal. Es como hacer dos ECCA en un mismo grupo de pacientes, en dos periodos de tiempo diferente. Una de las principales ventajas es que se duplica el tamaño de muestra, puesto que todos los pacientes recibirán las dos intervenciones. Sin embargo, el tiempo de duración del estudio se duplica, lo cual puede incrementar los costos y la probabilidad de pérdidas. Asimismo, se debe tener en cuenta que, en el caso de intervenciones educativas o medicamentos poco conocidos, el periodo de lavado puede ser insuficiente, lo que impedirá obtener resultados confiables.
Ensayo clínico N de 1
Una variante de los ensayos cruzados es el N de 1. En este tipo de estudios solo existe un paciente con una condición crónica, pero con dos o más alternativas terapéuticas, siendo el mismo sujeto su propio control. Como se muestra en la Figura 1d hay tres intervenciones, las cuales se brindarán a periodos similares de tiempo. Entre cada una deberá haber medición de la(s) variable(s) desenlace, idealmente un periodo de lavado. Como también es un ECCA, pero únicamente con un participante, entonces la aleatorización será el momento de brindar cualquiera de las tres intervenciones. Por ejemplo, las secuencias de las intervenciones pueden ser: 1-2-3, 3-1-2 o 2-3-1. La desventaja consisten en que puede ocurrir un efecto de aprendizaje del participante en el estudio, además del efecto acumulado tras recibir múltiples medicamentos durante las etapas del estudio.
Diseños cuasiexperimentales
En el área de la salud para la evaluación de intervenciones, en muchas ocasiones no se pueden realizar ECCA por diferentes razones: tiempo, costos, razones éticas, la falta de deseo de los participantes. Cuando esto ocurre, la alternativa puede ser un estudio cuasiexperimental o casi experimento, cuya característica principal es que la asignación a la(s) intervención(es) no es aleatoria, pero también puede ser por la falta de un grupo de comparación, o por ambas situaciones. Si bien, ambas situaciones llevan a considerar menor grado de validez, estos diseños pueden tener ciertas fortalezas:
Requieren menor tiempo por la falta de un proceso menos riguroso de selección de participantes y porque es posible que los tiempos para medir los desenlaces sean más cortos.
Recrean un ambiente natural dado el investigador no siempre tiene la capacidad para seleccionar a los sujetos de investigación.
Son más baratos pues los costos se reducen al carecer de un grupo control o que se le otorgue placebo y también porque no hay control tan estricto en cuanto a la selección de los participantes y la medición de las variables de resultado.
Pueden aplicarse en ámbitos sociales, en virtud de que los investigadores pueden evaluar tratamientos ya establecidos.
Las desventajas son las siguientes:
Asociaciones espurias: la incapacidad del investigador para controlar a priori (en los criterios de selección) todas las variables, lo que impide demostrar de forma válida que la intervención evaluada es la única responsable del resultado de interés.
Vigilancia: el número y tiempo en el que se realizan las mediciones para determinar el efecto de la intervención sobre la(s) variable(s) de desenlace pueden ser insuficientes para demostrar resultados contundentes. Al respecto, quienes optan por realizar este tipo de estudios deberían procurar que la medición de la variable de resultado sea cegada.
En la actualidad se conoce una gama de estudios cuasiexperimentales; los más conocidos se describen a continuación:
Cuasiexperimento con grupo control no equivalente
En este diseño existe el grupo experimental que recibe la intervención por evaluar, el cual se compara con un grupo control; debido a que ningún participante fue seleccionado de manera aleatoria es posible que ambos grupos sean distintos entre sí al inicio de la aplicación de la intervención. De esta forma, es posible que en los grupos existan diferencias, por ejemplo, ser poblaciones diferentes, con distintos grados de gravedad de la enfermedad, o bien, con una variante particular de la enfermedad por estudiar en uno de los dos grupos (Figura 2a).
Por otro lado, la medición de la variable de resultado puede ser antes y después de la maniobra (Figura 2a) o también solo después de la intervención, como se muestra en la Figura 2b. Las pruebas estadísticas empleadas se encaminan a demostrar si existe diferencia entre ambos grupos en el momento específico, en el cual se evalúan las variables de resultado. Sin embargo, los resultados del estudio tendrán mayor validez cuando se analiza(n) la(s) variable(s) de desenlace antes y después de aplicar la intervención, puesto que para comprobar que la intervención experimental es efectiva debe demostrarse cambio favorable en la variable de desenlace después de su aplicación.
Cuasiexperimento de antes y después en un solo grupo
En la Figura 2c se describe uno de los diseños más básicos, en el cual se evalúa la intervención en estudio en un solo grupo de pacientes. Para determinar si dicha intervención puede ser útil, entonces la variable de desenlace se mide antes y después de aplicarla. Se confirma la efectividad al observar mejoría en la variable de desenlace, es decir, después de la intervención se identifica modificación de los datos basales. El problema fundamental de este diseño es que no se puede establecer con certeza si la intervención sirve, ya que al no existir un grupo de comparación es posible que los cambios observados se deban a otros factores del ambiente o del propio participante en el estudio.
Cuasiexperimentos de medidas repetidas
Mediante múltiples registros del mismo grupo de pacientes a través del tiempo, los investigadores pueden analizar cambios tras la aplicación de una intervención. Este diseño es muy parecido al anterior, pero no solamente se miden los cambios en la variable de desenlace una vez antes y después de la maniobra experimental, sino que se realiza un mayor número de mediciones y por periodos de tiempo diferentes (Figura 2d). Esta variante permite estimar con mayor precisión el efecto de la maniobra, ya que es posible que los participantes regresen al estado basal después de un tiempo, o bien, continuar igual o mejorando.
En este tipo de diseños también puede evaluarse más de una intervención. Como se observa en la Figura 2e, son dos intervenciones con diferentes mediciones, pero tomando como base los resultados obtenidos de la variable de desenlace antes de la aplicación de la primera intervención.
Cuasiexperimento de series temporales
En este diseño, el tiempo es la variable independiente principal donde se hacen mediciones por periodos de tiempo (iguales o diferentes) de la(s) variable(s) de desenlace, antes y después de la aplicación de la intervención experimental. También pueden ser series temporales interrumpidas en las que se puede medir el efecto de una maniobra después de interrumpir su uso (Figura 2f), ya sea cambiando de tratamiento o dejando de otorgarlo.
Estos diseños son de utilidad en estudios donde se desea evaluar maniobras educativas o cambios en el comportamiento de comunidades o individuos, tras implementar nuevas las políticas de salud en la búsqueda de mejorar la calidad de atención.
Conclusiones
En la actualidad el ensayo clínico controlado y aleatorizado es el diseño de investigación que aporta la mejor evidencia para determinar si una intervención terapéutica, preventiva o educativa es eficaz o efectiva. Cuando no es posible su realización se tienen disponibles los estudios cuasiexperimentales, si bien tienen menor grado de validez porque les falta el proceso de aleatorización o no existe un grupo control.