Sr. Editor:
Las medidas de magnitud del efecto (ME) suelen ser asociadas con procedimientos empíricos como comparación entre grupos, correlaciones, entre otros1 como una alternativa a la interpretación aislada de la prueba de significancia de la hipótesis nula (NHST, por sus siglas en inglés). Sin embargo, si bien las ME se orientan a la valoración del tamaño de la diferencia entre grupos2 o la fuerza de asociación entre dos o más variables3, también podría utilizarse en procedimientos vinculados el análisis de normalidad (p.e., con la prueba de Kolmogorov-Smirnov; K-S), cuya interpretación depende de la NHST.
Esto es relevante porque frecuentemente la decisión sobre el cumplimiento o no de la normalidad, con base en la NHST, tiene dos aspectos a considerar. El primero, es que el reporte dicotómico del análisis de la normalidad (cumple / no cumple) no informa qué tan cercana o lejana se halla la distribución empírica de la distribución normal, ya que la hipótesis nula (Ho: la variable X se aproxima a una distribución normal) no será retenida si el p-valor asociado al estadístico de prueba es menor que el error tipo I (α), sin considerar otros criterios complementarios.
El segundo aspecto se vincula con la anterior, ya que la exigencia de distribución normal para puntuaciones que reflejan constructos psicológicos usados en investigación en salud (p.e., ansiedad, depresión) es poco realista4,5, y si no se retiene la Ho podrían utilizarse procedimientos analíticos que, probablemente, provean resultados que representen una pérdida de información al pasar de un nivel de medición a otro (p.e., la U de Mann-Whitney convierte las puntuaciones directas a medidas ordinales denominadas rangos) o que puedan conducir a una modificación implícita de los objetivos de la investigación debido a que algunos estadísticos aparentemente equivalentes proveen información distinta (p.e., el coeficiente de correlación de Pearson evalúa la relación lineal entre las variables, mientras que el de Spearman analiza si la relación es monotónica). Ante esa circunstancia, existen estudios que se establecen criterios para utilizar determinados estadísticos paramétricos aun cuando no se cumple el supuesto de normalidad6.
Por tal motivo, además del cumplimiento o no de la normalidad es necesario informar qué tanto se alejan los datos de dicha distribución. En este punto, es útil el concepto de ME dado que se desea conocer la magnitud del alejamiento. En tal sentido, cuando se decide el uso de la prueba K-S-L (K-S con corrección Lilliefors) (una de las más usadas para evaluar las características distribucionales de los datos a pesar sus limitaciones7) la medida de ME es la diferencia más extrema absoluta (D) asociada al estadístico Z de dicha prueba. El cálculo de D es automático en paquetes estadístico comerciales (p.e., SPSS(R), donde aparece como Most Extreme Differences - Absolute), pero resulta esclarecedor conocer la expresión matemática para derivar la propuesta de valoración:
Esta expresión es similar a la utilizada para calcular la ME cuando se emplea la U de Mann-Whitney (
Por ejemplo, en un estudio sobre indecisión para elegir la carrera profesional y autoeficacia percibida9, previamente se analizó si las puntuaciones utilizadas se aproximan a la normalidad o no. En dicha investigación, las dimensiones de información inconsistente (Z = 2.262; p < .001; n = 82) y escases de información (Z = 4.299; p < .001; n = 108) no se aproximan a la normalidad desde la NHST. Asimismo, las D fueron de .250 y .414, respectivamente. Es decir, mientras que el primero podría calificarse como un alejamiento cercano a moderado, y el segundo como moderado. A su vez, en ese mismo estudio la autoeficacia percibida se aproxima a la normalidad (Z = 1.285; p = .073; n = 28), aunque su alejamiento evaluado con la D es cercano a moderado (D = .243). Esta situación ilustraría que, independiente del resultado derivado de la NHST, es necesario reportar e interpretar D.
Entonces, con esta información el investigador evaluaría si el grado de alejamiento de la normalidad que presentan sus datos (p.e., insignificante o pequeño) es tolerable, según el diseño de investigación elegido o el constructo estudiado, para decidir por análisis paramétricos o no paramétricos. Asimismo, cabe precisar que a pesar que K-S-L no es la única prueba de normalidad disponible7, tiene un mejor desempeño con muestra pequeñas y moderadas en distribuciones simétricas, pero no mejor que la prueba de Shapiro-Wilk que funciona adecuadamente con muestras grandes (n > 500)10. Los estudios citados previamente7,10 son importantes para decidir qué prueba usar ya que se basan en la capacidad de cada una para rechazar la Ho, e incluso uno de ellos realiza la simulación considerando la presencia de distribución normal para todas las muestras generadas10. Sin embargo, estos no hacen referencia al grado de alejamiento de la normalidad que posee la distribución de los datos, que representa el objetivo del presente manuscrito.
Finalmente, al ser una primera aproximación para la valoración cuantitativa de D como una medida de ME, es necesario realizar estudios que permitan establecer puntos de corte con base empírica como ya fue realizado con otras ME con el objetivo de valorar la D en el contexto de la investigación realizada11.