Introducción
Independientemente del área de la investigación que se trate, es frecuente que se presente la necesidad de diferenciar las características que definan a dos o más grupos de estudio con el propósito de identificarlos y clasificarlos. La estadística básica, como las tablas de frecuencia, las medidas de tendencia central y dispersión, utilizadas comúnmente en estos trabajos, en ocasiones son insuficientes para encontrar las posibles diferencias que presentan los grupos de estudio, por lo que el investigador recurre a su propia experiencia o a la de otros para realizar dichas clasificaciones. Sin embargo, dicha subjetividad lo puede conducir a elaborar una conclusión errónea, por lo que se recomienda hacer uso de metodologías y procedimientos que le proporcionen argumentos más contundentes. Los análisis multivariados pueden ser una herramienta que provean de una visión más amplia sobre los distintos factores de un simple evento. “Las técnicas multivariantes son, en su mayoría, herramientas muy poderosas que permiten al investigador extraer abundante información de los datos disponibles. Estas técnicas son, en sí mismas, relativamente complejas y requieren para su utilización un conocimiento profundo de sus fundamentos y condiciones de aplicabilidad. Sin embargo, el notable desarrollo de programas informáticos de manejo sencillo y el invariable avance de la tecnología están provocando que, en muchas áreas de conocimiento, y de manera especial en el campo de las ciencias sociales, las técnicas de análisis multivariante estén siendo ampliamente empleadas” (Antonio Humberto Closas, 2003).
Dentro de los análisis multivariados se encuentra el método del análisis discriminante como una técnica de clasificación de uno o más conjuntos, que ayuda al investigador a identificar las diferencias de distintos grupos de estudio de una manera más eficiente. “Sirve para determinar si existen diferencias estadísticamente significativas entre los perfiles de las puntuaciones medias sobre el conjunto de variables de dos o más grupos definidos a priori” (Hair F., E. Anderson, L. Tatham, y C. Black, 2007).
Conocer estas diferencias presupone un trabajo previo de investigación, en el que a través de diversos instrumentos de recolección se cuantifican y clasifican correctamente las distintas variables a partir de los valores que proporcionan los ítems. La ejecución del análisis discriminante multivariado devuelve datos que ayudan a diferenciar de manera más oportuna el marco de referencia de cada grupo estudiado, así como las variables dependientes e independientes necesarias para su clasificación, denominadas también variables de clasificación o discriminantes. “Las disciplinas donde es útil el análisis discriminante son múltiples. En las ciencias de la salud esta es una técnica estadística que cada vez se utiliza más debido a la difusión de la informática” (Cáceres, 1994).
Por lo anterior, el objetivo fue utilizar el método de análisis discriminante multivariado como base para detectar los diferentes niveles de adicción por género a partir de los resultados del estudio denominado Nomofobia: identificación del porcentaje de alumnos afectados de la Licenciatura en Informática Administrativa del Centro Universitario UAEM Temascaltepec (Mendoza Rafael, 2013). Específicamente, su propósito fue medir el nivel de adicción al móvil de los alumnos que cursaban en ese momento la Licenciatura en Informática Administrativa.
Metodología de recolección de datos
La muestra original del estudio consistió en 118 alumnos de los diferentes semestres de la Licenciatura en Informática Administrativa del C.U., quienes se distribuyeron de la siguiente manera:
Primer semestre (1I) = 20 alumnos (4 mujeres y 16 hombres)
Tercer semestre (3I) = 28 alumnos (11 mujeres y 17 hombres)
Quinto semestre (5I) = 25 alumnos (9 mujeres y 16 hombres)
Séptimo semestre (7I) = 21 alumnos (8 mujeres y 13 hombres)
Noveno semestre (9I) = 24 alumnos (9 mujeres y 15 hombres)
La edad de los jóvenes participantes fue de 17 a 24 años, todos ellos usuarios de un Smartphone.
La metodología que se utilizó para el análisis fue de tipo correlacional con la técnica estadística de Análisis de Componentes Principales (ACP), con rotación varimax para determinar si existían niveles de afectación en el rendimiento escolar debido al uso de los dispositivos móviles. Además, se utilizaron la Prueba de Káiser-Meyer-Olkin y la Prueba de esfericidad de Bartlett para comprobar la pertinencia del análisis, con el apoyo del software de estadística SPSS en su versión 19. Los resultados concluyen que los jóvenes que cursan la Licenciatura en Informática Administrativa, debido a su acercamiento a las TIC, presentan comportamientos que podrían provenir de la adicción al móvil (Smartphone) y establece la siguiente premisa: el uso del móvil en las universidades va en aumento y es alarmante ya que interfiere con el proceso de aprendizaje, principalmente con la capacidad de concentración del estudiante y, por tanto, con su rendimiento académico.
El Análisis Estadístico Determinante se utilizó para identificar la eficacia del estudio realizado en su medición de la adicción al móvil por género, utilizando variables de discriminación, en este caso el género como la variable endógena no métrica, para mostrar las diferencias en los niveles de adicción al móvil entre hombres y mujeres en función de las características y métricas observadas (variables independientes), así como el valor asociado a cada factor mediante el siguiente modelo matemático:
Se parte de q grupos (femenino y masculino), donde se representaron el objeto la adicción al móvil y las p variables (Ítems) de estudio con (X1, X2,…, Xp). El análisis trata de obtener para el objeto adicción al móvil una serie de puntuaciones que indican el grupo al que pertenecen, en este caso el género representado por (Y1, Y2,…,Ym), para que sean funciones lineales de (X1,X2,…, Xp) con la finalidad de obtener la máxima separación de los q grupos:
Resultados
La Tabla 1 muestra los resultados después de procesar los cuestionarios del estudio original, a través del número de cuestionarios válidos que el SPSS consideró para el análisis discriminante multivariado, de donde 118 fueron descartados, 18 por no haber sido contestados apropiadamente en algunas preguntas utilizadas como variables independientes. Por tanto, el total utilizado para este estudio fue de 100, que corresponde al 84.8 % del total de cuestionarios de la muestra original.
El estadístico de grupo (Tabla 2) informa del número de casos válidos para cada grupo y cada variable independiente. Puesto que la exclusión de casos se realiza según la lista (es decir, se excluyen del análisis los casos con valor perdido en al menos una variable independiente), el resumen de número de casos válidos en cada variable discriminante posee un interés especial, pues un número desigual de casos en cada uno de los grupos puede afectar la clasificación. En nuestro caso, el número de casos válidos de todas las variables es el mismo en cada grupo: 66 para el masculino y 34 para el femenino.
La Tabla 3 muestra los autovalores y estadísticos descriptivos multivariantes. Al trabajar con dos grupos (géneros), en la tabla aparece una fila numerada para una función que explica la totalidad de las diferencias existentes entre ellos. Cuando se trabaja con más de dos grupos se obtiene más de una función discriminante, con la que es posible comparar de manera global la capacidad discriminativa de cada función.
El autovalor es el cociente entre la variación debida a las diferencias entre los grupos (medida mediante la suma de cuadrados inter-grupos) y la variación que se da dentro de cada grupo combinada en una única cantidad (medida mediante la suma de cuadrados intra-grupo). El autovalor permite comparar la manera como se distribuye la dispersión inter-grupos.
Aunque un autovalor tiene un mínimo de cero no tiene un máximo, lo cual hace difícil la interpretación por sí solo; por esta razón se acostumbra utilizar el estadístico Lambda de Wilks, estrechamente relacionado con los autovalores. En otras palabras, el autovalor de una función se interpreta como la parte de variabilidad total de la nube de puntos proyectada sobre el conjunto de todas las funciones atribuible a la función. Si su valor es grande, la función discrimina mucho.
Las correlaciones canónicas miden las desviaciones de las puntuaciones discriminantes entre grupos respecto a las desviaciones totales sin distinguir grupos. Si su valor es grande (próximo a 1), la dispersión será consecuencia de las diferencias entre grupos y la función discrimina mucho.
La correlación canónica es la correlación entre la combinación lineal de las variables independientes (la función discriminante) y una combinación lineal de variables indicador (unos y ceros) que recogen la pertinencia de los sujetos a los grupos. En el caso de dos grupos, la correlación canónica es la correlación simple entre las puntuaciones discriminantes y una variable con códigos 1 y 0, según pertenezca a un grupo o a otro. Una correlación canónica alta indica que las variables discriminantes permiten diferencias entre los grupos.
El autovalor obtenido en la presente investigación es de 0.610, valor intermedio entre 0 y 1, mientras que el valor de correlación canónica es moderado: 0.615. Estos son síntomas claros de que la función discriminante no logra diferenciar la media de los dos grupos (el sexo de estudiantes con problemas al utilizar móvil), lo cual indica que los datos están poco diferenciados en ambos grupos.
Resumen de funciones discriminantes canónicas
El estadístico Lambda de Wilks expresa la proporción de variabilidad total que no es ocasionada por las diferencias entre los grupos, lo que permite contrastar la hipótesis nula de que las medias multivariantes de los grupos son iguales. “Es un estadístico que mide el poder discriminante de un conjunto de variables” (Figueroa Salvador, 2000). “El valor Lambda de Wilks es otra de las medidas de la importancia de las funciones discriminantes, y además sirve para demostrar la significación estadística de la función discriminante” (Namakforoosh, 2000).
De esta forma, cuando los grupos se encuentran superpuestos en el espacio multidimensional, su cociente valdrá 1; a medida que los grupos se separen más y más, el cociente irá disminuyendo. Por lo tanto, valores próximos a 1 indicarán un gran parecido entre los grupos, mientras que valores próximos a 0 indicarán una gran diferencia entre ellos.
El estadístico del contraste de significación global Lambda de Wilks es moderadamente alto (0.621), lo que significa que existe bastante solapamiento entre los grupos. Este resultado se apoya con el valor transformado de Lambda (Chi-cuadrado = 39.518), asociado con 30 grados de libertad, un nivel de significancia de 0.115 que conduce a aceptar la hipótesis nula de igualdad de medias [p‐valor = 0,115 > 0,05], lo que indica que dicha función no es significativa; en consecuencia, se acepta la hipótesis nula de que los grupos son iguales.
La Tabla 5 de Coeficientes de función discriminante canónica estandarizada contiene una versión estandarizada de los coeficientes de la función canónica discriminante, estos coeficientes aparecen cuando se tipifica o estandariza cada una de las variables clasificadoras para que tenga media 0 y desviación típica 1.
De esta forma se evitan los problemas de escala que pueden existir entre las variables, y consecuentemente, la magnitud de los coeficientes estandarizados son un indicador de la importancia que tiene cada variable en el cálculo de la función discriminante. En esta línea se observa que los ítems ¿Con qué frecuencia personas a tu alrededor te recriminan que pasas demasiado tiempo usando un dispositivo móvil?, ¿Te has desvelado por hacer uso de tu dispositivo móvil? y ¿Tus calificaciones se han visto afectadas por hacer uso del dispositivo móvil?, tienen una influencia superior (0.537, 0.573 y 0.964 respectivamente) a la ejercida por las demás variables.
La matriz de estructuras contiene las correlaciones entre las variables discriminantes y la función discriminante estandarizada. Estas correlaciones muestran la relación bruta entre cada variable y la función discriminante. En la tabla 6 podemos apreciar que todas las variables tienen baja correlación (correlacionan poco) con la función discriminante. Las variables son poco importantes en la función. La matriz de estructura presenta las variables ordenadas por su grado de correlación de mayor a menor con la función discriminante. Este orden inicia con las preguntas con mayor correlación positiva (.276, .266 y .205 respectivamente), sin embargo, dichos valores son muy bajos.
La Tabla 7 contiene la ubicación de los centroides en la función discriminante. Podemos observar que el género femenino se encuentra localizado, en promedio, en las puntuaciones positivas de la función, mientras que el masculino se encuentra ubicado en las puntuaciones negativas.
La información de la tabla 8 muestra los resultados del Análisis de Varianza Univariados (ANOVA’s), que suele utilizarse como prueba preliminar para detectar si los grupos difieren en las variables de clasificación seleccionadas; sin embargo, hay que considerar que una variable no significativa a nivel univariante podría aportar información discriminativa a nivel multivariante.
Los contrastes de igualdad de medias entre los dos grupos para cada variable son:
Se rechazan las hipótesis nulas (p_valor < 0,05), es decir, los dos grupos en media son diferentes. Para todos los demás casos, las medias son iguales; no existe diferencia significativa entre los sexos. En efecto, esta prueba se utilizó para detectar cuáles ítems marcan la diferencia entre los dos grupos. La tabla ANOVA incluye el estadístico Lambda de Wilks univariante.
La función Lambda (λ) de Wilks, conocida también como U-estadístico, demuestra que cuando se contemplan las variables de forma individual y estas son similares a las desviaciones de media dentro de cada grupo, dividido entre las desviaciones de la media total sin distinción de grupo, se genera una serie de valores. De esta forma, si los valores que arroja la división son pequeños significa que la discriminación del Ítem es grande.
La Tabla 9 muestra los logaritmos de los determinantes de todas las matrices utilizadas en el cálculo estadístico y además comprueba los grupos donde difieren más
Fuente: elaboración propia. Nota: los logaritmos naturales y los rangos de determinantes impresos son los de las matrices de covarianzas de grupo.
La Tabla 10 muestra los resultados de la prueba M de Box y hace referencia a la igualdad entre las diferentes matrices de covarianzas de grupo. Esta prueba parte de la hipótesis nula:
Ho = Las matrices de covarianza son iguales.
Fuente: elaboración propia. Nota: prueba la hipótesis nula de las matrices de covarianzas de población iguales.
Ya que su cálculo es tomado de las determinantes de las matrices de covarianza en cada grupo y su valor se aproxima por una F de Snedecor, donde si el p-valor es menor que 0.05 se rechaza la igualdad entre las matrices, existen diferencias entre los grupos. El resultado de la prueba de este trabajo hace que se rechace la igualdad de matrices de varianzas‐covarianzas (Sig=0,000 < 0,05), concluyendo que los dos grupos tienen diferente matriz de varianzas‐covarianzas; hay un grupo más variable que otro (Tabla 9).
Las Gráficas 1 y 2 mostraron el resultado del uso dispositivo móvil por género, donde se observa la diferencia de grupos, detectada por los análisis de varianza. Se aprecia la razón por la cual se rechazó la hipótesis nula de igualdad de grupos para este ítem (p_valor < 0,05).
Discusión
Cualquier uso o actividad descontrolados puede transformarse en una adicción o propensión patológica que genere dependencia y limite la capacidad de decisión del ser humano. En la sociedad moderna se pueden observar conductas o hábitos socialmente aceptados porque aparentemente son inofensivos, sin embargo, casi siempre terminan por convertirse en adictivos e interferir con las actividades cotidianas familiares, sociales y académicas.
El teléfono móvil es una tecnología reciente cuyo abuso desemboca en problemas de diversa índole, por lo que es importante desarrollar diagnósticos y metodologías que detecten las causas y las contrarresten. En definitiva, actualmente hay un uso excesivo, adictivo o compulsivo de las tecnologías de información y la comunicación (TIC). Después de aplicar la prueba de correlación para las variables de adicción y rendimiento, encontramos que tiene una correlación significativa de 1, por lo que podemos concluir que estas 2 variables: ¿Con qué frecuencia haces uso de tu dispositivo móvil? y ¿Tus calificaciones se han visto afectadas por utilizar los dispositivos móviles? tienen un grado de correlación más allá de moderado, de acuerdo a las características planteadas al inicio(Mendoza Rafael, 2013). Los resultados obtenidos en este estudio, a partir de la aplicación del método discriminante multivariado, indican que el género femenino muestra una tendencia más elevada en el uso frecuente del teléfono móvil. Los autores Pedrero Pérez, Rodríguez Monje, y Ruiz Sánchez (2012) manifiestan que las mujeres tienen más probabilidades de presentar un uso problemático con el móvil que los varones (Pullido Rull et al., 2013). La Universidad de Sevilla, a través de su Departamento de Psicología Evolutiva y de la Educación, en un estudio de adicciones llamado Informe sobre nuevas tecnologías y riesgo de adicción entre los jóvenes andaluces, de una muestra de 1601, manifestó que, por su lado, los análisis de inferencia estadísticas además de correlación y regresión sugieren que el uso problemático de las nuevas tecnologías podría ser más grave en las mujeres que en los hombres, Finalmente, la adicción al uso del teléfono móvil fue explicada en 14 % por las variables personales y contextuales. Así, los niveles de adicción fueron más altos entre mujeres con bajo autocontrol y altos niveles de ansiedad-depresión (Departamento de Psicología y de la Educación, Universidad de Sevilla, 2012). El estudio de Leung (2007) no arrojó ninguna relación entre el género y su inclusión en el grupo de adictos, pero tras un análisis por discriminantes que incorporó las variables psicológicas se encontró que el grupo más vulnerable eran las mujeres con baja autoestima (Pedrero Pérez, Rodríguez Monje, y Ruiz Sánchez, 2012).
En tiempos recientes, el análisis discriminante ha sido un método utilizado con mayor frecuencia es estudios psicológicos: psicología industrial, psicología escolar y psicología clínica; en esta última ha sido una herramienta para establecer variables que distingan de la mejor manera diferencias entre grupos con diferentes patologías, caracterizando mejor a cada uno de ellos (Seco, 1992).
Aunque el resultado del estudio original presentó correlaciones entre las distintas variables al indicar los niveles de adicción al móvil (Mendoza Rafael, 2013 ), no se observó de manera patente que el sexo o género tenga un papel relevante en los niveles de adicción, de tal manera que en estos casos la metodología del análisis discriminante nos ayuda a encontrar diferencias estadísticas significativas entre los géneros: (P≤0.05), a partir de los ítems: ¿Usas dispositivos móviles?, y ¿Con qué frecuencia haces uso de tu dispositivo móvil? Los resultados del logaritmo determinante fueron -24.214 para el género masculino y -42.709 para el género femenino.
Conclusiones
Debido a las características del análisis y de la metodología empleada se concluye que:
El método del análisis discriminante es una herramienta que permite identificar las diferencias de grupos de estudio de una manera precisa. En este caso se observó esta diferenciación de grupo únicamente en dos ítems:
Las correlaciones canónicas respaldan lo anterior ya que el autovalor fue intermedio e indicó poca diferenciación entre los géneros; Lambda de Wilks mostró que tendieron a la igualdad.
El grupo o género femenino presentó mayor porcentaje en el ítem: ¿Usas dispositivo móvil? La escala Siempre alcanzó 59.46 % en comparación con 36.49 % en el género masculino. Y en el ítem: ¿Con qué frecuencia haces uso de tu dispositivo móvil?, la escala Siempre alcanzó el valor de 72.97 % en contraste con 54.05 % del género masculino.
Así, la metodología de análisis discriminante, aunque limitada, demostró ser efectiva para detectar las posibles diferencias en la investigación de géneros, realizada en el Centro Universitario Temascaltepec con los alumnos de la Licenciatura en Informática Administrativa,