Introducción
Las Instituciones de Educación Superior (IES) que adoptan la filosofía del mejoramiento continuo y establecen como unos de sus objetivos mejorar la calidad de esta institución, además de incrementar el prestigio de la IES, al alcanzar este objetivo, contribuyen a lograr los objetivos para el Desarrollo Sostenible hasta el año 2030 que se adoptan en la Asamblea General de las Naciones Unidas del año 2015, en la que se considera que la calidad de las IES es uno de los elementos necesarios para cumplir con estos objetivos y con ello enfrentar, solucionar o minimizar los problemas actuales de carácter irresolubles (Almuiñas y Galarza, 2021). La calidad, no siempre ha sido un aspecto fundamental o de importancia para las IES, Paredes (2008) señala que en el caso de las escuelas de medicina, es a partir del año 1904 cuando, al realizar una evaluación en 155 de estas escuelas en Estados Unidos y Canadá encuentran situaciones como por ejemplo, la entrega de título de médicos para personas que estudiaron por correspondencia, entre otros aspectos que no permiten garantizar el ejercicio de esta profesión con la calidad adecuada, y a partir de entonces se crea la necesidad de certificar o acreditar estos estudios. Por otro lado, Cabrera (2005) menciona que el concepto de calidad empieza a permear a partir de la sexta década del siglo XX, y que actualmente, la mayoría de las IES en América Latina y el Caribe consideran la evaluación de la calidad en un primer plano. Fernández y Muñiz (2019); Tiana (2018) establecen que la calidad en las IES toma importancia a partir de los años 80 del siglo XX, cuando la evaluación y acreditación de las instituciones de educación empieza a tomar fuerza como consecuencia de la globalización de la economía y la movilidad de los profesionistas. Los autores anteriores, señalan que se hace necesario: primero definir el concepto calidad en las IES, segundo, medir la calidad como un concepto intangible; tercero, mejorar la calidad.
El concepto de calidad de las IES, es un concepto dinámico que ha estado y seguirá evolucionando, por lo que resulta inapropiado tratar de establecer una definición única para este concepto, y para definirla en cada contexto de interés, se consideran los aspectos que resultan fundamentales para la IES. La UNESCO, considera la pertinencia, la calidad y la internalización de las IES como los tres aspectos básicos a considerar en la calidad, mientras Cabrera (2005) contempla dos aspectos para definir la calidad de las IES: el primero, refiere a la síntesis de las propiedades o características de la IES, y los propone como las propiedades que permiten definir las variables a utilizar para su evaluación; segundo, el grado en que los valores de estas propiedades o características de las IES se aproximan los valores ideales u óptimos establecidos en los organismos evaluadores y acreditadores para estas características o propiedades.
El someter una IES a un proceso de acreditación, consiste en medir o evaluar su calidad (Almuiñas y Galarza, 2021; Cabrera, 2005; Guzmán, et al., 2022; Paredes, 2008; Torres, et al., 2018), y el obtener esta acreditación, le proporciona a esta institución la certeza de cumplir con los estándares mínimos o parámetros establecidos para cada uno de los indicadores de calidad empleados por los organismos evaluadores y acreditadores para evaluar, precisamente, los aspectos, características o propiedades que se considera deben poseer las universidades clasificadas como de calidad. Otras dos formas de evaluar la calidad de las IES es: primera, a través de la autoevaluación, con la que se obtiene información de las diferencias entre los valores de sus variables de calidad con respecto a parámetros que establezcan como referencia de calidad; segunda, someter los procesos educativos de las IES a evaluación ante algún organismo acreditador del sistema ISO 9000, lo que le permite asegurar que sus procesos están operando dentro de los estándares de calidad establecidos.
Un esquema que se emplea en la administración de las IES, es adoptar la Planeación Estratégica (PE) como una herramienta para mejorar la calidad de estas instituciones. Almuiñas y Galarza (2020) consideran a la PE como una dimensión que forma parte del conjunto de las metodologías y gestión del proceso; Freire, et al. (2019) establecen que la PE es una herramienta de la gestión de la calidad de las IES, que permite verificar que las acciones de planeación, ejecución, evaluación y retroalimentación se desarrollan de manera efectiva para lograr el (los) objetivo(s) planteado(s); Rivero y López (2012), presentan los elementos conceptuales y teóricos sobre la dirección estratégica y la planeación estratégica, de esta última, se describe el proceso que lo sustenta en su aplicación para el mejoramiento de la calidad en las IES, para lo anterior establecen como requisito necesario evaluar su calidad.
Las IES que optan por mejorar su calidad, deben establecer las estrategias apropiadas para lograr este objetivo. Una de las estrategias por la que pueden optar, es construir los modelos de regresión lineal multivariada en el que se establecen las relaciones causales entre los factores que influyen en cada indicador de calidad y/o entre estos indicadores. Para construir este tipo de modelos, cuando los indicadores y factores son de naturaleza intangibles o latentes, los Modelos de Ecuaciones Estructurales (SEM, por sus siglas en inglés), constituyen una herramienta adecuada para lograr esta meta.
Una de las aplicaciones de los SEM en la IES, es en la construcción de modelos para representar diversos procesos educativos de las IES, con los cuales: Brígido, et al. (2021) determinan el nivel de impacto con los que los factores o dimensiones personal, institución, e incentivo aplicado a la investigación influyen sobre el puntaje de rendimiento académico; López y Álvarez (2021) relacionan la intención de deserción escolar en las IES como consecuencia de la pandemia debida al virus covid-19; Binsawad (2020) en combinación con redes neuronales determina que factor de la responsabilidad social tiene mayor impacto favorable en la competitividad de la IES. Ghasemy et al. (2020) presentan recomendaciones sobre el uso de los SEM, mismas que se generan como consecuencia de las inconsistencias observadas en la revisión de artículos publicados en los que se modelan procesos educativos de las IES desde el año 1999 al año 2018; Mondaca, et al. (2019) consideran a la investigación y a la enseñanza como los indicadores del nivel de desarrollo de las universidades; Ayala y Atencio (2018) relacionan la variable retención de una IES con las dimensiones familia, ingreso familiar, beneficio económico, clasificación de la IES, sexo del estudiante y edad; Cabrero, et al. (2022) desarrollan un modelo causal para las competencias digitales de los alumnos.
El objetivo de este trabajo consiste en mostrar, a través del análisis de un caso, que los SEM, con los que es posible construir modelos lineales en los que se describen las relaciones causales, cuantificando sus efectos directos, indirectos y totales, entre los indicadores de calidad (tangibles o intangibles) y sus factores (tangibles o intangibles), donde los factores o variables independientes son de naturaleza aleatoria representan una herramienta útil para las IES que pretenden mejorar la calidad de sus programas educativos. Los SEM, además de dar respuesta a la pregunta de si estas relaciones causales son significativas desde el punto vista estadístico, también presentan el valor del efecto directo, indirecto y total que tienen estas relaciones causales, y con ello discriminar cuáles de esos indicadores o factores se han de priorizar para establecer las estrategias para mejorar al (los) indicador(es) de una manera eficiente al asignar los recursos a los factores que tengan mayor impacto sobre el mejoramiento de los niveles de cada indicador de calidad a fin de al menos igualar el valor del parámetro correspondiente a cada indicador.
La deserción estudiantil es un indicador o variable de calidad que es considerada por los órganos evaluadores y acreditadores de las IES (Consejo para la Acreditación de la Educación Superior, COPAES. En México), y es considerado como la finalización del vínculo de permanencia que existe entre el estudiante y la universidad. Semimari y Aparicio (2019), señalan que el porcentaje promedio que este indicador corresponde a las universidades latinoamericanas es del 55%, y que representa una pérdida económica entre dos y 145 millones de dólares por año para cada país de América Latina y el Caribe. Aparte de estas implicaciones económicas, también conlleva afectaciones sociales negativas que, como consecuencia de este fenómeno, generan baja en las expectativas de movilidad social y laboral, y es debido a lo anterior que los países buscan reducir estos porcentajes. También plantean, que la eficiencia con la que puede lograr este objetivo depende del concepto que se tenga de esta variable y de las dimensiones utilizadas para cuantificarla.
La variable elección de carrera e IES, por parte de los estudiantes que egresan de las escuelas preparatorias (E), es una dimensión o factor que influye en la variable dependiente deserción universitaria, (Bobadilla, et al., 2022; Calderón, et al., 2020; Casadiego, et al., 2022; Chaparro, 2018; Cortés, et al., 2019; Giménez, et al., 2022; Henao y Londoño, 2018; Jiménez, et al. 2019; Mejia, et al., 2021; Ruiz, et al, 2022; Sanzana y Secul, 2021; Smulders, 2018; Torres, 2019). De los trabajos de investigación referentes a los causales de la deserción universitaria, Casanova, et al. (2021); Muñoz y Hernández (2011) obtienen, que el porcentaje de los desertores universitarios que cambian de carrera o universidad, varía desde el 80% hasta el 41%. Cabe mencionar que otros trabajos de investigación no consideran a la variable E como variable independiente o predictora sobre la variable deserción (Behr, et al., 2021; Araque, et al., 2009). Por otro lado, Connie, et al. (2022) establecen que los factores que tienen un efecto positivo sobre la variable E, representan un elemento a considerar en las estrategias que se establezcan para mejorar tanto la calidad de la IES como la mercadotecnia.
La variable elección de carrera e IES, depende de dos factores causales, decisión o motivación: intrínseca, que se refiere a la vocación e interés del estudiante; y la extrínseca que corresponde a todos los elementos contextuales que interfieren en su decisión personal, como lo es, la familia, las amistades, la oferta educativa, duración de la carrera, seguridad, costos, los mitos profesionales y salida laboral.
Derkach, et al. (2021) presentan un estudio descriptivo, en el que al menos el 30% de los encuestados responde que las variables: prestigio de la universidad; posibilidad de trabajar en áreas relacionadas con su profesión; el tamaño de la población donde se ubica la universidad; facilidad para obtener empleo; consejos de padres, amigos y adultos mayores, son las que influyeron sobre su decisión de elegir la universidad a cursar la carrera elegida.
En los estudios sobre los factores que influyen sobre la elección de carrera en la áreas de Ciencia-Tecnología, Ingeniería y Matemáticas (STEM, por sus siglas en inglés): Sasson (2021) presenta una análisis descriptivo, el cual valida estadísticamente, y establece que la preferencia por estas áreas son causadas por los factores edad del alumno y la oferta laboral son significativas, mientras que la variable ámbito familiar no es estadísticamente significativa; Rodríguez, et al. (2020) realizan un análisis de la variable latente ámbito familiar y su impacto en la elección de carrera en las áreas del conocimiento correspondientes a STEM, describen y validan estadísticamente tanto los resultados que obtienen, y además, validan el instrumento de medición con el método Análisis Factorial Confirmatorio (AFC), y concluyen que el efecto que tiene la madre sobre el estudiante en el momento de elegir su carrera, es mayor que el efecto del padre, y que el nivel educativo de los padres tiene un efecto mínimo. De igual forma, en la tesis doctoral de Enciso (2022) analiza el efecto que tiene el nivel educativo de los padres sobre la elección de carrera en STEM en sus hijos, estableciendo, a través de un Modelo Probit Binomial, que a mayor nivel educativo mayor influencia de los padres en la elección de carrera de los hijos en estas áreas del conocimiento.
Trujillo, et al. (2020) presentan un análisis descriptivo, en el que establecen que la ubicación, la acreditación académica y los apoyos económicos o becas que brinda la universidad son los principales motivos extrínsecos que influyen sobre la elección de carrera. Mientras el factor emocional, es decir consejos u opiniones de padres, amigos, pareja, maestros, etcétera no tienen un efecto significativo sobre la variable E.
Rodríguez, et al. (2019) establece un modelo en el que la variable elección de carrera está en función de las variables latentes o dimensiones: motivaciones intrínsecas y motivaciones extrínsecas, a las que asigna, respectivamente cuatro y doce ítems, y los resultados que obtienen mediante el método SEM, indican que las motivaciones intrínsecas son más importantes o influyentes que las motivaciones extrínsecas, y que de esta última, los ítems tradición familiar y dificultad de la carrera son los de menor influencia o efecto sobre la decisión de elección de carrera.
Doña y Luque (2019) presentan un análisis descriptivo en el que la vocación es el ítem, que pertenece a la dimensión motivos intrínsecos, es la de mayor efecto sobre la variable E, seguido por el ítem salida profesional, dimensión motivos extrínsecos, mientras el ítem tradición familiar es el que más bajo efecto tiene.
López y Hernández (2018) presentan un estudio descriptivo sobre factores que influyen sobre la variable elección de carrera, y determinan que la familia no influye sobre esta decisión cuando el alumno está definido sobre la carrera a cursar, y en caso contrario la mamá es la persona que mayor influencia tiene sobre la elección de carrera.
Ngan y Khoi (2021) presentan un modelo estadístico, el cual es analizado como un modelo de primer orden con el método SEM-PLS, donde la variable elección universitaria representa a la variable endógena, y las variables: expectativa de carrera futura; reputación universitaria; oportunidad de inscripción; capacidad individual; referencias de grupo; características de la universidad y comunicación representan a las variables exógenas de este modelo. Los resultados establecen que solo las primeras cinco variables exógenas tienen un efecto significativo sobre la variable E, y dentro de estas cinco variables, las dos primeras son las que mayor efecto presentan.
La motivación intrínseca, es la que lleva al alumno por elegir una carrera y universidad, sin embargo, esta motivación se ve afectada por la interacción con las motivaciones extrínsecas (Trujillo, et al., 2020), por lo que en este trabajo se analiza el efecto que tienen las motivaciones extrínsecas sobre la variable E, a fin de cuantificar el efecto que tienen las motivaciones extrínsecas sobre la variable latente E.
Arribas, et al. (2022) presentan un trabajo de revisión de literatura sobre las publicaciones que se realizan en Iberoamérica, durante el periodo 2011-2021, respecto al tema elección de carrera, y que encuentran que las investigaciones que se llevan a cabo sobre esta variable, son de naturaleza exploratoria y descriptiva, y que, en la mayoría de estas investigaciones, concluyen que las motivaciones intrínsecas tienen un mayor efecto o peso sobre las variables extrínsecas.
En esta investigación, las motivaciones extrínsecas que llevan a los alumnos a elegir una carrera y universidad son agrupadas en las seis variables latentes o constructos: Prestigio o Imagen (IM); Costos (EC); Ubicación (UB); Servicios (SE) Infraestructura (IN) de la IES; y Emocionales (EM), mismas que son consideradas como las variables exógenas o dimensiones del modelo multivariante, y la variable E, es la variable endógena, el modelo estructural correspondiente a este modelo multivariante se muestra en la Figura 1. En este trabajo, se plantea la hipótesis de que los efectos de cada una de estas seis variables latentes son estadísticamente significativos.
El modelo lineal propuesto en el que se relacionan las seis variables latentes o intangibles IM, IN.SE, UB, EC y EM, con la variable de respuesta o dependiente E, se presenta en la siguiente ecuación
Los parámetros
representan valores de números reales, mismos que son estimados a través de los Modelos de Ecuaciones Estructurales de segundo orden, con el Método de Mínimos Cuadrados Parciales (SEM-PLS, por sus siglas en ingles). Analizar el modelo, como de segundo orden, se hace necesario puesto que no es posible obtener mediciones de la variable elección de carrera y universidad, dado que la medición se lleva a cabo con alumnos recién egresados y no tienen una percepción madura sobre los resultados de su elección.
Las hipótesis a verificar en este trabajo, se presentan en la siguiente ecuación
Para estimar y validar estadísticamente los valores de los parámetros de este modelo lineal, se utiliza el método SEM-PLS, con el que es posible analizar y validar estadísticamente, además de una relación lineal entre este variable de naturaleza intangible, una relación de mediación o interacción entre estas variables, lo que lleva a considerar, a este método, como una herramienta apropiada para las administraciones de IES que establecen como objetivo mejorar la calidad de su institución.
Método
La metodología de investigación, que se sigue en este trabajo para validar las hipótesis planteadas en la Ecuación (1), su enfoque es de naturaleza cuantitativa, su alcance es correlacional, su diseño es no experimental, es transversal de tipo correlacional. Los datos a utilizar en este trabajo, corresponden a una muestra de 258 estudiantes de nuevo ingreso del Instituto Tecnológico de Hermosillo del periodo 2021-2022.
El instrumento de medición que se utiliza para para la obtención de datos en este trabajo se muestra en la Tabla 1, en la que se exponen los ítems utilizado como indicadores de cada variable latente, su respectiva codificación y a la variable latente que pertenecen. Este instrumento es una adaptación del instrumento de medición presentado por García, et al., (2021),
Ítem | Codificación | Variable latente |
¿Qué tan importante fue para ti…? | ||
La imagen del Instituto Tecnológico de Hermosillo (TEC) | IM 01 | IM |
El prestigio de la carrera de Elegida del TEC | IM02 | |
El nivel académico y/o preparación de los egresados del TEC | IM03 | |
Los salones y audiovisuales con los que cuenta el TEC | IN01 | IN |
Los Laboratorios y talleres que tiene el TEC | IN02 | |
El TEC cuente con Biblioteca | SE02 | SE |
El TEC cuente con estacionamiento | SE01 | |
El TEC cuente con cafetería | SE02 | |
La facilidad de acceso para llegar al TEC | UB01 | UB |
La seguridad del área donde se localiza el TEC | UB02 | |
El costo de inscripción al TEC | EC01 | EC |
El costo de transporte o traslado para llegar al TEC | EC02 | |
El costo de libros y materiales que necesitas en el TEC | EC03 | |
La recomendación de un conocido que estudiaras en el TEC | EM01 | EM |
Un familiar que esté estudiando o haya estudiado en el TEC | EM02 | |
Un amigo que esté estudiando o haya estudiado en el TEC | EM03 |
Fuente: Elaboración propia
La estimación y validación de los valores numéricos de los seis parámetros establecidos en la Ecuación (1), y las respectivas pruebas de las hipótesis, se llevan a cabo con el método establecido en el Método de Ecuaciones Estructurales de Mínimos Cuadrados Parciales (SEM-PLS, por sus siglas en inglés) con constructos de orden dos, del tipo molar, con el procedimiento de Indicadores repetidos, se utiliza el método del centroide, con un ‘bootstrapping” de 200 remuestreos para la validación estadística con un nivel de significancia del 5%, para lo cual se emplea función plspm del software de libre acceso R-Studio (Sánchez, 2013; Wetzels, et al. 2009). Con este método: primero, se verifica que el instrumento de medición sea confiable; segundo, se analiza el modelo estructural, que consisten en estimar y validar estadísticamente las estimaciones de los parámetros que corresponden al modelo representado en la Figura 1; tercero, se obtiene la estimación de su capacidad predictiva del modelo estructural; cuarto, se estima la colinealidad de cada variable exógena en relación con la variable endógena correspondiente; quinto, se analiza la heterogeneidad de la muestra.
Resultados
De la muestra original de tamaño n=258 datos, al calcular la distancia de Mahalanobis de cada uno de estos datos y compararlos contra el valor del percentil 0.975 de la distribución Chi-cuadrada con 14 grados de libertad, se identifican 30 de ellos que exceden este percentil, lo que lleva a considerarlos como datos atípicos y son eliminados del análisis, por lo que, en el análisis estadístico en este trabajo, se considera una muestra de tamaño n=228 datos.
De la prueba de esfericidad de Bartlett, de acuerdo con la función cortes.bartlett {psych} del software R-estudio, que para estos 228 datos y de acuerdo con los valores que se muestran en la Tabla 2, se rechaza la hipótesis nula en la que se establece la afirmación de que la matriz de varianza covarianza de las variables consideradas en esta muestra, es la matriz nula. Mientras que el valor correspondiente, que se obtiene con la función KMO {psych} del mismo software antes mencionado, para la medida de adecuación de muestreo Kaiser-Meyer-Olkin (KMO), para esta muestra es igual 0.88 que excede el valor límite cuyo valor es 0.70 para considerar que es viable una correlación entre estas variables. De acuerdo con los resultados de las pruebas de Bartlett y KMO, se establece que para los valores de las variables en esta muestra es razonable suponer una correlación entre estas variables y proceder a construir un modelo donde se cuantifique el efecto de las variables dependientes con la(s) variable(s) independiente(s).
La confiabilidad del instrumento de medición, se evalúa con los indicadores para cada
constructo: valores alfa de Cronbach
Factor | AVE |
|
|
IM | 0.64 | 0.724 | 0.846 |
IN | 0.89 | 0.877 | 0942 |
SE | 0.75 | 0.840 | 0.904 |
UB | 0.82 | 0.782 | 0.902 |
EC | 0.83 | 0.900 | 0.937 |
EM | 0.70 | 0.789 | 0.877 |
Fuente: Elaboración propia
La validez convergente del instrumento de medición, se evalúa utilizando los
indicadores los valores del promedio de la Varianza Extraída Promedio (AVE, por sus
siglas en inglés) y las cargas factoriales de cada ítem. En la Tabla 3, se presentan los valores del AVE para
cada variable latente, y se observa que exceden el valor crítico igual a 0.50 que se
establece para este indicador (Aldás y Uriel,
2017). Mientras que en la Tabla 4,
se presentan los valores de la carga factorial original estimadas, las cargas medias
factoriales y sus intervalos del 95% de confianza, para cada ítem, que son estimados
con el procedimiento de re muestreo o “bootstrap”, en los que 15 de los 16
indicadores o ítems tienen un valor, con un valor de significancia del 5%, mayor que
0.80; mientras el indicador IM-IM01 tiene un valor igual a 0.683, Este ítem no es
eliminado del análisis, dado que el resto de los indicadores AVE,
Ítem | Carga original | Carga original | Desviación estándar | Percentil 0.025 | Percentil 0.975 |
IM-IM1 | 0.682 | 0.686 | 0.048 | 0.581 | 0.762 |
IM-IM2 | 0.860 | 0.858 | 0.022 | 0.807 | 0.895 |
IM-IM3 | 0.860 | 0.945 | 0.006 | 0.801 | 0.957 |
IN-IN1 | 0.945 | 0.945 | 0.006 | 0.931 | 0.950 |
IN-IN2 | 0.942 | 0.942 | 0.007 | 0.926 | 0.954 |
SE-SE1 | 0.828 | 0.828 | 0.021 | 0.785 | 0.863 |
SE-SE2 | 0.885 | 0.886 | 0.015 | 0.852 | 0.916 |
SE-SE3 | 0.897 | 0.898 | 0.014 | 0.868 | 0.921 |
UB-UB1 | 0.887 | 0.888 | 0.017 | 0.852 | 0.919 |
UB-UB2 | 0.924 | 0.925 | 0.006 | 0.910 | 0.938 |
EC-EC1 | 0.891 | 0.892 | 0.017 | 0.853 | 0.922 |
EC-EC2 | 0.928 | 0.930 | 0.010 | 0.907 | 0.947 |
EC-EC3 | 0.919 | 0.921 | 0.012 | 0.896 | 0.940 |
EM-EM1 | 0.849 | 0.850 | 0.020 | 0.802 | 0.881 |
EM-EM2 | 0.826 | 0.826 | 0.023 | 0.779 | 0.867 |
EM-EM3 | 0.840 | 0.839 | 0.027 | 0.783 | 0.890 |
Fuente Elaboración propia
La validez discriminante del instrumento de medición, se evalúa con el criterio de
Fornell y Lacker, y el criterio Heterotrait y Monotrait radio (HTMT). Los valores
del criterio de Fornell y Lacker, que corresponden a los valores de las
correlaciones entre los factores independientes o constructos, valores fuera de la
diagonales principal, y las raíces cuadradas del valor del AVE para cada constructo,
valores en la diagonal principal en negritas, se presentan en la Tabla 5, y se observa que los valores fuera de
la diagonal principal, son menores que el valor de
IM | IN | SE | UB | EC | EM | |
IM | 0.800* | |||||
IN | 0.584 | 0.94* | ||||
SE | 0.454 | 0.676 | 0.86* | |||
UB | 0.388 | 0.515 | 0.684 | 0.90* | ||
EC | 0.310 | 0.510 | 0.668 | 0.737 | 0.91* | |
EM | 0.497 | 0.300 | 0.410 | 0.369 | 0.322 | 0.83* |
* Valores de
Fuente: Elaboración propia
En la Tabla 6 se muestran los valores del HTMT correspondientes para el instrumento de medición, sonde se observa que todos los valores son menores que 0.90, que es el valor critico establecido para este criterio (Aldás y Uriel, 2017), por lo que bajo este otro criterio, ocurre que el instrumento de medición tiene validez discriminante. Dado que se cumplen con los criterios establecidos en Fornell-Larcker y el criterio HTMT, se tiene que el instrumento de validación tiene validez discriminante.
EC | EM | IN | SE | UB | IM | |
EC | ||||||
EM | 0.386 | |||||
IN | 0.572 | 0.358 | ||||
SE | 0.767 | 0.503 | 0.787 | |||
UB | 0.873 | 0.466 | 0.611 | 0.838 | ||
IM | 0.387 | 0.642 | 0.729 | 0.584 | 0.489 |
Fuente: Elaboración propia
La colinealidad, es un concepto con el cual se determina si en la muestra, está presente el sesgo común inherente a la persona que responde las preguntas establecidas en el instrumento de medición, ya sea este sesgo se genere debido a las propias preguntas del instrumento de medición que son interpretadas de manera diferentes entre las personas encuestadas; o también, se puede atribuir al deseo consciente o inconsciente de la persona encuestada, para responder los ítems de acuerdo a algún interés personal, no coincidente con su verdadera percepción. Para detectar la presencia de esta colinealidad, se utiliza el Factor de Inflación de la Varianza (VIF, por sus siglas en inglés), donde un valor del VIF mayor que 3.3 indica la presencia de colinealidad en la base de datos (Hair, et al., 2012; Kock y Lynn, 2012; Kock, 2015). En la Tabla 7, se presentan los valores VIF para cada una de las variables exógenas considerada en el modelo correspondiente a la Figura 1, donde se observa que la colinealidad no está presente en la base de datos utilizada para la estimación y validación de este modelo multivariante.
Dado que el instrumento de medición, es confiable posee validez convergente y discriminante, y, además, está exento del sesgo común, se procede a realizar el análisis estructural del modelo representado en la ecuación (1.1).
Análisis
En la Ecuación (2) se muestra el modelo de ecuaciones estructurales que relaciona
la variable E con los seis constructos o variables latentes, donde los valores
path de los parámetros
Path | Parámetro | p-value | Intervalo del 95% de confianza |
---|---|---|---|
IM |
0.192* |
|
|
IN |
0.196* |
|
|
SE |
0.270* |
|
|
UB |
0.184* |
|
|
EC |
0.271* |
|
|
M |
0.186* |
|
|
Nota: * Significativo al 0.01.
Fuente: Elaboración propia
De la Tabla 8, se observan dos grupos de valores de los parámetros estimados: altos={SE, EC} y bajos={IM, IN, UB, EM}, se destaca, de acuerdo a los intervalos del 95% de confianza dispuestos en esta misma tabla, que no existe diferencia significativa entre los valores correspondientes a los parámetros estimados de las variables latentes pertenecientes a cada uno de estos grupos, dado que los intervalos correspondientes a cada grupo no se intersectan o cruzan entre sí, lo cual no ocurre entre los dos grupos, lo que lleva a que existe diferencia significativa entre ellos.
Para el modelo presentado en la Ecuación (2), no es posible llevar a cabo un
análisis de su capacidad explicativa, dado que la única variable endógena que
aparece en este modelo, es una variable jerárquica de segundo orden, y la
estimación de los parámetros de este modelo, se lleva a cabo con modelo de tipo
molar con el método de indicadores repetidos, lo que implica que los ítems de la
variable latente de segundo orden E, se le asignen todos y cada uno de los ítems
de cada variable latente que participa como variable exógena en este modelo: lo
que implica que el valor del coeficiente de determinación (
El análisis de heterogeneidad, es un análisis que se lleva a cabo posterior al
análisis estructural del modelo, modelo global, y tiene como objetivo validar el
supuesto de que los datos de la muestra son homogéneos, esto es, determinar si
no existen categorías o conglomerados en la muestra que pudieran afectar los
resultados que se obtienen bajo la hipótesis de que la muestra es homogénea. En
este trabajo, el análisis de heterogeneidad se ejecuta con el método Respuesta
Basado en Unidades de Segmentación en SEM-PLS (REBUS, por sus siglas en inglés),
el cual es un algoritmo que detecta clases latentes dentro del SEM-PLS, este
método, no requiere asumir distribuciones de probabilidad para las variables
involucradas en el modelo, y una de sus utilidades, al descubrir estas clases,
es mejorar la capacidad de predicción. En este trabajo de investigación se
detectaron dos clases o categorías, denominadas grupos, de las cuales el valor
del índice de calidad del grupo igual a 0.7790, es ligeramente menor que el
valor del
En la Tabla 9, se presentan los valores estimados de los parámetros: del modelo global; de cada uno de los dos modelos para cada uno de estos dos grupos o estratos sugeridos por el dendograma de la figura 2, referidos como grupo A y grupo B; los valores de las diferencias, entre los parámetros, respectivos, estimados para cada grupo.
Path | Global | Grupo A | Grupo B | Diferencia |
IM->E | 0.192 | 0.197 | 0.177 | 0.020 |
IN->E | 0.195 | 0.181 | 0.212 | 0.031 |
SE->E | 0.270 | 0.269 | 0.269 | 0.000 |
UB->E | 0.184 | 0.178 | 0.192 | 0.014 |
EC->E | 0.270 | 0.248 | 0.301 | 0.053 |
EM->E | 0.186 | 0.197 | 0.169 | 0.028 |
Fuente: Elaboración propia
Para determinar si esta diferencia entre los parámetros de cada grupo, es significativa, se plantea las pruebas de hipótesis nulas, que establecen que no existe diferencia significativa entre los valores de estas diferencias entre cada grupo, las cuales se contrastan con sus respectivas hipótesis alternativa, que declaran que, estas diferencias son significativas, a un nivel de significancia del 0.01. Hipótesis que se representan en la Ecuación (3)
donde representan la diferencia entre el valor del parámetro i del grupo A, menos el valor del parámetro i correspondiente al grupo B.
Para validar las hipótesis planteadas en la Ecuación (3), se utiliza el método de comparación de grupos (grupo A y grupo B), con la prueba Bootstrap t-test, disponible en la función plspm.groups del paquete plspm del software de acceso libre RStudio. Los resultados que se obtienen, se muestran en la Tabla 10, en donde se observa que ninguna de las seis diferencias entre los parámetros de estos dos grupos es significativa al 1.0%, lo que lleva a establecer que los datos utilizados para estimar el modelo global son homogéneos.
Path | Global | Grupo A | Grupo B | Diferencia | t-student | n-value | Sig. 1% |
IM->E | 0.192 | 0.197 | 0.177 | 0.020 | 0.884 | 0.188 | no |
IN->E | 0.195 | 0.181 | 0.212 | 0.031 | 1,603 | 0.055 | no |
SE->E | 0.270 | 0.269 | 0.269 | 0.000 | 0.113 | 0.454 | no |
UB->E | 0.184 | 0.178 | 0.192 | 0.014 | 0.826 | 0.204 | no |
EC->E | 0.270 | 0.248 | 0.301 | 0.053 | 2,297 | 0.011 | no |
EM->E | 0.186 | 0.197 | 0.169 | 0.028 | 1,230 | 0. 109 | No |
Fuente: Elaboración propia
Discusión
De acuerdo al análisis estadístico de los datos, los valores de las seis variables latentes IM, IN, SE, UB, EC y EM presentan efectos significativos sobre la variable E, lo que lleva a establecer que el modelo representado por la Ecuación (2), es adecuado para representar la relación causal entre estas seis variables latentes y la variable elección de carrera universitaria e IES, con una adecuada capacidad predictiva.
Lo anterior, permite a la administración de la IES, identificar cuáles variables, y en qué grado, tienen impacto o influyen sobre la decisión que lleva al estudiante egresado de preparatoria a elegir la carrera profesional y el instituto o universidad en donde cursarla. Por lo que, al establecer estrategias para mejorar los valores percibidos de estas variables latentes, y con ello incrementar la preferencia de elección de esta IES por parte del egresado de bachillerato, de primera instancia debe considerar el incrementar el valor percibido de estas seis variables latentes, estableciendo prioridad en las variables SE y EC que son las que mayor efecto tienen sobre la variable E.
Al incrementar la demanda de ingreso en las IES, la administración de estas instituciones tiene elementos para establecer requisitos de ingreso acordes a los perfiles de ingreso establecidos en sus programas de estudios, de tal forma que se logre un mayor empate entre los intereses y aspiraciones de los estudiantes con la oferta de formación profesional que se ofrece en esta IES, de tal forma que, entre otros indicadores de calidad, se logre reducir la deserción en este nivel educativo.
Para efecto de predecir o pronosticar la deserción y/o rezago en las IES, se recomienda tomar como base el modelo representado por la Ecuación (2), para construir, ya sea con el método de modelo lineales generalizados o con los arboles de decisión “machine learning”, el modelo de predicción del riesgo en la deserción y/o rezago, para caracterizar y asignar la probabilidad de este evento para los alumnos que ingresan a la IES. Para construir este modelo de predicción, es necesario a dar seguimiento a los alumnos considerados en la muestra, que se utiliza para estimar el modelo expresado por la Figura 1, durante cuatro años y medio para contar con la información de quienes concluyeron su programa de estudios en tiempo y forma acorde al tiempo establecido para los programas de estudios correspondientes a los alumnos de esta cohorte.
En este trabajo y en los trabajos presentados por: (Al-Adwan, et al., 2021; Alenezi,
2022; Cabrero, et al., 2022; Del Arco, et al., 2021; Gaurav, et al., 2019; López y
Álvarez, 2021; Machorro y Romero,
2021), se pone de manifiesto la utilidad de los modelos de ecuaciones
estructurales para modelar indicadores de calidad de las IES, sean estos tangibles o
intangibles. Sin embargo, en estos modelos construidos en estos trabajos, no se
lleva a cabo un análisis de su capacidad explicativa y predictiva más allá de los
valores del coeficiente de determinación
Por lo anterior, se recomienda llevar a cabo un análisis de la capacidad explicativa y predictiva de los modelo construidos con el método SEM-PLS, a través del PLSpredict y del CVPAT, de cada uno de los modelos que se generen al reducir o aumentar las variables latentes del modelo y/o los efectos mediadores entre estas variables latentes; además de aplicar los criterios de selección de: Criterio de Información de Akaike (AIC, por sus siglas en inglés); Criterio de Información de Bayes (BIC, por sus siglas en inglés), Criterio de Geweke-Meese (GM), o Criterio Ponderado Geweke-Meese (GMweight, por sus siglas en inglés).
La estimación y validación de los parámetros correspondientes al modelo representado en la Ecuación (2), se lleva a cabo asumiendo homogeneidad en las observaciones para cada variable latente, esto es, se asume que cada alumno al elegir la carrera e IES, le asigna la misma importancia o peso a cada una de las seis variables latentes o constructos IM, IN, SE, UB, EC y EM. El utilizar modelos de ecuaciones estructurales para llevar a cabo predicciones, y que son construidos bajo el no cumplimento de este supuesto, puede generar resultados no apropiados (Sánchez, 2013).
Verificar el cumplimiento del supuesto de homogeneidad aplica para cualquier modelo de regresión lineal, y cobra relevancia llevar a cabo esta verificación, dado que, en caso de existir al menos dos clases con diferencia significativa, los efectos de las variables latentes del modelo en cada una de estas clases, pueden diferir de los efectos del modelo global, esto es, del modelo en el que se asume homogeneidad en el total de las observaciones. Por lo que, al plantear estrategias para mejorar las variables latentes o endógenas del modelo, basándose en los efectos observados en el modelo global, no es posible determinar, en este caso, si con estas acciones se está favoreciendo o no a la clase con mayor proporción dentro del total de observaciones, ya que, en caso de no ser así, se pierde eficiencia al tratar de mejorar la variable de respuesta.
Por ejemplo en este trabajo, el modelo que corresponde a la Ecuación (2), se
construye bajo el supuesto de homogeneidad en las observaciones de la muestra, las
variables latentes
En la construcción del modelo representado en la Ecuación (2), se soporta la suposición de que la muestra es homogénea, lo cual permite establecer que no existen categorías, segmentos o clases en la muestra utilizada para el análisis correspondiente, este resultado contraviene a las declaraciones de que el sexo del estudiante impacta en la elección de carrera (Mosteiro, 1997; Rodríguez y Padín, 2022; Sánchez, et al., 2023).