La personalidad es una de las teorías con mayor evidencia y de las más utilizadas a nivel mundial para la evaluación de las características personales. El desarrollo de esta teoría ha sido largo y lleno de discusiones, para ello múltiples autores han aportado a lo largo del tiempo hasta llegar a desarrollar un sistema de clasificación que considere las características del ser humano. Conforme a Bischof (2014) la primer alegoría a la personalidad como constructo teórico fue hecha por Allport en 1937 y retoma características de Carl Gustav Jung como la dicotomía Extraversión/Intraversión. Por su parte, Galimberti y Quevedo (2006) la definen como: un conjunto de características psíquicas y modalidades de comportamiento que, en su integración, constituyen el núcleo irreductible de un individuo, que perdura como tal en la multiplicidad y diversidad de situaciones ambientales en las que se manifiesta y actúa.
Dentro de este cúmulo de formas de definir y conceptualizar la personalidad, el modelo de los cinco factores cuenta actualmente con uno de los mayores usos y reconocimientos a nivel mundial. Laak (1996) hace una revisión del desarrollo y evolución de este modelo analizándolo desde varias aristas buscando una síntesis como propuesta integrativa de varias teorías de la psicología (i.e. de Galton-Golberg). Comienza la discusión a partir del modelo de dos factores Extraversión-Neuroticismo que fue obtenido por medios psicométricos mediante la reducción de los 16 factores de la personalidad hasta llegar a la propuesta de Costa y McCrae (1985) del instrumento formal NEO-PI y sus revisiones posteriores.
El modelo teórico de los cinco grandes de la personalidad se descompone en cinco factores: (a) Extraversión, (b) Neuroticismo, (c) Agradabilidad, (d) Responsabilidad y (e) Apertura a la Experiencia. Estos han sido retomados por múltiples investigaciones a lo largo del mundo y han sido evaluados por medio de muchas investigaciones (Allik & McCrae, 2002).
Dentro de los instrumentos que se han desarrollado a partir del modelo teórico original, el de Costa y McCrae es el más usado a nivel internacional y el se ha adaptado a más idiomas en sus diferentes versiones (NEO-PI, NEO-PI-R). Existen estudios interculturales que reportan la utilidad en diferentes contextos (Benet-Martínez & John, 1998; Soto et al., 2008) incluyendo población española que se enfocan en la validez factorial (Benet-Martínez & John, 1998).
Entre los estudios interculturales más relevantes se encuentra uno que analiza la estabilidad psicométrica del instrumento en su versión revisada (NEO-PI-R) a lo largo de 36 culturas reportando solidas propiedades psicométricas entre las que destaca la confiabilidad y fiabilidad (McCrae, 2002). A pesar de estos resultados de invarianza cultural; los entornos de investigación requieren instrumentos cortos que puedan evaluar los constructos teóricos de la manera más eficiente posible, el principal problema con esta versión del instrumento en entornos de investigación se centra en el que el número de reactivos (240-100) propician el cansancio del sujeto que los responde; para lo cual fueron desarrolladas versiones más cortas como la desarrollada y publicada por el laboratorio de la personalidad de Berkeley para fines de investigación (John & Srivastava, 1999). Esta versión cuenta con su versión al español y sólo 44 reactivos que lo hacen más viables para su uso en investigación. A pesar de que existen también las versiones ultra cortas, no existe aún información suficiente para garantizar sus propiedades psicométricas a pesar de que algunos trabajos la consideran prometedoras (Romero et al., 2012).
El principal problema para los países de habla hispana es que existen pocos instrumentos originalmente desarrollados en español, ya que la mayoría se realizan en inglés. Garantizar que los procesos de traducción sean culturalmente equivalentes (Arribas, 2004; Beaton et al., 2000) es parte del objeto de la investigación transcultural. En términos psicométricos el uso del análisis factorial y los modelos de ecuación estructural han sido el estándar para evaluar la conservación de las propiedades psicométricas (Lloret et al., 2017; Pérez & y Medrano, 2010) la aplicación de éstos métodos en diferentes poblaciones permite evaluar si las diferencias culturales modifican la estructura teórica subyacente.
Además de los análisis factoriales, existen complicaciones relativas al lenguaje y la cultura que deben considerarse. El lenguaje español tiene sus variantes entre España vs México, situación que complica la conservación de las estructuras. Generalmente, se establece una equivalencia entre el español de ambos países, a pesar de que cuenta con diferencias culturales importantes que deben tomarse en consideración para la evaluación. Situación similar que se repite con México y los países hispanohablantes de Latinoamérica.
En el caso de uso del modelo de cinco factores, el primer problema se centra en la multiplicidad de las versiones bajo un mismo constructo; primariamente se diferencian por el uso que se le dan: la evaluación psicológica (Versión larga) y el uso para investigación (Versiones cortas). En el caso del BFI se ha visto marcado en el estudio (Benet-Martínez & John, 1998), en donde coeficiente alfa de Cronbach se reduce en todas las escalas para población hispanohablante. Aunado a ello, este estudio considera a población española y mexicana que radica en Estados Unidos, lo que limita mucho el alcance para población mexicana.
Dentro del contexto latinoamericano, existen dos estudios enfocados que analizan las propiedades psicométricas del instrumento, un estudio llevado a cabo en estudiantes universitarios peruanos, mostrando resultados adecuados para la población; sin embargo, reporta problemas con la escala agradabilidad (Dominguez-Lara et al., 2018) y el caso mexicano que dónde se reporta una confiabilidad de ( = 0.72 en donde se encuentran problemas de análisis factorial para la escala de Agradabilidad, mostrando menor confiabilidad que en otros estudios (Reyes Zamorano et al., 2014). Existen también algunos estudios que solamente reportan su confiabilidad oscilando entre 0.31 a .69 en granjeros de la amazona Boliviana (Gurven et al., 2013), de 0.60 a.069 en población colombiana (Puerta-Cortés & Carbonell, 2014).
Por último, existen algunas versiones reducidas del instrumento (Dominguez-Lara & Merino-Soto, 2018) y ultra reducidas (Ehrhart et al., 2009; Romero et al., 2012). Sin embargo, hacen falta más estudios que permitan conocer mejor sus propiedades psicométricas.
Objetivo
El presente estudio tiene la finalidad reportar las propiedades psicométricas del BFI en una muestra de población mexicana, buscando: determinar su fiabilidad y validez de la replicación de su estructura factorial.
Método
Levantamiento de datos y poder de la muestra
El cuestionario se administró electrónicamente para evitar pérdida de información y minimizar errores de transcripción y captura. Se utilizó la plataforma Survey Monkey para la aplicación de la batería, en conjunto con otro instrumento y una cédula de datos sociodemográficos. La aplicación fue de manera presencial para los participantes en un centro de cómputo del CUCS y se contó con la asesoría de un experto durante toda la ejecución.
El tamaño de la muestra fue calculada en 600 para satisfacer la necesidad de todos los análisis con un poder del 99% considerando la factibilidad de los errores tipo I y II (Grady & Rose, 2011; Marsh et al., 2004). Además, para cada análisis se determinó la adecuación de la muestra conforme a las pruebas estadísticas: confiabilidad (ej. Prueba de aditividad de Turkey) y validez de constructo.
Participantes
La muestra se compone de 607 personas que estudian carreras asociadas a la salud pública, incluidas carreras técnicas (Nutrición = 93, Medicina = 20, Psicología = 100 y Enfermería = 394) en una universidad pública de México. La edad media fue de 20.91 años (Desviación Típica de 2.602). La distribución por sexo biológico fue: 137 hombres (22.57%) y 470 mujeres (77.43%). Se auditó la base de datos para la aleatoriedad de las respuestas, duplicidad de casos y aquiescencia mediante la herramienta de validación de datos del programa Paquete Estadístico para las Ciencias Sociales (SPSS, por sus siglas en inglés) versión 23 en español.
Instrumento
El BFI Consta de 44 preguntas que evalúan Cinco Factores de la personalidad: Extraversión (EXT, 8 reactivos), Responsabilidad (RES, 9 reactivos), Apertura a la Experiencia (APE, 10 reactivos) Neuroticismo (NEU, 8 reactivos) y Agradabilidad (AGR, 9 reactivos). Las opciones de respuesta son presentadas en escala con formato de respuesta tipo Likert de 5 opciones (1 “Totalmente en desacuerdo” a 5 “Totalmente de acuerdo”). El ejemplo del reactivo es: Me veo a mi mismo(a) como alguien que… 1.- Es bien hablador.
Diseño estadístico
En primer lugar, se realizó el análisis descriptivo de las escalas de la muestra, posteriormente se hizo el cálculo de la consistencia interna por medio del método de Alpha de Cronbach y la correlación interenunciados mediante la matriz de correlación de Rho de Spearman. Para la exploración de la validez del constructo se siguieron tres métodos: el Análisis Factorial -Exploratorio (AFE), el Análisis Factorial Confirmatorio (AFC) y el Análisis Factorial con Intercepto Aleatorio (AFCIA).
Para evaluar el ajuste de los modelos confirmatorios se considerarán los siguientes estimadores y puntos de corte. Para el AFE: Índice de Ajuste Comparativo y Aproximación de la Raíz Media del Error Cuadrático, Raíz de la Media Cuadrática Estandarizada (CFI ≥ .90, TLI≥ .90, RMSEA < 0.08, SRMR <0.08, respectivamente, por sus siglas en inglés), para el AFC se sustituye el SRMR por la Raíz de la Media Cuadrática de los pesos (WRMR, por sus siglas en inglés) derivado de que es el estimador más robusto, para modelos confirmatorios en escala de respuesta ordinal (Hau & Marsh, 2004; Marsh et al., 2014a).
A pesar de que la literatura considera adecuado un valor WRMR ≤ 1, este valor ha sido caracterizado por la susceptibilidad al número de interceptos del modelo en el que se aplica (Sass et al., 2014). No se consideró el valor de chi cuadrado, derivado a que es un indicador muy sensible al tamaño de la muestra y existe mucha discusión aún sobre su uso en indicadores robustos.
Registro del estudio y avales éticos
El presente estudio es parte de un protocolo de tesis doctoral registrada ante dos comités de ética e investigación regulados. El primero avalado por la Comisión Nacional de Bioética de México con el número de registro: 0250/18HCJIM/2018. El segundo es el comité de ética e investigación del Doctorado en Ciencias de la Salud Pública con el número de registro: DCSP/CEI/2016/08/0026.
Resultados
Normalidad uni-multivariada
Se determinó la normalidad mediante la prueba de Kolmogorov-Smirnov en el programa SPSS. Los reactivos presentan coeficientes que van desde 0.174 hasta 0.362 significativo a p < 0.001 por lo cual, ningún ítem presenta normalidad. Así también, ninguna de las subescalas de la prueba presenta normalidad, mostrando coeficientes de 0.094 para AGR, 0.049 para EXT, 0.059 para RES, 0.056 para NEU y 0.052 para APE, todos significativos a p < .01 por lo cual no presentan normalidad las escalas.
Consistencia interna
Las pruebas de consistencia interna se calcularon en el programa SPSS.24. El coeficiente Alpha de Cronbach para las escalas fue de: AGR a = 0.703, EXT a = 0.838, NEU a = 0.768, RES a = 0.772 y APE a = 0.786 y de a = 0.777 para todo el instrumento. La prueba de Turkey es significativa p < .01 para todas las escalas excepto la escala AGR donde una p = 0.59 para los residuos, lo que sugiere una interacción entre los errores de los puntajes entre sujetos. Por su parte, las correlaciones interenunciados de las escalas oscilaron entre: AGR = - 0.066 a 0.530, EXT = 0.165 a 12 NEU = 0.137 a 0.465, RES = 0.101 a 0.489 y APE = 0.037 a 0.558.
En lo que respecta a las correlaciones positivas entre los factores Agradabilidad con Apertura a la Experiencia supera r = .303 en este mismo sentido, Extraversión con Apertura a la Experiencia r = 0.237 y negativamente la Responsabilidad con el Neuroticismo r = -0.203. Estas correlaciones podrían interferir con la estructura factorial.
Análisis Factorial Exploratorio (AFE)
El AFE se realizó con la finalidad de explorar la estructura factorial de los datos y se muestra en la Tabla 1.
Factores | F1 | F2 | F3 | F4 | F5 |
---|---|---|---|---|---|
Items | EXT | APE | NEU | RES | AGR |
BFI6 | 0.899* | ||||
BFI16 | 0.899* | ||||
BFI27 | 0.774* | ||||
BFI43 | 0.672* | ||||
BFI1 | 0.489* | ||||
BFI38 | -0.405* | ||||
BFI40 | 0.399* | ||||
BFI11 | 0.391* | ||||
BFI32 | 0.371* | ||||
BFI20 | 0.757* | ||||
BFI39 | 0.658* | ||||
BFI31 | 0.631* | ||||
BFI5 | 0.611* | ||||
BFI17 | 0.603* | ||||
BFI36 | 0.602* | ||||
BFI10 | 0.578* | ||||
BFI23 | 0.556* | ||||
BFI44 | 0.528* | ||||
BFI21 | 0.427* | ||||
BFI40 | 0.364* | ||||
BFI29 | 0.324* | ||||
BFI15 | 0.683* | ||||
BFI9 | 0.669* | ||||
BFI26 | 0.600* | ||||
BFI30 | 0.564* | ||||
BFI35 | 0.554* | ||||
BFI19 | 0.509* | ||||
BFI4 | 0.472* | ||||
BFI38 | 0.464* | ||||
BFI25 | 0.720* | ||||
BFI18 | 0.695* | ||||
BFI42 | 0.604* | ||||
BFI8 | 0.568* | ||||
BFI21 | 0.482* | ||||
BFI14 | 0.471* | ||||
BFI29 | 0.444* | ||||
BFI3 | 0.406* | ||||
BFI34 | 0.362* | ||||
BFI37 | 0.835* | ||||
BFI7 | 0.651* | ||||
BFI41 | 0.617* | ||||
BFI22 | 0.545* | ||||
BFI32 | 0.416* | ||||
BFI28 | 0.406* | ||||
BFI33 | 0.396* | ||||
BFI14 | 0.372* | ||||
BFI11 | 0.349* | ||||
BFI24 | 0.327* | ||||
BFI38 | 0.318* |
Nota: * significativo al 95%, Items que cargan en más de un factor se ponen en negritas. Se omiten los reactivos 2,12 y 13 porque no alcanzan el criterio de > 0.3
Los análisis factoriales se llevaron a cabo en el programa Mplus7.0 (Muthén & Muthén, 1997-2018) derivado de la naturaleza ordinal de la escala Likert y la falta de normalidad en las variables. Para el AFE se utilizó el método: Media Cuadrática Ponderada y Varianza Ajustada (WLSMV, por sus siglas en inglés) con rotación Oblicua (Geomin) ya que, algunos coeficientes en la matriz de correlación superan el criterio (r > .32). Se forzó la extracción de 5 factores para facilitar la comparación con la estructura teórica original de la prueba. El análisis muestra adecuados índices de bondad de ajuste para el análisis exploratorio (CFI:.904, RMSEA:.049, SRMR:.044).
La estructura factorial muestra una necesidad de revisión de la escala para población mexicana, ya que, existen tres reactivos (2-AGR,12-AGR,13-APE) que no alcanzaron la carga factorial mínima (> 0.3) para mantenerse en su escala original. Además, existen varios elementos que cargan en más de un factor que se detallan en la Tabla 1.
Derivado de que este análisis es únicamente exploratorio se decide mantener todos los reactivos para los análisis posteriores, sin embargo, hay que poner especial atención a estos reactivos para una futura revisión de la escala centrada en factores culturales, lingüísticos y/o de comprensión de los reactivos por parte de los participantes.
Análisis Factorial Confirmatorio (AFC)
El AFC se realizó utilizando los mismos criterios metodológicos que el AFE. Los resultados del AFC no muestran adecuados índices de bondad de ajuste (CFI: .706, TLI: .689, RMSEA: .078, WRMR: 2.323) a pesar de que se realiza bajo el método robusto, posiblemente asociado a los resultados explorados en el AFE. En lugar de ajustar las covarianzas en los errores del modelo se optó por implementar otra metodología de AFC para ajustar el modelo y simplificar la replicación de resultados.
AFC con Intercepto Aleatorio (AFCIA)
El Análisis Factorial con Intercepto Aleatorio (AFCIA) y la rotación target, son metodologías que se aplican para las variables ordinales; derivado de que lidian mejor con la distribución y por ende la variabilidad de las escalas de tipo Likert (Maydeu-Olivares & Coffman, 2006; Reise et al., 2011). Con este análisis, se busca lograr un mejor ajuste al modelo ya que, pondera cada respuesta en función del nivel de la escala. El cálculo del modelo se realizó con los índices de bondad de ajuste robustos mediante el método WLSMV en el programa Mplus7.0.
Los resultados muestran adecuados índices de bondad de ajuste para el modelo (CFI:.904, TLI:.876, RMSEA:.049, WRMR:.1.021). Lo que demuestra que a pesar de que algunos reactivos necesitan revisión, la estructura factorial es replicable para población mexicana.
Discusión
Uno de los hallazgos más relevantes fue una correlación de 1 entre dos reactivos: el 6- Es reservado y 16- Tiende a ser callado. Debido a ello se puede asumir que ambos reactivos son idénticos (culturalmente equivalentes) para la población mexicana. Se sugiere que para futuras investigaciones consideren la eliminación de alguno de los dos en el factor de Extraversión.
Referente a la consistencia interna, los coeficientes Alfas de Cronbach se encuentran muy cercanos al límite aceptado por la literatura (Cortina, 1993; Ponterotto & Ruckdeschel, 2010); a pesar de ello, estudios anteriores muestran similares coeficientes de confiabilidad (Reyes Zamorano et al., 2014). Además, existe una tendencia que se repite en población mexicana; el factor Agradabilidad presenta la menor fiabilidad entre todos los factores posiblemente asociados al significado de los reactivos para la población mexicana.
La evaluación del análisis factorial sirve para explorar la solución factorial de un instrumento de medición de una medición para poder comparar con otras. A pesar de ser considerado un elemento exploratorio; es considerado un elemento útil para la comparación entre el ajuste de un instrumento en poblaciones (Morales-Vallejo, 2011; Perez et al., 2000). El ajuste del análisis factorial exploratorio muestra adecuados índices de bondad de ajuste para la solución factorial del presente estudio, lo que pude interpretarse como una replicación de la estructura original dado que se han forzado los cinco factores; sin embargo, en la comparación con la estructura original los resultados parecen sugerir diferencias.
En primer lugar, existen reactivos con carga factorial > = 0.3 en más de un factor al mismo tiempo, lo que implica que los factores parecen no estar totalmente diferenciados entre sí; situación que coincide con los hallazgos de la correlación perfecta antes señalada entre reactivos y la correlación alta entre puntajes. Aunado a ello, algunos reactivos no alcanzan las cargas factoriales suficientes para permanecer en la solución factorial (2 - Tiende a ser criticón, 12 - Prefiere trabajos que son rutinarios y 13 - Inicia disputas con los demás); estos hallazgos parecen consistentes con la estructura factorial reportada en otros estudios (Reyes Zamorano et al., 2014) empero, deben considerarse con reserva debido a que más reactivos no alcanzaron ese criterio y el manejo de los puntajes de las escalas se realizaron con datos ipsatizados.
Por su parte, el análisis confirmatorio basado en la estructura factorial original no alcanzó los índices de bondad de ajuste, a pesar de que, se realizaron las adecuaciones con métodos robustos; lo que sugiere que las relaciones entre los factores o los participantes podrían estar influyendo en la estructura. El análisis factorial con intercepto aleatorio es un método que se ha usado para ajustar las variaciones entre los factores asumiendo la variación aun factor adicional para ponderar esa diferencia (Maydeu-Olivares & Coffman, 2006). Los resultados muestran un adecuado ajuste de la estructura factorial confirmatoria lo que sugiere la necesidad de una modificación de la estructura factorial para población mexicana. Sin embargo, estudios adicionales que consideren otras formas de validez deben considerarse además del binomio EFA-CFA (Perez et al., 2000).
Es importante considerar que a pesar de que las metodologías aplicadas en el presente estudio aún no cuentan con demasiados estudios que las respalden; se consideró su aplicación teórica y práctica porque se ha demostrado su efectividad (Marsh et al., 2014b; Pérez & y Medrano, 2010; Schmitt, 2011). Por lo cual es necesario que se realicen otros estudios que permitan comparar los resultados ya que actualmente todo apunta a una posible reducción de items.
Existen versiones más cortas del BFI que han demostrado tener mejores resultados respecto en estudios interculturales (Rodríguez & Church, 2003) incluso las versiones ultra cortas (Romero et al., 2012). En México esta una propuesta que ha implementado una estructura factorial diferente (Meda Lara et al., 2015) por lo cual, se sugiere que futuros estudios evalúen la viabilidad de la reducción de la prueba o la exploración factorial de la estructura mexicana.
Una de las principales limitaciones del presente artículo se centra en que su población se encuentra focalizada a la región de Guadalajara y con estudiantes; por lo cual será necesario realizar otros estudios que incluyan una mayor representatividad del país. De este mismo modo, la implementación de análisis robustos y metodologías enfocadas en la variabilidad de la muestra, podrían sugerir que se debe tener en cuenta la variabilidad interna de la muestra.