Introducción
La medición se ha convertido en un elemento esencial para demostrar la madurez de una disciplina. La validez es uno de los aspectos más importantes y sobresale sobre los diversos criterios de medición, pues a la vez que fomenta el desarrollo del conocimiento científico, permite contrastar los aspectos teóricos frente a los empíricos (LeBel et al., 2017). De hecho, no es posible hablar de la existencia de conclusiones válidas sin un instrumento con una adecuada consistencia interna (Solimun & Fernandes, 2017). Es así que la validez se ha convertido en un aspecto trascendental dentro del proceso inductivo de la ciencia, específicamente para replicar un instrumento de medición en diferentes contextos y poblaciones (Manterola et al., 2018).
La validez, en términos generales, es definida como el grado en que un cuestionario mide lo que debe medir o cumple con el objetivo para el cual fue construido (Clark & Watson, 2019; Ravid, 2020; Sapsford, 2006). Un instrumento puede tener diversos tipos de validez (i.e. de contenido, de constructo, discriminante y convergente [Andrew et al., 2020; Rosendo, 2018]) , dependiendo del propósito, la población objetivo, las condiciones en que se aplica y el método empleado. Primeramente, la validez de contenido se establece en el diseño de una prueba o juicio de expertos (Álvarez-Ríos et al., 2019; Nievas et al., 2020). Éste -el juicio de expertos- es recurrente cuando un instrumento que fue construido para una población diferente se adapta mediante un proceso de traducción-retraducción (Dorantes-Nova et al., 2016). Es frecuente que instrumentos estandarizados en países de habla inglesa sean utilizados en países de lengua no inglesa, lo cual en ocasiones presenta dificultades importantes, ya que la sola traducción no genera una equivalencia cultural y/o semántica (Garcimartin et al., 2019), debido a barreras del idioma (Squires et al., 2020), o en cuanto a su propósito (Muñiz & Fonseca-Pedrero, 2019).
Por otra parte, aunque los estudiosos de las organizaciones tienen una idea general acerca de lo que se busca al caracterizar al capital intelectual (CI), existen aspectos específicos en los que hay desacuerdos. Considerando que la mayoría de las investigaciones en torno a esta variable se han centrado en su medición (Martín-de Castro et al., 2019), es en este marco de referencia donde cobra sentido la validez de constructo, como elemento unificador que integra las relaciones teóricamente relevantes a partir de la evidencia empírica. La validez de constructo consiste en un análisis del significado de lo que mide un instrumento (Carrillo-Avalos et al., 2020; Morales-Vallejo, 2011). Ésta parte del análisis del concepto (Larroulet, 2021; Stone, 2019), y se refiere al grado en que un instrumento favorece la medición de una dimensión o factor, lo cual depende de cuán adecuada sea la definición y los elementos para conceptualizar y medir la variable (Creswell & Creswell, 2017).
Además de la validez de constructo, la validez convergente corresponde al grado en que se asocian dos medidas del mismo constructo (García, 2018; Krabbe, 2017), mientras que la validez discriminante, a la forma en que la variable se distingue de otros conceptos (Hair et al., 2018) o grupos (Carrillo-Álvarez et al., 2019).
En conjunto, la validez ha dado lugar a una reflexión profunda sobre el rol que desempeña la medición dentro de la ciencia, en especial en ciencias sociales (Flake et al., 2017; Rammstedt & Bluemke, 2019), lo que conlleva que la validez de un instrumento deba ser vista de manera crítica e integral (Markus, 2016; Norman, 2016), en especial porque ha surgido una discusión sobre lo que es la validez (Stone, 2019) y su utilidad (Larroulet, 2021) , donde se promueve que lo estadístico no prevalezca sobre lo práctico y teórico (Guyon, 2018; Mercado-Salgado et al., 2016).
Es así que, desde las primeras publicaciones sobre la validez hasta la actualidad, siguen latentes cuestionamientos en cuanto a que: (1) si la parte estadística es suficiente para sostener que un instrumento cumple con propiedades de validez; (2) si la validez se refiere al cuestionario o a los elementos del mismo; (3) o qué tipo de validación es suficiente para un instrumento de medición. Respecto al primero, algunos autores están de acuerdo en que ciertas pruebas estadísticas son suficientes para medir la validez (Martínez-García & Martínez-Caro, 2009; Norman, 2016). Sin embargo, la validez trasciende a la obtención de un coeficiente estadístico (Kline, 2016, citando a Thompson, 2000; Mercado-Salgado et al., 2016; Morales-Vallejo, 2011), pues no solo se refiere a la medición de las propiedades psicométricas de un cuestionario, sino en cómo éstas pueden ser empleadas en otros contextos (Squires et al., 2020), lo que da lugar a la necesidad de analizar la validez de contenido, específicamente mediante el método de traducción inversa (o traducción-retraducción [Dorantes-Nova et al., 2016]).
En segundo lugar, algunos autores definen a la validez como una característica propia del instrumento (Sapsford, 2006), mientras que otros la consideran un proceso multifacético (Adcock & Collier, 2001), con la integración de diferentes elementos. En este sentido, la validez no es una cualidad del instrumento de medición sino de los indicadores del mismo (Ventura-León, 2017), la cual pretende explicar las dimensiones y, posteriormente, al cuestionario.
En cuanto al tercer cuestionamiento, los criterios sobre el tipo de validez del instrumento se agrupan en tres posturas: (a) existen publicaciones con pruebas exhaustivas acerca de la validez (Hawkins et al., 2018); (b) la validación sólo puede ser fruto de una integración de pruebas cualitativas y cuantitativas debido a que no es posible validar un instrumento con un solo tipo de validación (Adcock & Collier, 2001); y (c) es posible obtener resultados contradictorios al medir la validez, debido al uso de diferentes pruebas estadísticas (Martínez-García & Martínez-Caro, 2009). Es importante destacar que en el campo de las ciencias sociales prevalece la validez de instrumentos usando el Análisis Factorial Exploratorio (AFE) (Orçan, 2018).
Al considerar que la validez se encuentra asociada significativamente con la posibilidad de replicar un estudio en diferentes escenarios (Corral, 2017; LeBel et al., 2017), permitiendo llevar a cabo estudios transculturales que a menudo involucran la necesidad de comunicarse con personas en idiomas distintos al propio del investigador (Squires et al., 2020), es imperativo contar con instrumentos suficientemente válidos para contribuir a la solidez del estudio de las organizaciones y sus recursos, tanto tangibles como intangibles. Para ello se requiere profundizar en la estabilidad de los resultados de los diferentes tipos de validación, sin olvidar que lo estadístico no puede estar sobre lo teórico (Kline, 2016, citando a Thompson, 2000), o bien, que las consideraciones estadísticas por sí solas, no garantizan resultados con significación conceptual (Mercado-Salgado et al., 2016; Morales-Vallejo, 2011).
A partir de lo anterior, el objetivo de esta investigación es identificar la estabilidad entre los resultados de las diferentes pruebas de validez de un instrumento de capital intelectual en organizaciones latinoamericanas. La estructura del presente documento comprende cinco secciones. La primera contiene la revisión de la literatura incluyendo diferentes modelos, estudios e indicadores sobre el capital intelectual, considerando las características de la operacionalización de la variable en sus tres dimensiones (CH, CS y CO) y los 14 reactivos en español, así como la caracterización de la muestra. En una tercera sección se presentan los resultados en tres partes: validez de constructo, validez discriminante y validez convergente. Continúan las conclusiones e implicaciones del estudio, para finalizar con las limitaciones y recomendaciones para estudios futuros.
El interés por el estudio sobre el capital intelectual ha ido en aumento en todo el mundo (Inkinen, 2015; Martín-de Castro et al., 2019; Popescu, 2019; Serenko & Bontis, 2013). La mayoría de los modelos coinciden en la existencia de tres capitales: capital humano (CH), capital estructural (CE) y capital relacional (CR) (Gómez-Bayona et al., 2020). La concepción de las dimensiones del CI varían según el modelo al que se haga referencia; no obstante, según Ferenhof et al. (2015), las diferentes propuestas coinciden en ciertos aspectos que integran a los capitales: CH (motivación, relaciones interpersonales, conocimiento, habilidades, actitudes y agilidad; CE (capital de innovación, el capital tecnológico y organizacional, y procesos); y CR (relación con clientes y otros entes).
Por otro lado, algunos estudios de meta-análisis reportan que ha aumentado el número de publicaciones empíricas sobre CI (Inkinen, 2015; Pedro et al., 2018), lo cual ha sido posible a partir del desarrollo de instrumentos de medición. La Tabla 1 contiene estudios empíricos sobre capital intelectual que se han llevado a cabo a nivel internacional.
Autor(es) | Año | País(es) | Muestra | Validez | Prueba estadística para validación |
Publicaciones en inglés | |||||
Bontis | 1998 | Canadá (n = 64) | Estudiantes universitarios | De constructo Discriminante | AFE-AFC |
Youndt, Subramaniam & Snell | 2004 | E.U.A. (n= 208) | Administradores/ Directivos | De constructo | AFC |
Subramaniam & Youndt | 2005 | E.U.A. (n= 93) | Administradores/ Directivos | De constructo Convergente Discriminante | AFC |
Chahal & Bakshi 2016 | India (n= 339) | Administradores/ Directivos | De constructo Convergente Discriminante | AFC AVE Criterio Fornell- Larcker | |
Cabrita & Bontis | 2008 | Portugal (n =253) | Empleados | De constructo Convergente Discriminante | AFE-AFC AVE Criterio Fornell- Larcker |
*Wang & Chen | 2013 | China (n = 164) | Empresarios | De constructo Convergente Discriminante | AFC AVE Criterio Fornell- Larcker |
*Nguyen | 2018 | Vietnam (n = 95) | Directivos | De constructo | AFE |
Publicaciones en español | |||||
Rodríguez & Rubio | 2006 | España (n = 24) México (n = 14) Chile (n = 8) República Dominicana (12) | Empresarios/ Administradores | N/A | N/A |
Mejía, Rodríguez & Hernández | 2014 | México (n = 63) | Administradores/ Directivos | De constructo | AFE-AFC |
Daou, Karuranga & Su | 2013 | México (n= 445) | Empresarios | De constructo | AFE-AFC |
Mercado-Salgado, Gil-Monte & Cernas | 2016 | México (n = 750) | Universitarios | De constructo | AFE |
Nota. Elaboración propia con base en los autores citados en la tabla. E.U.A.= Estados Unidos de América; AFE = Análisis factorial exploratorio; AFC = Análisis factorial confirmatorio; AVE = Varianza promedio extraída.
*Estudios realizados mediante el empleo del cuestionario propuesto por Subramaniam y Youndt (2005).
La medición del CI hace posible fortalecer el control y el aprovechamiento de los intangibles dentro de la organización (Bontis, 1998). Aunque algunos modelos no tienen indicadores cualitativos y financieros siguen latentes algunas complicaciones como, por ejemplo: (a) impiden la estandarización de la evaluación y control del CI; (b) no permiten el comparativo entre empresas diferentes; (c) complican el estudio de la relación del CI con otras variables. Por ello, es trascendental contar con instrumentos validados en el idioma dominante de las organizaciones.
A nivel mundial las investigaciones sobre CI han sido mayormente cuantitativas (Pedro et al., 2018) y escritas en inglés, dificultando la difusión de estudios en otras lenguas. Aun así, esta variable se ha convertido en un tema de interés para investigadores de países iberoamericanos (Montes, 2010), con lo que académicos de la región en cuyos países el idioma dominante es el español, han sobresalido a nivel mundial; sin embargo, dichos autores también publican en lengua inglesa (Serenko et al., 2010; Serenko & Bontis, 2013). No obstante, a pesar de esto, la evidencia empírica en español todavía es escasa, donde se destacan ciertos estudios (Costamagna et al., 2019; Fernández-Jardón & Martos, 2016; Jardon & Catalina, 2015; Rodríguez & Rubio, 2006).
Para cubrir el vacío de conocimiento en regiones latinas, así como de instrumentos en español que puedan ser administrados en diferentes países latinoamericanos, es inminente aumentar la investigación y publicación de la medición del CI en organizaciones ubicadas en territorios cuya lengua es el español. Para que esto sea posible, existe la necesidad de instrumentos que mejoren el acercamiento empírico al CI (Mercado-Salgado et al., 2016) , mediante instrumentos válidos dentro de este contexto. En este sentido, todavía es necesario realizar más investigaciones empíricas (Esparza et al., 2019), ante la necesidad de desarrollar instrumentos validados para medir a esta variable.
Con tal propósito, en esta investigación se valida la adaptación al español del cuestionario elaborado por Subramaniam y Youndt (2005). Estos autores, al asociar el CI con las capacidades de innovación, generaron un cuestionario para medir el capital humano (CH), el capital social (CS) y el capital organizacional (CO). La definición conceptual y operativa del capital organizacional (CO) corresponde al clásico capital estructural; mientras que, el capital social (CS) coincide con lo denominado como capital de clientes o relacional (Bontis, 2003). El instrumento propuesto por los autores se encuentra integrado por 14 ítems, de los cuales cinco corresponden al CH, cinco al CS y cuatro al CO.
Dicho instrumento ya ha sido replicado y validado en otros contextos y por otros autores como Wang y Chen (2013) y Nguyen (2018). Entre los resultados obtenidos con relación al instrumento de medición, los primeros autores encontraron, mediante el Modelamiento de Ecuaciones Estructurales (MEE), resultados favorables en una muestra de empresas chinas, mientras que el segundo autor hizo lo propio con empresas de Vietnam al calcular el AFE. Sin embargo, tal instrumento no ha sido adaptado y traducido al español a pesar de sus características favorables: (1) es un cuestionario corto y entendible; (2) a diferencia de otros cuestionarios de CI, éste ha sido traducido y validado a otras lenguas (e.g., chino mandarín); (3) mide las tres dimensiones básicas del CI: la humana (CH), la estructura y organización (CO), así como la relación con otros entes (CS).
A partir de lo anterior, la pregunta de investigación es: ¿los indicadores de un instrumento para medir el CI elaborado originalmente en inglés por Subramaniam & Youndt (2005) y traducido al español para aplicarse en el contexto de organizaciones latinoamericanas (mexicanas y bolivianas), cuentan con estabilidad de medida a través de validez de constructo, convergente y discriminante?
Método
Muestra
Con el propósito de medir el nivel de validez de constructo, convergente y discriminante de un instrumento de medición sobre CI, se recurrió a una metodología cuantitativa, con un diseño no experimental. En la recolección de datos primarios se utilizó un muestreo no probabilístico por conveniencia obteniendo la participación total de 226 empresas (161 en México y 65 en Bolivia). Se contó con la representación mayormente de empresas industriales y de servicios. En cuanto al número de empleados, predominaron las empresas con uno a 10 empleados (Tabla 2).
Características | n | % |
---|---|---|
País | ||
México | 161 | 71.2 |
Bolivia | 65 | 28.3 |
Actividad | ||
Industria | 74 | 32.7 |
Comercio | 59 | 26.1 |
Servicios | 93 | 41.2 |
Número de empleados | ||
1-10 | 130 | 57.5 |
11-50 | 25 | 11.1 |
51-250 | 22 | 9.7 |
251 o más | 49 | 21.7 |
Área de comercialización | ||
Nacional | 185 | 81.9 |
Internacional | 12 | 5.3 |
Ambas | 29 | 12.8 |
Puesto del encuestado | ||
Gerencial | 124 | 42.8 |
Jefatura | 29 | 10.0 |
Supervisión | 24 | 8.3 |
Administrativo | 49 | 16.9 |
Nota. Elaboración propia con información de la muestra.
El trabajo de campo se llevó a cabo durante 2017 y 2018 en el estado de Sonora, México y el Departamento de Santa Cruz, Bolivia. En ambos casos, el cuestionario para la medición del CI fue autoadministrado a representantes de las empresas participantes, quienes después de conocer el objetivo del presente estudio, decidieron participar voluntariamente.
Aunque este documento no pretende ser un manual que explique la validez de instrumentos dentro de ciencias sociales, con el fin de cumplir el objetivo inicial, se retoman aspectos y supuestos tanto metodológicos como estadísticos. Mediante el empleo del programa SPSS (Statistical Package for the Social Sciences) y su extensión AMOS, se aplicaron las pruebas estadísticas necesarias para medir la validez de constructo, discriminante y convergente.
Como se mencionó con anterioridad, un instrumento se construye a partir de un sólido sustento teórico y antecedentes científicos (LeBel et al., 2017). En este sentido, un primer criterio para medir la consistencia interna de un cuestionario es la validez de contenido, entendida como un juicio sobre el constructo en cuestión (Kerlinger & Lee, 2002). Aunque es posible destacar la existencia de diferentes modelos acerca del CI, la mayoría de estos concuerdan que esta variable es operacionalizada a través de tres dimensiones: capital humano, capital estructural y capital relacional (Gómez-Bayona et al., 2020). Ferenhof et al. (2015), al hacer una revisión exhaustiva de las dimensiones del CH, encontraron que las diferentes aproximaciones teóricas coinciden en que éste se define a través de la motivación, relaciones interpersonales, conocimiento, habilidades, actitudes y agilidad. Este autor, por medio de la misma metodología, expone las características de un segundo capital, el cual se basa en la innovación, de los procesos, así como el capital tecnológico y organizacional; además de un tercero donde se encuentra la relación con clientes y otros entes, los cuales dentro de la presente investigación son nombrados como capital organizacional (CO) y capital social (CS), respectivamente.
Según el estudio bibliométrico elaborado por Pedro et al. (2018), con una revisión de estudios empíricos hasta 2016, estos tres tipos de capitales han sido los más frecuentes al operacionalizar al CI desde un enfoque organizacional. Si bien identificaron 35 tipos de capital, todos quedan en esta triada (CH, CE y CR). Por su parte, Ferenhof et al. (2015) realizaron una revisión de 83 artículos sobre CI y encontró que una gran cantidad de estudios teóricos y empíricos emplean una taxonomía basada en tres dimensiones: una que se basa en la parte individual, es decir, el capital humano -aspecto de mayor frecuencia entre los autores-; otra que considera la estructura, tecnología, innovación, organización, procesos y/o negocio; y una tercera que se centra en las relaciones con los clientes y otras entidades sociales. De alguna forma, ya sea como primer nivel o segundo, dichos aspectos aparecen en la mayor parte de los modelos, a pesar que el concepto empleado no sea el mismo. Es decir, más allá de la etiqueta de la dimensión, existen equivalencias. Por ejemplo, entre el capital estructural de Bontis (1998, 2003; Bakhsha et al., 2018) y el capital social de Subramaniam & Youndt (2005).
Un modelo que sigue dicha lógica es la propuesta de medición de Subramaniam & Youndt (2005), quienes operacionalizan al CI, en las habilidades, experiencia y conocimientos de las personas (CH), estructura organizacional, cultura, procesos y sistemas (CO), así como relaciones y redes de colaboración entre los empleados, clientes, proveedores y patrocinadores (CS).
A partir de lo anterior, para la medición del CI sigue siendo necesaria la traducción de instrumentos en el lenguaje de la cultura que está siendo estudiada, sin perder de vista que dichas herramientas deben ser válidas y confiables en cada cultura. Por ello, la calidad de la traducción desempeña un papel significativo para asegurar que los resultados obtenidos no se deban a errores en la traducción (Boer et al., 2018; Silalahi et al., 2018) , sino que reflejen diferencias o similitudes reales de un fenómeno entre culturas (Gregorio, 2017; Squires et al., 2020). Una alternativa es optar por la traducción-retraducción (o traducción inversa), técnica tomada de la literatura (Álvarez & Torronteras, 2020), que juega un papel relevante en la validación de contenido (Arancibia et al., 2020; Espinoza & Garcés, 2016; Rojas-Ospin & Valencia-Serrano, 2019).
Se realizaron los siguientes pasos para alcanzar la validez de contenido del instrumento de medición del CI: (1) se tradujo el cuestionario del inglés al español; (2) tres profesores conocedores de la lengua inglesa y de las ciencias administrativas, revisaron la traducción e hicieron comentarios de mejora; (3) se realizaron ajustes gramaticales y semánticos; (4) se re-tradujo del español al inglés con el fin de revisar similitudes y detectar diferencias en la redacción de los reactivos; (5) se aplicó una prueba piloto a una pequeña muestra de estudiantes de posgrado que trabajaban en empresas privadas; (6) la versión final del cuestionario se aplicó a la muestra de estudio en México; y (7) antes de ser aplicado en Bolivia, dos profesores de ese país revisaron el cuestionario.
La Tabla 3 contiene la operacionalización del instrumento de CI en sus tres dimensiones medidas a través de 14 ítems: cinco para CH, cinco para CS y cuatro respecto a CO. Se empleó una escala de tipo Likert de cinco puntos que oscilan desde 1 (totalmente en desacuerdo) hasta 5 (totalmente de acuerdo).
Indicador* | Ítems | Dimensión |
---|---|---|
CH1 | Los empleados de la organización están altamente calificados. | Capital Humano |
CH2 | Los empleados de la organización son considerados los mejores en la industria. | |
CH3 | Los empleados de la organización son creativos y brillantes. | |
CH4 | Los empleados de la organización son expertos en su trabajo y funciones. | |
CH5 | Los empleados de la organización desarrollan nuevas ideas y conocimientos. | |
CS1 | Los empleados de la organización están capacitados para colaborar con otros para diagnosticar y resolver problemas. | Capital Social |
CS2 | Los empleados de la organización comparten información y aprenden de cada uno. | |
CS3 | Los empleados de la organización interactúan e intercambian ideas con personas de diferentes áreas de la organización. | |
CS4 | Los empleados de la organización se relacionan con clientes, proveedores y socios para desarrollar soluciones. | |
CS5 | Los empleados de la organización aplican los conocimientos de un área a los problemas y oportunidades que surgen en otra. | |
CO1 | Nuestra organización usa patentes y licencias como una forma para conservar el conocimiento. | Capital Organizacional |
CO2 | La mayoría del conocimiento de la organización está registrado en manuales o bases de datos. | |
CO3 | La cultura de la organización (historias, rituales) contiene ideas valiosas, formas de hacer las cosas. | |
CO4 | Nuestra organización convierte el conocimiento e información en estructuras, sistemas y procesos. |
Nota. Adaptado de Subramaniam y Youndt (2005).
* Los indicadores (nomenclatura) son empleados con el propósito de sintetizar las dimensiones e ítems.
En la versión en inglés, los autores inician los ítems con “nuestros empleados” (Our employees) debido a que su muestra de estudio estuvo conformada exclusivamente por Directivos (CEOs). En el caso de la presente investigación, considerando que la muestra se integraría por respondientes de diferentes niveles jerárquicos, se optó por iniciar con “los empleados de la organización”.
En cuanto a las propiedades psicométricas del instrumento, Subramaniam & Youndt (2005) realizaron el siguiente procedimiento: (1) aplicación de una prueba piloto con estudiantes de maestría; (2) obtención de valores favorables para la validez de constructo: AFC (X2/gl = 2.78; CFI = .91; GFI = .87), y confiabilidad (α > .70). Además, el cuestionario fue validado por otros autores (Wang & Chen, 2013), reportando resultados satisfactorios en cuanto a los niveles de confiabilidad y validez, a través de la Modelación de Ecuaciones Estructurales (MEE) y validez convergente (criterio Fornell-Larcker). Finalmente, Nguyen (2018), añadió algunos ítems al cuestionario original, el cual validó mediante un AFE.
Resultados
Para medir la validez de constructo usualmente se recurre al AFE y al AFC (Kyriazos, 2018; Moafian et al., 2019; Valdés et al., 2019). El AFE es ampliamente usado en investigación en ciencias sociales (Orçan, 2018), en especial en administración para detectar los factores que pueden explicar la inter-correlación entre los elementos que conforman la variable. El AFC requiere pruebas complementarias de bondad de ajuste para confirmar si la estructura obtenida coincide con la estructura propuesta (Hair et al., 2018; Morales-Vallejo, 2011); o bien, evalúa si los factores obtenidos en el AFE explican la matriz de inter-correlaciones adecuadamente (Foster, 2006). Por tanto, el AFE y el AFC suponen procedimientos distintos.
Si bien no existe un criterio o norma definitiva sobre el número de sujetos necesarios para el cálculo del AFE, Foster (2006) y Ho (2006) recomiendan, al menos, 100 sujetos. En cambio, para Hair et al. (2018), el mínimo de sujetos debe ser 50, aunque es importante cuidar la proporción de sujetos con respecto al número de variables (ítems), siendo idóneo 10 sujetos por cada ítem (variable) que mide el cuestionario (Morales-Vallejo, 2011). En este caso, el instrumento traducido y aplicado tiene 14 reactivos, por lo tanto, se requieren como mínimo 140 sujetos, lo cual se cumplió al tener una muestra de 226 empresas.
Mediante el método de componentes principales, cuyo objetivo es simplificar y agrupar los indicadores en factores, se analiza toda la varianza, común y no común. Este método es recomendable cuando el cuestionario contiene 20 o menos reactivos. Además, cuando los ítems que delimitan un factor poseen pesos de 0.50 o más en este factor y menores en los demás, puede afirmarse que se cuenta con una estructura factorial clara (Ho, 2006; Morales-Vallejo, 2011).
Para ello, es necesario tomar en cuenta dos pruebas preliminares que soporten la conveniencia de realizar el AFE del instrumento en el que los ítems son la unidad de análisis: el Keiser-Meyer-Olkin (KMO) y la prueba de esfericidad de Bartlett. De acuerdo con Field (2018) y Ho (2006), los valores superiores a 0.7 son aceptables para la prueba KMO, mientras que la segunda prueba muestra que las variables son independientes cuando se tienen resultados significativos (p < 0.05). En el presente estudio, se encontraron valores favorables con un KMO de 0.880 y una prueba de Bartlett significativa (X 2 = 1239.9; gl = 91; p < 0.001). En la Tabla 4, se observa que los tres factores del CI (CH, CS y CO) explican 59.856% de la varianza, resultado satisfactorio en ciencias sociales, según Hair et al. (2018).
Componente | Autovalores iniciales | Sumas de cargas al cuadrado de la extracción | Sumas de cargas al cuadrado de la rotación | ||||||
Total | % de varianza | % acumulado | Total | % de varianza | % acumulado | Total | % de varianza | % acumulado | |
1 | 5.509 | 39.353 | 39.353 | 5.509 | 39.353 | 39.353 | 3.052 | 21.800 | 21.800 |
2 | 1.746 | 12.474 | 51.827 | 1.746 | 12.474 | 51.827 | 2.997 | 21.410 | 43.209 |
3 | 1.124 | 8.029 | 59.856 | 1.124 | 8.029 | 59.856 | 2.331 | 16.647 | 59.856 |
4 | .902 | 6.441 | 66.297 | ||||||
5 | .741 | 5.290 | 71.587 | ||||||
6 | .623 | 4.449 | 76.036 | ||||||
7 | .579 | 4.134 | 80.170 | ||||||
8 | .523 | 3.739 | 83.909 | ||||||
9 | .452 | 3.225 | 87.134 | ||||||
10 | .429 | 3.062 | 90.196 | ||||||
11 | .403 | 2.881 | 93.077 | ||||||
12 | .375 | 2.675 | 95.752 | ||||||
13 | .305 | 2.176 | 97.928 | ||||||
14 | .290 | 2.072 | 100.000 |
Nota. Elaboración propia.
En este AFE se empleó la rotación Varimax con la finalidad de identificar la separación de los factores que conforman a una variable (Ho, 2006). Los resultados de la Tabla 5 muestran que los 14 ítems se agrupan, tal como lo proponen Subramaniam y Youndt (2005), en tres factores: cinco ítems para CH; cinco ítems para CS y cuatro para CO. Se obtuvo una estructura factorial clara y simple, con la ausencia de factores de segundo orden. Los pesos de los ítems en cada factor son mayores a .545, lo que representa una clara relevancia práctica, toda vez que en cada uno de ellos están los pesos mayores de cada ítem (Hair et al., 2018).
Componente | h 2 | |||
1 | 2 | 3 | ||
CH 1 | .730 | .169 | .126 | .578 |
CH 2 | .545 | .304 | .267 | .461 |
CH 3 | .768 | .269 | .044 | .665 |
CH 4 | .707 | .246 | .165 | .587 |
CH 5 | .573 | .486 | .084 | .572 |
CS 1 | .422 | .687 | .120 | .664 |
CS 2 | .331 | .704 | .010 | .605 |
CS 3 | .300 | .734 | .005 | .629 |
CS 4 | .166 | .614 | .237 | .460 |
CS 5 | .056 | .787 | .199 | .662 |
CO 1 | .183 | -.188 | .660 | .505 |
CO 2 | .078 | .140 | .806 | .675 |
CO 3 | .037 | .403 | .713 | .672 |
CO 4 | .136 | .352 | .709 | .645 |
Nota. Elaboración propia.
Los valores obtenidos en las comunalidades (h2) de los ítems superaron el 0.3, valor mínimo aceptado como un elemento que interpreta significativamente al factor (Sapsford, 2006). Estos hallazgos muestran valores favorables a las pruebas realizadas para medir la validez de constructo del instrumento.
El AFE permite apreciar que se está midiendo lo que debe medirse al clarificar los tres factores (CH, CS y CO) que subyacen al CI y al identificar los ítems (variables) que definen cada factor, pero también la relación entre sí, con lo cual se tamiza la estructura del constructo (Tabla 6), misma que, según Morales-Vallejo (2011), se entiende como validez lógica o aparente más que experimental, pues lo medido debe corroborarse con criterios externos. Los resultados obtenidos confirman que entre los tres factores existe una correlación estadísticamente significativa y positiva: entre el CH y el CS la correlación es fuerte, mientras que es menor entre el CS y el CO.
Capital humano | Capital social | Capital organizacional | |
Capital humano (CH) | 1 | .650** | .408** |
Capital social (CS) | 1 | .342** | |
Capital organizacional (CO) | 1 |
Nota. Elaboración propia.
Estas correlaciones corresponden al modelo original.
** p <. 01 (bilateral).
Hasta ahora y a pesar de haber encontrado los tres factores esperados (CH, CS y CO), no puede concluirse que la escala es multidimensional, es decir, que mide constructos distintos y bien diferenciados. Es preciso proceder al AFC, el cual se calculó mediante la MEE, herramienta multivariante que verifica la relación de dependencia entre diferentes variables (Ho, 2006). Esta técnica es empleada para evaluar un modelo teórico (Field, 2018; Hair et al., 2018), o bien, debe ser precedida por modelos teóricos previos (Schumacker & Lomax, 2016), y pretende medir cuán adecuados (válidos) son los indicadores del instrumento para la medición del CI, en su versión en español y con una muestra de empresas latinoamericanas. Es importante señalar que la MEE busca confrontar modelos teóricos y empíricos (Hair et al., 2018; Ho, 2006), por lo que han surgido estudios que, con el fin de verificar el modelo teórico más óptimo, comparan diferentes modelos, revisando cuál arroja los mejores niveles de bondad de ajuste (Fromont et al., 2017; Gómez-Lugo et al., 2016) . En este caso, se presentan seis modelos empíricos (Figura 1) y sus respectivas pruebas complementarias de bondad de ajuste, para detectar qué estructura coincide mejor con la organización teórica de CI propuesta por Subramaniam y Youndt (2005) y, con ello, avanzar en la estabilidad de los resultados de la validez del instrumento traducido.
Porcentaje de explicación de la varianza por modelo: Modelo 1 (59.856%); Modelo 2 (60.552%); Modelo 3 (58.122%); Modelo 4 (65.907%); Modelo 5 (62.297%); Modelo 6 (58.321%).
Entre los indicadores que se emplean para evaluar un modelo de MEE sobresalen los siguientes, según Ho (2006): chi-cuadrado sobre los grados de libertad (X 2/gl), significancia (p), índice de bondad de ajuste (GFI), índice ajustado de bondad de ajuste (AGFI), índice de Tucker-Lewis (TLI), índice de bondad de ajuste comparativo (CFI), ajuste de parsimonia (NFI), raíz del residuo cuadrático promedio de aproximación (RMSEA) y la raíz del residuo cuadrático promedio (RMR).
Se pretende que la X2 del modelo sea no significativa (Hair et al., 2018), puesto que se busca rechazar la hipótesis nula de que no existe diferencia significativa entre lo empírico y lo teórico. Al comparar los modelos obtenidos (Tabla 7), puede observarse que sólo los modelos 3 y 6 cumplen con este criterio. X2/gl debe ser menor de 3.0 (Kline, 2016; Ruiz et al., 2010), mientras que los valores aceptables para GFI, AGFI, TLI, CFI y NFI deben ser ≥ .90. Para RMSEA, resultados entre el rango 0.05-0.08 son considerados de un alto grado de aceptación; y en el caso del RMR, valores cercanos a 0 son adecuados (Ho, 2006). Es así que, luego de revisar tales resultados, es posible constatar que los modelos tuvieron valores favorables. Sin embargo, solo los dos referidos cumplen con la no significancia de la X2. Sin tratar de afirmar que estos son mejores que el modelo teórico original, es importante observar que no mejora el resultado de las covarianzas entre los factores ni cómo estos explican a sus respectivos ítems.
Modelos | X2/gl | p | GFI | AGFI | TLI | CFI | NFI | RMSEA | RMR |
1 | 1.858 | .000 | .923 | .890 | .934 | .946 | .892 | .062 | .069 |
2 | 1.925 | .000 | .928 | .895 | .931 | .945 | .894 | .064 | .070 |
3 | 1.285 | .159 | .971 | .946 | .984 | .990 | .955 | .036 | .037 |
4 | 1.476 | .040 | .960 | .932 | .971 | .979 | .939 | .046 | .044 |
5 | 1.808 | .001 | .943 | .909 | .942 | .957 | .910 | .060 | .070 |
6 | 1.194 | .208 | .968 | .944 | .989 | .992 | .956 | .029 | .039 |
Nota. Elaboración propia.
Para demostrar la cohesión entre lo teórico y lo empírico, el AFE y AFC no pueden ser considerados como los únicos elementos para medir la idoneidad de los factores y explicar la variable latente. Por tal motivo, los presentes hallazgos deben ser contrastados con los análisis de validez convergente y discriminante.
Según Martínez-García y Martínez-Caro (2009), los análisis de validez convergente y discriminante complementan la validez de constructo. Para realizar estas pruebas se tomaron como base los seis modelos propuestos anteriormente. Puesto que no se encontraron resultados concluyentes en cuanto al modelo más óptimo para explicar la estructura del CI, es necesaria una comparación de los modelos propuestos.
En cuanto a la validez convergente, en los modelos 3, 4, 5 y 6 se obtuvieron valores superiores a 0.5 en la Varianza Promedio Extraída (AVE) de las tres dimensiones del CI (Tabla 8) , lo cual es aceptable, según Hair et al. (2018). De tal forma que la validez convergente existe cuando los ítems de un factor comparten una varianza importante en común (Sapsford, 2006), y se relacionan de manera significativa (Anis et al., 2020) . Por otro lado, la validez discriminante contribuye a diferenciar un factor de otro Kerlinger & Lee, 2002).
α de Cronbach | AVE (Validez convergente) | |||||
---|---|---|---|---|---|---|
Modelos | CH | CS | CH | CH | CS | CO |
1 | .813 | .822 | .739 | .450 | .500 | .524 |
2 | .778 | .822 | .739 | .480 | .510 | .523 |
3* | .748 | .755 | .799 | .588 | .612 | .668 |
4 | .748 | .769 | .799 | .578 | .536 | .665 |
5 | .748 | .769 | .739 | .526 | .528 | .533 |
6* | .748 | .819 | .739 | .574 | .576 | .667 |
Nota. Elaboración propia.
* Se extrajeron tres factores fijos.
Para medir la validez discriminante, se empleó el criterio propuesto por Fornell y Larcker (1981), el cual se basa en que la raíz cuadrada de AVE de cada constructo (CH, CS y CO) sea mayor que la correlación entre estos. En este caso, en todos los modelos la raíz cuadrada de AVE es mayor que dicha correlación, lo cual ratifica la validez discriminante (Tabla 9). Esto también puede ser confirmado cuando las correlaciones entre los ítems de cada constructo son menores a 0.85 (Ghazali et al., 2016).
Modelos | CH-CS | CS-CO | CO-CH |
---|---|---|---|
1 | (.670) > .650** | (.707) > .408** | (.723) > .342** |
2 | (.692) > .603** | (.714) > .406** | (.723) > .342** |
3* | (.766) > .504** | (.782) > .308** | (.817) > .413** |
4 | (.760) > .539** | (.732) > .342** | (.815) > .413** |
5 | (.725) > .539** | (.726) > .323** | (.730) > .354** |
6* | (.757) > .554** | (.758) > .335** | (.816) > .413** |
Nota. Elaboración propia. El resultado de la raíz cuadrada de AVE se muestra (entre paréntesis).
* Se extrajeron tres factores fijos.
** p < .01 (bilateral).
Discusión
Este documento parte de la premisa de que la validez desempeña un papel fundamental dentro de la investigación, con el fin de replicar estudios en diferentes contextos y verificar la relación teórica-empírica (LeBel et al., 2017). Aunque dentro de la validación lo cuantitativo ha cobrado importancia, han surgido ciertas críticas referentes al papel que juegan las pruebas estadísticas (Markus, 2016; Martínez-García & Martínez-Caro, 2009; Squires et al., 2020). Además, no está del todo claro si el término validez se refiere al instrumento o a los indicadores. Es así que resulta necesario un análisis más crítico acerca del estudio de la validación de instrumentos (Markus, 2016; Norman, 2016), así como de la investigación del CI (Dumay, 2016; Dumay et al., 2018; Dumay et al., 2020; Dumay & Guthrie, 2019; Secundo et al., 2018). Esto podría sea posible a través de un análisis a fondo de los resultados empíricos, así como de una medición exhaustiva que involucre pruebas de diferentes tipos de validez (de constructo, convergente y discriminante).
A partir de lo anterior, se buscó responder a interrogantes orientas hacia la importancia de la estadística en la medición de la validez, la relación entre validación-instrumento y los tipos de validez. Luego de haber aplicado ciertas pruebas para medir diferentes tipos de validez de un instrumento de CI traducido y retraducido del inglés al español, es posible inferir que esta investigación: (1) se adhiere a estudios que han tomado una postura holística e integradora dentro de la comprensión de la validez de un instrumento (Bowden et al., 2021; Kim & Kang, 2019; Vargas & Castillo-Camporro, 2020; Zlatkin‐Troitschanskaia et al., 2019); (2) figura como punto medio entre los que proponen que la validez no puede ser medida con una sola prueba (Adcock & Collier, 2001), y los que sugieren que la aplicación de diversas pruebas estadísticas puede arrojar resultados contradictorios (Martínez-García & Martínez-Caro, 2009).
En un primer momento, los elementos que integran el cuestionario propuesto por Subramaniam y Youndt (2005) para medir CI mostraron un alto grado de validez de constructo en una muestra de empresas latinoamericanas (mexicanas y bolivianas), de acuerdo con los resultados del AFE donde los tres factores (CH, CO y CS) son robustos y claros, llegando a explicar casi 60% de la varianza, resultados coincidentes con lo reportado por Nguyen (2018) con una muestra de 95 empresas vietnamitas.
Además, los resultados de las comunalidades (h 2 ) en todos los ítems superaron los valores mínimos sugeridos (0.3 según Sapsford, 2006) y que junto con la agrupación de los 14 ítems dentro de sus respectivas variables teóricas, reflejaron hallazgos adecuados para fortalecer la validez de constructo, lo cual coincide con lo reportado por Subramaniam y Youndt (2005) y Wang y Chen (2013), este último en una muestra de 164 empresas chinas. Con ello, se confirmó la pertinencia de realizar el AFC.
En cuanto al AFC del modelo original, se encontraron resultados satisfactorios dentro de los parámetros de la MEE. No obstante, el valor X2 fue significativo y, de acuerdo a Ho (2006), no es lo esperado. Es así que, tomando como referencia a estudios psicológicos (Gómez-Lugo et al., 2016; Martín-Albo et al., 2007), se comparó el modelo teórico-empírico original con otros cinco con la finalidad de verificar si dicho indicador podría mejorar. Aunque dos modelos (3 y 6) obtuvieron el resultado deseado -incluyendo un ligero aumento en la explicación de la varianza con menor número de ítems-, no se observaron mejoras en los indicadores en cuando a la relación de covarianzas, ni en el nivel de confiabilidad.
Si bien la validez de constructo debe ir acompañada de otras pruebas con la finalidad de hacer un análisis integral, luego de haber medido tanto la validez discriminante y la validez convergente del modelo original, es posible confirmar que el cuestionario traducido al español y aplicado en empresas latinoamericanas posee propiedades psicométricas para ser replicado en contextos similares, toda vez que se cuidó no privilegiar lo estadístico sobre la lógica conceptual (Mercado-Salgado et al., 2016).
Considerando que la esencia de la MEE es comparar modelos teóricos con empíricos (Ho, 2006; Ruiz et al., 2010) a partir de pruebas de bondad de los parámetros, ésta podría ser una herramienta útil para verificar la validez de constructo de una manera más exhaustiva (Fromont et al., 2017), a lo cual no escapan las ciencias económico administrativas. Para complementar esto, la comparación entre los seis modelos reflejaron que el modelo original compuesto por 14 ítems (Subramaniam & Youndt, 2005), mostró ser el más adecuado al obtener una AVE por debajo de 0.50 (validez convergente) y, al mismo tiempo, presentar congruencia (validez de constructo) con el fundamento teórico de la estructura del CI (CH, CS y CO).
Al respecto, es importante destacar que una de las principales críticas del CI es su sustento teórico (Dumay & Garanina, 2013), y su falta de madurez teórica (Si, 2019), mientras existen posturas que sostienen que el CI es una teoría en sí misma (Statsenko et al., 2013). Para la mayoría de los expertos en el tema, esta variable se sustenta en la Teoría de Recursos y Capacidades (Claver-Cortés et al., 2018; Gómez-Bayona et al., 2020; Ortega-Lapiedra et al., 2019; Radjenovic & Krstic, 2017; Vergara et al., 2016), y la Teoría Basada en el Conocimiento (Cassol et al., 2016; Kengatharan, 2019; Kianto et al., 2020; Li et al., 2019; Najar et al., 2020), las cuales explican que los activos intangibles, al poseer ciertos atributos, pueden generar ventajas competitivas sostenidas, en donde el conocimiento es el principal activo para el desarrollo de la organización. En medio de esta polémica, la comprensión del desarrollo del CI en diferentes contextos desempeña un papel trascendental. Para que esto sea posible, se requiere de instrumentos de medición confiables y válidos, en especial dentro de Latinoamérica, donde la evidencia no es vasta.
Conclusiones
Entonces, ¿el instrumento utilizado para esta investigación cumple con los requisitos de validez para medir el capital intelectual? Si bien se ha avanzado en la respuesta a esta cuestión, todavía se requiere de un análisis más profundo. Coincidiendo con Ventura-León (2017), respecto a que validez se refiere de los indicadores del cuestionario, se concluye que dichos elementos son válidos para medir y explicar al CI; sin embargo, esto va más allá, pues su interpretación debe ser holística (Chin & Marcolin, 1995). Es decir, bajo este aspecto, las inferencias son varias: a) a través de las diferentes pruebas realizadas fue posible verificar que dichos elementos pueden explicar las variables latentes (validez de constructo); b) los indicadores pueden dar continuidad al fundamento teórico de CI y sus dimensiones, así como al cuestionario traducido (validez de contenido); c) los factores son independientes entre sí y se distinguen como CH, CS y CO (validez discriminante); d) y, finalmente, dichas dimensiones, además de ser diferentes, se relacionan entre sí para explicar a una variable mayor como lo es el CI (validez convergente).
Como consecuencia de contrastar los resultados del AFC (validez de constructo), del AVE (validez convergente) y del criterio Fornell-Larcker (validez discriminante) entre los seis modelos de CI, se detectaron ligeras inconsistencias, que estadísticamente podrían ser no adecuadas. Sin embargo, a lo largo de este documento se ha reiterado que lo estadístico no puede estar por encima de lo teórico (Mercado-Salgado et al., 2016; Morales-Vallejo, 2011).
La diferencia de este estudio frente a los referidos en la Tabla 1, radica en que la mayoría reportan exclusivamente el AFE y/o AFC como únicos métodos para medir la validación de constructo, lo cual denota la necesidad de hacer una revisión más exhaustiva acerca de la medición de esta variable. Es así que la presente investigación ha tratado de dar continuidad a dos perspectivas respecto a la validez en los instrumentos empleados en las ciencias administrativas. Por un lado, están quienes defienden que la validación sólo puede ser fruto de una integración de métodos debido a que no es posible validar un instrumento con un solo tipo de validación (Adcock & Collier, 2001); y, por el otro, que cuando se llevan a cabo diferentes pruebas de validación, se corre el riesgo de obtener resultados contradictorios (Martínez-García & Martínez-Caro, 2009). ¿Qué concluye este estudio respecto a la estabilidad en los resultados de la validez de constructo, convergente y discriminante?
Con los hallazgos obtenidos en esta investigación, puede concluirse que, ante las ligeras inconsistencias en los resultados de la validez de constructo, convergente y discriminante en un cuestionario para medir el CI en las empresas traducido del inglés (Subramaniam & Youndt, 2005) al español (mexicano y boliviano), prevalece la confianza de réplica en empresas latinoamericanas, toda vez que se ha tenido cuidado en el fundamento teórico y la obtención de la evidencia. En contra parte, al elegir un modelo sobre otro a partir de ligeras mejoras en ciertos indicadores estadísticos (como el aumento en la explicación de la varianza), no es argumento suficiente para decidir por un modelo u otro. Lo importante es destacar que la medición de la validez de un instrumento debe regirse bajo un enfoque crítico (Markus, 2016; Norman, 2016) y holístico (Bowden et al., 2021; Kim & Kang, 2019), es decir, privilegiar el uso del cuestionario completo sobre la elección de algunos items y/o dimensiones, aun cuando Ventura-León (2017) sostiene que la validez no es una cualidad del instrumento de medición sino de los indicadores del mismo.
Finalmente, es menester reconocer que dichos hallazgos pudieron haber sido afectados por las limitaciones del estudio. La primera de ellas se vincula al menoscabo de un análisis robusto para medir la validez de contenido, pues sólo se llevó a cabo un ejercicio de traducción-retraducción. Dicho proceso exige el cálculo V de Aiken para obtener la validez de contenido, y evaluar la representatividad de un ítem al medir una dimensión mediante el análisis de los resultados del juicio de expertos (Boluarte & Tamari, 2017), así como la prueba Alfa de Krippendorff, cuyo propósito es medir la confiabilidad inter-observadores o nivel de acuerdo entre los jueces (Hayes & Krippendorff, 2007); es decir, con esto se buscará la cuantificación del consenso de los juicios realizados por los expertos acerca de la pertinencia de los ítems (Lawshe, 1975).
Una limitación más se refiere al carácter no probabilístico de la muestra del estudio, aunque ésta sea usual en investigaciones que toman como unidad de análisis a las organizaciones (Kerlinger & Lee, 2002). Lo menos salvable es que sólo están representadas empresas de dos países (México y Bolivia), siendo necesaria la vinculación con colegas para continuar en esta línea de investigación. En otras palabras, y dado que se cumplió con los requisitos (pruebas de bondad de ajuste) para los cálculos del AFE y el AFC, es recomendable verificar si se mantiene la misma estructura en una muestra distinta (Morales-Vallejo, 2011). En esencia, para investigaciones futuras sería conveniente: (a) replicar el estudio tomando como base un muestreo probabilístico; (b) recolectar información en otros países latinoamericanos de habla hispana; (c) medir la validez concurrente y predictiva o de criterio.