Anexo

Los modelos utilizados: Referencia metodológica

Modelos Log-lineal

La regresión log-lineal es un método estadístico que tiene por objeto estudiar la clasificación de las variables categóricas o cualitativas. En esencia es un modelo de regresión lineal múltiple entre las variables cualitativas y el logaritmo neperiano de la frecuencia de los datos de referencia, de la forma:

Ln (frecuencia) = µ + λa + λB + λC + λAxB+ λAxC + λBxC + λAxBxC

Esta forma corresponde a un modelo completo (saturado) para las variables cualitativas A, B y C; sin embargo, supone un modelo muy complejo. Por un principio elemental de simplificación, se deben encontrar uno o más modelos más simples que puedan generar un resultado aceptablemente preciso. Éstos se definen como modelos jerárquicos, en tanto que si un parámetro es nulo lo serán también los términos de orden inferior.26

A diferencia de los modelos de regresión múltiple convencionales, los modelos log-lineal permiten un análisis más adecuado para el tipo de variables categóricas, ya sea dicotómicas o politómicas. A través de dicho análisis es posible determinar la contribución de cada una de las variables seleccionadas, en la conformación de las tablas de contingencia.27

El análisis log-lineal descompone el logaritmo de las frecuencias de cada casilla por medio de un modelo lineal. Tal logaritmo se expresa como suma de la contribución de los distintos parámetros o factores que intervienen en su formación (Lozares et al., 1998, p. 82). El modelo utilizado se puede validar de acuerdo con el problema específico que se esté analizando. Para ello existen pruebas de bondad de ajuste, como la de chi-cuadrada de Pearson y el L2 de máxima verosimilitud.

 

El análisis de correspondencias

A partir de los objetivos planteados, Lozares et al. (1998, p. 83) sugieren que "la situación ideal es aquella en que el análisis log-lineal nos orienta hacia el modelo más adecuado para las variables cualitativas en estudio (es decir, responde a la cuestión de las variables que están relacionadas) y el análisis de correspondencias nos orienta sobre la relación entre los valores".

El análisis de correspondencias descompone el estadístico X2 (chi cuadrada) de una tabla de contingencia28 usando los valores propios. Con esta descomposición se llega a un modelo de independencia, donde cada una de las filas y columnas de dicha tabla quedan reflejadas en un espacio específico. En la prueba de independencia de chi cuadrada, si la hipótesis nula -que plantea precisamente la independencia entre dos variables- se acepta, indica que no hay asociación entre éstas; si se rechaza, ello revela que existe asociación entre tales variables.

Después de haber corrido las pruebas chi cuadrada29 se vuelve necesario ir más allá y evaluar las magnitudes de esas relaciones, las distancias, lo que además resulta cada vez más factible con la incorporación de técnicas nuevas, más precisas y de más fácil interpretación, con las nuevas versiones de paquetes estadísticos como el NSS, utilizado para este trabajo.

De acuerdo con Figueras (2003), el análisis de correspondencias es una técnica que se utiliza para analizar, gráficamente, las relaciones de dependencia e independencia de un conjunto de variables categóricas, a partir de los datos de una tabla de contingencia. Para ello asocia a cada una de las modalidades de la tabla un punto en el espacio Rn, de tal forma que las relaciones de cercanía/lejanía entre los puntos calculados reflejen las relaciones de dependencia y semejanza existentes entre ellas.

Dentro del análisis de correspondencias están el análisis factorial de correspondencias simples y el análisis factorial de correspondencias múltiples. Este último es el adecuado para una investigación como la que nos ocupa,30 pues es el que se utiliza cuando se manejan matrices de variables categóricas o varias tablas de contingencia.

Como también lo señala Díaz de Rada (2002, p. 21), los análisis factoriales examinan las interrelaciones entre un elevado número de variables, mismas que se busca explicar a partir de un número más reducido de éstas y que se conocen como factores. Con estos factores, o variables resumen, es posible reducir la dimensión de la matriz inicial de datos y lograr una solución más fácil de representar y más sencilla de interpretar. Cuando las variables de que se dispone son categóricas o cualitativas, la técnica adecuada es el análisis de correspondencias.

 

Método de los pesos preferenciales o indicadores cardinales de preferencia. Estimación de los índices

Como lo sugiere Romero (1996), en muchos problemas resulta necesario obtener pesos o indicadores de las preferencias relativas de determinadas variables respecto a otras. En este caso, en el momento de pasar a la construcción de indicadores que permitieran a su vez conformar la taxonomía de las plantas estudiadas, resultaba necesario definir preferen cias o establecer una suerte de orden de importancia en los distintos niveles de las variables utilizadas.

Con los modelos empleados fue posible, de hecho, determinar cuáles requisitos o qué características debían cubrir las variables que se tomaron para proceder al paso siguiente, que era construir la taxonomía de las plantas. Los requisitos o características son: diversificación, estrategias de mercado y alcance del mercado, como variables relativas a conductas estratégicas; y exportación y ventas, variables relativas a resultados o desempeño de las plantas en el mercado.

De esta manera, de acuerdo con los log-lineal y AC, los niveles que marcaron la pauta para definir las "plantas exitosas" fueron:

En las variables de conductas estratégicas:

• Diversificación: nivel alto.

• Estrategias de mercado: nivel alto.

• Alcance del mercado: internacional y nacional.

En las variables de resultados/desempeño:

• Exportaciones: sí (plantas con alguna proporción de producto exportado)

• Ventas: altas y medias.

Al tomar en cuenta esta información arrojada por los modelos se definieron a su vez los niveles requeridos para la construcción de los índices. Es decir, para establecer las ponderaciones se tomaron:

• En diversificación de productos: niveles alto, medio, bajo.

• En estrategias de mercado: alto, bajo, nulo.

• En alcance del mercado: alto (definido por internacional y nacional) y bajo.

• En nivel de ventas: alto (definido a su vez por los niveles anteriores alto y medio).

• En exportaciones: sí (cuando hay alguna proporción de producto exportado) y no (si no es así).

Con base en estas consideraciones se procedió a aplicar la fórmula establecida en el método de pesos preferenciales utilizado:

Wj= (1/rj)/∑ni=1n(1/rj)

Donde rj es el lugar o posición que ocupa el criterio j-ésimo en la clasificación establecida.

A partir de ello quedaron conformados los índices para cada una de las variables y el índice compuesto (IC), que finalmente permitió construir la taxonomía de las plantas estudiadas, misma que quedó definida como sigue:

IC > 3 Plantas con estrategias competitivas exitosas.
2 < IC < 2.99 Plantas con estrategias de posicionamiento.
IC < 1.99 Plantas con estrategias de subsistencia

 

Notas

26 El paquete estadístico NCSS (Number Crunching Statistical Software) permite determinar los modelos saturado y jerárquico más adecuados. Se obtiene un modelo cuya variable respuesta es el logaritmo neperiano de la frecuencia, y las variables explicativas son aquellas variables categóricas que se seleccionaron para determinar su relevancia en el fenómeno de estudio.

27 Molinero (2003, p. 1) lo plantea claramente: "El razonamiento para contrastar si existe o no asociación entre dos variables cualitativas se basa en calcular cuáles serían los valores de frecuencia esperados para cada una de las celdas en el caso de que efectivamente las variables fuesen independientes, y compararlos con los valores realmente observados. Si no existe mucha diferencia entre ambos, no hay razones para dudar que las variables sean independientes".

28 La tabla de contingencia, también conocida como tabla de sección cruzada (cross tabulation), consiste en una combinación de distribuciones de frecuencia con un arreglo tal que cada una de las celdas representa una única combinación de las variables cruzadas. A partir de ésta es posible examinar las frecuencias observadas que pertenecen a cada una de las combinaciones específicas de dos o más variables (Piol, 2004). Cuando se analizan variables cualitativas es habitual presentar en tablas las frecuencias de casos observadas para cada una de las diferentes categorías de las variables, las cuales se denominan tablas de contingencia (Molinero, 2003).

29 La chi cuadrada indica sólo las desviaciones del valor observado respecto al esperado, pero no indica un patrón de desviación que resulte de si la hipótesis nula es falsa cuando la chi cuadrada es significativa. En otras palabras, "no muestra la forma en que se relacionan las variables, de ahí que por sí misma quizás oculta tanto como lo que revela" (Reynolds, 1977). Al descansar sólo en la prueba chi cuadrada se gana poca información nueva. Al mismo tiempo, se pueden estar dejando de lado hallazgos importantes por no sujetar los datos a un escrutinio más minucioso (Reynolds, 1977).

30 En un principio se había considerado como opción el análisis de conglomerados o clusters, por el hecho de que se contaba con información de tres ramas de la industria alimentaria con características aparentemente heterogéneas, lo cual es una condición para este tipo de análisis (los agrupamientos se caracterizan por tener elementos similares al interior de cada uno,y muy distintos al resto de los agrupamientos o clusters). Sin embargo, a partir del análisis exploratorio de los datos se detectó que en muchas de las variables había elementos comunes en las características de las plantas, independientemente de la rama a la que pertenecieran, de tal manera que el método referido resultaba improcedente. Lo mismo sucedió al evaluar la pertinencia de utilizar el análisis de componentes principales, uno de los métodos más indicados cuando se cuenta con variables numéricas, no categóricas, que son las que predominan en este caso.