Introducción
El diseño de experimentos es una aplicación del método científico para generar conocimiento sobre un proceso o sistema a través de pruebas planificadas adecuadamente. Esta metodología se ha fortalecido como un conjunto de técnicas estadísticas y herramientas de ingeniería para ayudar a comprender situaciones complejas de causa y efecto (Gutiérrez y De la Vara, 2008).
El diseño de experimentos ha probado ser una herramienta muy poderosa para la solución de problemas en manufactura, ciencia, tecnología, investigación y optimización de productos y procesos. Montgomery (2009) menciona que un experimento puede definirse como una prueba o serie de pruebas en las que se hacen cambios deliberados en las variables de entrada de un proceso o sistema para observar e identificar las razones de los cambios que pudieran observarse en la respuesta de salida. El diseño experimental tiene dos enfoques principales, el enfoque clásico y el enfoque de Taguchi, también conocido como diseño robusto.
El enfoque clásico es una estrategia en donde la experimentación se utiliza con el propósito de estudiar el desempeño de un proceso o producto. Un proceso es comúnmente representado como se muestra en la Figura 1, donde se involucran tres tipos de variables: variables controlables (x), son aquellas que el experimentador puede manipular fácilmente; variables no controlables (z), son las que difícilmente el experimentador puede controlar y la variable de respuesta (y) que es la que se pretende medir, la cual es típicamente una característica de calidad. Las variables de entrada x son las variables donde se realizan distintos ajustes en el desarrollo de la experimentación con la finalidad de observar los cambios que ocurren en la variable de respuesta. Montgomery (2009) menciona algunos de los objetivos de este enfoque, entre ellos, se tienen determinar qué factores de control son los más significativos y cuáles niveles de estos factores alcanzan el valor deseado de la variable de respuesta y.
La experimentación robusta tiene sus orígenes a principios de la década de los 80 cuando Genichi Taguchi introduce el diseño de parámetros, esta metodología gira en torno al uso de un arreglo ortogonal para las variables de control conocido como arreglo interno y un arreglo ortogonal para las variables de ruido (arreglo externo) (Vuchkov y Boyadjieva, 2001). Ambos arreglos se cruzan para formar uno cruzado como se muestra en la Figura 2. Es importante señalar que no todos los experimentos de Taguchi son arreglos cruzados, en casos en que no existe interés en hacer al producto robusto, se puede correr solamente el arreglo interno sin la necesidad de agregar el arreglo externo.
El enfoque Taguchi hace énfasis en la apropiada selección de niveles de factores de control con el objeto de minimizar la variabilidad transmitida por los factores de ruido y de esta manera generar un producto o proceso robusto. Montgomery (2009) menciona dos objetivos del diseño robusto:
Asegurar que la media de la respuesta alcance un valor objetivo.
Que la variabilidad alrededor del valor objetivo sea tan pequeña como sea posible.
La presente investigación propone fraccionar los diseños experimentales de Taguchi. La razón fundamental es que se observó que los arreglos ortogonales de Taguchi están diseñados de tal forma que un mismo arreglo puede usarse para diferentes números de factores, pero el número de corridas permanece fijo. La Tabla 1 muestra los arreglos ortogonales de Taguchi de dos niveles y la cantidad de factores que puede manejar cada arreglo. Por ejemplo, el arreglo L32 permite estimar hasta 31 factores con 32 corridas; en caso de que el número de factores fuera menor, 16 por ejemplo, la cantidad de corridas se mantiene constante.
Número de factores a analizar | Arreglo ortogonal | Número de corridas |
Entre 2 y 3 | L4 | 4 |
Entre 4 y 7 | L8 | 8 |
Entre 8 y 11 | L12 | 12 |
Entre 12 y 15 | L16 | 16 |
Entre 16 y 31 | L32 | 32 |
Entre 32 y 63 | L64 | 64 |
Debido a lo anterior, se plantea analizar los casos en que se tiene un número de factores menor al número máximo que el arreglo puede manejar. El método se pretende aplicar a los arreglos L8, L12, L16 y L32, de tal forma que la fracción generada ayude únicamente a estimar los efectos principales y las corridas restantes se agreguen solo en caso de ser requeridas. El método se basa en la utilización de búsqueda exhaustiva para encontrar un subgrupo de corridas bajo el criterio de D-optimalidad y posteriormente en casos de empates, los FIV y el IBG pueden utilizarse como criterios complementarios para encontrar la fracción con mejores propiedades de balance y ortogonalidad.
La Figura 3 es una salida del programa Qualitek-4, donde, por ejemplo, el arreglo ortogonal L32, se utiliza cuando se tienen de 16 a 31 factores y requiere 32 experimentos. En el caso en que se tienen solo 16 factores, las 15 columnas que quedan libres son normalmente asignadas para estimar interacciones. La alternativa sería correr 16+2 = 18 experimentos que permitan estimar los 16 efectos principales, la intersección y el error y dejar las 14 corridas restantes como un aumento que puede ser agregado en un paso posterior. La fracción inicial puede ser generada mediante búsqueda exhaustiva, el objetivo es encontrar las 18 corridas extraídas de un grupo de 32 que presenten los mejores niveles de D-optimalidad, ortogonalidad y balance.
Optimalidad, ortogonalidad y balance
Dentro del diseño de experimentos es común utilizar un criterio de optimalidad que permita a través de un proceso de selección formar una fracción con las mejores propiedades, también llamado “diseño óptimo”. Estos diseños a diferencia de los diseños clásicos son más eficientes en cuanto al número de corridas necesarias para obtener información útil en la región experimental.
El diseño óptimo proporciona una conexión más directa entre el diseño experimental y el rendimiento estadístico al enmarcar la selección del diseño como un problema de óptimización, en el que se minimizan los errores estándar o se maximizan los parámetros de no centralidad (Morris, 2011, p. 299). Los diseños óptimos se emplean cuando se presentan algunas situaciones entre las que destacan:
La región experimental es irregular.
Los factores cualitativos tienen más de dos niveles.
Cuando el número de corridas de un diseño tiene que ser reducido (situación abordada en esta investigación).
Cuando se ajusta un modelo de regresión específico.
Cuando factores de proceso y mezcla son implementados en el mismo diseño.
La construcción de un diseño óptimo requiere la especificación de tres elementos:
La región experimental, la cual es el escalar o vector de variables independientes (x) que define un tratamiento.
Regresión lineal.
La función del criterio.
El diseño óptimo requiere una función φ(D) que puede emplearse como una medición de calidad de la inferencia resultante. La Tabla 2 muestra varios criterios de optimalidad, así como su descripción y ecuación de cálculo. Los diseños que se consideran óptimos cumplen con alguno de los criterios de optimalidad.
Criterio | Descripción | Ecuación |
D-optimalidad | Una matriz D-óptima es
aquella para la cual la varianza generalizada se minimiza para el modelo lineal e/stándar. |
|
A-optimalidad | Una matriz A-óptima es
aquella que minimiza la varianza promedio de los coeficientes estimados. |
|
V-optimalidad | Una matriz V-óptima es aquella donde la selección de candidatos elegidos tiene la varianza promedio de la predicción más baja. |
Donde: para un candidato χi la predicción de la varianza es d(χi)= χ'i*(X'X)-1 χi; χi es un vector que representa a un diseño simple y χ’i representa la transpuesta del vector. |
G-optimalidad | Una matriz G-óptima es
aquella que minimiza la varianza más alta de predicción de un diseño. |
|
E-optimalidad | Una
matriz E-óptima minimiza la varianza más alta de predicción del diseño. |
|
El primer trabajo de diseño de experimentos óptimo fue publicado por Smith (1918) quien propuso un criterio para la regresión polinomial que más tarde en Kiefer y Wolfovitz (1959) fue llamado G-optimización. Ehrenfeld (1955) estableció el criterio de E-optimalidad. Dentro de la literatura, los criterios de optimalidad más usados son D, A y E (Nguyen y Miller, 1992; Nishii, 1993).
Los principios de la D-optimalidad se remontan a Wald (1943) donde se establece el criterio de maximización del determinante de la matriz de información. Más tarde Kiefer y Wolfovitz (1960) le darán el nombre de D-optimalidad. El diseño D-óptimo se define como aquel que minimiza la region de confianza conjunta del vector que contiene a los estimadores de los coeficientes de regresión. Triefenbach (2008) menciona que para la formación de un diseño óptimo se necesita seleccionar la matriz que contiene los puntos candidatos a pertenecer al diseño óptimo, esta matriz se conoce como matriz de puntos candidatos, contiene N renglones y se denota con el símbolo ξ N , (Figura 4, sección a). La matriz de diseño X contiene n filas con p coeficientes (Figura 4, sección b).
La primera columna de la matriz de diseño representa el termino constante de β 0 que es la intersección, y el resto de las columnas representan los términos de un modelo de regresión lineal, siendo las variables x i las que fungen como variables regresoras permitiendo hacer estimaciones sobre la variable de respuesta. En el ejemplo mostrado en la ecuación 2 las columnas 2 y 3 se refieren a los términos de x 1 y x 2 , conforme incrementa la matriz de puntos candidatos, la selección de ξ N se torna más complicada. Para hacer la selección de los mejores puntos candidatos, el proceso se realiza mediante un adecuado criterio de selección. La selección del mejor grupo de puntos candidatos se conoce como optimalidad y la matriz de diseño correspondiente es llamada matriz de diseño óptimo (De Aguiar et al., 1995).
Existen dos matrices que son necesarias para realizar la selección de un conjunto de puntos candidatos, la primera es la matriz de información (X´X), que se obtiene de la multiplicación de la matriz de diseño transpuesta (X´) y la matriz de diseño (X). La otra matriz importante es la matriz de dispersión, esta matriz se obtiene al invertir la matriz de información (X´X) -1 . La importancia de conocer estas matrices radica en la forma de cómo se calcula la D-optimalidad; maximizar el determinante de la matriz de información (X’X) es equivalente a minimizar el determinante de la matriz de dispersión (X’X) -1 .
Con el objetivo de construir la fracción que permita estimar los efectos de interés, dos propiedades deseables han sido consideradas en forma adicional a la D-optimalidad, la ortogonalidad y el balance. Se dice que dos columnas son ortogonales cuando su producto punto es igual a cero, esto significa que son linealmente independientes y son útiles para evaluar el efecto de cada factor de manera separada. La ortogonalidad hace que los efectos de los factores sean independientes, por lo tanto, cada columna proporciona diferente información al diseño.
Existen diversos criterios para medir el grado de ortogonalidad, algunos de estos son: aberración mínima generalizada (Xu y Wu, 2001), momento de aberración mínima (Xu, 2003), proyección de momento de aberración (Xu y Deng, 2005), J2-optimalidad (Xu, 2002), J2-optimalidad modificada, entre otros, donde los FIV son los más utilizados por su simplicidad de cálculo. Cuando una matriz es ortogonal, todos los factores de inflación de varianza son iguales a 1. Los FIV miden el grado en el que aumentan las varianzas de los estimadores de los coeficientes de regresión cuando los regresores están correlacionados (Salmerón et al., 2016). De acuerdo con Marquardt (1970) y Salmerón et al. (2016), el cálculo se realiza mediante la ecuación 6
Donde R 2 i es el coeficiente de determinación de x i en el resto de las variables independientes. Esto quiere decir que se realiza una regresión lineal considerando a x i como la variable dependiente y el resto de x i+1 como las variables independientes para el modelo de regresión con x i >2.
Un diseño esta balanceado si todas sus columnas están balanceadas. Para que una columna esté balanceada, cada uno de los niveles pertenecientes a dicha columna debe aparecer el mismo número de veces. El balance permite una distribución uniforme de información para cada nivel y hace que la columna intersección se vuelva ortogonal a los efectos principales. Tres formas de medir el balance fueron consideradas para esta investigación:
El coeficiente de balance en su forma I, donde este debe ser maximizado.
El coeficiente de balance en su forma II, donde este debe ser minimizado (Guo, Simpson y Pignatiello, 2007).
El IBG (Guo et al., 2009).
Para esta investigación se decidió utilizar el IBG, este índice se utiliza para medir el grado de balance de las fracciones generadas. El IBG requiere menos complejidad de cálculo y ofrece amplia información sobre el nivel de balance de la fracción construida. De acuerdo con Guo et al. (2009) el IBG puede ser calculado para una matriz d de tamaño n × k, donde n es el número de filas y k es el número de columnas, dt (t = 1, …, k) indica las columnas de interacciones para los factores desde 1 hasta k y d 1 representa la matriz de efectos principales. Por lo tanto:
Donde:
Ctrj = |
número de veces que un nivel r aparece en la columna j |
ltj = |
número de niveles que la columna j contiene |
El cálculo del IBG proviene de la diferencia del número de veces que un nivel debería aparecer respecto al número de veces que aparece, estos cálculos se hacen para la submatriz de efectos principales, y para las submatrices de interacciones de dos y de tres factores. Finalmente, se obtiene un vector de la forma (H 1 , H 2 , H 3 ), donde H 1 indica el balance para efectos principales, H 2 para interacciones de dos factores y H 3 para interacciones de 3 factores. Cuando un diseño está balanceado para efectos principales, para interacciones de dos factores y para interacciones de tres factores, el IBG es un vector ceros (0,0,0).
Descripción del método
El método generado para fraccionar los arreglos ortogonales de Taguchi está basado en cuatro pasos (Figura 5). El primer paso consiste en seleccionar el número de factores a estudiar, el segundo paso es la aplicación de la búsqueda exhaustiva utilizando como criterio de selección la D-optimalidad. En el caso de que dos o más fracciones empaten en los valores de D-optimalidad, el tercer y cuarto paso permiten detectar aquellas fracciones con los mejores niveles de ortogonalidad y balance.
De esta manera, el algoritmo produce la fracción D-óptima de un arreglo ortogonal de Taguchi que además es ortogonal y balanceada. El algoritmo fue programado en Matlab. Note que para la ejecución del programa la única información requerida es el arreglo ortogonal de Taguchi y el tamaño deseado de la fracción.
El diseño que se utiliza para ejemplificar la construcción de una fracción de Taguchi es el L32 que consta de 32 corridas experimentales y es capaz de manejar hasta 31 factores a dos niveles. La metodología propuesta busca fraccionar el arreglo L32 para casos en que se tienen menos de 31 factores y de esta manera obtener una fracción que pueda estimar efectos principales sin la necesidad de realizar las 32 corridas. La fracción generada contiene los grados de libertad necesarios para estimar los efectos principales, la intersección y el error.
Ejemplo
Se pretende realizar un diseño de experimentos de Taguchi con 16 factores, el arreglo sugerido es un L32, el cual se muestra en la Figura 6. Note que las columnas asignadas a los 16 efectos principales corresponden a las posiciones 1, 2, 4, 7, 8, 11, 13, 14, 16, 19, 21, 22, 25, 26, 28 y 31 (conforme la asignación del software Qualitek-4). La fracción que se construirá contará como mínimo con 18 corridas para poder estimar 16 efectos principales más la intersección y el error, esto implica realizar una búsqueda exhaustiva con el objeto de buscar la fracción óptima bajo el criterio de D-optimalidad. El programa se encargará de evaluar todos los subgrupos de corridas de tamaño 18 extraídos de un grupo de 32.
La Figura 7 muestra la fracción obtenida, esta fracción es capaz de estimar los 16 efectos principales, la intersección, el error y tiene buenas propiedades de D-optimalidad, ortogonalidad y balance. Para seleccionar esta fracción, el programa filtró las 30 fracciones con la mejor D-optimalidad, si existieron empates, es decir, varias fracciones tuvieron el mismo valor de D-optimalidad, se procedió a calcular la ortogonalidad, para esto se utilizó el promedio de los factores de inflación de varianza. Si varias fracciones tuvieron el mismo promedio para los VIFs, se procedió a calcular el balance, para esto se utilizó el IBG. Al final, se descubrió que existen varias fracciones con las mejores propiedades, de estas, simplemente se seleccionó la primera.
El proceso de selección se detalla a continuación, note que de todas las combinaciones evaluadas, 30 de ellas poseen el determinante más pequeño de 3.39E-21 lo que significa que son D-óptimas, de estas, las 4 primeras tienen los VIFs promedio más cercanos a 1, con valor de 1.12 y estas mismas 4 fracciones tienen el IBG más bajo de 112, lo que significa que las fracciones 1 a 4 son las que tienen las mejores propiedades.
Ortogonalidad (FIVs) | |||||
Fracción | D-optimalidad | Máximo | Mínimo | Promedio | Balance (IBG) |
1 | 3.39E-21 | 1.78 | 1.05 | 1.12 | 112 |
2 | 3.39E-21 | 1.78 | 1.05 | 1.12 | 112 |
3 | 3.39E-21 | 1.78 | 1.05 | 1.12 | 112 |
4 | 3.39E-21 | 1.78 | 1.05 | 1.12 | 112 |
5 | 3.39E-21 | 1.75 | 1.05 | 1.18 | |
6 | 3.39E-21 | 1.75 | 1.05 | 1.18 | |
7 | 3.39E-21 | 1.75 | 1.05 | 2.18 | |
8 | 3.39E-21 | 1.75 | 1.05 | 2.18 | |
9 | 3.39E-21 | ||||
. | . | ||||
. | . | ||||
30 | 3.39E-21 |
Resultados
Por medio de esta investigación ha sido posible obtener fracciones para los arreglos ortogonales de Taguchi L8, L12, L16 y L32. Considere el caso en que se desea construir una fracción para conocer el efecto de 18 factores; para hacer esto, bastaría con ir a la Figura 8, localizar en la columna de factores el valor de 18 y tomar las 20 filas (1, 4, 5, 6, 9, 10, 12, 14, 15, 16, 17, 20, 21, 22, 25, 26, 27, 28, 30, 31) y 18 columnas ( 1, 2, 4, 7, 8, 11, 13, 14, 16, 19, 21, 22, 25, 26, 28, 29, 30, 31) que forman la fracción del arreglo L32 de Taguchi. Note que cuando el experimentador desee trabajar con 7, 11, 15 y 31 factores, se deberán tomar los arreglos completos L8, L12, L18 y L32, respectivamente, contando con un grado adicional a los necesarios para conocer los efectos principales como ya se sabe; en estos casos, el ahorro en corridas no es posible, ya que se requieren todas las corridas para estimar los efectos.
La Figura 9 muestra la fracción recomendada de Taguchi que permite conocer la influencia de 4 factores, esta fracción permite una reducción de 8 a 6 corridas (25 %). En la Figura 10 se muestra la fracción de Taguchi para estudiar 8 factores con una reducción de 12 a 10 corridas (16 %) y por último la Figura 11 muestra la fracción de Taguchi para estudiar 12 factores con una reducción de 16 a 14 corridas (12.5 %). La ventaja de usar estas fracciones cuando se desea conocer la influencia de los efectos principales es claramente mostrada en el porcentaje de reducción.
El fraccionamiento puede utilizarse como una herramienta estratégica de experimentación secuencial que permite al experimentador centrar sus recursos, tiempo y dinero para obtener la mayor cantidad información al menor costo, pudiendo disponer de esos recursos en etapas posteriores de la experimentación. Note también que en los tres casos la ortogonalidad es alta, puesto que los valores promedio de los VIFs permanecen cercanos a 1 y el balance cuantificado con el criterio IBG también permanece con valores bajos lo que indica que las fracciones tienen buen nivel de balance.
Conclusiones
La búsqueda de alternativas para reducir el costo de los diseños experimentales es una tarea que se ha desarrollado durante muchos años; la experimentación secuencial es una práctica que contribuye a este fin. Sin embargo, esfuerzos para fraccionar los diseños de Taguchi no habían sido cubiertos en la literatura. Ríos y Guerrero (2018) presentan un enfoque de experimentación secuencial para diseños robustos que se enfoca en agregar nuevas corridas con el objeto de desacoplar interacciones entre factores de control, sin embargo, el fraccionamiento de arreglos ortogonales no había sido propuesto.
Los resultados demostraron que es posible fraccionar los arreglos ortogonales de Taguchi. Las fracciones obtenidas presentaron buenos niveles de D-optimalidad, ortogonalidad y balance, fueron capaces de estimar los efectos principales de interés, así como de proporcionar ahorros en cuanto al número de corridas requerida. Por lo tanto, esta investigación brinda al experimentador una herramienta que permite reducir el costo de la experimentación. El enfoque de experimentación secuencial tiene la ventaja de que, si varios de los factores estudiados no son significativos, el diseño puede ser colapsado y los grados de libertad disponibles pueden utilizarse para estimar interacciones; también existe la posibilidad de aumentar el experimento agregando las corridas restantes con el objeto de confirmar los resultados. Cabe mencionar que para esta investigación el L4 no se analizó, pues requiere muy pocas corridas haciendo el fraccionamiento innecesario; de igual manera, el L64 también se omitió debido a que la búsqueda exhaustiva es computacionalmente ineficiente y generalmente no se presentan situaciones en la práctica en las que se requieran tantos factores.