Introducción
En un experimento de cruzas dialélicas completo hay p2 combinaciones genéticas que incluyen p progenitores (i= j), p(p-1)/2 cruzas directas (CD; i< j)), y p(p-1)/2 cruzas recíprocas (CR; i> j) (Griffing, 1956). Este diseño ha sido ampliamente utilizado en fitomejoramiento (Saavedra et al., 2021) pero es impráctico cuando p aumenta debido a que CD y CR también se incrementan; una situación similar se presentó cuando se diseñaron experimentos 2H, con H variando de 2 a 8, para ser analizados con InfoStat e InfoGen, si H= 8 habrá 256 tratamientos y 247 interacciones. Para ahorrar tiempo y recursos podría diseñarse un factorial fraccionado que incluya sólo a un subconjunto de éstos (Pérez et al., 2021). Si 13 progenitores, 78 CD y 78 CR serán estudiados, aun para los diseños en látice rectangular habría serias limitantes (González et al., 2007).
Cochran y Cox (1958); Gomez y Gomez (1984); Martínez (1998) mostraron los planes básicos para látice balanceado y parcialmente balanceado; se podrían aleatorizar hasta 144 tratamientos en un látice triple 12 x 12. Si en un ambiente se evalúa maíz (Zea mays L.) en tres repeticiones con parcelas de tres surcos de 5 m de longitud, cada uno distanciado a 0.8 m, para evaluar esos 144 tratamientos serían necesarios casi 6 400 m2 (repeticiones separadas a 2 m y bloques incompletos distanciados a 1.5 m). Este problema será mayor al considerar varios años, localidades o combinaciones de éstos. En el otro extremo, con p= 4, las estimaciones de aptitud combinatoria general serán sesgadas debido al pequeño tamaño de muestra utilizando.
Ambas limitantes han conducido al muestreo de las cruzas incluyendo más progenitores sin afectar la eficiencia de la técnica dialélica. Hinkelmann y Stern (1960); Kempthorne y Curnow (1961); Fyfe y Gilbert (1963); Rojas (1973) diseñaron metodologías para el muestreo y análisis de un dialélico parcial. Kempthorne y Curnow (1961) inventaron una técnica dialélica incompleta a partir del método 4 de Griffing (1956) usando una muestra de tamaño ps/2, dónde s es el número de veces que cada progenitor (p) es utilizado en los cruzamientos; p y s no pueden ser simultáneamente números nones pero la precisión con que se estiman los parámetros de interés para el fitomejorador depende de ambos valores. Murthy et al. (1966); Chaudhary et al. (1977) precisaron que el sesgo es mayor cuando s es menor que p/2. Con s= p-1 se tendrá el método 4 de Griffing (1956).
No obstante, deberá considerarse que el diseño experimental de bloques completos al azar podría perder eficiencia si p y s se incrementan significativamente debido a que el tamaño del bloque aumentará y habrá menor uniformidad dentro de éste por lo que el error experimental será mayor así, una opción muy deseable sería dividir cada repetición en bloques incompletos balanceados. Este ha sido estudiado por Shunmigathai y Srinivasan (2012), quienes han discutido la disminución de la eficiencia de un dialélico incompleto, incluso con la pérdida de una o más observaciones.
La cruza dialélica parcial se ha utilizado principalmente para estimar parámetros genéticos en híbridos de cruza simple formados con líneas endogámicas derivadas de la misma población evaluadas en un diseño experimental de bloques completos al azar, bajo la consideración de un modelo genético de efectos fijos (Christie y Shattuck, 1992; Mumtaz et al., 2015; Awata et al., 2018), pero Miranda y Vencousky (1999) y Silva et al. (2017) entre otros, han desarrollado otra metodología para analizar un dialélico parcial formado con dos grupos de líneas o progenitores genéticamente contrastantes; ellos realizaron cruzamientos entre material exótico y genotipos adaptados localmente.
Diseño de las cruzas
Primero deberá calcularse k, que debe ser un número entero. Así: k=
Análisis de varianza (Anava) general
El modelo estadístico para un diseño experimental de bloques completos al azar es: Yij= µ + τi + βj + εij. Dónde: µ es la media aritmética de los tr datos, τi es el efecto del i-ésimo tratamiento, βj es la contribución de la j-ésima repetición, y εij es el error experimental o residual del modelo.
Etapas para obtener un Anava general
E1. Concentrar los datos en una tabla: las hileras (subíndices ij) representarán cruzas y las columnas (subíndice k) repeticiones, calcular totales y medias aritméticas (Cuadro 2).
Cruza (ij) | Repeticiones (k) | |||||
---|---|---|---|---|---|---|
R1 | R2 | R3 | R4 | Total | Media | |
1x3 | 7.56 | 4.5 | 8.68 | 8.43 | 29.17 | 7.292 |
1x4 | 6.62 | 7.33 | 6.87 | 7.16 | 27.98 | 6.995 |
1x5 | 7.1 | 6.87 | 6.7 | 5.83 | 26.5 | 6.625 |
1x6 | 7.36 | 4.81 | 7.64 | 7.64 | 27.45 | 6.862 |
1x7 | 6.06 | 6.68 | 5.2 | 6.37 | 24.31 | 6.077 |
2x4 | 6.35 | 6.16 | 6.56 | 6.66 | 25.73 | 6.432 |
2x5 | 7.58 | 5.33 | 7.85 | 7.41 | 28.17 | 7.042 |
2x6 | 8.66 | 7.29 | 8.35 | 6.75 | 31.05 | 7.762 |
2x7 | 6.91 | 6.62 | 7.02 | 7.12 | 27.67 | 6.917 |
2x8 | 7.62 | 9.41 | 6.99 | 7.41 | 31.43 | 7.857 |
3x5 | 6.99 | 5.7 | 6.27 | 6.75 | 25.71 | 6.427 |
3x6 | 6.62 | 5.23 | 9.16 | 7.95 | 28.96 | 7.24 |
3x7 | 6.27 | 5.83 | 6.62 | 6.6 | 25.32 | 6.33 |
3x8 | 6.87 | 5.12 | 7.56 | 7.73 | 27.28 | 6.82 |
4x6 | 5.73 | 4.37 | 5.2 | 8.08 | 23.38 | 5.845 |
4x7 | 6.95 | 6.66 | 6.45 | 6.08 | 26.14 | 6.535 |
4x8 | 7.7 | 5.31 | 7.08 | 8.33 | 28.42 | 7.105 |
5x7 | 6.18 | 5.62 | 6.14 | 5.83 | 23.77 | 5.942 |
5x8 | 6.89 | 5.75 | 7.89 | 8.08 | 28.61 | 7.152 |
6x8 | 5.77 | 5.68 | 8.2 | 6.83 | 26.48 | 6.62 |
Total | 137.79 | 120.27 | 142.43 | 143.04 | 543.53 | 135.877 |
E2. Definir el formato del Anava general (Cuadro 3). Concentrar los cálculos anteriores en el formato del Anava general
Fuente de variación |
Grados de libertad |
Suma de cuadrados |
Cuadrados medios |
Valores de F | ||
---|---|---|---|---|---|---|
Calculado | Tablas | |||||
5% | 1% | |||||
Repeticiones | 3 | 17.07 | 5.69 | 6.84** | 2.78 | 4.16 |
Cruzas | 19 | 22.43 | 1.18 | 1.42 ns | 1.75 | 2.22 |
Error | 57 | 47.38 | 0.83 | |||
Total | 79 | 86.89 |
**= altamente significativo (p= 0.01); ns= no significativo (p= 0.05); CV= 13.4%.
Calcular grados de libertad (GL)
En esta sección, t es el número de cruzas muestreadas, por lo que t= ps/2. GL del total= (ps/2)(r)-1= 20(4) - 1= 79; GL rep= r - 1= 4 - 1= 3; GL cruzas= (ps/2) - 1= 20 - 1= 19; GL del error = [(ps/2)- 1] (r - 1)= GL total - GL rep - GL cruzas = 57.
Estimar sumas de cuadrados (SC)
Aquí se introduce la restricción i< j. Adicionalmente, ij ≠ 12, 18, 23, 34, 45, 56, 67 y 78, son las cruzas no muestreadas en el dialélico parcial, en orden de hembra y macho. SC total=
Determinar cuadrados medios (CM)
CM rep= SC rep/r -1= 17.07/3= 5.691; CM cruzas= SC cruzas /[(ps/2)-1]= 22.439/19 = 1.181; CM error= SC error/(r-1) [(ps/2)-1]= 47.384/57= 0.8312.
Obtener valores de F calculados
F rep= CM rep/CM error= 5.691/0.8312= 6.846. F trat= CM cruzas/CM error= 1.181/0.8312= 1.42.
Definición de la matriz circulante A = [sI + N]
A8x8 =
La inversa de A se obtuvo con una calculadora de matrices (https://matrixcalc.org.es). Así:
A-1
8x8 =
en cada hilera (r) o columna (c) es:
Cuando sólo se dispone de una calculadora de escritorio podrían aplicarse las metodologías de Kempthorne y Curnow (1961); Singh y Chaudhary (1985); Martínez (1991). Para obtener los elementos de la primera hilera de su inversa Martínez (1991) calculó sus raíces características cómo: λj=
Las cruzas 1x2 y 1x8 no fueron muestreadas (b12 y b18= 0) y serán eliminadas; en b11 su coeficiente es s=5 y en b’s restantes es 1, después de reagrupar sus componentes: λ1 =
Kempthorne y Curnow (1961) estimaron las λ’s cómo: λj =
Los otros elementos se calculan similarmente, como la matriz es simétrica y circulante, para obtener los de la siguiente hilera simplemente se desplazan los de la anterior una columna a la derecha. Este procedimiento se repite hasta completar todas las hileras en la inversa de la matriz.
Cálculo de la suma corregida de las cruzas muestreadas (Qi)
El factor de corrección (FCQ) se calcula con las mismas restricciones que para SC cruzas: FCQ =
Línea i (♀) | Línea j (♂) | |||||||
---|---|---|---|---|---|---|---|---|
P1 | P2 | P3 | P4 | P5 | P6 | P7 | P8 | |
P1 | - | - | 7.292 | 6.995 | 6.625 | 6.862 | 6.077 | - |
P2 | - | - | - | 6.432 | 7.042 | 7.762 | 6.917 | 7.857 |
P3 | 0.498 | - | - | - | 6.427 | 7.24 | 6.33 | 6.82 |
P4 | 0.201 | -0.361 | - | - | - | 5.845 | 6.535 | 7.105 |
P5 | -0.168 | 0.248 | -0.366 | - | - | - | 5.942 | 7.152 |
P6 | 0.068 | 0.968 | 0.446 | -0.948 | - | - | - | 6.62 |
P7 | -0.716 | 0.123 | -0.463 | -0.258 | -0.851 | - | - | - |
P8 | - | 1.063 | 0.026 | 0.311 | 0.358 | -0.173 | - | - |
La suma de los Qi es cero y éstos se calculan cómo: Q1 = 1x3 + 1x4 + 1x5 + 1x6 + 1x7 = 0.498 + 0.201 - 0.168 + 0.068 - 0.716 = - 0.118. Q2 = 2x4 + 2x5 + 2x6 + 2x7 + 2x8 = - 0.361 + 0.248 + 0.968 + 0.123 + 1.063 = 2.041. También: Q3 = 0.140; Q4 = -1.057; Q5 = -0.781; Q6 = 0.360; Q7 = -2.168; Q8 = 1.585.
Estimación de los efectos de aptitud combinatoria general (ACG)
La estimación de la ACG para cada progenitor (gi) se hace con álgebra de matrices. A G = H su solución es: G = A-1 H. Dónde: A-1 es la inversa de la matriz A; H es un vector columna formado por los valores de las sumas corregidas de las cruzas muestreadas (Qi), y G es otro vector columna integrado por las estimaciones de gi.
Así: G 8x1 = A-1 8x8 H 8x1
El valor de g1 se obtiene como la sumatoria de los productos de la primera hilera de la inversa de la matriz A con la única columna de la matriz H; es decir: g1 = [(0.238) (-0.118) + (0.027) (2.041) + (-0.029) (0.114) +,…,+ (0.027) (1.585)] = 0.1977. También: g2=0.5853; g3= 0.1028; g4= -0.3137; g5= -0.3005; g6= -0.1071; g7= -0.4879; g8= 0.3236.
Estimación de valores Sij
Los efectos de aptitud combinatoria específica (Sij) para cada cruza simple se estiman cómo: Sij = Ȳij. - µ - gi - gj. Dónde: µ es la media aritmética de los (ps/2)r datos, Ȳij. Es el valor promedio de la cruza entre los progenitores i, j, gi, gj son las estimaciones de aptitud combinatoria general de las líneas i, j. Las restricciones son:
Cálculo de la SC ACG
La suma de cuadrados entre tratamientos se divide en ACG y ACE; si se conoce el valor de dos de estas tres fuentes de variación en la tabla dialélica, la tercera se calcula por diferencia. SC ACG= rΣGi’ Hi. Dónde: r= número de repeticiones, Gi’= transpuesta del vector columna 8x1 formada por los valores de gi y Hi= vector columna integrado con los valores de Qi, se multiplica por r porqué se utilizaron promedios aritméticos. SC ACG= 4[(0.1977)(-0.118) + (0.5853)(2.041) + (0.3236)(1.585)= 13.137. SC ACE= SC Cruzas-SC ACG= 22.439-13.137= 9.3019.
Del Cuadro 5 puede concluirse que sólo entre repeticiones y entre efectos de aptitud combinatoria general hubo diferencias significativas (p= 0.05 y p= 0.01, respectivamente). Estos resultados indican que el bloqueo en el área experimental, establecido en sentido perpendicular al gradiente de heterogeneidad ambiental, fue eficiente. Esto contribuyó a disminuir el error experimental. Con relación al rendimiento de grano de las 20 cruzas muestreadas, en éstas los efectos genéticos aditivos fueron de mayor importancia que los no aditivos (dominancia y epistasis), por lo que este grupo de ocho progenitores de maíz podría utilizarse eficientemente en la formación de variedades sintéticas. En las generaciones segregantes (F2 o superior), provenientes del apareamiento aleatorio entre este grupo de líneas endogámicas, podrían seleccionarse plantas destinadas a la obtención de nuevas y mejores variedades de polinización libre.
Fuente de variación |
Grados de libertad |
Suma de cuadrados |
Cuadrados medios |
Valores de F | ||
---|---|---|---|---|---|---|
Calculado | Tablas | |||||
5% | 1% | |||||
Repeticiones | 3 | 17.07 | 5.69 | 6.84** | 2.78 | 4.16 |
Cruzas | (19) | (22.43) | 1.18 | 1.42 ns | 1.75 | 2.22 |
ACG | 7 | 13.137 | 1.876 | 2.25* | 2.18 | 2.98 |
ACE | 12 | 9.302 | 0.775 | 0.93 ns | 1.93 | 2.53 |
Error | 57 | 47.38 | 0.83 | |||
Total | 79 | 86.89 |
GL ACG = p-1= 8-1= 7; GL ACE= GL cruzas-GL ACG= 19-7= 12. También, GL ACE= [p(s-2)/2]= [8(5-2)/2]= 12.
Estimación de componentes de varianza y heredabilidad. σ2
e = cuadrado medio del error = 0.8312. σ2
s = (CM de ACE - CM del error)/ r = (0.7751 - 0.8312) / 4 = - 0.014. σ2
g = (p-1) (CM ACG - CM ACE)/rs(p-2) = 7(1.8767 - 0.7751)/4(5)(6)= 0.0642. La varianza promedio para calcular las diferencias entre dos valores de gi estimados se calcula cómo: VM (
La equivalencia entre las varianzas calculadas previamente y las aditivas y de dominancia se establece cuando se asume que el coeficiente de endogamia es igual a uno, debido a que las líneas usadas en el dialélico parcial son endogámicas (S7). Entonces: σ2 A = 2 σ2 g = 2(0.0642) = 0.1284; σ2 D = σ2 s = -0.014. La varianza genética total, σ2 G, se estima cómo: σ2 G = σ2 A + σ2 D = 0.1284 - 0.014 =0.1144. La heredabilidad en sentido amplio, H2, se estima cómo: H2= 100 (σ2 G / σ2 F)= 100 (0.1144/0.3222)= 35.5%, donde σ2 F es la varianza fenotípica. σ2 F = 2 σ2 g + σ2 s + (σ2 e /r) = 0.1284- 0.014 + 0.2078 = 0.3222. La heredabilidad en sentido estrecho, h2, se estima cómo: h2 = 100 (σ2 A/σ2 F)= 100 (0.1284/0.3222) = 39.85%.
La estimación negativa de la varianza de aptitud combinatoria específica (efectos genéticos no aditivos) sugiere que hubo una subestimación en la heredabilidad en sentido amplio (35.5%) comparativo con la estimación de la heredabilidad en sentido estrecho (39.85%). El valor de h2 sugiere que la variabilidad fenotípica total medida en las 20 cruzas simples de maíz está relacionada con genes aditivos que determinan el rendimiento de grano. En este contexto se asume que 39.8% de la variabilidad fenotípica total estimada en esta variable cuantitativa se atribuye a las diferencias que existen entre los progenitores endogámicos, cuyos efectos predominantes son aditivos.
Resultados obtenidos con OPSTAT
Source of Variation | DF | Sum of Squares | Mean Squares | F-Calculated | Signficance |
---|---|---|---|---|---|
Replications | 3 | 17.074 | |||
Treatments | 19 | 22.438 | 1.181 | 1.421 | 0.15415 |
Error | 57 | 47.385 | 0.831 | ||
Total | 79 | 86.897 |
Cross | Mean | Standard error |
---|---|---|
1 X 3 | 7.293 | 1.665 |
1 X 4 | 6.995 | 0.272 |
1 X 5 | 6.625 | 0.48 |
1 X 6 | 6.863 | 1.191 |
1 X 7 | 6.077 | 0.552 |
2 X 4 | 6.433 | 0.193 |
2 X 5 | 7.043 | 1.001 |
2 X 6 | 7.763 | 0.774 |
2 X 7 | 6.918 | 0.187 |
2 X 8 | 7.858 | 0.925 |
3 X 5 | 6.428 | 0.494 |
3 X 6 | 7.24 | 1.468 |
3 X 7 | 6.33 | 0.32 |
3 X 8 | 6.82 | 1.033 |
4 X 6 | 5.845 | 1.378 |
4 X 7 | 6.535 | 0.317 |
4 X 8 | 7.105 | 1.127 |
5 X 7 | 5.943 | 0.23 |
5 X 8 | 7.153 | 0.927 |
6 X 8 | 6.62 | 1.018 |
Los errores estándar de la tabla anterior corresponden a
Source of variation | DF | Sum of squares | Mean squares | F-calculated | Signficance |
---|---|---|---|---|---|
Replications | 3 | 17.074 | 5.691 | ||
Crosses | 19 | 22.438 | 1.181 | 1.421 | 0.15415 |
Due to GCA | 7 | 13.142 | 1.877 | 2.258* | 0.0423 |
Due to SCA | 12 | 9.296 | 0.775 | 0.932 | 0.52237 |
Error | 57 | 47.385 | 0.831 | ||
Total | 79 | 86.897 |
SIGMASQ-G | 0.064 |
SIGMASQ-S | -0.014 |
SIGMASQ-A | 0.129 |
SIGMASQ-D | -0.014 |
Average variance(gi-gj) | 0.100 |
SE (gi-gj) (EE) | 0.316 |
La equivalencia entre las varianzas reportadas en el cuadro anterior, con las de la sección de estimación de heredabilidades, es σ2 g, σ2 s, σ2 A, σ2 D, VM, respectivamente. Heritability (Narrow Sense)= 1.12.
Conclusiones
La obtención de la inversa de la matriz A es muy laboriosa cuando se utiliza una calculadora de escritorio, pero la estimación de sus raíces características, λ’s, se simplifica cuando se aplica el método de Kempthorne y Curnow (1961), en comparación con el de Martínez (1991) y ambos conducen a resultados similares; con éstas, también es más fácil estimar los elementos de su primera hilera. Como la matriz A-1 es simétrica y circulante, los elementos de la segunda hilera se obtienen desplazando los de la primera a la siguiente columna y así sucesivamente. Si no es posible el uso de software, ambas metodologías serán de gran utilidad. Adicionalmente, se observó que hay pocos paquetes estadísticos para el análisis de un dialélico incompleto que estén disponibles gratuitamente.
El software Opstat analiza experimentos en un solo ambiente, éste verificó fácil, rápida y confiablemente los análisis obtenidos con la calculadora de escritorio, incluidos la varianza promedio y los errores estándar para cualquier contraste de gi con gj. Si se ignora Sij en el modelo genético, se puede estimar el potencial de producción de las cruzas simples usando los dos métodos de Kempthorne y Curnow (1961). Cómo la varianza de dominancia fue negativa el software estimó h2 incorrectamente.