Introducción
La industria lechera de ganado bovino en México produjo alrededor de 11,489 millones de litros de leche a nivel nacional en el 2020 (SIAP, 2020)1 de los cuales, más del 30 % del volumen se produjo en el sistema de lechería familiar (SLF), que incluye aproximadamente al 78 % de los establos2). En los establos del SFL predominan los animales de la raza Holstein, aunque se pueden encontrar animales Pardo Suizo, así como las cruzas de estos3. Actualmente en este sistema se cuenta con poca información de registros productivos por animal y en escasas ocasiones se puede recopilar información genealógica, lo que hace poco viable realizar evaluaciones genéticas de los animales de este sistema. El mejoramiento genético de estos animales se ha llevado a cabo por la selección que realiza el ganadero dentro de su hato, o por la introducción de material genético, pero no se tiene evidencia de apareamientos dirigidos con un fin genético determinado.
El uso de la información genómica ha permitido describir la estructura de las poblaciones que no cuentan con información genealógica o de registros. El estudio de estas poblaciones o animales se ha realizado a partir del estudio de marcadores de un solo polimorfismo (SNP) o los patrones de agrupamiento de los mismos; como, por ejemplo, las corridas de homocigosidad (ROH), que son segmentos homocigotos en el genoma, idénticos por descendencia, que pueden ser utilizados para estudiar la estructura de la población, la historia demográfica y para descifrar la estructura genética de enfermedades complejas4. Las ROH son el resultado del cruzamiento entre individuos emparentados5, provenientes de poblaciones con alto nivel de intensidad de selección, influenciada por la disponibilidad de reemplazos y adopción de herramientas tecnológicas y reproductivas6, o bajas tasas de recombinación7. Su distribución y longitud depende de la intensidad de la selección, siendo más frecuentes y más extensas cuando ésta es mayor8, cuando los apareamientos entre parientes cercanos son frecuentes o cuando el tamaño de las poblaciones es reducida4.
El potencial de las ROH para ayudar al mejoramiento genético de los animales de producción es grande, debido a que dentro de ellas se encuentran una gran cantidad de genes que codifican para características de interés9. Además, la identificación de ROH puede ayudar a visualizar y reconocer patrones de haplotipos característicos de razas o especies7, permitiendo identificar regiones genómicas con posibles huellas de selección para la raza10 y calcular los niveles de consanguinidad individual. Esto último, mediante la evaluación de la porción del genoma cubierto por los segmentos ROH, especialmente porque que hay una alta probabilidad de detectar información genómica proveniente de parentescos antiguos11. Herramienta útil para poblaciones que no cuentan con información genealógica12.
Las huellas de selección son regiones del genoma que han sido conservadas por generaciones en las poblaciones debido a la selección natural o artificial. Estas secuencias de material genético están relacionadas con caracteres funcionalmente importantes13 y su detección ayuda a identificar genes candidatos que se han favorecido en los procesos de selección a los que han sido expuestas las poblaciones, y a identificar mutaciones benéficas. Además, ayudan a la comprensión de las rutas moleculares relacionadas con los rasgos fenotípicos14,15.
Con los análisis de marcadores tipo SNP, también es posible conocer la estructura poblacional a través de análisis de mezclas y conocer los orígenes más influyentes en una población. Además, mediante métodos reductivos de información, como lo son los análisis de componentes principales, es posible determinar patrones de la estructura poblacional, información importante para establecer las bases de un programa de mejoramiento genético.
El objetivo del presente estudio fue conocer la estructura poblacional, identificar posibles orígenes del material genético, conocer el grado consanguinidad e identificar posibles huellas de selección en el genoma, que permitan vislumbrar las características que se han mejorado a través de los años por las decisiones de los ganaderos en sistemas de producción familiar de México.
Material y métodos
Se utilizaron 270 genotipos de vacas Holstein, elegidas al azar de la población presente en tres hatos de SFL ubicados en la región de Tepatitlán, Jalisco, México. Los animales fueron genotipados con el chip GeneSeek Genomic Profiler Bovine GGP 50K®. El control de calidad a la información genómica consistió en excluir animales con tasa de llamada < 0.90; excluir SNP con frecuencia del alelo menor (MAF) < 0.02, o con una tasa de llamada < 0.95, o con un valor de P para Hardy Weinberg < 0.000116,17. Después del control de calidad, se incluyeron 43,548 SNP autosómicos.
Para conocer la estructura y principales orígenes poblacionales, se realizó un análisis de mezclas a través de la estimación basada en modelos de verosimilitud que definen la estructura de la ascendencia en individuos no relacionados, metodología implementada en el software Admixture V 1.3.018. Mientras que, para identificar posibles agrupaciones poblacionales por hato, se realizaron análisis de Componentes principales (CP). Para estimar la consanguinidad con información genómica y huellas de selección en la población, se buscaron ROH en el genoma. Para definir las ROH, se incluyeron las corridas que contaban con una longitud mínima de 500 kb y una cantidad mínima de 25 SNP, con una densidad mínima de 1 marcador cada 50 kb y una brecha máxima entre marcadores homocigotos contiguos de 500 Kb. Con los parámetros mencionados, se evitó el riesgo de incluir ROH muy cortas, caso común debido al desequilibrio de ligamiento (DL)17. El DL se asocia con la presencia de genes ligados, por lo que al heredarse de padres a hijos lo hacen de forma conjunta, afectando la frecuencia de recombinación (menor del 50 %) y presencia de ROH en el genoma19. Adicionalmente, se permitió 1 SNP heterocigoto y 5 genotipos perdidos por corrida20,21.
El análisis de ROH se realizó con la plataforma bioinformática SNP & Variation Suite v7.6.8 Win64 (Golden Helix, Bozeman, MT, USA)22, mientras que los análisis de los datos obtenidos se realizaron con SAS Institute 9.3.23. Para analizar la distribución de
Las huellas de selección se detectaron a través de la pérdida de variación genética, empleando las ROH identificadas en el genoma, utilizando las más frecuentes en la población (en al menos 10 % de los animales). De acuerdo con su posición física en el genoma, fueron identificadas anotaciones o regiones previamente relacionadas con genes, QTL o caracteres que se han realizado en otras poblaciones y que se encuentran reportadas en la base de datos Animal QTLdb Release 4325. Además, se buscaron huellas de selección previamente reportadas en la base de datos de Variación del Genoma Bovino (BGVD)26; lo anterior con la finalidad encontrar información genómica que ayude a conocer posibles características que se han seleccionado en la población del Sistema de lechería familiar (SLF) en México.
Para el cálculo del coeficiente de consanguinidad por corridas (FROH) se utilizó la metodología propuesta por Mcquillan et al27, quienes la definieron como
Adicionalmente se realizó el cálculo del coeficiente de consanguinidad a través de marcadores homocigotos observados y esperados (FHOE) para todos los animales, el cual se ha reportado tiene una correlación de 0.96 ± 0.001 con la matriz de relaciones genómicas en ganado Holstein28, los valores de FHOE pueden oscilar entre −1 y +1. Los números negativos se refieren a la exogamia presente en el apareamiento entre individuos de poblaciones diferentes y los valores positivos indican el nivel de endogamia de individuos de la misma población; el cálculo se realizó a través del método referenciado por Ferenčaković et al11 con el programa SNP & Variation Suite v7.6.8 Win64 (Golden Helix, Bozeman, MT, USA)22.
Resultados y discusión
En el análisis de mezclas, el valor que mejor definió el número de poblaciones ancestrales (K) fue seis y de acuerdo con la información recopilada de algunos padres de vacas, se lograron identificar seis familias grandes, definidas principalmente por el país de origen de los sementales. En la Figura 1-a, se muestra la estructura de la población ligada a los seis grupos principales por país de origen de los sementales, aunque algunas de esas familias comparten el mismo país de origen. Por lo anterior, se conjuntaron los grupos que compartieron el mismo origen, quedando sólo representados tres grupos grandes, dos que representan a Estados Unidos de América y uno al Reino Unido (USA, 840 y GBR, respectivamente) (Figura 1-b). Los orígenes USA y 840 corresponden a Estados Unidos de América, sólo que el 840 es asignado a los animales que usan identificaciones de radiofrecuencia (RFID), dispositivos expedidos por el Comité Internacional de Registro Animal (ICAR); mientras que los animales registrados con país de origen USA no llevan un RFID y el uso del material genético es a nivel local o más limitado que los 84029. Los resultados de este estudio evidencian la dependencia genética que tiene el sistema familiar en México del material extranjero, principalmente proveniente de Estados Unidos, ya que más del 80 % de los orígenes fueron ligados a familias con orígenes de este país, ya sea de comercio local o de los registrados internacionalmente.
A pesar de que en otro estudio29 se había reportado la influencia de otras razas de bovinos lecheros en el sistema familiar, en el presente estudio no se encontró evidencia del uso o cruza con otras razas. Estos resultados podrían sugerir que los ganaderos han seguido un sistema de apareamientos más dirigidos, y que se limitan a usar animales de la misma raza en los servicios.
En los análisis de CP (Figura 2), no se encontró estratificación por país de origen del semental, y cuando se evaluó el hato de origen, se observa un hato (morado) homogéneo en la población, y se aprecia una diferencia entre los animales de los otros hatos (rojo y azul). El porcentaje de la variabilidad asociada a cada componente fue de 2.9, 2.0 y 1.8 para los componentes o eigenvalores (EV) 1, 2 y 3 respectivamente.
El número total de ROH (
Tipo de ROH | Longitud | Número de ROH | Porcentaje |
---|---|---|---|
Únicas | - | 5,628 | 35.86 |
Repetidas | Idénticas | 5,663 | 36.08 |
Variable | 4,404 | 28.06 |
El
El número promedio de ROH por animal fue de 58.13 ± 11.89, con un máximo y mínimo de 92 y 10; lo que es un valor alto comparado con los resultados de ganado Holstein del sistema especializado en México24 reportado en promedio en 20.07 ROH por animal con un máximo de 283 y un mínimo de 1. Estudios en otras poblaciones Holstein de producción intensiva han reportado alrededor de 82.3 ± 9.83 ROH por animal en ganado Holstein de EUA31 y 81.7 ± 9.7 corridas por animal en ganado Holstein de Italia32. Estas diferencias pueden ser debidas al alto grado de selección en las poblaciones de sistemas de producción especializados tanto de EUA como de Italia, así como a la disponibilidad de material genético de sementales altamente seleccionados en comparación con el SLF que se analizó en donde no están tan definidos los objetivos de selección.
De acuerdo con la clasificación de L 𝑅𝑂𝐻 , las corridas más frecuentes fueron las más cortas (0.5 a 4 Mb) con el 64.42 %, seguidas de las de 4 a 8 Mb con 20.45 %, y las menos frecuentes fueron las corridas más largas (>16 a 20 y >20; Cuadro 2). Las longitudes de las ROH proporcionan información sobre el número de generaciones en las que se comparte el ancestro común, siendo las más largas las formadas en generaciones recientes21, por lo que la longitud de las ROH encontradas en esta población reflejan una consanguinidad reciente y baja.
Longitud (Mb) | Cantidad | Porcentaje |
---|---|---|
0.5 a 4 | 10,110 | 64.42 |
>4 a 8 | 3,209 | 20.45 |
>8 a 12 | 1,131 | 7.21 |
>12 a 16 | 539 | 3.43 |
>16 a 20 | 296 | 1.89 |
>20 | 410 | 2.61 |
Mb= Mega bases.
El coeficiente de consanguinidad (FROH) promedio en la población fue de 0.59 ± 0.53 % con un máximo de 3.35 % y un mínimo de 0.034 %. Los resultados concuerdan con la poca cantidad de ROH encontradas y la corta longitud promedio. Estos valores se encontraron muy por debajo a lo reportado en otras poblaciones de ganado Holstein altamente seleccionadas; por ejemplo, 4.2 % en EUA33. Aunque la consanguinidad encontrada en esta población fue insignificante, valor que se confirma con los valores calculados para FHOE que fueron de -0.02 ± 0.08, al revisar los promedios por número de parto, se encontró un leve incremento en FROH de las generaciones recientes, lo que podría indicar el inicio de una tendencia desfavorable para el grupo estudiado (Figura 3).
Para identificar las huellas de selección a lo largo del genoma, se buscaron cromosomas y regiones específicas en la ubicación y distribución de las ROH. La presencia de ROH se mostró en mayor medida en los cromosomas largos que en los cortos, aunque estos últimos presentaron una mayor proporción del genoma cubierta por regiones homocigóticas como lo fue en el caso de los cromosomas10 y 20, que presentaron un 10 y un 20 con 16.98 % y 17.76 % (Figura 4), comportamiento similar a lo reportado por Szmatola et al34 en vacas Holstein de Polonia sugiriendo que estas regiones han estado sujetas a una mayor selección, por asociación a caracteres de interés económico. Los porcentajes de homocigosidad por cromosoma son mayores que el valor promedio de FROH porque se toma la longitud del cromosoma como el ciento por ciento y no la longitud total del genoma cubierto por los SNP; con esto se tiene una mejor percepción de la longitud del cromosoma cubierto por ROH.
A lo largo del genoma se observó una relación positiva entre el tamaño de cromosoma y el número de ROH detectadas en ese cromosoma, pero no fue así para el porcentaje de la longitud del cromosoma cubierto por ROH, ya que los cromosomas cortos mostraron una mayor proporción cubierta por ROH (Figura 5), esto debido a que la longitud promedio de las ROH fue mayor en los cromosomas cortos que en los largos, debido a que en los cromosomas largos existe mayor recombinación que en los cromosomas cortos8. Del total de ROH determinado en la población, los cromosomas 1 y 6 fueron los que presentaron una mayor cantidad de ROH (5.98 y 5.39 %) y los cromosomas con una menor cantidad fueron los cromosomas 28 y 27 (1.31 y 1.50 %) resultados similares a los de Purfield et al17quienes también reportaron una mayor cantidad de ROH en los cromosomas largos que en los cortos.
De acuerdo con la frecuencia de las ROH repetidas en la población, sólo 35 se encontraron en 10 animales o más y se distribuyeron en los cromosomas 2, 3, 4, 5, 6, 8, 9, 10, 11, 12, 13, 14, 15, 17, 19, 21, 22, 23, 26 y 29. Las ROH más frecuentes se encontraron en cromosomas 2 y 22, en 27 y 23 animales, respectivamente, siendo la longitud en estas corridas de 1.82 Mb y 1.61 Mb. En la misma posición de las corridas encontradas en el cromosoma 2 (83.84-85.66 Mb), Cole et al35 dieron a conocer QTL (Loci de Rasgos Cuantitativos) relacionados con el ancho de la cadera y estatura en ganado Holstein de EUA; Cai et al36 reportaron QTL asociados a producción de grasa en leche en ganado Holstein de países Nórdicos, pudiendo indicar huellas de selección en estos cromosomas37.
Del total de ROH con longitud variable, solo 37 se encontraron en 10 animales o más, distribuyéndose a lo largo del genoma, excepto en el cromosoma 8. En la región donde se encontraron las ROH más frecuentes en la población (≥20 animales), se han reportado numerosas asociaciones, QTL y genes que se encuentran relacionados con producción y composición de la leche, parámetros de fertilidad, susceptibilidad a enfermedades, conformación corporal, eficiencia alimenticia y algunas características de composición de la canal (Cuadro 3). Los resultados muestran que a pesar de que las longitudes de las ROH en esta población (~4.79 Mb) sugieren un cruzamiento de animales emparentados hace aproximadamente 16 generaciones11, las regiones conservadas podrían indicar que la selección en esta población se encuentra dirigida a mejorar la producción de leche, composición, fertilidad y salud, como podría esperarse en los sistemas de producción de leche. En los cromosomas 1 y 2, además de las asociaciones con características de interés en ganado lechero, se observan asociaciones con características de la canal, hallazgos que pudieran sugerir posibles cruzamientos con otras razas.
BTA | Posición de inicio |
Longitud (pb) |
NoA | Asociaciones /QTL reportadas |
Genes NCBI |
Huellas de selección |
---|---|---|---|---|---|---|
13 | 389,736 | 1,593,318 | 38 | CALEASE, PTAT, FY, MY, NM, PY, UHT, SB, STA, FANG, FTLEG, UA, RLEGR, RLEGS, RTPL, SCS, MRCT, FSC, CONCEPT, MBCASP, MPFRAT, DYF, DYST, TPL, TLGTH, UDPTH, PP, FP, HTINT. |
Asociado: 287026. |
TMX4, PLCB1, MIR2285M-1. |
1 | 761,316 | 1,116,706 | 32 | PP, MKCASP, CONCRATE, MUGKCASP, BTBS, SCS, FATTH, PY, RFI. |
Asociado: 506426. Candidato: 282257. |
ATP5O, ITSN1, CRYZL1, DONSON, SON, GART, DNAJC28, TMEM50B, IFNGR2, IFNAR1, LOC104970778, IL10RB, IFNAR2, LOC526226, OLIG1, OLIG2. |
17 | 67,686 | 1,209,677 | 32 | FY, PY, CONCRATE, CONCEPT. |
TMEM192, KLHL2, MSMO1, CPE, LOC101903170. |
|
2 | 83,841,602 | 1,794,112 | 31 | FSC, NRR, CONCRATE, CONCEPT, MUGKCASP, MSPD, BTBS, FY, BD, CALEASE, PTAT, FTPL, UA, NM, PL, RTPL, UHT, RUMWD, SCS, SB, STA, STR, UC, UDPTH, LMY, EY, BW, BVDV. |
Candidato: 526800 Candidato: 19122 Gen: 521004. |
SLC39A10, DNAH7, STK17B, LOC531691. |
7 | 153,780 | 811,014 | 31 | CALEASE, SB, FANG, FTLEG, PTAT, FTPL, UA, NM, PL, RLEGR, RLEGS, UHT, SCS, STA, UC, UDPTH, MBCASP. |
Gen: 338031. |
LOC107131408, LOC100125913, LOC101902704, FLT4, CNOT6, GFPT2, MAPK9, RASGEF1C. |
BTA= cromosoma, NoA= número de animales.
Asociaciones /QTLs reportados. CALEASE= facilidad de parto, PTAT= puntos finales de conformación, FY= producción de grasa en leche, MY= producción de leche, NM= mérito Neto, PY= producción de proteína en leche, UHT= altura de inserción de la ubre, SB= mortinatos, STA= estatura, FANG= ángulo de la pezuña, FTLEG= conformación de patas y pezuñas, UA= inserción de la ubre, RLEGR= colocación de las patas traseras - vista trasera, RLEGS= vista lateral de aplomos posteriores, RTPL= posición de tetas posteriores, SCS= puntuación de células somáticas, MRCT= tiempo de coagulación del cuajo de la leche, FSC= concepción a primer servicio, CONCEPT= número de inseminaciones por concepción, MBCASP= porcentaje de B-Caseína en leche, MPFRAT= proporción de proteína y grasa de leche, DYF= carácter lechero, DYST= distocia, TPL= posición de tetas, TLGTH= longitud de pezones, UDPTH= profundidad de la ubre, PP= porcentaje de proteína en leche, FP= porcentaje de grasa en leche, HTINT= intensidad del estro, MKCASP= porcentaje de Kappa caseína en leche, CONCRATE= tasa de concepción, MUGKCASP= porcentaje de kappa caseína en leche no glucosilada, BTBS= susceptibilidad a tuberculosis bovina, FATTH= espesor de grasa en la 12a costilla, RFI= consumo residual, NRR= tasa de no retorno, MSPD= velocidad de ordeño, BD= profundidad de Cuerpo, FTPL= posición de tetas anteriores, PL= duración de vida productiva, RUMWD= anchura del anca, STR= fortaleza lechera, UC= hendidura de ubre, LMY= rendimiento de carne magra, EY= energía de producción láctea, BW= peso corporal al nacimiento, BVDV= susceptibilidad a diarrea viral bovina.
Genes NCBI. 287026= fosfolipasa C beta 1, 506426= crystallin zeta codificador de proteínas, 282257= subunidad 1 del receptor de interferón alfa y beta, 526800= ankyrin repetidor dominio 44, 19122= proteína priónica, 521004= portador de soluto familia 39 miembro 10, 338031= receptor relacionado con fms tirosina quinasa 4.
Huellas de selección (genes codificadores de proteínas). TMX4= proteína transmembrana 4 relacionada con tiorredoxina, PLCB1= fosfolipasa C beta 1, MIR2285M-1= microARN que participan en la regulación postranscripcional de la expresión génica, ATP5O= subunidad del tallo periférico de la ATP sintasa, OSCP= subunidad periférica del tallo de ATP sintasa, ITSN1= intersección 1, CRYZL1= crystallin zeta codificador de proteínas, DONSON= factor de estabilización de la horquilla de replicación del ADN, SON= proteína de unión a ADN y ARN, GART= fosforribosilglicinamida formiltransferasa y sintetasa, fosforribosilaminoimidazol sintetasa, DNAJC28= familia de proteínas de choque térmico, TMEM50B= proteína transmembrana 50B, IFNGR2= receptor de interferón gamma 2, IFNAR1= subunidad 1 del receptor de interferón alfa y beta, LOC104970778= gen ARN no caracterizado, IL10RB= subunidad beta del receptor de interleucina, IFNAR2= subunidad 2 del receptor de interferón alfa y beta, LOC526226= histona H4, OLIG1= factor de transcripción de oligodendrocitos 1, OLIG2= factor de transcripción de oligodendrocitos 2, TMEM192= proteína transmembrana 192, KLHL2= kelch de la familia 2, MSMO1= metilsterol monooxigenasa 1, CPE= carboxipeptidasa E, LOC101903170= cen ARN no caracterizado, SLC39A10= familia de portadores de soluto 39, DNAH7= cadena pesada axonemal de dineína 7, STK17B= serina/treonina quinasa 17b, LOC531691= dominio HECT, C2 y WW que contiene la proteína ligasa 2 de ubiquitina E3, LOC107131408= familia de receptores olfativos 5 subfamilia W miembro 39, LOC100125913= gen no caracterizado, LOC101902704= familia de dominios de lectina de tipo C, 7, A, FLT4= receptor relacionado con fms tirosina quinasa 4, CNOT6= subunidad 6 del complejo de transcripción CCR4-NOT, GFPT2= glutamina-fructosa-6-fosfato transaminasa 2, MAPK9= proteína quinasa 9 activada por mitógeno, RASGEF1C= miembro de la familia de dominio RasGEF 1C.
Para buscar anotaciones de ROH con longitud variable, se tomó como referencia la ROH más corta con respecto a la posición final (Cuadro 3), para evitar proporcionar información fuera de la región común a todos los animales con una ROH especifica.
En la población de estudio, se identificaron ROH que se han mantenido como resultado del proceso de selección de la población del sistema familiar. Estas regiones conservadas, se encuentran asociaciones de marcadores tipo SNP, QTL y genes; que en su mayoría están relacionados con características de interés económico en la industria lechera, como producción y composición de la leche, parámetros de fertilidad, susceptibilidad a enfermedades, conformación corporal, eficiencia alimenticia y algunas otras características como la composición de la canal, lo que podría tomarse como huellas de selección (Cuadro 3). Estos resultados muestran los caracteres que han sido incluidos en los procesos de selección en la población; ya sea de forma intencional por la selección que realizan los ganaderos o no intencional por la disponibilidad de material genético en el mercado, ya que, al usar la IA, la elección de sementales guía al ganadero a modificar la genética de sus animales en la forma que lo hacen las empresas de IA.
Conclusiones e implicaciones
El ganado productor de leche del SLF tiene orígenes ancestrales de países que son proveedores de material genético a nivel internacional, como son EE.UU. y GBR, sin mostrar evidencia de cruzamientos recientes con otras razas lecheras. Dentro de la población estudiada, se puede observar genéticamente homogénea, con una menor cantidad y longitud de ROH que los animales en sistemas especializados de producción, lo que refleja una amplia variación genética causada por una baja intensidad de selección. En este trabajo se identificaron ROH que se han mantenido como resultado del proceso de selección, que en su mayoría están relacionados con características de interés económico en la industria lechera.
Los resultados de este estudio reflejan la existencia de un bajo nivel de consanguinidad en la población y una mayor diversidad genética en esta población respecto a los que se encuentran en sistemas especializados, por lo que se tiene la posibilidad de realizar trabajos de mejoramiento genético dirigidos a las características de interés de los productores a través de selección, sin que la consanguinidad comprometa la productividad y salud de la población.