selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/aguilar...
TRANSCRIPT
Selección genómica utilizando metodología “en una etapa”
Ignacio Aguilar Instituto Nacional de Investigación Agropecuaria
INIA Las Brujas, Uruguay
Selección genómica en una etapa
• Metodología desarrollada para implementar
evaluaciones genéticas incorporando toda la
información disponible:
– Registros fenotípicos
– Relaciones de pedigrí
– Información genómica: “SNP chips”
Valor de Cría: DEP
Mejora Genética Animal
Identificar animales con alto Mérito Genético
para los caracteres de interés, para ser usados
como progenitores de la siguiente
generación, de manera de maximizar el
mérito esperado de la progenie
Evaluaciones genéticas
Evaluaciones genéticas “tradicionales”
usan información fenotípica
y de pedigrí
para predecir valores de cría
de rasgos de relevancia económica
para la selección
Selección genómica
• Disponibilidad – Marcadores moleculares (SNP) que cubren todo
el genoma
– Plataformas para el genotipado a gran escala con costos rentables
• Desarrollo de metodología estadísticas y bioinformáticas: – Selección genómica – Meuwissen et al 2001
Beneficios selección genómica
• Incremento significativo de la ganancia genética
debido al incremento de la precisión de los
valores de cría a edades tempranas
• Mayores ganancias:
– rasgos medidos en un solo sexo
– Tamaño adulto
– Calidad de carne y canal
– Resistencia genética a enfermedades
Selección Genómica Industria lechera
Toro
Nacimiento 1 año 2 años 5 años 10 años
Selección DEP de padres
Nacimiento de
Hijas
Toro Probado Prueba de progenie
Hijo Probado Prueba de progenie
Selección Toro
Selección Hijos
Selección nietos
Selección Bisnietos
Fuente: H. Daetwyler
Estimación de valores de cría genómicos
• No todos los animales son genotipados
• Información fenotípica histórica
• Múltiples valores de cría
• Necesidad de combinar diferentes fuentes de información en un solo valor de cría
Uso de información genómica
• Disponibilidad de un sistema que combine
distintas fuentes de información:
– evaluaciones genéticas “tradicionales”
– datos genómicos
• “DEP mejorados”, “DEP Genómicos” etc.
Diferentes modelos propuestos • Incorporación de los datos genómicos en
en los modelos en varios pasos
– Asumiendo como caracteres correlacionados (Kachman 2008, MacNeil et al., 2010)
– Utilizando teoría de índices de selección (VanRaden et al., 2009, Johnston et al., 2010)
• Evaluación genética utilizando toda la información disponible: genotipos, fenotipos y genealogía (Aguilar et al., 2010)
Múltiples etapas en selección genómica
Registros ‘Y’
BLUP Pseudo Registros
VC De-regresados
BayesX GBLUP
etc
index PA*w2
SPA*w3 GVC*w1
Valores de Cría
SNPs
Pedigri
VanRaden et al., 2009
Holstein Association • Metodología usada en evaluaciones
genéticas de ganado lechero involucra varias etapas:
– Evaluación genética tradicional
– Extracción de pseudo-observaciones: Val. de cría de-
regresados
– Estimación de efectos de SNP: predicciones genómicas
– Combinación tradicional y predicciones genómicas
• Estimación de valores de cría moleculares (MBV) por dos empresas comerciales (Ingenity, Pfizer) para 16 rasgos diferentes
– Igenity® Profile Angus
– Pfizer HD 50K for Angus
• Evaluación genética (AGI) que incorpora a los MBV como “fenotipos” correlacionados a los 16 rasgos evaluados
American Angus Association
Kachman 2008, MacNeil et al 2010
Múltiples etapas en selección genómica
Registros ‘Y’
BLUP Pseudo Registros
VC De-regresados
BayesX GBLUP
etc
index PA*w2
SPA*w3 GVC*w1
Valores de Cría
SNPs
Pedigri
VanRaden et al., 2009
Selección Genómica en Una Etapa
Registros ‘Y’
BLUP
Valores de Cría
Pedigri SNPs
Misztal et al., 2009, Legarra et al 2009, Aguilar et al., 2010
X'X X'Z
Z'X Z'Z +a A-1
é
ëêê
ù
ûúú
b
u
é
ëêê
ù
ûúú
=X'y
Z'y
é
ë
êê
ù
û
úú
X'X X'Z
Z'X Z'Z +a H -1
é
ëêê
ù
ûúú
b
u
é
ëêê
ù
ûúú
=X'y
Z'y
é
ë
êê
ù
û
úú
• Evaluación Tradicional BLUP
• Evaluación Genómica Una Etapa
Es posible evaluación genomica en una etapa ?
Parentesco Valores de cría
Selección Genómica en Una Etapa
• Relaciones de parentesco basadas en el pedigrí combinada con matriz de relaciones genómicas (Misztal et al. 2009)
X'X X'Z
Z'X Z'Z +a H -1
é
ëêê
ù
ûúú
b
u
é
ëêê
ù
ûúú
=X'y
Z'y
é
ë
êê
ù
û
úú
H = A+ AL
A- matriz de relaciones tradicional basa en pedigri
AD - matriz con desviaciones debido a informacion genomica
• H = Matriz de relaciones combinada
• A = Matriz de relaciones basadas en pedigrí
• G = Matriz de relaciones genómicas
Matriz de relaciones combinada Legarra et al., 2009
1 1 1
12 22 22 22 21 12 22 22
1
22 22 21 22
A A G A A A A A G AH A
G A A A G A
Inversa de la matriz de relaciones combinada
1 1 1
12 22 22 22 21 12 22 22
1
22 22 21 22
A A G A A A A A G AH A
G A A A G A
1 1
1 1
22
0 0
0
H A
G A Aguilar et al., 2010
Christensen & Lund 2010
X'X X'Z
Z'X Z'Z +a H -1
é
ëêê
ù
ûúú
b
u
é
ëêê
ù
ûúú
=X'y
Z'y
é
ë
êê
ù
û
úú
Uso Equaciones de modelos mixtos tradicionales
Modelo equivalente VanRanden et al 2009; Goddard, 2009; Habier el al 2007
y= m + Za+e, var(a) = Ds a
2
y= m +u+e, var(u) = Gsu
2, G= ZDZ '/ k
Modelo que estima efectos de los SNPs
Modelo que estima Valores de Cría
u= Za
a= DZ '(ZDZ ')-1u Stranden & Garrick, 2009
Simple conversión entre:
Valores de Cría y efectos de SNP
u= Za
Información genómica ≈ relaciones genómicas
• Efectos de los SNPs se pueden estimar usando diferentes supuestos sobre la distribución
Estimación de valores de cría genómicos
Metodología Supuestos
BayesX LASSO PLS
Genes con efecto mayor Varianza variable por SNP Muchos SNP no tiene ningún efecto
Bayes BLUP
No existen genes con efecto mayor Varianza constante por SNP Todos los SNP tiene efectos
GBLUP Matriz de relaciones genomicas mismos supuestos que Bayes BLUP
Resultados asumiendo diferentes distribuciones para los efectos de SNPs
Metodo Correlacion promedio varios
caracteres
Bayes BLUP 0.589
Bayes A 0.578
Bayes C 0.597
LASSO 0.595
SVR 0.587
GBLUP 0.588
PLS 0.592
Verbyla et al., 2009
Matriz de relaciones genómicas • Selección genómica ‘funciona’, en cierto modo, debido a
que la información molecular (SNPs) estima las relaciones de parentesco entre animales
• Matriz de relaciones genómica (‘observada’) mas precisa que
• Matriz de relaciones basada en pedigrí (‘promedio’)
• Matriz de relaciones genómicas utiliza desvíos debidos al muestreo Mendeliano
Genotipo de “Elevation” Cromosoma 1
1000111220020012111011112111101111001121100020122002220111 1202101200211122110021112001111001011011010220011002201101 1200201101020222121122102010011100011220221222112021120120 2010020220200002110001120201122111211102201111000021220200 0221012020002211220111012100111211102112110020102100022000 2201000201100002202211022112101121110122220012112122200200 0200202020122211002222222002212111121002111120011011101120 0202220001112011010211121211102022100211201211001111102111 2110211122000101101110202200221110102011121111011202102102 1211011022122001211011211012022011002220021002110001110021 1021101110002220020221212110002220102002222121221121112002 0110202001222222112212021211210110012110110200220002001002 0001111011001211021212111201010121202210101011111021102112 2111111212111210110120011111021111011111220121012121101022 202021211222120222002121210121210201100111222121101
P.VanRaden USDA
Hermanos enteros
Ningun alelo IBD
cov=0
Un alelo IBD
Cov=1/2Va
Ambos alelos IBD
Cov=V(a)
Padre Madre
J. P. Steibel MSU
Matriz de relacione basada en pedigri
Matriz de relaciones genomicas
Diferencia, SD<0.04 (Wang et al., 2012)
Implementación en evaluación genética Modelo “Single-Step”
• Calificación Final vacas Holando EEUU – 10,466,066 registros (1955-2009) – 9,100,106 animales en el pedigrí
• Genotipos de AIPL-USDA 38,416 SNPs
– 6,508 toros evaluados con hijas
Evaluación Genómica Multicaracter para Rasgos de Tipo (Tsuruta et al 2011)
• 18 rasgos de tipo
• 10 millones de animales Holando USA
• 17k animales genotipados
• Modelos multicaracter con selección genómica solo 2% mas de tiempo por iteración vs BLUP tradicional
Aplicaciones en otras especies
Nuevas variantes “single-step”
• Uso con Valores de cria de-regresados -Incrementos de la población de referencia (animales genotipados y no genotipados) – Pruebas de toros internacionales – Su et al 2012
• Posibilidad de “blending” con MBV de empresas
comerciales + animales con genotipos – Swan et al 2012
• Nuevos algoritmos – VanRaden 2012, Legarra & Ducroq 2012
• Convertir GEBV a efectos de SNP
• Estimar variancia de SNP
• Incorporar varianzas en matriz G
• Recalcultar GEBV e iterar
• Similar desarrollo para GBLUP en ISU (Sun et al., 2011, R. Fernando Lab)
“Single-Step” GWAS
1. D=I
2. G=ZDZ’/q
3. Compute a
4. u=DZ’/q G-1 a
5. di=2pi(1-pi)ui2
6. D=n D/tr(D)
7. Loop to 2
Resultados GWAS
Single-Step GWAS Heat Stress • Multiple-Trait Test-Day model heat tolerance
• ~ 90 millions records, ~ 9 millions pedigrees
• ~ 3,800 genotyped bulls
• Computing time
– Complete evaluation ~ 16 h
Milk yield no Heat stress Heat stress
Aguilar et al 2011 ADSA
Selección genómica en una etapa
• Mínima modificación de software de evaluación genética
• Creación de matriz de relaciones genómicas
• Implementación directa en modelos
– Multicaracter
– Efectos maternos
– Umbrales
– Regresiones aleatorias
Software – BGF90
• Implementado en programas BGF90 – UGA – Componentes de varianza (REMLF90, AIREMLF90,
GIBBSxF90.)
– Estimación de valores de cría (BLUPF90)
• Creación de matrices de relaciones genómicas – PreGSf90
– G usando diferentes opciones
– Uso de eficientes librerías
– Procesamiento en paralelo
http://nce.ads.uga.edu
Sumario
• Evaluación genómica en una sola etapa
– precisiones comparables a la de los métodos de múltiple etapas
– Integración simple a las evaluaciones genéticas.
– Simplicidad y derivación automática de pesos para las diversas fuentes de información
– Extensión directa a modelos multicaracter o complejos
Evaluaciones genéticas
Evaluaciones genéticas “tradicionales”
usan información fenotípica,
de pedigrí
e información genómica
para predecir valores de cría
de rasgos de relevancia económica
para la selección candidatos.
Muchas gracias por su atención [email protected]