selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/aguilar...

48

Upload: lamphuc

Post on 21-Sep-2018

220 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones
Page 2: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Selección genómica utilizando metodología “en una etapa”

Ignacio Aguilar Instituto Nacional de Investigación Agropecuaria

INIA Las Brujas, Uruguay

Page 3: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Selección genómica en una etapa

• Metodología desarrollada para implementar

evaluaciones genéticas incorporando toda la

información disponible:

– Registros fenotípicos

– Relaciones de pedigrí

– Información genómica: “SNP chips”

Page 4: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Valor de Cría: DEP

Mejora Genética Animal

Identificar animales con alto Mérito Genético

para los caracteres de interés, para ser usados

como progenitores de la siguiente

generación, de manera de maximizar el

mérito esperado de la progenie

Page 5: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Evaluaciones genéticas

Evaluaciones genéticas “tradicionales”

usan información fenotípica

y de pedigrí

para predecir valores de cría

de rasgos de relevancia económica

para la selección

Page 6: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Selección genómica

• Disponibilidad – Marcadores moleculares (SNP) que cubren todo

el genoma

– Plataformas para el genotipado a gran escala con costos rentables

• Desarrollo de metodología estadísticas y bioinformáticas: – Selección genómica – Meuwissen et al 2001

Page 7: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Beneficios selección genómica

• Incremento significativo de la ganancia genética

debido al incremento de la precisión de los

valores de cría a edades tempranas

• Mayores ganancias:

– rasgos medidos en un solo sexo

– Tamaño adulto

– Calidad de carne y canal

– Resistencia genética a enfermedades

Page 8: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Selección Genómica Industria lechera

Toro

Nacimiento 1 año 2 años 5 años 10 años

Selección DEP de padres

Nacimiento de

Hijas

Toro Probado Prueba de progenie

Hijo Probado Prueba de progenie

Selección Toro

Selección Hijos

Selección nietos

Selección Bisnietos

Fuente: H. Daetwyler

Page 9: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Estimación de valores de cría genómicos

• No todos los animales son genotipados

• Información fenotípica histórica

• Múltiples valores de cría

• Necesidad de combinar diferentes fuentes de información en un solo valor de cría

Page 10: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Uso de información genómica

• Disponibilidad de un sistema que combine

distintas fuentes de información:

– evaluaciones genéticas “tradicionales”

– datos genómicos

• “DEP mejorados”, “DEP Genómicos” etc.

Page 11: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Diferentes modelos propuestos • Incorporación de los datos genómicos en

en los modelos en varios pasos

– Asumiendo como caracteres correlacionados (Kachman 2008, MacNeil et al., 2010)

– Utilizando teoría de índices de selección (VanRaden et al., 2009, Johnston et al., 2010)

• Evaluación genética utilizando toda la información disponible: genotipos, fenotipos y genealogía (Aguilar et al., 2010)

Page 12: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Múltiples etapas en selección genómica

Registros ‘Y’

BLUP Pseudo Registros

VC De-regresados

BayesX GBLUP

etc

index PA*w2

SPA*w3 GVC*w1

Valores de Cría

SNPs

Pedigri

VanRaden et al., 2009

Page 13: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Holstein Association • Metodología usada en evaluaciones

genéticas de ganado lechero involucra varias etapas:

– Evaluación genética tradicional

– Extracción de pseudo-observaciones: Val. de cría de-

regresados

– Estimación de efectos de SNP: predicciones genómicas

– Combinación tradicional y predicciones genómicas

Page 14: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

• Estimación de valores de cría moleculares (MBV) por dos empresas comerciales (Ingenity, Pfizer) para 16 rasgos diferentes

– Igenity® Profile Angus

– Pfizer HD 50K for Angus

• Evaluación genética (AGI) que incorpora a los MBV como “fenotipos” correlacionados a los 16 rasgos evaluados

American Angus Association

Kachman 2008, MacNeil et al 2010

Page 15: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Múltiples etapas en selección genómica

Registros ‘Y’

BLUP Pseudo Registros

VC De-regresados

BayesX GBLUP

etc

index PA*w2

SPA*w3 GVC*w1

Valores de Cría

SNPs

Pedigri

VanRaden et al., 2009

Page 16: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Selección Genómica en Una Etapa

Registros ‘Y’

BLUP

Valores de Cría

Pedigri SNPs

Misztal et al., 2009, Legarra et al 2009, Aguilar et al., 2010

Page 17: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

X'X X'Z

Z'X Z'Z +a A-1

é

ëêê

ù

ûúú

b

u

é

ëêê

ù

ûúú

=X'y

Z'y

é

ë

êê

ù

û

úú

X'X X'Z

Z'X Z'Z +a H -1

é

ëêê

ù

ûúú

b

u

é

ëêê

ù

ûúú

=X'y

Z'y

é

ë

êê

ù

û

úú

• Evaluación Tradicional BLUP

• Evaluación Genómica Una Etapa

Es posible evaluación genomica en una etapa ?

Parentesco Valores de cría

Page 18: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Selección Genómica en Una Etapa

• Relaciones de parentesco basadas en el pedigrí combinada con matriz de relaciones genómicas (Misztal et al. 2009)

X'X X'Z

Z'X Z'Z +a H -1

é

ëêê

ù

ûúú

b

u

é

ëêê

ù

ûúú

=X'y

Z'y

é

ë

êê

ù

û

úú

H = A+ AL

A- matriz de relaciones tradicional basa en pedigri

AD - matriz con desviaciones debido a informacion genomica

Page 19: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

• H = Matriz de relaciones combinada

• A = Matriz de relaciones basadas en pedigrí

• G = Matriz de relaciones genómicas

Matriz de relaciones combinada Legarra et al., 2009

1 1 1

12 22 22 22 21 12 22 22

1

22 22 21 22

A A G A A A A A G AH A

G A A A G A

Page 20: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Inversa de la matriz de relaciones combinada

1 1 1

12 22 22 22 21 12 22 22

1

22 22 21 22

A A G A A A A A G AH A

G A A A G A

1 1

1 1

22

0 0

0

H A

G A Aguilar et al., 2010

Christensen & Lund 2010

X'X X'Z

Z'X Z'Z +a H -1

é

ëêê

ù

ûúú

b

u

é

ëêê

ù

ûúú

=X'y

Z'y

é

ë

êê

ù

û

úú

Uso Equaciones de modelos mixtos tradicionales

Page 21: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Modelo equivalente VanRanden et al 2009; Goddard, 2009; Habier el al 2007

y= m + Za+e, var(a) = Ds a

2

y= m +u+e, var(u) = Gsu

2, G= ZDZ '/ k

Modelo que estima efectos de los SNPs

Modelo que estima Valores de Cría

u= Za

a= DZ '(ZDZ ')-1u Stranden & Garrick, 2009

Simple conversión entre:

Valores de Cría y efectos de SNP

u= Za

Información genómica ≈ relaciones genómicas

Page 22: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

• Efectos de los SNPs se pueden estimar usando diferentes supuestos sobre la distribución

Estimación de valores de cría genómicos

Metodología Supuestos

BayesX LASSO PLS

Genes con efecto mayor Varianza variable por SNP Muchos SNP no tiene ningún efecto

Bayes BLUP

No existen genes con efecto mayor Varianza constante por SNP Todos los SNP tiene efectos

GBLUP Matriz de relaciones genomicas mismos supuestos que Bayes BLUP

Page 23: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Resultados asumiendo diferentes distribuciones para los efectos de SNPs

Metodo Correlacion promedio varios

caracteres

Bayes BLUP 0.589

Bayes A 0.578

Bayes C 0.597

LASSO 0.595

SVR 0.587

GBLUP 0.588

PLS 0.592

Verbyla et al., 2009

Page 24: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Matriz de relaciones genómicas • Selección genómica ‘funciona’, en cierto modo, debido a

que la información molecular (SNPs) estima las relaciones de parentesco entre animales

• Matriz de relaciones genómica (‘observada’) mas precisa que

• Matriz de relaciones basada en pedigrí (‘promedio’)

• Matriz de relaciones genómicas utiliza desvíos debidos al muestreo Mendeliano

Page 25: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones
Page 26: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones
Page 27: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones
Page 28: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Genotipo de “Elevation” Cromosoma 1

1000111220020012111011112111101111001121100020122002220111 1202101200211122110021112001111001011011010220011002201101 1200201101020222121122102010011100011220221222112021120120 2010020220200002110001120201122111211102201111000021220200 0221012020002211220111012100111211102112110020102100022000 2201000201100002202211022112101121110122220012112122200200 0200202020122211002222222002212111121002111120011011101120 0202220001112011010211121211102022100211201211001111102111 2110211122000101101110202200221110102011121111011202102102 1211011022122001211011211012022011002220021002110001110021 1021101110002220020221212110002220102002222121221121112002 0110202001222222112212021211210110012110110200220002001002 0001111011001211021212111201010121202210101011111021102112 2111111212111210110120011111021111011111220121012121101022 202021211222120222002121210121210201100111222121101

P.VanRaden USDA

Page 29: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones
Page 30: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones
Page 31: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones
Page 32: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Hermanos enteros

Ningun alelo IBD

cov=0

Un alelo IBD

Cov=1/2Va

Ambos alelos IBD

Cov=V(a)

Padre Madre

J. P. Steibel MSU

Page 33: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Matriz de relacione basada en pedigri

Page 34: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Matriz de relaciones genomicas

Page 35: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Diferencia, SD<0.04 (Wang et al., 2012)

Page 36: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Implementación en evaluación genética Modelo “Single-Step”

• Calificación Final vacas Holando EEUU – 10,466,066 registros (1955-2009) – 9,100,106 animales en el pedigrí

• Genotipos de AIPL-USDA 38,416 SNPs

– 6,508 toros evaluados con hijas

Page 37: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Evaluación Genómica Multicaracter para Rasgos de Tipo (Tsuruta et al 2011)

• 18 rasgos de tipo

• 10 millones de animales Holando USA

• 17k animales genotipados

• Modelos multicaracter con selección genómica solo 2% mas de tiempo por iteración vs BLUP tradicional

Page 38: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Aplicaciones en otras especies

Page 39: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Nuevas variantes “single-step”

• Uso con Valores de cria de-regresados -Incrementos de la población de referencia (animales genotipados y no genotipados) – Pruebas de toros internacionales – Su et al 2012

• Posibilidad de “blending” con MBV de empresas

comerciales + animales con genotipos – Swan et al 2012

• Nuevos algoritmos – VanRaden 2012, Legarra & Ducroq 2012

Page 40: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

• Convertir GEBV a efectos de SNP

• Estimar variancia de SNP

• Incorporar varianzas en matriz G

• Recalcultar GEBV e iterar

• Similar desarrollo para GBLUP en ISU (Sun et al., 2011, R. Fernando Lab)

“Single-Step” GWAS

1. D=I

2. G=ZDZ’/q

3. Compute a

4. u=DZ’/q G-1 a

5. di=2pi(1-pi)ui2

6. D=n D/tr(D)

7. Loop to 2

Page 41: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Resultados GWAS

Page 42: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Single-Step GWAS Heat Stress • Multiple-Trait Test-Day model heat tolerance

• ~ 90 millions records, ~ 9 millions pedigrees

• ~ 3,800 genotyped bulls

• Computing time

– Complete evaluation ~ 16 h

Milk yield no Heat stress Heat stress

Aguilar et al 2011 ADSA

Page 43: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Selección genómica en una etapa

• Mínima modificación de software de evaluación genética

• Creación de matriz de relaciones genómicas

• Implementación directa en modelos

– Multicaracter

– Efectos maternos

– Umbrales

– Regresiones aleatorias

Page 44: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Software – BGF90

• Implementado en programas BGF90 – UGA – Componentes de varianza (REMLF90, AIREMLF90,

GIBBSxF90.)

– Estimación de valores de cría (BLUPF90)

• Creación de matrices de relaciones genómicas – PreGSf90

– G usando diferentes opciones

– Uso de eficientes librerías

– Procesamiento en paralelo

Page 45: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

http://nce.ads.uga.edu

Page 46: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Sumario

• Evaluación genómica en una sola etapa

– precisiones comparables a la de los métodos de múltiple etapas

– Integración simple a las evaluaciones genéticas.

– Simplicidad y derivación automática de pesos para las diversas fuentes de información

– Extensión directa a modelos multicaracter o complejos

Page 47: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Evaluaciones genéticas

Evaluaciones genéticas “tradicionales”

usan información fenotípica,

de pedigrí

e información genómica

para predecir valores de cría

de rasgos de relevancia económica

para la selección candidatos.

Page 48: Selección genómica utilizando - labegen.orglabegen.org/menu/principal/arquivos_palestras/Aguilar TicksWS.pdf · •H = Matriz de relaciones combinada •A = Matriz de relaciones

Muchas gracias por su atención [email protected]