Download - Et t bl i lEstructura poblacional - UPV - UAB - CIHEAM

E t t bl i lEstructura poblacional

Análisis de la diversidad

égenética

k h

∑ ∑= =

−==i i

kiSSS pHkHH1 1

21 ,/

∑∑ =−=k

kii

h

iT pppH 21 ,

= frecuencia del alelo k en la raza ikip== si 11

kip ,

n = número de poblaciones

h ú d l l

H = Heterocigosidad esperada promediada sobre

h = número de alelos

HS = Heterocigosidad esperada promediada sobre poblacionesHT = Heterocigosidad esperada si todas lasHT Heterocigosidad esperada si todas las poblaciones se aparearan al azar

∑ ∑k h

2∑ ∑= =

−==i i

kiSSS pHkHH1 1

21 ,/

∑∑ =−=k

kii

h

iiT pppH

11

21 ,== si 11

= frecuencia del alelo k en la raza ikip frecuencia del alelo k en la raza ikip ,


∑ ∑∑ −==− kjkiST ppDHH 22 )(1 ∑ ∑∑

i kkjki

jST pp

n ,,2 )(2

D Di t i í i d N i=D Distancia mínima de Nei

Consideremos tres poblacionesConsideremos tres poblaciones

Población 1 A1A1 A1A2 A1A2

Población 2 A1A1 A1A1 A2A2

Población 3 A1A3 A3A3 A3A3Población 3 A1A3 A3A3 A3A3

Pob H p1 p2 p3 HS DPob HI p1 p2 p3 HS D

1 0 67 0 67 0 33 0 0 44 0 181 0.67 0.67 0.33 0 0.44 0.18

2 0 0.67 0.33 0 0.44 0.18

3 0.33 0.17 0. 0.83 0.28 0.350.230.390.33 0.50 0.22 0.28 .. 9. . . .

HT=0.62H H D

HT 0.6HT=HS+D

Distancia mínima de Nei entre poblaciones

0 0 0 53 0 181

1 2 3

0 0 0.53 0.18

0 0 0 53 0 18

1

2 0 0 0.53 0.182

0.53 0.53 0 0.353

0 230.23

21∑ −=i

ii ppD 2)'(21

i

Estadísticos F de Wright

∑ ∑−==k h

iSSS pHkHH 21/

∑∑

∑ ∑= =

kh

i isiSSS pHkHH

2

1 11/ , kip ,


h = número de alelos∑∑==

=−=s

siii

iT pppH11

21 ,h número de alelos

∑=k

iiI kHH

1/

=i 1

HI = heterocigosidad observada promediada sobre poblaciones

H heterocigosidad esperada promediada sobre poblacionesHS = heterocigosidad esperada promediada sobre poblaciones

HT = heterocigosidad esperada si las poblaciones se juntaran y se aparearan al azar

E t dí ti F d W i htEstadísticos F de Wright

T

STIS H

HHF −=

ITIT

HHF −=

T

STST H

HHF −= T

IT HF

H h t i id d b d di d b bl iHI = heterocigosidad observada promediada sobre poblaciones

HS = heterocigosidad esperada promediada sobre poblaciones

H = heterocigosidad esperada si las poblaciones se juntaran y se aparearan al azarHT = heterocigosidad esperada si las poblaciones se juntaran y se aparearan al azar

)1)(1()1( STISIT FFF −−=−SII HHH= ))(()( STISIT

TST HHH=

Análisis de la diversidad éti di t di t i genética mediante distancias

genéticasgenéticas

Las distancias genéticas son una medida de la diferenciación entre poblaciones

Algunos tipos de distanciasSi xi e yi son las frecuencias del alelo i en las poblaciones x e y i yi p y

Distancia mínima de Nei

1∑ −=i

iim yxD 2)(21

⎟⎞

⎜⎛ ∑ yx

Distancia estándar de Nei

⎟⎟⎟

⎠

⎞

⎜⎜⎜

⎝

⎛−=

∑ ∑

∑

i iii

iii

S yx

yxD

22ln

⎠⎝ i i

The chord distance of Cavalli-Sforza (Dc)

( ) ⎟⎠

⎞⎜⎝

⎛−∑

iiic yxπ=D 12/2

Distancia de Nei

Distancia de Reynolds

∑−=i

iiA yxD 1

Distancia de Reynolds

∑=

−= mi

ii DyxD

)(12

∑∑ −=

−=

iii

iii

R yxyxD

112

Dist i d L tt

= mL

DD 222

Distancia de Latter

∑ ∑+i i

iiL yx

D 22

LA DIVERGENCIA ENTRE POBLACIONES SE DEBE A: Deriva, Mi ió M ió S l ióMigración, Mutación y Selección

La mayor parte de las distancias asumen un modelo de deriva y mutación

-La distancia estándar de Nei es preferible para marcadores genéticos con bajo nivel de mutación (proteinas), y poblaciones que se genéticos con bajo nivel de mutación (proteinas), y poblaciones que se hayan separado durante mucho tiempo (especies). El valor de la distancia es lineal con el tiempo de divergencia.

Las distancias de Goldstein cuerda y Nei son apropiadas para el uso -Las distancias de Goldstein, cuerda y Nei son apropiadas para el uso de microsatélites y poblaciones que se hayan separado durante mucho tiempo (especies o razas muy alejadas). El valor de la distancia no es lineal con el tiempo de divergencialineal con el tiempo de divergencia

-La distancias minima de Nei, Reynolds y Latter son útiles para poblaciones próximas (razas) en las que sólo se asume deriva

ET de la distancia (d)

dist markers x alleles

no.ind.

m marcadores 25 50 100 (con k alelos) y n animales

por raza.05 25 .025 .020 .017

50 .018 .014 .012100 013 010 008

SE(dist) = (2 / k m )½ ( d + 1 / n )

100 .013 .010 .008

10 25 040 034 031.10 25 .040 .034 .03150 .028 .024 .022

100 .020 .017 .016

Se requiere un número de marcadores bastante altoSe requiere un número de marcadores bastante alto(FAO recomienda unos 25 marcadores en 25 individuos)

Árboles:

de distancias: tratan simplemente de representar de forma mp m p f mgráfica matrices de distancias

filogenéticos: tratan de reconstruir la historia filogenética a partir de la matriz de distanciasfilogenética a partir de la matriz de distancias

Tipos de árboles:

i d bl i h di id h enraizados: para poblaciones que han divergido hace mucho tiempo

no enraizados: para poblaciones que han divergido p p q ghace poco tiempo

Métodos para construir árboles:

Parsimonia: se elige el árbol que minimiza el número de pasos o Parsimonia: se elige el árbol que minimiza el número de pasos o transformaciones que explican los datos

UPGMA (Unweighted Pair Group Method with Arithmetic mean)

NJ (Neighbour-Joining): superior si las tasas de evlucion son distintas en las distintas ramas

La fiabilidad suele establecerse por bootstrapping

ML: máxima verosimilitud

Métodos que asumen un modelo matemático:

Métodos bayesianos

Para establecer la fiabilidad de un árbol tenemos que utilizar distribuciones muestrales de los propios datos

En la técnica del bootstrapping utilizamos los datos para producir los errores típicos de la longitud de las ramas tomando muestras los errores típicos de la longitud de las ramas tomando muestras repetidas de los datos y construyendo varios árboles. El valor encada rama da la proporción de muestras en las que aparece un determinado nodo

8 chicken populations

Experimental line (J)Lohmann selected Leghorn (LSL)Lohmann selected Leghorn (LSL)Finnish White Leghorn (M)3 Finnish Landrace populations FJ, FK, FS3 Finnish Landrace populations FJ, FK, FSRoss broiler (BRO)Rhode Island Red (RIR)

Vanhala et al Poultry Sci 77, 783-790

Genetic distances between chicken lines

neighbour-joining method1000 resamples with bootstrapping

Vanhala et al Poultry Sci 77, 783-790

Linajes maternosLinajes maternos

El mtDNA es apropiada para análisis de la diferenciación de poblacionesp p p pa largo plazo• acumula mutaciones, sin recombinación

l d i l d l DNA l D l • la tasa de mutation es mayor que el del DNA nuclear, esp. D-loop que es muy variable y se utiliza muy comumente

• se hereda de forma materna (linajes maternos)• se hereda de forma materna (linajes maternos)

Linajes paternos

L d d l Y t di li j tLos marcadores del cromosoma Y se usan para estudiar linajes paternos

Tree of mtDNA types in North-European sheep populations

etäisy y s v astaa 4 mutaat iotadistance corresponding to 4 mutations

yp p p p p

tree constructed with maximum parsimony principle or with the smallest number ofDNA base changes

• European typeEuropean type

° Asian type

Se ha sugerido priorizar razas o poblaciones a

partir de las distancias genéticas

Sin embargo, esto conllevaría priorizar poblaciones

más consanguíneas

(Ds)(Ds)

Análisis de la diversidad éti di t áli i d genética mediante análisis de

“clusters”clusters

Inferencia sobre la estructura de una población mediante el análisis de población mediante el análisis de

“clusters”Se han desarrollado métodos para estimar la Se han desarrollado métodos para estimar la

estructura oculta de una población (Pritchard et al. 2000)

t i “ l t ” éti ti d j t d construir “clusters” genéticos a partir de un conjunto de genotipos individuales sin información a priori sobre la subdivisión de la población

a) separar un conjunto de individuos en varias subpoblaciones aunque no se conozca esta subdivisión de antemano

b) estudiar la correspondencia entre los “clusters” genéticos inferidos y las subplaciones predefinidas

estimar, para cada individuo, la fracción de su genoma que puede asignarse a cada “cluster”

D t hDatos humanos:1056 humanos pertenecientes a 52 poblaciones377 microsatélites

Kalash(N = 25)(N = 25)

América (N = 108)

Oceanía (N = 39)

Asia Oriental (N = 241)

Centro SurCentro-SurAsia (N = 210)Oriente Medio(N = 178)Europa (N = 161)

K = 5STRUCTURE

K = 5MPM

K = 5 K = 5MPM

K = 6STRUCTURE

K = 6MPM

K = 6K= 2STRUCTURE

K = 3STRUCTURE

K = 4STRUCTURE

K= 2 K = 3 K = 4

Europa (N = 161)

África (N = 119)

S UC U MPMMPM STRUCTURE MPMSTRUCTUREMPM

STRUCTUREMPM

STRUCTUREMPMMPM MPM MPM

Rosenberg et al. (2001): si algunas razas se separan mas fácilmente en clusters indicaría la presencia de combinaciones genética multilocus distintivas

El número de loci que se requieren para establecer un clustering correcto serviríaestablecer un clustering correcto serviría para identificar las poblaciones que son genéticamente más distintivasgenéticamente más distintivas

Resultados obtenidos al clasificar 213 cerdos (173 Ibéricos y 40 Duroc) en 2 clusters con el programa Ibéricos y 40 Duroc) en 2 clusters con el programa

STRUCTURE (Pritchard et al., 2000)

ClusterEstirpe 1 2Torbiscal 0,001 0,999Torbiscal 0,001 0,999Guadyerbas 0,001 0,999R ti t 0 011 0 989Retinto 0,011 0,989Entrepelado 0,050 0,950Lampiño 0,010 0,990Duroc 0 997 0 003Duroc 0,997 0,003

Resultados obtenidos al clasificar 173 cerdos Ibéricos en 5 esu tados o ten dos a c as f car 73 cerdos ér cos en 5 “clusters” con el programa STRUCTURE program (Pritchard

et al., 2000)Cl

EstirpesCluster

1 2 3 4 5pTorbiscal 0,985 0,006 0,003 0,004 0,002Guadyerbas 0 002 0 994 0 001 0 001 0 001Guadyerbas 0,002 0,994 0,001 0,001 0,001Retinto 0,084 0,007 0,451 0,449 0,009Entrepelado 0,030 0,016 0,420 0,527 0,008Lampiño 0 024 0 081 0 223 0 322 0 351Lampiño 0,024 0,081 0,223 0,322 0,351

Torbiscal y Guadyerbas están mejor definidas genéticamente que Torbiscal y Guadyerbas están mejor definidas genéticamente que otras estirpes de ibérico

Thirty microsatellite markers were analysed in 1426 goats from 45 traditional or rarebreeds in 15 E ropean and Middle Eastern co ntries (ECONOGENE)breeds in 15 European and Middle Eastern countries (ECONOGENE)

R f•Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Gandini, G.C., Villa, E., 2003. Analysis of the cultural value of local livestock breeds: a methodology. J.Anim. Breed. Genet.,120: 1-11.•Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31.

References• Oldenbroek, K. 2007. Utilization and conservation of farm animal genetic resources.

Wageningen Academic Publishers.• Caballero, A., Toro, M.A., 2002. Analysis of genetic diversity for the management of

e ed bdi ided l ti C e Ge et 3 289 299conserved subdivided populations. Conserv. Genet. 3, 289–299.• Fabuel, E., Barragán, C., Silió, L., Rodríguez, M.C., Toro, M.A., 2004. Analysis of

genetic diversity and conservation priorities in Iberian pigs based on microsatellite markers. Heredity 93, 104–113.microsatellite markers. Heredity 93, 104 113.

• Toro, M.A., Caballero, A., 2005. Characterisation and conservation of genetic diversity in subdivided populations. Phil. Trans. Roy. Soc. Series B, 360, 1367-1378.

Toro M., Fernandez J. & Caballero A. (2008) Molecular characterization of breeds and its use in conservation. Livestock Science, Production Science, 120: 174-195.4

Download - Et t bl i lEstructura poblacional - UPV - UAB - CIHEAM

Top Related