E t t bl i lEstructura poblacional
Análisis de la diversidad
égenética
k h
∑ ∑= =
−==i i
kiSSS pHkHH1 1
21 ,/
∑∑ =−=k
kii
h
iT pppH 21 ,
= frecuencia del alelo k en la raza ikip== si 11
kip ,
n = número de poblaciones
h ú d l l
H = Heterocigosidad esperada promediada sobre
h = número de alelos
HS = Heterocigosidad esperada promediada sobre poblacionesHT = Heterocigosidad esperada si todas lasHT Heterocigosidad esperada si todas las poblaciones se aparearan al azar
∑ ∑k h
2∑ ∑= =
−==i i
kiSSS pHkHH1 1
21 ,/
∑∑ =−=k
kii
h
iiT pppH
11
21 ,== si 11
= frecuencia del alelo k en la raza ikip frecuencia del alelo k en la raza ikip ,
n = número de poblaciones
∑ ∑∑ −==− kjkiST ppDHH 22 )(1 ∑ ∑∑
i kkjki
jST pp
n ,,2 )(2
D Di t i í i d N i=D Distancia mínima de Nei
Consideremos tres poblacionesConsideremos tres poblaciones
Población 1 A1A1 A1A2 A1A2
Población 2 A1A1 A1A1 A2A2
Población 3 A1A3 A3A3 A3A3Población 3 A1A3 A3A3 A3A3
Pob H p1 p2 p3 HS DPob HI p1 p2 p3 HS D
1 0 67 0 67 0 33 0 0 44 0 181 0.67 0.67 0.33 0 0.44 0.18
2 0 0.67 0.33 0 0.44 0.18
3 0.33 0.17 0. 0.83 0.28 0.350.230.390.33 0.50 0.22 0.28 .. 9. . . .
HT=0.62H H D
HT 0.6HT=HS+D
Distancia mínima de Nei entre poblaciones
0 0 0 53 0 181
1 2 3
0 0 0.53 0.18
0 0 0 53 0 18
1
2 0 0 0.53 0.182
0.53 0.53 0 0.353
0 230.23
21∑ −=i
ii ppD 2)'(21
i
Estadísticos F de Wright
∑ ∑−==k h
iSSS pHkHH 21/
∑∑
∑ ∑= =
kh
i isiSSS pHkHH
2
1 11/ , kip ,
n = número de poblaciones
h = número de alelos∑∑==
=−=s
siii
iT pppH11
21 ,h número de alelos
∑=k
iiI kHH
1/
=i 1
HI = heterocigosidad observada promediada sobre poblaciones
H heterocigosidad esperada promediada sobre poblacionesHS = heterocigosidad esperada promediada sobre poblaciones
HT = heterocigosidad esperada si las poblaciones se juntaran y se aparearan al azar
E t dí ti F d W i htEstadísticos F de Wright
T
STIS H
HHF −=
ITIT
HHF −=
T
STST H
HHF −= T
IT HF
H h t i id d b d di d b bl iHI = heterocigosidad observada promediada sobre poblaciones
HS = heterocigosidad esperada promediada sobre poblaciones
H = heterocigosidad esperada si las poblaciones se juntaran y se aparearan al azarHT = heterocigosidad esperada si las poblaciones se juntaran y se aparearan al azar
)1)(1()1( STISIT FFF −−=−SII HHH= ))(()( STISIT
TST HHH=
Análisis de la diversidad éti di t di t i genética mediante distancias
genéticasgenéticas
Las distancias genéticas son una medida de la diferenciación entre poblaciones
Algunos tipos de distanciasSi xi e yi son las frecuencias del alelo i en las poblaciones x e y i yi p y
Distancia mínima de Nei
1∑ −=i
iim yxD 2)(21
⎟⎞
⎜⎛ ∑ yx
Distancia estándar de Nei
⎟⎟⎟
⎠
⎞
⎜⎜⎜
⎝
⎛−=
∑ ∑
∑
i iii
iii
S yx
yxD
22ln
⎠⎝ i i
The chord distance of Cavalli-Sforza (Dc)
( ) ⎟⎠
⎞⎜⎝
⎛−∑
iiic yxπ=D 12/2
Distancia de Nei
Distancia de Reynolds
∑−=i
iiA yxD 1
Distancia de Reynolds
∑=
−= mi
ii DyxD
)(12
∑∑ −=
−=
iii
iii
R yxyxD
112
Dist i d L tt
= mL
DD 222
Distancia de Latter
∑ ∑+i i
iiL yx
D 22
LA DIVERGENCIA ENTRE POBLACIONES SE DEBE A: Deriva, Mi ió M ió S l ióMigración, Mutación y Selección
La mayor parte de las distancias asumen un modelo de deriva y mutación
-La distancia estándar de Nei es preferible para marcadores genéticos con bajo nivel de mutación (proteinas), y poblaciones que se genéticos con bajo nivel de mutación (proteinas), y poblaciones que se hayan separado durante mucho tiempo (especies). El valor de la distancia es lineal con el tiempo de divergencia.
Las distancias de Goldstein cuerda y Nei son apropiadas para el uso -Las distancias de Goldstein, cuerda y Nei son apropiadas para el uso de microsatélites y poblaciones que se hayan separado durante mucho tiempo (especies o razas muy alejadas). El valor de la distancia no es lineal con el tiempo de divergencialineal con el tiempo de divergencia
-La distancias minima de Nei, Reynolds y Latter son útiles para poblaciones próximas (razas) en las que sólo se asume deriva
ET de la distancia (d)
dist markers x alleles
no.ind.
m marcadores 25 50 100 (con k alelos) y n animales
por raza.05 25 .025 .020 .017
50 .018 .014 .012100 013 010 008
SE(dist) = (2 / k m )½ ( d + 1 / n )
100 .013 .010 .008
10 25 040 034 031.10 25 .040 .034 .03150 .028 .024 .022
100 .020 .017 .016
Se requiere un número de marcadores bastante altoSe requiere un número de marcadores bastante alto(FAO recomienda unos 25 marcadores en 25 individuos)
Árboles:
de distancias: tratan simplemente de representar de forma mp m p f mgráfica matrices de distancias
filogenéticos: tratan de reconstruir la historia filogenética a partir de la matriz de distanciasfilogenética a partir de la matriz de distancias
Tipos de árboles:
i d bl i h di id h enraizados: para poblaciones que han divergido hace mucho tiempo
no enraizados: para poblaciones que han divergido p p q ghace poco tiempo
Métodos para construir árboles:
Parsimonia: se elige el árbol que minimiza el número de pasos o Parsimonia: se elige el árbol que minimiza el número de pasos o transformaciones que explican los datos
UPGMA (Unweighted Pair Group Method with Arithmetic mean)
NJ (Neighbour-Joining): superior si las tasas de evlucion son distintas en las distintas ramas
La fiabilidad suele establecerse por bootstrapping
ML: máxima verosimilitud
Métodos que asumen un modelo matemático:
Métodos bayesianos
Para establecer la fiabilidad de un árbol tenemos que utilizar distribuciones muestrales de los propios datos
En la técnica del bootstrapping utilizamos los datos para producir los errores típicos de la longitud de las ramas tomando muestras los errores típicos de la longitud de las ramas tomando muestras repetidas de los datos y construyendo varios árboles. El valor encada rama da la proporción de muestras en las que aparece un determinado nodo
8 chicken populations
Experimental line (J)Lohmann selected Leghorn (LSL)Lohmann selected Leghorn (LSL)Finnish White Leghorn (M)3 Finnish Landrace populations FJ, FK, FS3 Finnish Landrace populations FJ, FK, FSRoss broiler (BRO)Rhode Island Red (RIR)
Vanhala et al Poultry Sci 77, 783-790
Genetic distances between chicken lines
neighbour-joining method1000 resamples with bootstrapping
Vanhala et al Poultry Sci 77, 783-790
Linajes maternosLinajes maternos
El mtDNA es apropiada para análisis de la diferenciación de poblacionesp p p pa largo plazo• acumula mutaciones, sin recombinación
l d i l d l DNA l D l • la tasa de mutation es mayor que el del DNA nuclear, esp. D-loop que es muy variable y se utiliza muy comumente
• se hereda de forma materna (linajes maternos)• se hereda de forma materna (linajes maternos)
Linajes paternos
L d d l Y t di li j tLos marcadores del cromosoma Y se usan para estudiar linajes paternos
Tree of mtDNA types in North-European sheep populations
etäisy y s v astaa 4 mutaat iotadistance corresponding to 4 mutations
yp p p p p
tree constructed with maximum parsimony principle or with the smallest number ofDNA base changes
• European typeEuropean type
° Asian type
Se ha sugerido priorizar razas o poblaciones a
partir de las distancias genéticas
Sin embargo, esto conllevaría priorizar poblaciones
más consanguíneas
(Ds)(Ds)
Análisis de la diversidad éti di t áli i d genética mediante análisis de
“clusters”clusters
Inferencia sobre la estructura de una población mediante el análisis de población mediante el análisis de
“clusters”Se han desarrollado métodos para estimar la Se han desarrollado métodos para estimar la
estructura oculta de una población (Pritchard et al. 2000)
t i “ l t ” éti ti d j t d construir “clusters” genéticos a partir de un conjunto de genotipos individuales sin información a priori sobre la subdivisión de la población
a) separar un conjunto de individuos en varias subpoblaciones aunque no se conozca esta subdivisión de antemano
b) estudiar la correspondencia entre los “clusters” genéticos inferidos y las subplaciones predefinidas
estimar, para cada individuo, la fracción de su genoma que puede asignarse a cada “cluster”
D t hDatos humanos:1056 humanos pertenecientes a 52 poblaciones377 microsatélites
Kalash(N = 25)(N = 25)
América (N = 108)
Oceanía (N = 39)
Asia Oriental (N = 241)
Centro SurCentro-SurAsia (N = 210)Oriente Medio(N = 178)Europa (N = 161)
K = 5STRUCTURE
K = 5MPM
K = 5 K = 5MPM
K = 6STRUCTURE
K = 6MPM
K = 6K= 2STRUCTURE
K = 3STRUCTURE
K = 4STRUCTURE
K= 2 K = 3 K = 4
Europa (N = 161)
África (N = 119)
S UC U MPMMPM STRUCTURE MPMSTRUCTUREMPM
STRUCTUREMPM
STRUCTUREMPMMPM MPM MPM
Rosenberg et al. (2001): si algunas razas se separan mas fácilmente en clusters indicaría la presencia de combinaciones genética multilocus distintivas
El número de loci que se requieren para establecer un clustering correcto serviríaestablecer un clustering correcto serviría para identificar las poblaciones que son genéticamente más distintivasgenéticamente más distintivas
Resultados obtenidos al clasificar 213 cerdos (173 Ibéricos y 40 Duroc) en 2 clusters con el programa Ibéricos y 40 Duroc) en 2 clusters con el programa
STRUCTURE (Pritchard et al., 2000)
ClusterEstirpe 1 2Torbiscal 0,001 0,999Torbiscal 0,001 0,999Guadyerbas 0,001 0,999R ti t 0 011 0 989Retinto 0,011 0,989Entrepelado 0,050 0,950Lampiño 0,010 0,990Duroc 0 997 0 003Duroc 0,997 0,003
Resultados obtenidos al clasificar 173 cerdos Ibéricos en 5 esu tados o ten dos a c as f car 73 cerdos ér cos en 5 “clusters” con el programa STRUCTURE program (Pritchard
et al., 2000)Cl
EstirpesCluster
1 2 3 4 5pTorbiscal 0,985 0,006 0,003 0,004 0,002Guadyerbas 0 002 0 994 0 001 0 001 0 001Guadyerbas 0,002 0,994 0,001 0,001 0,001Retinto 0,084 0,007 0,451 0,449 0,009Entrepelado 0,030 0,016 0,420 0,527 0,008Lampiño 0 024 0 081 0 223 0 322 0 351Lampiño 0,024 0,081 0,223 0,322 0,351
Torbiscal y Guadyerbas están mejor definidas genéticamente que Torbiscal y Guadyerbas están mejor definidas genéticamente que otras estirpes de ibérico
Thirty microsatellite markers were analysed in 1426 goats from 45 traditional or rarebreeds in 15 E ropean and Middle Eastern co ntries (ECONOGENE)breeds in 15 European and Middle Eastern countries (ECONOGENE)
R f•Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31. •Gandini, G.C., Villa, E., 2003. Analysis of the cultural value of local livestock breeds: a methodology. J.Anim. Breed. Genet.,120: 1-11.•Groeneveld, L.F. et al. Genetic diversity in farm animals – a review. Animal Genetics, 41 (Suppl. 1), 6–31.
References• Oldenbroek, K. 2007. Utilization and conservation of farm animal genetic resources.
Wageningen Academic Publishers.• Caballero, A., Toro, M.A., 2002. Analysis of genetic diversity for the management of
e ed bdi ided l ti C e Ge et 3 289 299conserved subdivided populations. Conserv. Genet. 3, 289–299.• Fabuel, E., Barragán, C., Silió, L., Rodríguez, M.C., Toro, M.A., 2004. Analysis of
genetic diversity and conservation priorities in Iberian pigs based on microsatellite markers. Heredity 93, 104–113.microsatellite markers. Heredity 93, 104 113.
• Toro, M.A., Caballero, A., 2005. Characterisation and conservation of genetic diversity in subdivided populations. Phil. Trans. Roy. Soc. Series B, 360, 1367-1378.
Toro M., Fernandez J. & Caballero A. (2008) Molecular characterization of breeds and its use in conservation. Livestock Science, Production Science, 120: 174-195.4