APLICACIÓN DE MODELOS MIXTOS
PARA EL ANÁLISIS ESPACIAL DE
ENSAYOS GENÉTICOS DE PINO
MARÍTIMO (P INUS PINASTER AIT.) Y
SUS IMPLICACIONES EN LA
MEJORA GENÉTICA DE LA ESPECIE
POR QUE ES NECESARIO
EL ANÁLISIS ESPACIAL?
El análisis de ensayos genéticos forestales mediantes técnicas estadísticas convencionales, esta fundamentado en supuestos que los datos deben de cumplir y uno de ellos es la independencia de las observaciones entre si.
Heterogeneidad espacial
Auto-correlación de las variables
Conduce a análisis y
estimaciones incorrectas Por que se
Incumple este supuesto?
2
Dutkowski, G. W., J. Costa, et al. (2002)
EFECTO DE LA HETEROGENEIDAD
ESPACIAL EN ENSAYOS GENETICOS
FORESTALES
Ensayos genéticos forestales presentan
condiciones de heterogeneidad
espacial
• Variación Continua
• Variación Discontinua
• Variación aleatoria
Diseño experimental busca controlar
condiciones ambientales
• Aleatorización
• Replicación
• Subdivisión del área
Pero los diseños son superados por las
características intrínsecas
• Ensayos internamente heterogéneos
• Incremento varianza residual
Como resultado se reduce la potencia y precisión de los
análisis aumentando GxE
3
PRINCIPALES CAUSAS DE LA
HETEROGENEIDAD ESPACIAL
La estructura espacial no aleatoria afecta el desarrollo y comportamiento de las plantas del ensayo
Auto correlaciones
positivas: Gradientes
Auto correlaciones
negativas: Competencia
Continua
Discontinua
Aleatoria
Patrones similares en el suelo subyacente y
efectos micro climáticos
Efectos de cultivo y de medición
heterogeneidad microambiental
Valores en posiciones vecinas tienden a ser más distintos de lo esperado bajo distribuciones aleatorias
4
Variabilidad espacial
IMPACTO DE LA AUTOCORRELACIÓN
ESPACIAL SOBRE LOS ANÁLISIS
•Incremento de varianza del error experimental dificulta la detección de diferencias entre tratamientos.
•Aumenta la probabilidad de cometer un error de tipo II, aceptar la hipótesis nula (Ho: sin diferencias entre tratamientos) siendo falsa
Significación de los efectos del modelo
Proporción explicada por cada factor
•Disminución relativa de la proporción de la variación total explicada por los factores del modelo.
•Muchas decisiones se basan en parámetros genéticos a partir de varianzas
Estimación de los efectos del modelo
•Reparto aleatorio provoca que ciertos tratamientos se sitúen siempre en zonas favorecidas (o desfavorecidas)
• Provoca sobre estimaciones o sub estimaciones.
Comparación entre tratamientos
•Aumento de los errores estándar de la estimación de los efectos del modelo
•A mayores errores estándar, más difícil resulta detectar diferencias significativas entre tratamientos
1
2
3
4 Dutkowski, G. W., J. Costa, et al. (2002).
5
ANÁLISIS ESPACIAL +
MODELOS MIXTOS EN QUE CONSISTE?
Descomponer la variación del error del modelo en un componente espacial y en un error aleatorio espacialmente independiente. Esta descomposición permite limpiar (eliminar) de los datos la autocorrelación espacial.
descomposición del residuo e:
e= +
y se refieren a los residuos espacialmente correlacionados y residuos aleatorios
β y µ vectores de los efectos fijos y aleatorios
X y Z son las matrices de incidencia que relacionan las observaciones a los efectos del modelo
Proceso autorregresivo de primer orden
(AR1 x AR1)
Henderson (1984)
Gilmour et al., (1997)
soluciones de los efectos fijos y aleatorios
R es la matriz de varianza covarianza de los residuos
G es la suma directa de las matrices de varianza-covarianza de cada uno de los efectos aleatorios
(AR) (MA) (ARMA) LIN EXP GAUSS
6
PROCEDIMIENTO PARA EL ANÁLISIS DE
DATOS AUTOCORRELACIONADOS
Datos originales
Análisis preliminar
Análisis grafico de los residuos
Imagen Residuos
Variogramas empíricos
Determinación modelo
Variación Local
Variación Global
Tendencia lineal fija en filas y
columnas
Estructura de correlación AR1
ó AR2
𝐷𝑒𝑣𝑖𝑎𝑛𝑐𝑒 = −2𝑥𝐿𝑜𝑔 − 𝐿𝑖𝑘𝑒𝑙𝑖ℎ𝑜𝑜𝑑 𝐴𝐼𝐶 = −2𝑙𝑜𝑑 + 2𝑝
Comparación modelos Elección modelo
mayor grado de ajuste y eficiencia
Diagnostico
7
EL VARIOGRAMA Y SU
IMPORTANCIA
El semivariograma es una grafico de la semivarianza contra la distancia entre observaciones. La semivarianza se define como un medio de la varianza de la diferencia entre dos observaciones a una distancia dada
i) Rango: distancia hasta la que aparece autocorrelación espacial ii) Meseta: valor en torno al cual se estabiliza la semivarianza, es decir, el valor de la semivarianza una vez que deja de haber autocorrelación espacial; iii) Efecto pepita: valor de la semivarianza en el origen, en cierto modo esta ligada a las unidades de muestreo utilizadas y a la variabilidad de la variable en escalas muy pequeñas.
Variograma experimental
1. Método Matheron de momentos (MoM)
2. Cressie and Hawkins 3. Dowd 4. Genton
GenStat Release 12.1
8
Dutkowski, G. W., J. Costa, et al. (2002)
Dutkowski, G. W., J. Costa, et al. (2002)
Zas, A. R. (2008)
RESULTADOS ANÁLISIS
ESPACIAL
VARIACIÓN
GLOBLAL
VARIACIÓN
LOCAL
Lineal (Fila) x
Lineal (Columna) AR2 X AR2
Diagnostico
9
𝐸𝑅 = 100𝑥 𝑆𝐸𝐷𝑅𝐸𝑀𝐿/𝑆𝐸𝐷𝑆𝑃 − 100
Magnussen (1990) y Cullis y Gleeson (1991)
F26CAV Cavada, Asturias
F26CAV Cavada, Asturias
ALTURA
CODIGO LOCALIDAD UBICACIÓN MEJOR MODELO REML
(SED)
MEJOR MODELO
REML+ AJUSTE
ESPACIAL (SED)
EFICIENCIA
RELATICA ER (%)
1 F26CAV Cavada, Asturias Modelo No6 10,49 4,68 124,29
2 F26IBI Ibias, Asturias Modelo No7 4,54 2,12 113,94
3 F26MER Amerca, Galicia Modelo No7 7,68 2,96 159,32
0.0
45
60
40
0.2
35
50
30
40
0.4
25
30
20
0.6
15
Y
X 20
10
0.8
10
5
1.0
0.8
0.2
0.4
0.6
Sample variogram
10
ORD FAMILIA BLUPs SE ORD FAMILIA BLUPs SE
1 Segu11 319,44 10,26 1 Cada10 317,48 7,66
2 Cada10 319,14 10,25 2 Segu19 317,3 7,66
3 Alto8 319,06 10,25 3 Puer2 317,16 7,65
4 San26 318,39 10,24 4 Cast7 317,12 7,66
5 Puer2 318,34 10,24 5 Lamu3 317,06 7,66
6 Cuel21 318,3 10,25 6 Segu11 317,03 7,66
7 Leir30 318,22 10,26 7 Arma6 316,95 7,66
8 Pini8 318,21 10,27 8 Pleu7 316,95 7,66
9 Segu19 318,16 10,25 9 Cuel2 316,91 7,66
10 Tamr26 318,16 10,28 10 Mimi3 316,87 7,66
REML+ ANÁLISIS ESPACIALREML
COMPARACIÓN PREDICCIONES EN ALTURA PARA F26CAV
RESULTADOS ANÁLISIS
ESPACIAL
Dutkowski, G. W., J. Costa, et al. (2002).
CONCLUSIONES 11
Es posible mitigar el error espacial presente en los ensayos genéticos de la especie Pino Marítimo (Pinus pinaster) modelándola la variación local como como un proceso auto-regresivo de segundo orden e incluyendo tendencias lineales para modelar la variación global. El análisis espacial contribuye a aumentar la precisión en la predicción y estimación de parámetros genéticos en los ensayos. Resulta imprescindible la aplicación de un método de corrección espacial en los ensayos genéticos forestales, ya que de lo contrario las conclusiones y resultados obtenidos pueden resultar completamente incorrectos.
MUCHAS GRACIAS POR SU ATENCIÓN…
12