anÁlisis e interpretaciÓn de datos …agro.unc.edu.ar/~mejogeve/clasepablo.pdf · aplican sobre...

35
ANÁLISIS E INTERPRETACIÓN DE DATOS EXPERIMENTALES EN EL MEJORAMIENTO GENÉTICO VEGETAL. Ing. Agr. Pablo Mansilla MGV-FCA, UNC.

Upload: ngonhan

Post on 21-Oct-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

ANÁLISIS E INTERPRETACIÓN DE DATOS EXPERIMENTALES

EN EL MEJORAMIENTO GENÉTICO VEGETAL.

Ing. Agr. Pablo Mansilla

MGV-FCA, UNC.

Page 2: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

ALGUNAS DEFINICIONES NECESARIAS..

El tamaño de la unidad experimental es usualmente una decisión arbitraria, pero afecta la calidad de la

observación de la variable respuesta.

UNIDAD EXPERIMENTAL (UE)

Ejemplos: planta, parcela de terreno, alícuota de materia prima (muestra de harina), grupo de insectos,

etc.

Porción de material o terreno, un individuo o grupo de individuos, susceptible de tratamiento experimental y sobre la que se observa una respuesta. Generalmente coincide con la Unidad de Observación (UO).

Page 3: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

RESPUESTA Cuando se planifica un experimento, se debe identificar la respuesta del sistema

que se va a evaluar

Cualitativas Univariadas (una sola

variable)

Cuantitativas Multivariadas (varias variables)

variables respuesta (variables dependientes)

Page 4: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

FACTORES Las potenciales fuentes de variación de la/s

variable/s respuesta en un sistema experimental identificadas a priori son llamadas factores

Los distintos estados o valores de los factores se designan niveles

La combinación de niveles evaluados para un conjunto de factores recibe el nombre de

tratamiento

TRATAMIENTO: conjunto de acciones que se aplican sobre las unidades experimentales y que

son objeto de comparación.

Page 5: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

EJEMPLOS…

“Se desea medir contenido de gluten en 15 cultivares de trigo”

“Se desea comparar los rendimientos de 13 híbridos experimentales de maíz bajo

diferentes dosis de nitrógeno (50, 90 y 120 kg/ha)”

“Se desea comparar la efectividad de 3 fungicidas (Benomyl, Captane e Iprodione) en diferentes

concentraciones ( 0.3, 3.0 y 30 mM) sobre cuatros hongos fitopatógenos (Colletrotrichum acutatum,

Colletrotrichum fragariae, Colletrotrichum gloesporioides y Fusarium oxysporum)”

Page 6: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

ERROR EXPERIMENTAL

El término error experimental se refiere a la diferencia entre el valor observado de la

variable respuesta sobre una unidad experimental y su valor esperado (de

acuerdo a un modelo).

El error experimental es el responsable de la variación observada entre unidades

experimentales tratadas de la misma forma.

Page 7: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

COMPONENTES DEL ERROR EXPERIMENTAL

Usualmente, una vez obtenido un dato experimental, no es posible identificar la magnitud de las distintas

componentes que, sumadas, conforman el error experimental.

Error de medición: Variación que introduce el instrumento o procedimiento de medición.

Error de muestreo: Variación en la respuesta diferencial de cada UE al tratamiento que recibe y depende de propiedades inherentes a la UE.

Error de tratamiento: Variación en la respuesta debida a los errores en la reproducción del tratamiento.

Error de observación: Variación debida al submuestreo de la unidad experimental.

Page 8: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

ALGUNOS RECURSOS DEL DISEÑO DE EXPERIMENTOS

Repetición

Aleatorización

Bloqueo

Page 9: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

ALEATORIZACIÓN Procedimiento de asignación aleatoria...

de los tratamientos a las unidades experimentales (distribución del error de muestreo)

del orden en que los tratamientos son aplicados (control sobre posibles variaciones en la aplicación de tratamientos)

del orden en que se miden las respuestas (control de variaciones sistemáticas del error de medición)

Permite distribuir aleatoriamente las fuentes de error

Page 10: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

REPETICIÓN

Se considera repetición a la aplicación de ese tratamiento a una

nueva unidad experimental.

Dado que toda observación tiene error, para estimar insesgadamente el efecto de un tratamiento, se debe promediar

sobre un conjunto de repeticiones.

Page 11: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

BLOQUEO Aunque la aleatorización “distribuye los errores” y controla el sesgo, no elimina ni minimiza el

error experimental.

El bloqueo es el resultado de un reconocimiento a priori de fuentes sistemáticas de error y

permite obtener experimento más eficientes

DISEÑOS EN BLOQUES El bloque señala que: Las unidades experimentales dentro de un bloque deben ser tan homogéneas como sea posible. Las diferencia entre UE deben ser explicadas por las diferencias entre bloques (heterogeneidad entre bloques).

Page 12: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

“en bloques completos” porque en cada bloque aparecen todos los tratamientos, y “al azar” porque los tratamientos son asignados en forma aleatoria dentro de cada bloque. Todas las UE de un mismo bloque tienen la misma probabilidad de recibir cualquiera de los tratamientos. Generalmente, el N° de R coincide con el N °de bloques.

EXPERIMENTO: 3 tratamientos en un Diseño en Bloques Completos al Azar (DBCA), con 4

repeticiones

Page 13: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

MODELO Y ANÁLISIS

Experimento bien planificado :

Análisis simple Interpretación directa

• En estudios observacionales, el análisis se transforma en una herramienta de exploración de datos

• El objetivo es “encontrar el modelo apropiado” • Se entra en un territorio donde la

interpretación de los resultados puede ser poco confiable

Page 14: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

ANÁLISIS DE LA VARIANZA

Page 15: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

Descompone la variabilidad total en la muestra (suma de cuadrados total de las observaciones) en componentes

(CUADRADOS MEDIOS) asociados cada uno a una fuente de variación

reconocida .

ANÁLISIS DE LA VARIANZA

Page 16: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

En experimentos con fines comparativos, usualmente se realiza la aplicación de varios tratamientos a un conjunto de unidades experimentales (parcelas, individuos, macetas, etc.)

De esta manera, se logra que las alteraciones en las respuestas (variables) puedan ser atribuidas a la acción de los tratamientos, excepto por variaciones aleatorias.

El propósito es comparar medias de tratamientos con el menor “ruido” posible.

OBJETIVO...

ANÁLISIS DE LA VARIANZA

Establecer si las diferencias obtenidas entre las medias estimadas reflejan las diferencias entre

las verdaderas medias (parámetros)

Page 17: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

ijiijY

El modelo lineal

Yij= + i + bj + ij

Efecto de bloque

DISEÑO EN BOQUES

Efecto de tratamiento

las variaciones debidas a la estructura presente entre bloques, es eliminada de las comparaciones entre unidades que reciben el mismo tratamiento. El bloqueo permite disminuir el error

Page 18: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

CONTRASTE DE HIPÓTESIS

La hipótesis nula en un análisis de la varianza es:

La hipótesis alternativa es:

• Las medias de tratamientos son iguales

• Existe al menos una media que se diferencia de las otras

1 2 ... a

Hipótesis Nula:

El modelo más simple es adecuado para

explicar la variación observada en los datos

Page 19: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

¿Cómo se establece si el modelo más simple es adecuado para los datos

observados?

¿Cómo se decide si la hipótesis nula es soportada por los datos

experimentales?

Dicho de otra manera…

Page 20: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

Se asume que la hipótesis nula es cierta

Se calcula una medida de credibilidad de la hipótesis nula, conocida como p-valor

Cuanto menor es el p-valor, menos verosímil es la hipótesis nula

Se fija un umbral por debajo del cual la hipótesis nula se rechaza, conocido como nivel de significancia (α)

Page 21: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

Si se rechaza

Ho ¿Cuál o cuáles de las medias poblacionales

son las diferentes?

Page 22: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

PROCEDIMIENTOS DE COMPARACIONES MÚLTIPLES

Page 23: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

FV

ENTRE PROGENIES

DENTRO PROGENIES

SC GL CM є (CM)

CME ENTRE PROGENIES

CMD

VE + R VG

VE

CUADRADO MEDIO DENTRO (CMD) = VARIANZA AMBIENTAL (VE)

CUADRADO MEDIO ENTRE (CME) = VARIANZA FENOTÍPICA (VE + VG * R), donde R es el N° de

Repeticiones.

VG = (CME – CMD)/R %VG ó H2 (amplio) = (VG) / (VG + VE)

Uno de los principales usos del ANOVA en MGV es para ESTIMAR VARIANZAS…

Page 24: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

ACTIVIDAD PRÁCTICA

Documento Excel: “base de datos para curso”

Page 25: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

EVALUACIÓN DEL VALOR NUTRICIONAL DE MAÍCES ESPECIALES (Zea mays L.):

SELECCIÓN PARA CALIDAD AGROALIMENTARIA

OBJETIVO GENERAL

TESIS…

Evaluar el valor nutritivo de maíces especiales a partir de su composición química, a fin de seleccionarlos para

calidad agroalimentaria.

Page 26: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

PROTEÍNAS Varían entre el 8 y 11% del peso del

grano

Page 27: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

Posee una mutación natural en el gen recesivo o2, que codifica para la síntesis de zeínas.

La expresión de este gen (doble recesivo) lo convierte en maíz con valor nutritivo superior

al maíz normal (QPM) .

Limita la síntesis de zeína, y se traduce en

la duplicación del contenido de lisina y

triptófano

Page 28: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

MATERIAL GENÉTICO: Prueba de progenies

Page 29: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

ANÁLISIS DE CORRELACIÓN Se deben tener dos o más variables aleatorias relevadas sobre cada UE. El Coeficiente de correlación de Pearson (r) es una medida de la magnitud de la asociación lineal entre dos variables cuantitativas que no depende de las unidades de medida de las variables originales. Asume valores entre -1;1 y el signo indica la dirección de la asociación.

LAS CORRELACIONES OBSERVADAS ENTRE DOS VARIABLES NO PUEDEN SER USADAS PARA ESTABLECER RELACIONES

CAUSALES.

Page 30: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

Oleico

Linoleico

Linolénico

Proteína Oleico 1 0,000001 0,000002 0,004365

Linoleico -0,934921 1 0,017301 0,006484

Linolénico -0,467880 0,245027 1 0,119157

Proteína 0,291491 -0,278916 0,161833 1

p-valores ≤ a 0.05, estadísticamente significativos. Los p-valores significativos se corresponden a un coeficiente de correlación “r”. Se analiza el valor “r” considerando su valor absoluto y signo. Un signo positivo indica que ambas variables se incrementan o disminuyen en el mismo sentido; un signo negativo indica que mientras una variable se incrementa, la otra disminuye.

Coeficientes de correlación (r)

Valores p asociada a la prueba de hipotésis de correlación nula

Page 31: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

En MGV, el coeficiente de correlación de Pearson permite determinar las correlaciones

fenotípicas entre caracteres, por ser la resultante de efectos genéticos y ambientales.

ESTABLECER CRITERIOS DE SELECCIÓN

Caracteres asociados al rendimiento.

UTILIDAD

Page 32: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

En el análisis de sendero se pretende construir modelos de causa-efecto entre las variables a través de la partición de la correlación. Estos son efectos directos de una variable sobre otra (senderos simples) y efectos indirectos de una variable sobre otra, vía una o más variables exógenas (senderos compuestos).

ANÁLISIS DE SENDERO (PATH ANALYSIS)

UTILIDAD

SELECCIÓN INDIRECTA

Page 33: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

CARÁCTER 1

CARÁCTER 2

rcp-2

rcp-1

r1-2 CP

INTERRELACIONES

Se calculan los coeficientes de correlación fenotípica entre los caracteres, y

los efectos directos e indirectos de los caracteres analizados sobre el carácter sobre el principal (CP).

Page 34: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

La correlación entre biomasa y área foliar es significativa (r=-0.49, p=0.0272), y está casi completamente determinada (-0.52) por la

correlación entre biomasa y semillas germinadas.

EJEMPLO…

Las semillas germinadas, posee una fuerte correlación con biomasa y un fuerte efecto indirecto sobre la relación encontrada entre área foliar y biomasa.

Page 35: ANÁLISIS E INTERPRETACIÓN DE DATOS …agro.unc.edu.ar/~mejogeve/ClasePablo.pdf · aplican sobre las unidades experimentales y que ... Las diferencia entre UE deben ser ... las variaciones

MUCHAS GRACIAS…