curso-taller datos multivariados: análisis clásicos y nuevas tecnologías tema 4: inferencia
Post on 16-Apr-2015
20 Views
Preview:
TRANSCRIPT
Curso-Taller
Datos multivariados: Análisis Clásicos y Nuevas Tecnologías
Tema 4: Inferencia
Inferencia
análisis de varianza multivariado
¿Qué pregunta podemos contestar con un MANOVA (MANCOVA)?
¿Hay diferencias significativas entre losvectores promedio
de los tratamientos?
¿Se requieren supuestos para que los resultados de un MANOVA sean válidos?
El objetivo del ANOVA de efectos fijos es contrastar la hipótesis de que los efectos de tratamientos son nulos versus que al menos uno no lo es. En términos estadísticos:
H0: 1=...=a= 0 H1: Al menos un tratamiento tiene efecto no nulo
Es equivalente a contrastar la hipótesis de que las medias de los tratamientos que se comparan son idénticas vs. que no lo son
Caso univariado
Caso multivariado
Similar al univariado, pero en lugar de tener una media (o un efecto) por tratamiento, tenemos vectores medios
Inferencia
análisis de varianza multivariado
ANOVA: H0: µ1= µ2 = ,…, = µt
µ1 es la media de la variable en el tratamiento 1, ….
MANOVA: H0: µ1= µ2 = ,…, = µa
µ1 es el vector de medias de las variables en el tratamiento 1
Inferencia
análisis de varianza multivariado
• Los estadísticos de prueba más usados para contrastar esta hipótesis multivariada son los de Wilks, Pillai, Lawley-Hotelling y Roy
• Todos se basan en propiedades de la matriz inv(E)H y cuantifican la relación entre la variabilidad entre y dentro de grupos en sentido multivariado, por lo que su distribución aproximada es la distribución F
Inferencia
análisis de varianza multivariado
Análisis de la varianza multivariado
Cuadro de Análisis de la Varianza (Wilks)F.V. Estadístico F gl(num) gl(den) p SEIS 0.01 19.88 35 398 <0.0001
Cuadro de Análisis de la Varianza (Pillai)F.V. Estadístico F gl(num) gl(den) p SEIS 2.43 13.25 35 490 <0.0001
Cuadro de Análisis de la Varianza (Lawley-Hotelling)F.V. Estadístico F gl(num) gl(den) p SEIS 9.12 24.08 35 462 <0.0001
Cuadro de Análisis de la Varianza (Roy)F.V. Estadístico F gl(num) gl(den) p SEIS 4.13 57.86 7 98 <0.0001
Ejemplo MANOVA 456
Inferencia
análisis de varianza multivariado
Prueba Hotelling Alfa=0.05Error: Matriz de covarianzas común gl: 100
SEIS af afe cfms ft dm p n p4 16329.10 10.95 385.96 0.77 0.52 1.05 21.32 33 A 5 16210.71 15.85 340.71 0.77 0.52 1.53 27.27 23 B 6 216170.34 11.90 431.41 1.01 0.36 1.27 24.64 6 C 1 11449.16 8.96 536.89 0.98 0.58 1.04 19.86 21 D2 33112.14 15.12 349.44 0.56 0.29 2.25 35.25 7 E 3 16593.80 12.76 502.43 0.73 0.39 1.51 30.99 16 F Medias con una letra común no son significativamente diferentes(p<= 0.05)
Resultados de la prueba de comparación de vectores medios DGCmultivariada
Inferencia
análisis de varianza multivariado
análisis de varianza multivariado
listo
Si tenemos:
Y (n x 1) vector de variable respuesta Y (n x 1)
X (n x p) matriz de predictoras X (n x p)
En la aplicación del Análisis de Regresión, se pueden presentar dos problemas :
1) n < p El número de observaciones es menor que el número de predictoras
2) Multicolinealidad : relación lineal entre predictoras
¿ Cómo se soluciona estos problemas ?
Respuesta: aplicar Análisis de Regresión PLS
Inferencia
Regresión por mínimos cuadrados parciales (PLS)
Inferencia
Regresión por mínimos cuadrados parciales (PLS)
Combina Análisis de Componentes Principales y Análisis de Regresión
OBJETIVO
• Hallar componentes (variables latentes) no correlacionadas
• Reducción de la dimensionalidad
• Mejorar la estimación
Regresión por mínimos cuadrados parciales (PLS)
listo
Inferencia
análisis de correlaciones canónicas
Objetivo del Análisis
El análisis de correlaciones canónicas (ACC) permite estudiar la asociación entre dos conjuntos de variables.
Conjunto uno: variables que caracterizan el tipo de hojas de especies vegetales
Conjunto dos: variables que caracterizan la arquitectura de la especie
(dos conjuntos de variables)
Inferencia
análisis de correlaciones canónicas
¿Cómo se alcanza el objetivo utilizando este análisis?
El ACC se basa en la correlación entre una combinación lineal de las
variables en un conjunto (en el ejemplo, una combinación lineal de
las variables que miden el tipo de hojas) con una combinación lineal
de las variables en el otro conjunto (combinación de variables que
describen la arquitectura de la planta)
1 2
1 2´ , ´ 1 2
1 2
( ´ , ´ )( ´ , ´ )
( ´ ) ( ´ ) l y l x
Cov l lr corr l l
Var l Var l
y xy x
y x
Inferencia
análisis de correlaciones canónicas
Pasos en el ACC
• En un primer paso del análisis, se pretende determinar el par de combinaciones lineales con máxima correlación
• En un segundo paso, el par con máxima correlación entre todos los pares no correlacionados con el par de combinaciones seleccionadas en el primer paso y así sucesivamente
• Las combinaciones lineales de un par son llamadas variables canónicas y la correlación entre ellas, es llamada correlación canónica, para diferenciarla de la correlación ordinaria entre dos variables
Fernando Casanoves: casanoves@catie.ac.cr Sergio Vilchez: svilchez@catie.ac.cr
GRACIAS
top related