curso-taller datos multivariados: análisis clásicos y nuevas tecnologías tema 4: inferencia

Report

Post on 16-Apr-2015

20 Views

Category:

Documents

7 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Curso-Taller

Datos multivariados: Análisis Clásicos y Nuevas Tecnologías

Tema 4: Inferencia

Inferencia

análisis de varianza multivariado

¿Qué pregunta podemos contestar con un MANOVA (MANCOVA)?

¿Hay diferencias significativas entre losvectores promedio

de los tratamientos?

¿Se requieren supuestos para que los resultados de un MANOVA sean válidos?

El objetivo del ANOVA de efectos fijos es contrastar la hipótesis de que los efectos de tratamientos son nulos versus que al menos uno no lo es. En términos estadísticos:

H0: 1=...=a= 0 H1: Al menos un tratamiento tiene efecto no nulo

Es equivalente a contrastar la hipótesis de que las medias de los tratamientos que se comparan son idénticas vs. que no lo son

Caso univariado

Caso multivariado

Similar al univariado, pero en lugar de tener una media (o un efecto) por tratamiento, tenemos vectores medios

Inferencia

análisis de varianza multivariado

ANOVA: H0: µ1= µ2 = ,…, = µt

µ1 es la media de la variable en el tratamiento 1, ….

MANOVA: H0: µ1= µ2 = ,…, = µa

µ1 es el vector de medias de las variables en el tratamiento 1

Inferencia

análisis de varianza multivariado

• Los estadísticos de prueba más usados para contrastar esta hipótesis multivariada son los de Wilks, Pillai, Lawley-Hotelling y Roy

• Todos se basan en propiedades de la matriz inv(E)H y cuantifican la relación entre la variabilidad entre y dentro de grupos en sentido multivariado, por lo que su distribución aproximada es la distribución F

Inferencia

análisis de varianza multivariado

Análisis de la varianza multivariado

Cuadro de Análisis de la Varianza (Wilks)F.V. Estadístico F gl(num) gl(den) p SEIS 0.01 19.88 35 398 <0.0001

Cuadro de Análisis de la Varianza (Pillai)F.V. Estadístico F gl(num) gl(den) p SEIS 2.43 13.25 35 490 <0.0001

Cuadro de Análisis de la Varianza (Lawley-Hotelling)F.V. Estadístico F gl(num) gl(den) p SEIS 9.12 24.08 35 462 <0.0001

Cuadro de Análisis de la Varianza (Roy)F.V. Estadístico F gl(num) gl(den) p SEIS 4.13 57.86 7 98 <0.0001

Ejemplo MANOVA 456

Inferencia

análisis de varianza multivariado

Prueba Hotelling Alfa=0.05Error: Matriz de covarianzas común gl: 100

SEIS af afe cfms ft dm p n p4 16329.10 10.95 385.96 0.77 0.52 1.05 21.32 33 A 5 16210.71 15.85 340.71 0.77 0.52 1.53 27.27 23 B 6 216170.34 11.90 431.41 1.01 0.36 1.27 24.64 6 C 1 11449.16 8.96 536.89 0.98 0.58 1.04 19.86 21 D2 33112.14 15.12 349.44 0.56 0.29 2.25 35.25 7 E 3 16593.80 12.76 502.43 0.73 0.39 1.51 30.99 16 F Medias con una letra común no son significativamente diferentes(p<= 0.05)

Resultados de la prueba de comparación de vectores medios DGCmultivariada

Inferencia

análisis de varianza multivariado

listo

Si tenemos:

Y (n x 1) vector de variable respuesta Y (n x 1)

X (n x p) matriz de predictoras X (n x p)

En la aplicación del Análisis de Regresión, se pueden presentar dos problemas :

1) n < p El número de observaciones es menor que el número de predictoras

2) Multicolinealidad : relación lineal entre predictoras

¿ Cómo se soluciona estos problemas ?

Respuesta: aplicar Análisis de Regresión PLS

Inferencia

Regresión por mínimos cuadrados parciales (PLS)

Inferencia

Regresión por mínimos cuadrados parciales (PLS)

Combina Análisis de Componentes Principales y Análisis de Regresión

OBJETIVO

• Hallar componentes (variables latentes) no correlacionadas

• Reducción de la dimensionalidad

• Mejorar la estimación

Regresión por mínimos cuadrados parciales (PLS)

listo

Inferencia

análisis de correlaciones canónicas

Objetivo del Análisis

El análisis de correlaciones canónicas (ACC) permite estudiar la asociación entre dos conjuntos de variables.

Conjunto uno: variables que caracterizan el tipo de hojas de especies vegetales

Conjunto dos: variables que caracterizan la arquitectura de la especie

(dos conjuntos de variables)

Inferencia

análisis de correlaciones canónicas

¿Cómo se alcanza el objetivo utilizando este análisis?

El ACC se basa en la correlación entre una combinación lineal de las

variables en un conjunto (en el ejemplo, una combinación lineal de

las variables que miden el tipo de hojas) con una combinación lineal

de las variables en el otro conjunto (combinación de variables que

describen la arquitectura de la planta)

1 2

1 2´ , ´ 1 2

1 2

( ´ , ´ )( ´ , ´ )

( ´ ) ( ´ ) l y l x

Cov l lr corr l l

Var l Var l

y xy x

y x

Inferencia

análisis de correlaciones canónicas

Pasos en el ACC

• En un primer paso del análisis, se pretende determinar el par de combinaciones lineales con máxima correlación

• En un segundo paso, el par con máxima correlación entre todos los pares no correlacionados con el par de combinaciones seleccionadas en el primer paso y así sucesivamente

• Las combinaciones lineales de un par son llamadas variables canónicas y la correlación entre ellas, es llamada correlación canónica, para diferenciarla de la correlación ordinaria entre dos variables

Fernando Casanoves: casanoves@catie.ac.cr Sergio Vilchez: svilchez@catie.ac.cr

GRACIAS

mailto:casanoves@catie.ac.ar

mailto:svilchez@catie.ac.cr

top related

curso-taller datos multivariados: análisis clásicos y nuevas tecnologías tema 4: inferencia

Documents

polinomios ortogonales multivariados discretos y su

mÉtodos multivariados en estudios de vulnerabilidad …

inferencia cientifica.docx

inferencia estadÍstica

argumento valido e inferencia inferencia

prontitud coordinativa: perfiles multivariados en función...

modelos multivariados garch para el análisis de los...

inferencia lbinomialypoisson

redalyc. algoritmos genéticos y modelos multivariados...

modelos econometricos univariados y multivariados · 2017....

inferencia estadística

inferencia estadística de procesos estocásticos … ·...

inferencia estadística.ppt

anÁlise estatÍstica de dados geolÓgicos multivariados ·...

4 castaño_análisis de datos multivariados

reglas inferencia

inferencia...

inferencia lógica

inferencia estadistica

inferencia estadÍstica