análisis de varianza anova (analysis of variation)
TRANSCRIPT
![Page 1: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/1.jpg)
Análisis de Varianza
ANOVA
(Analysis of Variation)
![Page 2: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/2.jpg)
ANOVA – Asunto básico
• Dos Variables:– Categórica (los grupos)– Cuantitativa (lo medido)
• ¿Los promedios de la variable cuantitativa varían entre los grupos (categorías)?
• Nota: si se trata solamente de dos grupos se hace test – t no pareado. Anova, para más de dos grupos.
![Page 3: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/3.jpg)
ANOVA
1. Muestras provienen de población con distribución normal y con similares DS (para hablar de similitud de DS siga la regla 2:1).
2. La varianza de cada grupo es un estimativo de la varianza de la población.
3. La varianza mezclada (pooled) de los grupos puede utilizarse para calcular IC de la diferencia de pares de promedios.
![Page 4: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/4.jpg)
Anova
• Cuando tenemos más de dos grupos.
• Hipótesis nula:
• Calcular valor de F (de Fisher).• Distribución de F tiene sesgo
cuando se acepta hipótesis nula.
...cba xxx
![Page 5: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/5.jpg)
Que hace el ANOVA?
En su forma más simple ANOVA:
H0: Los promedios de todos los grupos son iguales.
Ha: No todos los promedios son iguales• No dice cómo o cuáles son diferentes.
• Puede continuar con “múltiples comparaciones”
.
![Page 6: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/6.jpg)
Ejemplos de utilización de ANOVA en odontología
1. Cinco tratamientos diferentes para pacientes con herpes recurrente
2. Variación de ángulo goníaco en pctes con ADM clase I, II, III
3. Resistencia al desgaste de tres resinas diferentes
4. Grosor de la capa híbrida utilizando tres adhesivos diferentes
![Page 7: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/7.jpg)
Analysis of Variance
Source Type III SS df Mean Squares
F-ratio p-value
POSTGRADO 0.234 2 0.117 0.726 0.492
Error 5.145 32 0.161
Least Squares Means
Factor Level LS Mean Standard Error N
POSTGRADO Endo 6.100 0.127 10.000
POSTGRADO Orto 6.143 0.121 11.000
POSTGRADO Perio 6.286 0.107 14.000
Case 11 is an Outlier (Studentized Residual
:-3.466)
![Page 8: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/8.jpg)
Test de ANOVA, se asume que:
• Cada muestra debe ser independiente de las otras.
• Cada muestra debe haber sido seleccionada al azar de la pob de donde proviene.
![Page 9: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/9.jpg)
• Las pob de donde provienen las muestras debe tener dist normal.
• Las varianzas de cada pob deben ser iguales, aunque los promedios sean diferentes, es decir cuando los tratamientos tengan efecto.
Nota: si esto no se cumple, deberá ocupar otro test, generalmente test de Kruskal-Wallis.
![Page 10: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/10.jpg)
Cómo seleccionar muestra al azar?
• Asignando con la moneda (cara / sello) (fácil solamente para dos grupos).
• Tablas de números aleatorios (ver libros de bioestadística)
• Generar números aleatorios (función random o aleatorio.entre en excel), u otro software.
![Page 11: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/11.jpg)
Anotación en ANOVA
• N: número de individuos en total
![Page 12: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/12.jpg)
ANOVA – ANALISIS DE VARIANZA DE UNA VIA
Datos: 5 tratamientos con antivirales en 6 pctes (replicas)
f = 6, k = 5, N = 30
(P) (2) (3) (4) (5)
5 4 6 7 9
8 6 4 4 3
7 6 4 6 5
7 3 5 6 7
10 5 4 3 7
8 6 3 5 6
![Page 13: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/13.jpg)
5 trat para infección herpética (valores indican días de duración de las lesiones)
(P) (2) (3) (4) (5)
5 4 6 7 9
8 6 4 4 3
7 6 4 6 5
7 3 5 6 7
10 5 4 3 7
8 6 3 5 6
![Page 14: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/14.jpg)
5 trat para infección herpética (valores indican días de duración de las lesiones)
(P) (2) (3) (4) (5)
5 4 6 7 9
8 6 4 4 3
7 6 4 6 5
7 3 5 6 7
10 5 4 3 7
8 6 3 5 6
45 30 26 31 37 X
![Page 15: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/15.jpg)
5 trat para infección herpética (valores indican días de duración de las lesiones)
(P) (2) (3) (4) (5)
25 16 36 49 81
64 36 16 16 9
49 36 16 36 25
49 9 25 36 49
100 25 16 9 49
64 36 9 25 36
351 158 118 171 249
2X
2 X X
![Page 16: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/16.jpg)
Suma total de cuadrados
Suma total de los cuadrados (SSC):
Factor
de corrección (CF): (x)2/n
TSS = (351+158+118+171+249) – (45+3026+31+37)2 /30
= 1047 – 28561/30 = 1047 – 952,03 Factor de corrección
TSS = 94,97
nX
XTSS2
2
![Page 17: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/17.jpg)
Suma total de los cuadrados
• Está basada en la suma de los cuadrados de las diferencias de cada una de las observaciones del promedio general. Se divide en:– Suma de Cuadrados Entre los grupos basado en la
suma de los cuadrados de la diferencia entre el promedio de cada grupo y el promedio general (SSB)
– Suma de Cuadrados Dentro de los grupos: calculado como la suma de los cuadrados para la diferencia entre cada observación y el promedio de su grupo (SSw)
![Page 18: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/18.jpg)
SSB
• Variabilidad entre los grupos: Variabilidad de los promedios de los diferentes grupos alrededor del gran promedio (calculado sin tomar en cuenta la estructura del grupo)
![Page 19: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/19.jpg)
SSw
• Variabilidad dentro del grupo: También llamada variación NO explicada o residual y se refiere a la variación al azar entre los individuos dentro de cada grupo.
![Page 20: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/20.jpg)
Cuadrados dentro de los grupos(Error)
Suma de cuadrados dentro de los grupos (Within Sum of Squareds)
(Donde k: número de grupos; f: número de individuos en cada grupo)
SSW = 1047 – ( 452/6 +302/6 +262/6 +312/6 + 372/6 )
= 1047 – 988,51
SSW = 58,49
f
kW n
XXSS
22
![Page 21: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/21.jpg)
SUMA DE CUADRADOS ENTRE LOS GRUPOSBetween sum of squares
Suma de cuadrados entre los grupos (between)
SSB = ( 452/6 +302/6 +262/6 +312/6 + 372/6 ) – 952,03
SSB = 988,51 – 952,03
SSB = 36,48
CFnX
SSf
kB
2
![Page 22: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/22.jpg)
Cuadrados medios
• Cada suma de cuadrados se convierte en una varianza estimada (Cuadrados Medios) dividiendo por sus grados de libertad.
• GL entre los grupos: k – 1
• Dentro de los grupos: (n1 – 1 + n2 – 1 + n3 – 1)
![Page 23: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/23.jpg)
De la hipótesis nula:
• Todos los grupos tienen el mismo promedio y la misma varianza, por lo tanto la relación de las varianzas sería 1.
• Mediante el valor de F comparamos las varianzas y obtenemos la relación de ellas
GAUSS
![Page 24: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/24.jpg)
Tabla de ANOVA
Construcción de la tabla de Análisis de Varianza:
Fuente de SC gl MS F
Variación
Between 36,48 4 9,12 3,897
Within 58,49 25 2,339
Total 94,97 29
= 2,75 Por lo tanto existen dif. signif. (P<0,05) 25;4
05,0F
![Page 25: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/25.jpg)
Fcrítico depende de
los gl de CMentre y
CM dentro, y elegir el
valor de
![Page 26: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/26.jpg)
Por lo tantoP<0,05P>0,01
0,05>P>0,01
![Page 27: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/27.jpg)
Valores de F críticos según tablaValor de F obtenido = 3,897
= 2,75
= 3,35
= 4,18
Por lo tanto: 0,05> P > 0,01
25;405,0F
25;4025,0F
25;401,0F
![Page 28: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/28.jpg)
Valor de F
muestras las de varianzasde promedio
como estimadapoblación la de varianza
muestras las de medias la de
estimadapoblación la de varianza
F
![Page 29: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/29.jpg)
GRADOS DE LIBERTAD EN TABLA DE ANOVA
Entre los grupos (between) (k-1):n(úmero de grupos) – 1: (5 - 1) = 4
Dentro de los grupos (within)k(n-1): 5(6-1) = 25
Total = n – 1; 30 - 1 = 29
![Page 30: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/30.jpg)
VALOR DE F
Si F es un número grande, la variabilidad entre las medias de las muestras es mayor que la esperada a la variabilidad dentro de las muestras, y rechaza la hipótesis nula de que todas las muestras son de la misma población.
withinS
betweenSF
2
2
![Page 31: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/31.jpg)
Analysis of Variance
Source Type III SS
df Mean Squares
F-ratio p-value
Medicamento
36.467 4 9.117 3.896 0.014
Error 58.500 25 2.340
Least Squares Means
Factor Level LS Mean Standard Error
N
Medicamento Placebo 7.500 0.624 6.000
Medicamento a 5.000 0.624 6.000
Medicamento b 4.333 0.624 6.000
Medicamento c 5.167 0.624 6.000
Medicamento d 6.167 0.624 6.000
![Page 32: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/32.jpg)
Gráficos para ANOVA
• Promedios y DS de cada grupo.
• Cajas.
• Puntos.
![Page 33: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/33.jpg)
Tests para comparar medias
• Scheffé– Si tamaño de los grupos es diferente– Interesa además contrastes (Ej: grupo 1 y 2 vs 3)
• Tukey– Si tamaño de los grupos es igual– Interés prinicipal es comparar solo promedios de
grupos
• Bonferroni– No se había previsto comparar grupos
Utilizar solamente si resultado en ANOVA es p<0,05
![Page 34: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/34.jpg)
Test de Scheffé
• Dos promedios presentan diferencias significativas si su diferencia excede el valor calculado por:
k = número de promedios.
F3,8;0.05 = 4,0662
MSE = 0,917 (de cuadrado medio, within)
MSEnn
Fk *11
*)1(21
05.0
![Page 35: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/35.jpg)
Test de Scheffé
• Dos promedios presentan diferencias significativas si su diferencia excede el valor calculado por:
[(k-1)F0,05]1/2 [(1/n1 + 1/n2)*MSE]1/2
k = número de promedios.
F3,8;0,05 = 4,0662
MSE = 0,917 (de cuadrado medio, within)
![Page 36: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/36.jpg)
Cálculo de Scheffé
928,2)8829,0)(316,3(
339,2*6
1
6
175,2*4
*11
(1
2/12/1
2/1
21
2/125,405,0
MSE
nnFk
Existe diferencia entre dos grupos, si la diferencia desus promedios supera a 2,928
![Page 37: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/37.jpg)
5 trat para infección herpética (valores indican días de duración de las lesiones), última fila sus promedios
(P) (2) (3) (4) (5)
5 4 6 7 9
8 6 4 4 3
7 6 4 6 5
7 3 5 6 7
10 5 4 3 7
8 6 3 5 6
7,50 5,00 4,33 5,17 6,17x
![Page 38: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/38.jpg)
Promedios de cada grupo y sus diferencias
1. Entre Placebo y grupo (3) = 7,50 – 4,33 = 3,17
Valor supera al valor del test de Scheffé (2,928), por lo tanto existen diferencias significativas entre esos dos grupos
2. Entre placebo y grupo (2) = 7,50 – 5,0 = 2,50
Valor del test de Scheffé es superior, por lo tanto NO existen diferencias significatvas entre Placebo y grupo 2.
NO DEBE HACER MÁS COMPARACIONES…YA QUE TODAS LAS OTRAS DIFERENCIAS SON MENORES A VALOR DE SCHEFFÉ.
Promedios ordenados de mayor a menor (línea marca entre qué grupos NO existe diferencias significativas):
(P) (5) (4) (2) (3)
7,50 6,17 5,17 5,00 4,33
![Page 39: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/39.jpg)
Realización de Anova con software estadístico
• Dependiente: variable que desea examinar, debe ser continua (por ejemplo: edad, recuento de linfocitos, hematócrito, etc. D N !)
• Factor: una o más variables categóricas que tienen agrupados datos en más de dos grupos (variables de agrupar, ej.: NSE, Clase esq (I, II y III), etc.)
• Identificar si desea comparación entre grupos(Tukey, Scheffé, etc.)
![Page 40: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/40.jpg)
Analysis of Variance
Source Type III SS df Mean Squares
F-ratio p-value
Medicamento 36.467 4 9.117 3.896 0.014
Error 58.500 25 2.340
Least Squares Means
Factor Level LS Mean Standard Error
N
Medicamento Placebo 7.500 0.624 6.000
Medicamento a 5.000 0.624 6.000
Medicamento b 4.333 0.624 6.000
Medicamento c 5.167 0.624 6.000
Medicamento d 6.167 0.624 6.000
![Page 41: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/41.jpg)
![Page 42: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/42.jpg)
Tukey o Scheffé• Tukey. Uses the Studentized range statistic to
make all pairwise comparisons. This is the default.
• Scheffé. The significance level of Scheffé’s test is designed to allow all possible linear combinations of group means to be tested, not just pairwise comparisons available in this feature. The result is that Scheffé’s test is more conservative than other tests.
![Page 43: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/43.jpg)
Tipos de Anova
• Con un factor• Con dos factores:
– tres grupos (A, B, C)– género (M, F)– Interacción
• Con más de dos factores (NSE, género, religión)
• De medidas repetidas (activ EMG)
![Page 44: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/44.jpg)
Anova de dos víasCategorical values encountered during processing are:
GRUPO$ (3 levels)
A, B, C
METODO$ (2 levels)
I, II
Dep Var: LIPIDOS N: 18 Multiple R: 0.998 Squared multiple R: 0.996
Analysis of Variance
Source Sum-of-Squares df Mean-Square F-ratio P
GRUPO$ 109.644 2 54.822 1372.854 0.000
METODO$ 0.027 1 0.027 0.670 0.429
GRUPO$*METODO$ 0.047 2 0.024 0.591 0.569
Error 0.479 12 0.040
-------------------------------------------------------------------------------
![Page 45: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/45.jpg)
Desventajas de utilizar computador en estadística (Altman, 1999)
• Errores en los softwares• Versatilidad (dada la disponibilidad de
tantos softwares y tests: tentación a usar el q no corresponde)
• La caja negra le aleja de sus datos• La basura se va con la basura (si
ingresa datos en forma equivocada los resultados serán equivocados, ingreso de 0, 9, 99, 999)
![Page 46: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/46.jpg)
Ventajas de utilizar computador en estadística(Altman, 1999)
• Precisión y rapidez• Versatilidad (gran cantidad de tests
disponibles)• Gráficos• Flexibilidad• Nuevas variables• Volumen de datos• Transferencia de datos
![Page 47: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/47.jpg)
Estrategia para análisis de datos
• Recolección de datos (form codificados)
• Entrada de datos (Excel)• Chequear datos (min, max, x, ds)• Graficar antes de analizar• Análisis de datos• Chequear resultados• Interpretar
![Page 48: Análisis de Varianza ANOVA (Analysis of Variation)](https://reader033.vdocumento.com/reader033/viewer/2022061605/5665b43a1a28abb57c902dfe/html5/thumbnails/48.jpg)
Web Pages that Perform Statistical Calculations:
– http://members.aol.com/johnp71/javasta2.html#Demos