experimentos con un solo factor estadística iii. h lamos1
TRANSCRIPT
Estadística III. H Lamos 1
EXPERIMENTOS CON UN SOLO FACTOR
ANOVA 1 FACTORSe trata de un diseño con a tratamientos o niveles de una solo factor y n réplicas. En este caso Nivel= TratamientoCorridas= a*nLa secuencia de prueba es aleatoria para evitar efectos de variables perturbadoras desconocidas.
Estadística III. H Lamos 2
Factor PROCESO ijyNivel iUnidad experimental j
Estadística III. H Lamos 3
En la siguiente tabla se registran los datos obtenidos:
.iy.iy
Para los datos tabulados se obtienen:•Total de las observaciones bajo el tratamiento i-ésimo.•Promedio de las observaciones bajo el tratamiento i-ésimo.•Gran total de todas las observaciones.•Promedio de todas las observaciones.
..y ..y
A baja temperatura
A temperatura media
A Alta temperatura
42 36 3341 35 4437 32 4029 38 3635 39 4440 42 3732 34 45
Resumen Estadístico para y
Estadística III. H Lamos 4
Temperat Recuento
Promedio
Desviación Estándar
Coeficiente de Variación
Mínimo Máximo Rango
1 7 36,5714 4,85994 13,2889% 29,0 42,0 13,0
2 7 36,5714 3,35942 9,18592% 32,0 42,0 10,0
3 7 39,8571 4,67007 11,717% 33,0 45,0 12,0
Total 21 37,6667 4,41965 11,7336% 29,0 45,0 16,0
Modelo para los datosModelo de las Medias
Estadística III. H Lamos 5
ij
i
ij
ijiij
y
y
Observación i j – ésima.
Media del nivel del factor i.
Componente del error aleatorio de la observación i j – ésima.
Supuestos
Modelo de los Efectos
Estadística III. H Lamos 6
i
ijiijy
Parámetro común a todos los tratamientos o MEDIA GLOBAL.Parámetro único del tratamiento i- ésimo o EFECTO DEL TRATAMIENTO I-ÉSIMO.
1. El diseño experimental es un diseño completamente aleatorizado.2. Los errores del modelo son variables aleatorias que siguen una
distribución normal e independiente con media cero y varianza 3. La varianza es constante para todos los niveles del factor, lo que implica
que
2
),(Ny 2iij
ANÁLISIS DEL MODELO CON EFECTOS FIJOS. Notaciones
Estadística III. H Lamos 7
..
..
.
.
y
y
y
y
i
iTotal de las observaciones bajo el tratamiento i-ésimo.
Promedio de las observaciones bajo el tratamiento i-ésimo.
Gran total de todas las observaciones.
Promedio de todas las observaciones.
Para probar la igualdad de las a medias de los tratamientos:
Estadística III. H Lamos 8
0....: 21 aoH Los efectos de los tratamientos pueden considerarse como desviaciones de la media global
De forma alternativa:
a
iii
a
ii
i
n
a
1
1i
0
Se desprende que
Estadística III. H Lamos 9
iH
H
H
i
ao
i
a
una menos alpara 0:
0....:
eequivalentforma En
cero.a iguales
son parámetros los todosNo:
..:H
probara Hipótesis
1
21
1
210
ANÁLISIS DE VARIANZAEl nombre análisis de varianza se deriva de la partición de la variabilidad total en sus partes componentes.
Suma de cuadrados total corregida: Se construye la variable aleatoria
Estadística III. H Lamos 10
a
i
n
jijT
i
yySS1 1
2.. )( Evaluada en los datos
da la medida de la variabilidad de todos los datosVariable aleatoria chi
cuadrado con N-1 grados de Libertad
Puede hacerse la partición de la variabilidad total de los datos.
Estadística III. H Lamos 11
Error
i
osTratamient
i
ii
SS
a
i
n
jiij
SS
a
ii
a
i
n
jij
a
i
n
jiiji
a
i
n
jijT
yyyynyy
yyyyyySS
1 1
2.
1
2...
1 1
2..
1 1
2....
1 1
2..
)()()(
.))()(()(
Medida de la variabilidad entre los tratamientos
Medida de la variabilidad dentro de los tratamientos
Tabla ANOVA para y por Temperat
Estadística III. H Lamos 12
Fuente Suma de Cuadrados
Entre grupos 50,381
Intra grupos 340,286
Total (Corr.) 390,667
Cuadrados Medios
El valor esperado de las variables aleatorias;
Estadística III. H Lamos 13
aN
SSMS E
E
Estimador insesgado de la varianza poblacional.
aN
SSE)MS(E E
E
Cuadrados Medios
Estadística III. H Lamos 14
1a
SSMS osTratamient
osTratamient
Si se usa como estimador de la varianza, entonces es sesgado, naturalmente si la hipótesis nula es falsa.
0....:H a21o
Estimación de la varianza poblacional
Se obtiene también la varianza muestral del tratamiento i-ésimo.
Estadística III. H Lamos 15
aN
SSE
Es una estimación combinada de la varianza común dentro de cada uno de los a tratamientos.
1a
SS osTratamientSi no existe diferencia entre las medias de los a tratamientos, la variación de los promedios de los tratamientos es un estimador insesgado de la varianza poblacional.
Análisis EstadísticoDistribución de probabilidad de las variables aleatorias
Para probar la independencia de las 3 sumas de cuadrados se hace uso del Teorema de Cochran
Estadística III. H Lamos 16
cuadrado chi212 N
TSS
22 aNESS
212 a
oTratamientSS
Si las medias son iguales
Teorema de Cochran
s21
s1
i
1is21
2i
i
...
Q,...Q
).s,..2,1iQ,s
Q...QQZ
,..2,1iZ
si sólo y si
mente,respectiva libertad, de grados con pendientes inde
cuadrada-ji aleatorias variables son Entonces
( libertad de grados tienen y Donde
y para NID(0,1) v.a Sea
i
i
Estadística III. H Lamos 17
Por consiguiente: la prueba de independencia de las 3 sumas de cuadrados se basa :
11 NaNa
Estadístico de pruebaSi las medias son muy parecidas entonces
Si la Hipótesis Nula es falsa Entonces Se tiene que el estadístico de prueba es:
La Hípotesis Nula la podemos rechazar si:
Estadística III. H Lamos 18
EosTratamient MSMS
E
osTratamiento MS
MSF
2osTratamientMS
)()( EosTratamient MSEMSE
aNao FF ,1,
Tabla ANOVA para y por Temperat
Estadística III. H Lamos 19
Fuente Suma de Cuadrados
Gl Cuadrado Medio
Razón-F Valor-P
Entre grupos
50,381 2 25,1905 1,33 0,2886
Intra grupos 340,286 18 18,9048
Total (Corr.)
390,667 20
Cálculos Manuales
Estadística III. H Lamos 20
Estimación de los parámetros del modelo
.i...i..iij
ijijij
...ii
..
yyyyˆˆy
yye
yyˆ
yˆ
Estadística III. H Lamos
21
ijiijy
Estadística III. H Lamos 22
• Intervalo de confianza para la media de un tratamiento i
• Intervalo de confianza para la diferencia entre las medias de dos tratamientos i y j
Intervalos de medias
Estadística III. H Lamos 23
1 2 3
Medias y 95,0% de Fisher LSD
Temperat
34
36
38
40
42
44
y
VERIFICACIÓN DEL MODELOLa violación de supuestos básicos y la adecuación del modelo se investigan mediante los residuales.
Si el modelo es adecuado, los residuales deben estar sin estructura; es decir, no deben haber patrones obvios.
Estadística III. H Lamos 24
Residuales del modeloijijij yye ˆ
Estadística III. H Lamos 25
A Temperatura baja
A temperatura media
A Alta temperatura
5,43-0,57 -6,86
4,43-1,57 4,14
0,43-4,57 0,14
-7,571,43 -3,86
-1,572,43 4,14
3,435,43 -2,86
-4,57-2,57 5,14
Residuos
Estadística III. H Lamos 26
1 2 3
Gráfico de Residuos para y
-8
-4
0
4
8
resi
duos
Temperat
Trabajo en clase
Estadística III. H Lamos 27
Con el propósito de comparar los precios del pan (de una determinada marca) se llevo a cabo un experimento en cuatro zonas del área metropolitana: Cañaveral, Centro, Cabecera y Girón. En cada zona de la ciudad se tomaron muestra de 8 tiendas, pero en Girón, debido a una omisión, se tomó una muestra solamente 7 tiendas. Se empleó un diseño completamente aleatorizado. Describa el modelo estadístico para el análisis del problema. Defina la unidad experimental, los tratamientos, el número de corridas, el número de réplicas, los factores, la variable respuesta.¿Constituyen los datos evidencia suficiente que indique una diferencia en el precio medio del producto en las tiendas de las diferentes zonas del área?¿Cuál zona seleccionaría para comprar pan?Estudiar las diferencias en los efectos de los diversos niveles del factor.Construya un intervalo de confianza al intervalo de confianza al 90% para el valor medio del precio del pan en la zona de Centro. Construir la estimación del intervalo de confianza de 99% para la diferencia media entre el precio del pan de las zonas 2 y 3
Estadística III. H Lamos 28
Zona Precio del pan
Cañaveral 59 63 65 61 64 58 60 61
Centro 58 61 64 63 57 60 63 60
Cabecera 55 59 55 58 59 56 60 55
Girón 69 70 65 70 66 71 69