ejemplo ilustrativo diseño completo al azar
DESCRIPTION
estadistica 2TRANSCRIPT
EJEMPLO ILUSTRATIVO DISEO COMPLETO AL AZAR.1. Un ingeniero de desarrollo de productos tiene inters en investigar la Resistencia a la tensin de una fibra sinttica nueva que se usar para hacer tela de camisas para caballeros. El ingeniero sabe por experiencia previa que la resistencia a la tensin se afecta por el peso porcentual del algodn utilizado en la mezcla de materiales de lafibra. Adems, sospecha que al aumentar el contenido de algodn se incrementar la resistencia, al menos en un principio. Sabe asimismo que el contenido de algodn deber variar entre 10 y 40 % para que el producto final tenga otras caractersticas de calidad que se desean (como la capacidad de ser sometido a un tratamiento de planchado permanente). El ingeniero decide probar ejemplares en cinco niveles del peso porcentual del algodn: 15%,20%, 25%, 30% y 35%. Tambin decide probar cinco ejemplares en cada nivel del contenido del algodn. Los datos estn dados en psi (Pound square inch)Peso porcentual del algodon
15%20%25%30%35%
71214197
717182510
1512182211
1118191915
918192311
SOLUCION:a). Factor de inters: PESO PORCENTUAL DE ALGODN DE LA FIBRA.
b). Niveles del Factor: 15%; 20%; 25%; 30% y 35% (cinco niveles k = 5)ec). Variable de inters: Y = Resistencia a la tensin de la fibrad). Replicas por nivel: n = 5.Diseo balanceadoe) Modelo estadstico:
donde Yij := es la resistencia a la tensin de la j-sima fiibra sinttica con i-simo porcentaje de algodn,
:= es la medida del efecto a la tensin debida al i-simo porcentaje de algodon, = es el error aleatorio y = es la media global real de todos los tratamientos.
f) Hiptesis del problema:
para algunos i,j
g) Significancia de la Prueba: = 0.05
Resumen de datos
Peso porcentual del algodn
15%20%25%30%35%
71214197
717182510
1512182211
1118191915
918192311
49778810854
525=72+72+152+112+92122515662360616
9,8015,4017,6021,6010,80
Varianza11,209,804,306,808,20
376
6292
La tabla ANOVA para un dicen completamente al azar es de la siguiente forma
Fuente de las variacionesSuma de cuadradosGrados de libertadPromedio de los cuadradosF0P-value
Tratamientos
Error
Total
Clculos de sumas de cuadrados:
Clculos de Grados de libertad
Grados de libertad de los tratamientos
Grados de libertad del error
Grados de libertad totales
Clculos de cuadrados medios
Calculo de F
La tabla anova quedara de la siguiente forma
Fuente de las variacionesSuma de cuadradosGrados de libertadPromedio de los cuadradosF0Ftabla
Tratamientos475,764118,9414,762.866
Error161,2208,06
Total636,9624
VERIFICACION DE LOS SUPUESTOS DEL MODELO.
1. NORMALIDAD DE LOS RESIDUOSPrueba de Shapiro-Wilks
Hipotesis
H0 : Los RESIDUOS proceden de una distribucin normal
H1 : Los RESIDUOS no proceden de una distribucin normal
El primer paso consiste en hallar los residuos, los cuales son la diferencia entre el valor observado y la media de cada tratamiento, la tabla de los residuos quedara de la siguiente forma:
15%20%25%30%35%
(7-9,8)=-2,8(12-15,40)=-3,4-3,6-2,6-3,8
-2,81,60,43,4-0,8
5,2-3,40,40,40,2
1,22,61,4-2,64,2
-0,82,61,41,40,2
Para aplicar la prueba primero ordenamos los residuos de menor a mayor
Datos ordenados
Coeficientes de Shapiro ai (PAGINA 3 DEL PDF SHAPIRO)
-3,890,4454,005
-3,67,80,30692,39382
-3,46,80,25431,72924
-3,460,21481,2888
-2,85,40,18220,98388
-2,84,40,15390,67716
-2,640,12830,5132
-2,640,10460,4184
-0,82,20,08230,18106
-0,820,0610,122
0,20,20,04030,00806
0,20,20,020,004
0,4000
0,4TOTAL12,32462
0,4
El valor de W=0,942 lo ubicamos en la tabla Distribucin del estadstico de Shapiro-Wilk (w) para el contrastede normalidad. Para n=25 y observamos que por interpolacin (ENTRE 0,931 Y0,964 TABLA SAHIPIRO PAG 1) le corresponde un p-valor aproximado de 0,23 lo que significa que se cumple con el supuesto de normalidad (P-valor>)
1,2
1,4
1,4
1,4
1,6
2,6
2,6
3,4
4,2
5,2
2. SUPUESTO DE HOMOGENEIDAD DE VARIANZASPrueba de Bartlett
Estadstico de prueba en donde
donde Si2 es la varianza muestral de la poblacin i-sima.y Sp2 es la varianza ponderada, que es igual al CME
El valor anterior se busca en la tabla de chi con k-1=4 grados de libertad y por interpolacin obtenemos p-valor de 0,918. En este caso no se rechaza la hiptesis nula, lo que significa que las varianzas son homogneas.3. Supuesto de independencia: Grafica de los residuales en secuencia del tiempo
La graficacin de los residuales en el orden temporal de la recoleccin de los datos es til para detectar correlaciones entre los residuales. Una tendencia a tener corridas de residuales positivos y negativos indica una correlacin positiva.
Esto implicara que el supuesto de independencia de los errores ha sido violado . Se trata de un problema potencialmente serio y cuya solucin es difcil, por lo que de ser posible es importante evitar el problema cuando se colecten los datos. La aleatorizacin adecuada del experimento es un paso importante para conseguir Ia independencia
Una vez verificados los tres supuestos entonces podemos concluir el resultado de la tabla ANOVA.
Como el F tabulado 3,514< que el Fo 14,76 entonces se concluye que con una confianza del 95% de que se rechaza la hiptesis nula. En otras palabras, el peso porcentual en la fibra afecta de manera significativa la resistencia a la tensin media.
Ahora si se quiere saber cual es el mejor tratamiento se debe proceder a realizar un test de rangos multiples.
Para el ejemplo utilizaremos el test LSD (least significant difference), se llama diferencia mnima significativa ); ya que es la diferencia mnima que debe haber entre dos medias muestrales para poder considerar que los tratamientos son significativamente diferentes.
cuando el diseo es balanceado entonces
Se rechaza H0 : i=J si ocurre
* indica una diferencia significativa.Otra forma de presentar la informacin anterior es hacer un grafico de medias como el siguiente, en donde cada punto representan las medias, y los bigotes los intervalos LSD. Se observa que el tratamiento que maximisa la resistencia es el tratamiento que utiliza 30% de algodn.
EJERCICIO PROPUESTO.1. Para estudiar la confiabilidad de ciertos tableros electrnicos para carros, se someten a un envejecimiento acelerado durante 100 horas a determinada temperatura, midindose como variable de inters la intensidad de corriente que circula entre dos puntos, cuyos valores aumentan con el deterioro. Se probaron 20 mdulos repartidos equitativamente en cinco temperaturas y los resultados obtenidos son:
20oC40oC60oC80oC100oC
1517232845
1821193251
1311253457
1216223148
a) Realice el anlisis de varianza para estos datos, para estudiar si la temperatura afecta la intensidad de corriente promedio. b) La temperatura tiene efecto sobre la variabilidad de las intensidades? _1394378869.unknown
_1394380728.unknown
_1394382517.unknown
_1394386473.unknown
_1394387640.unknown
_1394388255.unknown
_1395320091.unknown
_1394387708.unknown
_1394386600.unknown
_1394383841.unknown
_1394386244.unknown
_1394383168.unknown
_1394381029.unknown
_1394381196.unknown
_1394381255.unknown
_1394381146.unknown
_1394380936.unknown
_1394380978.unknown
_1394380834.unknown
_1394379531.unknown
_1394379733.unknown
_1394380293.unknown
_1394379702.unknown
_1394379188.unknown
_1394379415.unknown
_1394378927.unknown
_1204553446.unknown
_1394378646.unknown
_1394378675.unknown
_1394378623.unknown
_1204553064.unknown
_1204553108.unknown
_1204553179.unknown
_1204553077.unknown
_1204553029.unknown
_1204553030.unknown
_1204552921.unknown
_1204553028.unknown