pruebas de hipotesis - libro montgomery

Upload: camilo-andres-rey

Post on 12-Jul-2015

1.370 views

Category:

Documents


13 download

TRANSCRIPT

PRUEBAS DE HIPTESIS Introduccin La experiencia sobre el comportamiento de algn ndice de un proceso, o la exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones sobre el valor de algn parmetro estadstico.Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar unadecisin entre aceptar o rechazar la proposicin Estas proposiciones se denominan Hiptesis y el procedimiento para decidir si se aceptan o se rechazan se denomina Prueba de Hiptesis Una prueba de hiptesis es una herramienta de anlisis de datos que puede en general formar parte de un experimento comparativo ms completo PRUEBAS DE HIPTESIS Introduccin Una hiptesis Estadstica es un proposicin sobre los parmetros de una poblacin o sobre la distribucin de probabilidad de una variable aleatoria Ejemplo: Se tiene inters en la rapidez de combustin de un agente propulsor para los sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable aleatoria con alguna distribucin de probabilidad). Especialmente interesa la rapidez de combustin promedio (que es unparmetro () de dicha distribucin). De manera ms especfica, interesa decidir si esta rapidez promedio es o no 50 cm/seg. El planteamiento formal de la situacin se realiza en trminos de una Hiptesis Nula (que es la proposicin que se quiere poner a prueba) y una Hiptesis Alternativa, la cual se aceptar si se rechaza la hiptesis nula: Hiptesis Nula: H0: = 50 cm/seg Hiptesis Alternativa:H1: = 50 cm/seg En el ejemplo se tiene una Hiptesis Alternativa Bilateral, ya que se verifica para valores de a ambos lados de 50 cm/seg. PRUEBAS DE HIPTESIS Introduccin En ocasiones interesa una Hiptesis Alternativa Unilateral, Por ejemplo: H0: = 50 cm/seg H0: = 50 cm/seg H1: < 50 cm/seg H1: > 50 cm/seg De donde puede surgir una Hiptesis Nula sobre un parmetro? Cul sera el inters dependiendo del origen de la hiptesis? 1) Origen: Experiencia, pruebas pasadas o conocimiento del proceso. Inters: averiguar si ha cambiado el parmetro 2) Origen: Alguna teora o modelo sobre el funcionamiento del proceso. Inters: Verificar la valids de dicha teora 3) Origen: Especificaciones de diseo, obligaciones contractuales, normas a cumplir o solicitudes del cliente. Inters: probar el cumplimiento o incumplimiento de las especificaciones. La verdad o falsedad de la hiptesis NO puede conocerse con total seguridad a menos que pueda examinarse toda la poblacin PRUEBAS DE HIPTESIS Introduccin Procedimiento General para la prueba de una hiptesis Tomar un muestra aleatoria Calcular un estadstico basado en la muestra Usar el estadstico y sus propiedades para tomar una decisin sobre la Hiptesis Nula PRUEBAS DE HIPTESIS Introduccin Ejemplo: Consideremos el ejemplo anterior de la rapidez de combustin. Aqu se tena:H0: = 50 cm/seg H1: = 50 cm/seg No rechazar H0.- Un valor de la media muestral x muy cercano a 50 cm/seg es una evidencia que apoya a la hiptesis nula, sin embargo es necesario introducir un criterio para decidir que tanto es muy cercano, para el ejemplo este criterio pudiera ser: 48.5 s x s 51.5, si esto ocurre se acepta H0

De lo contrario, es decir, six < 48.5 o x >51.5, se aceptaH1 _ _ __ 48.5 5051.5 Regin CrticaRegin de no rechazoRegin Crtica Se acepta H1No se rechaza H0Se acepta H1

=50 = 50 = 50 Valores Crticos PRUEBAS DE HIPTESIS Errores Tipo I y Tipo II El procedimiento anterior puede llevarnos a una de dos conclusiones errneas: Error Tipo I.- Se rechaza H0 cuando sta es verdadera En el ejemplo se cometer un error de tipo I cuando =50, pero x para la muestra considerada cae en la regin crtica Y se cometer un error de tipo II cuando = 50 pero x para la muestra considerada cae en la regin de no rechazo Error Tipo II.- No se rechaza H0 cuando sta es falsa _ _ Condicin real Decisin H0 verdaderaH0 falsa Rechazar H0 Error Tipo Iok No rechazar H0 okError Tipo II PRUEBAS DE HIPTESIS Error Tipo I A la probabilidad de cometer un error de Tipo I se denota por o, y se le llama el nivel o tamao de significancia de la prueba es decir o = P(error Tipo I)= P(rechazar H0 | H0 es verdadera) Ejemplo: Calcular o para el ejemplo de la rapidez de combustin para una muestra de N=10 datos, suponiendo que la desviacin estndar de la rapidez de combustin es o=2.5 cm/seg. _ o= 0.288+ 0.288 = 0.0576 Esto significa que el 5.76% de las muestras de tamao 10 conducirn al rechazo de la Hiptesis H0: =50 cm/seg, cuando sta es verdadera. Solucin: en este caso o = P( x caiga en la regin crtica | =50), es decir: o = P( x < 48.5) + P( x > 51.5) Recordando que La distribucin de x es Normal con media =50 y desviacin estndar o/\N =0.79, por lo tanto,__ _ PRUEBAS DE HIPTESIS Error Tipo I Es claro que o se puede reducir de dos maneras: - Aumentando la regin de no rechazo - Aumentando el tamao de la muestra Ejemplo: recalcular o del ejemplo anterior para a) los nuevos lmites de la regin de aceptacin 48 y 52.b) ParaN=16 con los lmites originales c) con ambas modificaciones Solucin: a) o = 0.0114 b) o = 0.0164 c) o = 0.0014 PRUEBAS DE HIPTESIS Error tipo II Para evaluar un experimento de prueba de hiptesis tambin se requiere calcular la probabilidad del error de Tipo II, denotada por |, es decir | = P(error Tipo II) = P(No rechazar H0 | H0 es falsa) Sin embargo, no es posible calcular | si no se tiene una hiptesis alternativa especfica, es decir, un valor particular del parmetro bajo prueba en lugar de un rango de valores Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio de combustin es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetra slo se requiere evaluar la probabilidad de aceptar H0: =50 cuando el valor verdadero es =52. PRUEBAS DE HIPTESIS Error tipo II 4546474849505152535455 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 H0: =50 H1: =52 | = 0.2643 De acuerdo a la figura: | = P(48.5 s x s 51.5 | =52) _ PRUEBAS DE HIPTESIS Error tipo II | = 0.8923 La probabilidad de obtener un error de tipo II aumenta muy rpido a medida que el valor verdadero tiende al valor hipottico, por ejemplo, si suponemos que =50.5, y recalculamos |, obtenemos | tambin depende del tamao de la muestra, por ejemplo, si N=16 obtenemos en el ejemplo cuando =52:o=0.625, por lo tanto | = 0.2119 Es decir, | disminuye cuando N aumenta, excepto si el valor real de est muy cerca del hipottico PRUEBAS DE HIPTESIS Conclusiones Fuerte y Dbil Es por eso que el rechazo de H0 siempre se considera como una Conclusin Fuerte. (los datos aportan fuerte evidencia de que H0 es falsa) Como uno puede elegir los valores crticos del intervalo de aceptacin uno controla el valor de o. Uno puede entonces controlar la probabilidad de rechazar de manera errnea H0. La decisin de no rechazar H0 se considera una Conclusin Dbil, a menos que se sepa que | es considerablemente pequeo. Por esto en lugar de decir se acepta H0 se prefiere decir incapaz de rechazar H0, es decir, no se ha encontrado evidencia suficiente para rechazar H0. O sea, no quiere decir que exista gran evidencia de que H0 sea cierta sino que no hay gran evidencia de que sea falsa. PRUEBAS DE HIPTESIS Hiptesis Unilaterales H0: =50 cm/seg H1: 50PRUEBAS DE HIPTESIS Hiptesis Unilaterales Ejemplo: Un embotellador de refresco desea estar seguro de que las botellas que usa tienen en promedio un valor que supera el mnimo de prsin de estallamiento de 200 psi. El embotellador puede formular una prueba de hiptesis de dos maneras: Con el planteamiento (1) Como el rechazo de H0 es una conclusin fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que las botellas soportan mayor presin que 200 psi H0: =200 psiH0: =200 psi H1: >200 psiH1: 200 psiH1: zo/2

No rechazar H0 si: - zo/2 s z s zo/2 PRUEBAS DE HIPTESIS Prueba de hiptesis sobre la media, varianza conocida Ejemplo: Se ilustrarn los 8 pasos del procedimiento general para el ejemplo del combustible slido para sistemas de escape deaeronaves. En este caso se conoce o=2 cm/seg, se desea probar si la media es de 50 cm/seg. Se selecciona una muestra aleatoria de tamao N=25, obteniendo x=51.3 cm/seg. Se especifica un nivel de sginificancia o=0.05 A qu conclusiones se debe llegar? 1) El parmetro de inters es (rapidez promedio de combustin) 2) H0: = 50 cm/seg 3) H1: = 50 cm/seg 4) o = 0.05 _ PRUEBAS DE HIPTESIS Prueba de hiptesis sobre la media, varianza conocida 5) La estadstica de prueba es 6) Rechazar H0 si z>1.96 o si z 1.96,se rechaza H0: = 50 cm/segcon un nivel de significancia o = 0.05 8) Es decir, Se concluye que en base a una muestra de 25 mediciones la rapidez promedio de combustin es diferente de 50 cm/seg, de hecho, existe evidencia fuerte de que sta es mayor. N / XZ0__=25 . 325 2/50 3 . 51Z ==PRUEBAS DE HIPTESIS Valores P Una manera de notificar los resultados de una prueba de hiptesis es establecer si la hiptesis nula fue o no rechazada con un nivel especificado o de significanciaUna alternativa es especificar el nivel de significancia o ms pequeo que conduce al rechazo de la hiptesis nula. A este se le llama el Valor PEste valor P slo depende de la muestra tomada, es decir, para una muestra y un estadstico calculado se puede obtener su valor P y comparar con un o especificado. Entonces, si P40 H1: = 40 Bioestadstica. Pruebas de hiptesis23 Significacin: p H0: = 40 o Significacin: p 43 = XNo se rechaza H0: = 40 H0: = 40 o Significacin: p 43 = XNo se rechaza H0: =40 Es la probabilidad que tendra una regin crtica que comenzase exactamente en el valor del estadstico obtenido de la muestra.Es la probabilidad de tener una muestra que discrepe an ms que la nuestra de H0.Es la probabilidad de que por puro azar obtengamos una muestrams extraa que la obtenida. p es conocido despus de realizar el experimento aleatorio El contraste es no significativo cuando p>o P P o o Significacin : p o 50 = XSe rechaza H0: =40 Se acepta H1: >40 Significacin : p P o Po 50 = XSe rechaza H0: =40 Se acepta H1: >40 El contraste es estadsticamente significativo cuandop < o Es decir, si el resultado experimental discrepa ms de lo tolerado a priori.Resumen: o, p y criterio de rechazo Sobre o Es nmero pequeo, preelegido al disear el experimento Conocido o sabemos todo sobre la regin crtica Sobre p Es conocido tras realizar el experimento Conocido p sabemos todo sobre el resultado del experimento Sobre el criterio de rechazo El contraste es significativo sip menor que oPRUEBAS DE HIPTESIS Valores P En el caso de la distribucin normal para la pureba sobre la media es fcil calcular el valor P. Si z0 fue el valor calculado del estadstico de prueba, entonces: Donde u(z) = P(Zsz) (Funcin de distribucin normal N(0,1)) Para el ejemplo z0= 3.25, entonces P=2(1-u(3.25))=0.0012. Es decir, H0 ser rechazada con cualquier nivel de significancia o > 0.0012 P = 2 [ 1- u(|z0|) ]Prueba de dos colas: H0:=0, H1: = 0 1- u(z0)Prueba de cola superior: H0:=0, H1: > 0 u(z0)Prueba de cola inferior: H0:=0, H1: < 0 Si se usa el enfoque del valor P el paso 6 del procedimiento general de prueba de hiptesis ya no es necesario. PRUEBAS DE HIPTESIS Error Tipo II y tamao de la muestra Consideremos la hiptesis bilateral H0:=0, H1: = 0. Si H0 es falsa y la media verdadera es = 0 + o (con o>0). El estadstico de prueba se puede escribir comoEs decir, Si H1 es verdadera Z tiene distribucin Normal con media y varianza 1.Por lo tanto, el error Tipo 1 (|) se puede calcular como N / XZ0__=N N /) (XZ0__++ =N ||.|

\|+ ~N z /2Y si definimos | = u(-z|), obtenemos ) z (zN /2+~PRUEBAS DE HIPTESIS Error Tipo II y tamao de la muestra Para el ejemplo del combustible slido. Si al analista le interesa disear la prueba de hiptesis de manera que si el valor verdadero de es 51 cm/seg se rechace H0 con una probabilidad alta (por ejemplo 90%) y con el mismo valor anterior de o=0.05 En este caso o=1, o=2, o=0.05 por lo tanto: N~ 42Observacin: Debe tenerse cuidado cuando se interpretan los resultados basados en una muestra muy grande, ya que es muyprobable que se detecte cualquier alejamiento (muy pequeo) respecto al valor hipottico o . Esta diferencia podra no tener ninguna importancia prctica pero conducir al rechazo de H0 PRUEBAS DE HIPTESIS Prueba de hiptesis sobre la igualdad de dos medias (varianzas conocidas) Se tienen dos poblaciones de inters. La primera con media 1 y varianza o12 conocidas y la segunda con media 2 y varianza o22 conocidas. Interesa saber si las dos medias son iguales. Se plantean las hiptesisH0: 1 = 2 H1: 1 = 2 Por lo tanto el siguiente estadstico de prueba Es N(0,1) si H0 es verdadera. Por lo tanto se rechazar H0 si z0>zo/2 o z 2 (se busca evidencia fuerte que indique que el tiempo de secado promedio de la muestra 2 es menor) __ PRUEBAS DE HIPTESIS Prueba de hiptesis sobre la igualdad de dos medias (varianzas conocidas) 4) o=0.05 5) El estadstico de prueba es 6) H0 se rechazar si z>z0.05 = 1.645 7) Sustituyendo los datos, obtenemos z=(121-112)/(12.8)1/2=2.52 8) Conclusin: Puesto que z = 2.52 > 1.645 se rechaza H0 con un nivel de significancia o=0.05 concluyndose el nuevo ingrediente s disminuye el tiempo de secado. Alternativamente puede calcularse un valor P =1-u(2.52) = 0.0059, es decir, se rechazar H0 para cualquier nivel de significancia o>0.0059 2221212___1___NN/ )X X( Z + =PRUEBAS DE HIPTESIS Identificacin Causa - Efecto En el ejemplo anterior se supone que fueron asignados de manera aleatoria 10 especmenes a una frmula (tratamiento) y 10 especmenes a la otra luego se aplic la pintura en un orden aleatorio a cada especmen hasta pintar los 20. Este es un Experimento Completamente Aleatorizado. En un estudio estadstico sobre la incidencia del cncer pulmonar entre personas que fuman normalmente se hace un seguimiento en el tiempo de los individuos a prueba. Este es un Experimento Observacional En este caso no se puede asignar de manera aleatoria un tratamiento u otro (fumar o no fumar) a una porcin de los individuos. Por otro lado, el hbito de fumar no es el nico factor que influye en el desarrollo de cncer pulmonar. PRUEBAS DE HIPTESIS Prueba de Hiptesis sobre la media, varianza desconocida Si la poblacin tiene una distribucin Normal con media y varianza o2 desconocidas pudiera utilizarse el estadstico S2 y el procedimiento descrito anteriormente para varianza conocida (esto es vlido para N grande), pero si la muestra es pequea, tendremos que usar el estadstico siguiente, el cual tiene una distribucin t con N-1 grados de libertad, As, para la prueba de Hiptesis bilateralH0: = 0 H1: = 0 Se rechazar H0 si t>to/2,N-1 o si t _21-o,k-p-1 Precaucin: Si las frecuencias esperadas son muy pequeas el estadstico _2 no reflejar el alejamiento entre lo observado y lo esperado. (Se considera que valores menores de 5 son pequeos) Si en una prueba resultan frecuencias esperadas pequeas, se pueden combinar intervalos de clase adyascentes para aumentar estos valores, ya que no es necesario que los anchos de clase sean del mismo tamao PRUEBAS DE HIPTESIS Prueba Ji2 de la Bondad del Ajuste Ejemplo 1.- Un algoritmo para generar enteros pseudoealeatorios de 0 a 9 se prueba para determinar si tiene una distribucin uniforme, para ello se generan 1000 nmeros, obteniendo la siguiente tabla de frecuencia. Existe evidencia de que el generador funciona de manera correcta?. Utilice o=0.05 Como Ei se puede calcular sin estimar ningn parmetro a partir de la muestra, entonces p=0 y el estadstico ser ji2 con k-p-1=10-0-1=9 grados de libertad. 0123456789 Oi 9493112101104951009910894 Ei 100100100100100100100100100100 PRUEBAS DE HIPTESIS Prueba Ji2 de la Bondad del Ajuste 1) Variable de inters: distribucin de los nmeros pseudoaleatorios 2) H0: La distribucin es uniforme en el intervalo de 0 a 9 3) H1: La distribucin No es uniforme en ese intervalo 4) o = 0.05 5) El estadstico de prueba es6) Se rechazar H0 si _2> _2 0.05,9=16.92 7) Clculos _2= 0.01*( (94-100)2+(93-100)2+...+(94-100)2 )=3.72 8) Conclusiones: como 3.72 < 16.92 No es posible rechazar la hiptesis. Por lo tanto parece ser que el generador de nmeros aleatorios trabaja bien.Cual es el valor P de la prueba ? ==k1 i i2i i2E) E (OPRUEBAS DE HIPTESIS Prueba Ji2 de la Bondad del Ajuste Ejemplo 2.- Se propone que el nmero de defectos en tarjetas de circuito impreso sigue una distribucin de Poisson. Se obtiene una muestra de 60 tarjetas y se observa el nmero de defectos, con los siguientes resultados: defectos01234 o ms Oi 3215940 Distribucin de Poisson. Es una distribucin discreta cuya funcin de probabilidad es Definida para x=0,1,2,3,.... Donde es la media de X x! ef(x)x -=PRUEBAS DE HIPTESIS Prueba Ji2 de la Bondad del Ajuste Clculo de las frecuencias Esperadas Ei: Un estimador para la media de la distribucin de Poisson es la media muestral, es decir, (32x0+15x1+9x2+4x3)/60=0.75 fallas/tarjeta. Usando este valor de m obtenemos la siguiente tabla de frecuencias esperadas: x01234 o ms F(x)0.4720.3540.1330.0330.0073 Ei 28.3221.247.981.980.44 Para evitar que las ltimas dos frecuencias esperadas sean menores que 5 combinamos las ltimas tres celdas para obtener: x012 o ms Ei 28.3221.2410.44 Oi 321513 PRUEBAS DE HIPTESIS Prueba Ji2 de la Bondad del Ajuste 1) Variable de inters: La forma de distribucin de los defectos en tarjetas de circuito impreso 2) H0: La distribucin es de Poisson3) H1: La distribucin No es Poisson 4) o = 0.05 5) El estadstico de prueba es , el cual tiene una distribucin _2 con k-p-1=3-1-1=1 grado de libertad 6) Se rechazar H0 si _2> _2 0.05,1=3.84 7) Clculos _2= (94-100)2/28.32+(93-100)2/21.24+(94-100)2/10.44 = 2.94 8) Conclusiones: como 2.94 < 3.84. No es posible rechazar la hiptesis. Por lo tanto parece ser que la distribucin de defectos en las placas de circuito impreso es Poisson El valor P de la prueba es P=0.9861 ==k1 i i2i i2E) E (OPRUEBAS DE HIPTESIS Prueba Ji2 de la Bondad del Ajuste Ejemplo 3.- Se desea determinar con o=0.05 si el voltaje de salida de una fuente de alimentacin est descrito por una distribucin Normal. Se toma una muestra aleatoria de N=100 fuentes, determinndose los siguientes valores muestrales x = 5.04, s = 0.08. Para evitar valores de frecuencias esperadas muy pequeos, de antemano se elige el ancho de los intervalos de clase de manera que la frecuencia esperada sea constante Fi = N / k. As, si k=8 clases, se buscarn 8 intervalos de clase que dividan la curva de densidad normal en 8 reas iguales, como se muestra en la siguiente figura para media 0 y varianza 1. PRUEBAS DE HIPTESIS Prueba Ji2 de la Bondad del Ajuste Para la distribucin N(0,1) los lmites de los 8 intervalos son , -1.15, -0.675, -0.32, 0, 0.32, 0.675, 1.15,+, por lo tanto para el ejemplo, los lmites son , 4.948, 4.986, 5.014, 5.040, 5.066, 5.094, 5.132,+ Con esta eleccin se obtiene la siguiente tabla de frecuencias para la muestra -4-3-2-101234 0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 PRUEBAS DE HIPTESIS Prueba Ji2 de la Bondad del Ajuste Intervalo de ClaseOi Ei De a 4.948 De 4.948 a 4.986 De 4.986 a 5.014 De 5.014 a 5.040 De 5.040 a 5.066 De 5.066 a 5.094 De 5.094 a 5.132 De 5.132 a + 12 14 12 13 12 11 12 14 12.5 12.5 12.5 12.5 12.5 12.5 12.5 12.5 Suma:100100 PRUEBAS DE HIPTESIS Prueba Ji2 de la Bondad del Ajuste 1) La variable de inters es el tipo de distribucin del voltaje dado por una fuente de alimentacin 2) H0: El tipo de distribucin es Normal 3) H1: El tipo de distribucin no es Normal 4) o = 0.05 5) El estadstico de prueba es 6) Para determinar los intervalos de clase se requiri estimar y o, por lo tanto los grados de libertad son k-p-1=8-2-1=5, por lo tanto se rechazar H0 si_2 > _20.05,5 = 11.07 7) Clculos: _2 = ( 1/12.5 )[(12-12.5)2+(14-12.5)2+...+(14-12.5)2] = 0.64 8) Conclusiones: como 0.64 _2o,(r-1)(c-1). = ==r1 iij2ij ijc1 j2E) E (OPRUEBAS DE HIPTESIS Tablas de Contingencia Ejemplo: Los empleados de una compaa eligen uno de tres posibles planes de pensin. La gerencia desea saber con o=0.05 si la preferencia en la eleccin es independiente de la clasificacin del contrato (asalariados y por horas). De una muestra aleatoria de 500 empleados se obtiene la siguiente tabla de contingencia Tipo de contratoPlan 1Plan 2Plan 3Total Asalariados16014040340 Por Horas406060160 Total200200100500 PRUEBAS DE HIPTESIS Tablas de Contingencia Solucin: Necesitaremos las frecuencias esperadas, para ello calculamos estimados de ui, vj para i=1,2, j=1,2,3: u1=0.68,u2=0.32, v1=0.4, v2=0.4, v3=0.2 Tipo de contratoPlan 1Plan 2Plan 3Total Asalariados13613668340 Por Horas646432160 Total200200100500 Con esto calculamos las frecuencias esperadas, por ejemplo E11= Nu1v1=500(0.68)(0.4)=136 El resto se muestran en la siguiente tabla PRUEBAS DE HIPTESIS Tablas de Contingencia 1) La variable de inters es la preferencia de los empleados por los planes de pensin 2) H0: La preferencia es independiente del tipo de contrato 3) H1: La preferencia no es independiente del tipo de contrato 4) o=0.05 5) El estadstico de prueba es 6) Como r=2, c=1, _2 tiene 2 grados de libertad, por lo tanto H0 debe rechazarse si _2> _20.05,2=5.99 7) Clculos: _2 = 49.63 8) Como 49.63>5.99, Se rechaza la hiptesis de independencia. El valor P para _2 = 49.63 es P=1.671x10-11

= ==r1 i ij2ij ijc1 j2E) E (O