Último trabajo métodos estadísticos prueba de hipotesis

8
Universidad del Bío Bío Concepción, Chile Trabajo de Métodos Estadísticos: “Prueba de Hipótesis” Alumnos: - Cristian Basoalto -Rodrigo Castillo -Francisco Luengo -Nicolas Espinoza -Javier Barra Asignatura: Mét. Estad. Aplicados a la Ing. Profesora: Pamela Sobarzo Fecha: 23 de Septiembre de 2015

Upload: cristian-basoalto

Post on 12-Jul-2016

13 views

Category:

Documents


4 download

DESCRIPTION

trabajo de prueba de hipotesis

TRANSCRIPT

Page 1: Último Trabajo Métodos Estadísticos Prueba de Hipotesis

Universidad del Bío Bío

Concepción, Chile

Trabajo de Métodos Estadísticos: “Prueba de Hipótesis”

Alumnos: - Cristian Basoalto

-Rodrigo Castillo -Francisco Luengo -Nicolas Espinoza -Javier Barra

Asignatura: Mét. Estad. Aplicados a la Ing.

Profesora: Pamela Sobarzo

Fecha: 23 de Septiembre de 2015

Page 2: Último Trabajo Métodos Estadísticos Prueba de Hipotesis

b) Explique en forma clara cuáles son los dos tipos de errores que se pueden cometer en pruebas de hipótesis. Muestre un ejemplo en cada caso.

R.- El hecho de utilizar estadísticos muestréales para tomar decisiones sobre parámetros poblacionales, incide en el hecho de cometer riesgos al establecer conclusiones incorrectas.

Dichas decisiones incorrectas reciben el nombre de Error Tipo I o Error Tipo II:

i) Error Tipo I: Ocurre si la hipótesis nula 𝐻𝐻0 es rechazada cuando realmente es cierta (y por ende, no debiese ser rechazada). La probabilidad de que ocurra un Error Tipo I se denota por ∝.

ii) Error Tipo II: Ocurre sí la hipótesis nula 𝐻𝐻0 no se rechaza cuando realmente es falsa (y por ende, debe ser rechazada). La probabilidad de que ocurra un Error Tipo II se denota por 𝛽𝛽.

Con el fin de comprender los conceptos de una mejor manera, se procederá a realizar un ejercicio, al cual se le calculara ambos tipos de errores: “Se tienen dos cajas (A y B). La caja A tiene 40 fichas con el número 1, 50 fichas con el número 10 y 10 fichas con el número 100. La caja B tiene 40 fichas con el número 100, 50 fichas con el número 10 y 10 fichas con el número 1.” Llevado a una tabla, la información que tenemos es la siguiente:

Tabla N°1: “Información del ejemplo”

Dado que al elegir una caja y sacar una ficha, esta elección es al azar, tendremos:

𝐻𝐻0: 𝐿𝐿𝐿𝐿 𝑐𝑐𝐿𝐿𝑐𝑐𝐿𝐿 𝑒𝑒𝑒𝑒 𝑙𝑙𝐿𝐿 𝐴𝐴

𝐻𝐻1: 𝐿𝐿𝐿𝐿 𝑐𝑐𝐿𝐿𝑐𝑐𝐿𝐿 𝑒𝑒𝑒𝑒 𝑙𝑙𝐿𝐿 𝐵𝐵 La probabilidad de cometer un Error Tipo I será:

∝= 𝑃𝑃(𝑟𝑟𝑒𝑒𝑐𝑐ℎ𝐿𝐿𝑎𝑎𝐿𝐿𝑟𝑟 𝐻𝐻0/ 𝐻𝐻0 𝑒𝑒𝑒𝑒 𝑣𝑣𝑒𝑒𝑟𝑟𝑣𝑣𝐿𝐿𝑣𝑣𝑒𝑒𝑟𝑟𝐿𝐿) ∝= 𝑃𝑃(𝑒𝑒𝐿𝐿𝑐𝑐𝐿𝐿𝑟𝑟 𝑢𝑢𝑢𝑢𝐿𝐿 𝑓𝑓𝑓𝑓𝑐𝑐ℎ𝐿𝐿 𝑣𝑣𝑒𝑒 100 𝑣𝑣𝑒𝑒 𝑙𝑙𝐿𝐿 𝑐𝑐𝐿𝐿𝑐𝑐𝐿𝐿 𝐴𝐴)

∝=10

100

Page 3: Último Trabajo Métodos Estadísticos Prueba de Hipotesis

∝= 0,1 Mientras que la probabilidad de cometer un Error Tipo II será:

𝛽𝛽 = 𝑃𝑃(𝐿𝐿𝑐𝑐𝑒𝑒𝑎𝑎𝑎𝑎𝐿𝐿𝑟𝑟 𝐻𝐻0 / 𝐻𝐻1 𝑒𝑒𝑒𝑒 𝑣𝑣𝑒𝑒𝑟𝑟𝑣𝑣𝐿𝐿𝑣𝑣𝑒𝑒𝑟𝑟𝐿𝐿) 𝛽𝛽 = 𝑃𝑃(𝑒𝑒𝐿𝐿𝑐𝑐𝐿𝐿𝑟𝑟 𝑢𝑢𝑢𝑢𝐿𝐿 𝑓𝑓𝑓𝑓𝑐𝑐ℎ𝐿𝐿 𝑣𝑣𝑒𝑒 1 ó 𝑣𝑣𝑒𝑒 10 𝑣𝑣𝑒𝑒 𝑙𝑙𝐿𝐿 𝑐𝑐𝐿𝐿𝑐𝑐𝐿𝐿 𝐵𝐵)

𝛽𝛽 = 60/100 𝛽𝛽 = 0,60

Por lo que vemos que es mucho más probable cometer un Error del Tipo II.

c) Explique en que consiste la función potencia y grafique.

R.- Potencia de una prueba se define como la probabilidad de rechazar la hipótesis nula 𝐻𝐻0 cuando realmente es falsa y debe rechazarse. Es el complemento (1 − 𝛽𝛽) de la probabilidad de un Error Tipo II. También se le llama “Poder de una Prueba Estadística”.

Gráfico N° 1: “Función de Potencia”

Page 4: Último Trabajo Métodos Estadísticos Prueba de Hipotesis

1.- Para comparar el rendimiento de dos autos nuevos (modelos comparables), 7 autos de la marca A fueron conducidos por un mismo chofer en una misma ruta. Las millas observadas por galón de gasolina fueron: 22.8, 26.0, 24.1, 25.3, 23.8, 24.5, 26.6. Si además se sabe que el rendimiento sigue una distribución normal con varianza 𝜎𝜎2𝐴𝐴 =1.85. ¿Aceptaría usted que el rendimiento de los autos del modelo A es superior a 24 millas por galón?

R.- Se debe probar que el rendimiento de los autos del modelo A es superior a 24 millas por galón.

Es decir:

𝐻𝐻0: 𝜇𝜇 ≥ 24

𝐻𝐻1: 𝜇𝜇 < 24

Para esto, se usará un nivel de confianza del 95%.

𝑢𝑢 = 7; �̅�𝑥 = 25,5897; 𝑆𝑆 = 1,36015; 1 − 𝛼𝛼 = 0,95

𝑍𝑍�̅�𝑥 =�̅�𝑥 − 𝜇𝜇

𝑆𝑆/√𝑢𝑢 − 1=

25,5897 − 241,36015/√7 − 1

= −2,8629

Como lo indica la hipótesis alternativa, se trabaja a una cola inferior que la tabla de distribución 𝑎𝑎𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆𝑆 con 6 grados de libertad y una confiabilidad del 90%, el valor de Z es -1,9432.

Como se puede observar en el gráfico N° 2, el estadístico de trabajo está ubicado en la zona de rechazo de la hipótesis nula, por lo tanto, con un nivel de confianza del 95% no se puede aceptar que el rendimiento de los autos del modelo A es superior a 24 millas por galón.

Gráfico N° 2: “Zona de Rechazo y no Rechazo”

Page 5: Último Trabajo Métodos Estadísticos Prueba de Hipotesis

2.- Suponga que un segundo modelo de autos marca B fue conducido de la misma manera, obteniendo los siguientes resultados: 19.7, 17.2, 25.3, 18.1, 16.9, 26.8, 19.5 y 24.8. ¿Existe razón para creer que el rendimiento medio de los autos marca B es inferior a 20 millas por galón? Suponga normalidad en el rendimiento.

R.- La información que podemos desprender directamente desde el enunciado es la siguiente:

𝑢𝑢 = 8; �̅�𝑥 = 21,0375; 𝑆𝑆 = 3,71077; 𝑆𝑆2 = 13,7698

Realizando la prueba de hipótesis para la media n<30:

𝐻𝐻0: 𝜇𝜇 ≤ 20 𝑚𝑚𝑓𝑓𝑙𝑙𝑙𝑙𝐿𝐿𝑒𝑒/ℎ𝑟𝑟

𝐻𝐻1: 𝜇𝜇 > 20 𝑚𝑚𝑓𝑓𝑙𝑙𝑙𝑙𝐿𝐿𝑒𝑒/ℎ𝑟𝑟

Para lo anterior, se hará uso de un nivel de confianza del 95%. De lo cual obtenemos:

𝑍𝑍�̅�𝑥 =�̅�𝑥 − 𝜇𝜇

𝑆𝑆/√𝑢𝑢 − 1=

21,0375 − 203,71077/√8 − 1

= 0,73973

Buscando el valor en la distribución t student con 7 grados de libertad, veremos que el valor de Z es de 1,8946.

Como el estadístico de trabajo (0,7397) está ubicado en la zona de no rechazo de la hipótesis nula, podemos afirmar (con un nivel de confianza del 95%), que el rendimiento medio de los autos marca B es inferior a 20 millas por galón.

Page 6: Último Trabajo Métodos Estadísticos Prueba de Hipotesis

3.- Un fabricante afirma que por lo menos el 90 por ciento de las piezas de una maquinaria que suministra una fábrica guardan las formas especificadas. Un examen de 200 de esas piezas, reveló que 160 de ellas no eran defectuosas. Pruebe si lo que afirma el fabricante es cierto.

R.- 𝐻𝐻0: 𝜋𝜋 ≥ 0,9

𝐻𝐻1: 𝜋𝜋 < 0,9

Referente a la información que se puede desprender directamente del ejercicio tenemos:

𝑢𝑢 = 200; 𝑎𝑎 =160200

= 0,8; 𝑞𝑞 = 1 − 𝑎𝑎 = 0,2; 1−∝= 0,95

Es decir:

𝑍𝑍𝑝𝑝 =𝑎𝑎 − 𝜋𝜋

�𝑎𝑎 ∗ 𝑞𝑞𝑢𝑢

=0,8 − 0,9

�0,8 ∗ 0,2200

= −3,536

Considerando una confiabilidad de un 95%, obtenemos que el valor correspondiente (obtenido desde la tabla de distribución) es -1,64.

El valor obtenido con anterioridad se encuentra en la zona de rechazo, conforme se aprecia en la siguiente imagen:

Imagen 2: “Zonas de aceptación y rechazo”

En base a los cálculos realizados, es posible mencionar (con una confiabilidad del 95%), que la afirmación del fabricante no es correcta.

Page 7: Último Trabajo Métodos Estadísticos Prueba de Hipotesis

4.- Para estudiar los hábitos alimenticios de los murciélagos se marcaron 22 murciélagos y se rastrearon por radio. De estos 22, 12 eran hembras y 10 eran machos. En cada uno de los 22 murciélagos se anotaron las distancias que volaron (en metros) entre una y otra ingestión de alimento, obteniendo los siguientes resultados:

Murciélagos hembra Murciélagos macho n 1 = 12 n 2 = 10 �̅�𝑥1 = 180 �̅�𝑥2 = 136 S1 = 92 S2 = 86

a) Pruebe la hipótesis de que la distancia media recorrida entre una y otra ingestión de alimento es la misma en los murciélagos macho y los murciélagos hembra. Para esto se utilizara el método de la diferencia de proporciones, y se debe comprobar si las varianzas son iguales.

La estadística de trabajo será:

𝑇𝑇 = 12 ∗ (9) ∗ 922

10 ∗ (11) ∗ 862= 1,1236

Por lo que con una confiabilidad del 90% se buscara en la tabla de distribución Fisher, con 11 grados de libertad en el numerador y 9 en el denominador, el valor de Z 0,05 es 0.345, y el valor de Z 0,95 es de 3,102. Dado que el estadístico de trabajo cae en la zona de aceptación de la hipótesis nula, como se puede apreciar en el grafico (imagen 3), se puede decir que “las varianzas poblacionales son iguales”, con un 90% de confianza.

Imagen 3: “Zonas de aceptación y rechazo”

Page 8: Último Trabajo Métodos Estadísticos Prueba de Hipotesis

Considerando que las varianzas son iguales, la estadística de trabajo a utilizar es:

Y la formulación de la hipótesis nula será:

H0: I = E

H1 : I ≠ E

𝑍𝑍𝑥𝑥1����−𝑥𝑥2���� =[(180 − 160)] ∗ √20

�� 112 + 1

10� ∗ [12 ∗ 922 + 10 ∗ 862]

𝑍𝑍𝑥𝑥1����−𝑥𝑥2���� = 0,275611

Con una confiabilidad del 95% en la tabla de distribución t-student son 20 grados de libertad, el valor de Z es 1,7247.

Imagen 4: “Zonas de aceptación y rechazo”

R: Como el estadístico de trabajo se encuentra en la zona de no rechazo, dados los límites que se pueden apreciar en el grafico (imagen 4), se puede afirmar que la distancia media recorrida entre una y otra ingestión de alimento es la misma en los murciélagos macho y los murciélagos hembra.

b) ¿Qué puede decir de las varianzas? R: como se demostró anteriormente, las varianzas son iguales.