universidad tecnológica de torreón

13
UNIVERSIDAD TECNOLÓGICA DE TORREÓN UNIVERSIDAD TECNOLÓGICA DE TORREÓN Procesos Industriales Área de Manufactura Irene Alejandra Cordero Acosta Estadística “Prueba de Hipótesis e Intervalos de Confianza” UNIDAD III Torreón, Coahuila A 18 de abril de 2012 Estadística 1

Upload: alejandra-cordero

Post on 17-Jun-2015

1.060 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Universidad Tecnológica de Torreón

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

Procesos Industriales Área de Manufactura

Irene Alejandra Cordero Acosta

Estadística

“Prueba de Hipótesis e Intervalos de Confianza”

UNIDAD III

Torreón, Coahuila

A 18 de abril de 2012

Prueba de Hipótesis

1

Page 2: Universidad Tecnológica de Torreón

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

1.- Cuando las ventas medias, por establecimiento autorizado, de una marca de relojes caen por debajo de las 170,000 unidades mensuales, se considera razón suficiente para lanzar una campaña publicitaria que active las ventas de esta marca. Para conocer la evolución de las ventas, el departamento de marketing realiza una encuesta a 51 establecimientos autorizados, seleccionados aleatoriamente, que facilitan la cifra de ventas del último mes en relojes de esta marca. A partir de estas cifras se obtienen los siguientes resultados: media = 169.411,8 unidades., desviación estándar = 32.827,5 unidades. Suponiendo que las ventas mensuales por establecimiento se distribuyen normalmente; con un nivel de significación del 5 % y en vista a la situación reflejada en los datos. ¿Se considerará oportuno lanzar una nueva campaña publicitaria?

n = 51

H0: ( = 170000

H1: ( < 170000

a = 0,05

2.- Se tiene interés en la rapidez de combustión de un agente propulsor para los sistemas de salida de emergencia en aeronaves. (Esta rapidez es una variable aleatoria con alguna distribución de probabilidad). Especialmente

2

Page 3: Universidad Tecnológica de Torreón

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

interesa la rapidez de combustión promedio (que es un parámetro (m) de dicha distribución). De manera más específica, interesa decidir si esta rapidez promedio es o no 50 cm/seg.

El planteamiento formal de la situación se realiza en términos de una Hipótesis Nula (que es la proposición que se quiere poner a prueba) y una Hipótesis Alternativa, la cual se aceptará si se rechaza la hipótesis nula:

Hipótesis Nula: H0: m = 50 cm/seg

Hipótesis Alternativa: H1: m ¹ 50 cm/seg

3.- Un gerente de ventas de libros universitarios afirma que en promedio sus representantes de ventas realiza 40 visitas a profesores por semana. Varios de estos representantes piensan que realizan un número de visitas promedio superior a 40. Una muestra tomada al azar durante 8 semanas reveló un promedio de 42 visitas semanales y una desviación estándar de 2 visitas. Utilice un nivel de confianza del 99% para aclarar esta cuestión.

( = 40

n = 8

Nivel de confianza del 99%

Nivel de significación = (100%-99%)/2 = 0,5% = 0,005

H0: ( = 40

H1: ( > 40

Grados de libertad: n-1 = 8-1 =7

a = 0,005

3

Page 4: Universidad Tecnológica de Torreón

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

4.- Un investigador de mercados y hábitos de comportamiento afirma que el tiempo que los niños de tres a cinco años dedican a ver la televisión cada semana se distribuye normalmente con una media de 22 horas y desviación estándar 6 horas. Frente a este estudio, una empresa de investigación de mercados cree que la media es mayor y para probar su hipótesis toma una muestra de 64 observaciones procedentes de la misma población, obteniendo como resultado una media de 25. Si se utiliza un nivel de significación del 5%. Verifique si la afirmación del investigador es realmente cierta.

n = 64

a = 5% = 0,05

H0: ( = 22

H1: ( > 22

a = 0,05

5.- Un error de tipo I cuando m=50, pero x para la muestra considerada cae en la región crítica y se cometerá un error de tipo II cuando m ¹ 50 pero x para la muestra considerada cae en la región de aceptación; calcular a para el ejemplo de la rapidez de combustión para una muestra de N=10 datos,

4

Page 5: Universidad Tecnológica de Torreón

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

suponiendo que la desviación estándar de la rapidez de combustión es s=2.5 cm/seg.

Calcular a del ejemplo anterior para

a) los nuevos límites de la región de aceptación 48 y 52.

b) Para N=16 con los límites originales

c) con ambas modificaciones

a) a = normcdf(48,50,0.79) + (1-normcdf(52,50,0.79)) = 0.0114

b) a = normcdf(48.5,50,0.625)+(1-normcdf(51.5,50,0.625)) = 0.0164

c) a = normcdf(48,50,0.625)+(1-normcdf(52,50,0.625)) = 0.0014

6.- Los empleados de una compañía eligen uno de tres posibles planes de pensión. La gerencia desea saber con a=0.05 si la preferencia en la elección es independiente de la clasificación del contrato (asalariados y por horas). De una muestra aleatoria de 500 empleados se obtiene la siguiente tabla de contingencia

Tipo de contrato Plan 1 Plan 2 Plan 3 Total

Asalariados 160 140 40 340

Por Horas 40 60 60 160

Total 200 200 100 500

La variable de interés es la preferencia de los empleados por los planes de pensión

H0: La preferencia es independiente del tipo de contrato

H1: La preferencia no es independiente del tipo de contrato

a=0.05

5

Page 6: Universidad Tecnológica de Torreón

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

El estadístico de prueba es χ2=∑

j=1

c

∑i=1

r (Oij−Eij )2

Eij

Como r=2, c=1, c2 tiene 2 grados de libertad, por lo tanto H0 debe rechazarse si c2> c2

0.05,2=5.99

Cálculos: c2 = 49.63

Como 49.63>5.99, Se rechaza la hipótesis de independencia. El valor P para c2 = 49.63 es P=1.671x10-11

Rechazar H0 si la rapidez promedio de combustión m es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar H0: m=50 cuando el valor verdadero es m=52.

b = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = 0.2643

7.- Un diseñador quiere reducir el tiempo de secado de una pintura. Se prueban dos fórmulas de pintura. La fórmula 1 es la normal y la fórmula 2 posee un ingrediente secante que se espera reduzca el tiempo de secado. Se sabe que el tiempo de secado tiene una desviación estándar de 8 min y que ésta no se afecta con la adición del nuevo ingrediente. Se pintan 10 especímenes con la fórmula 1, y 10 con la fórmula 2, obteniéndose tiempos promedio de secado de x1=121 min, y x2=112 min. Respectivamente. ¿A qué conclusión se llega sobre la eficacia del nuevo ingrediente utilizando a=0.05?

Cantidad de interés: m1 - m2

H0: m1 = m2

H1: m1 > m2 (se busca evidencia fuerte que indique que el tiempo de secado promedio de la muestra 2 es menor)

6

Page 7: Universidad Tecnológica de Torreón

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

a=0.05

El estadístico de prueba es

H0 se rechazará si z>z0.05 = 1.645

Sustituyendo los datos, obtenemos z=(121-112)/(12.8)1/2=2.52

z = 2.52 > 1.645 se rechaza H0 con un nivel de significancia a=0.05

8.- Un embotellador de refresco desea estar seguro de que las botellas que usa tienen en promedio un valor que supera el mínimo de présión de estallamiento de 200 psi. El embotellador puede formular una prueba de hipótesis de dos maneras:

H0: m=200 psi H0: m=200 psi

H1: m>200 psi H1: m<200 psi

Intervalos de Confianza

1.- Si la media de la muestra es 100 y la desviación estándar es 10, el intervalo

de confianza al 95% donde se encuentra la media para una distribución normal

es:

7

Page 8: Universidad Tecnológica de Torreón

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

100 + (10) X 1.96 => (80.4, 119.6) 1.96 = Z0.025

El 95% de Nivel de Confianza significa que sólo tenemos un 5% de oportunidad

de obtener un punto fuera de ese intervalo.

Esto es el 5% total, o 2.5% mayor o menor. Si vamos a la tabla Z veremos que

para un área de 0.025, corresponde a una Z de 1.960.

C.I. Multiplicador

Za/2

99 2.576

95 1.960

90 1.645

85 1.439

80 1.282

Para tamaños de muestra >30, o s conocida usar la distribución Normal

Para muestras de menor tamaño, o s desconocida usar la distribución t

El ancho del intervalo de confianza decrece con la raíz cuadrada del tamaño de

la muestra.

2.- resistencias a la tensión: 28.7, 27.9, 29.2 y 26.5 psi

media puntual:

X media = 28.08 con S = 1.02

8

Page 9: Universidad Tecnológica de Torreón

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

intervalo de confianza para un nivel de confianza del 95% (t = 3.182 con n-1=3

grados de libertad)

Xmedia±3.182*S/√n = 28.08±3.182*1.02/2=(26.46, 29.70)

3.- Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión.

2 5 6 8 8 9 9 10

11

11

11

13

13

14

14

14

14

14

14

15

15

16

16

16

16

16

16

16

16

17

17

17

18

18

18

19

19

19

19

19

19

19

19

20

20

Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional

desconocida. Como es desconocido, lo estimamos por s =18,7. Luego, un intervalo de confianza aproximado es

Luego, el intervalo de confianza para es (13,2 , 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%.

4.- En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15 años en la Región Metropolitana, se encontró que el 17.6% eran hipertensas. Un intervalo de 95% de confianza para la proporción de mujeres hipertensas en la Región Metropolitana está dado por:

Luego, la proporción de hipertensas varía entre (0,139 , 0,212) con una confianza de 95%.

9

Page 10: Universidad Tecnológica de Torreón

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

5.- El promedio de peso de nacimiento de cierta población es igual a la media nacional de 3250 gramos. Al tomar una muestra de 30 recién nacidos de la población en estudio, se obtuvo:

= 2930s= 450n= 30

Al construir un intervalo de 95% de confianza para la media poblacional, se obtiene:

Luego, el peso de nacimiento varía entre 2769 y 3091 gramos, con una confianza de 95%. Como el intervalo no incluye el valor =3250 gramos planteado en la hipótesis, entonces esta es rechazada con confianza 95% (o un valor p menor a 0,5).

6.- Una empresa de investigación llevó a cabo una encuesta para determinar la cantidad media que los fumadores gastan en cigarrillos durante una semana. La semana encontró que la distribución de cantidades gastadas por semana tendía a seguir una distribución normal, con una desviación estándar de $5. Una muestra de de 64 fumadores reveló que = $20.

¿Cuál es el estimador de intervalo de confianza de 95% para la μ?

n = 64= 20σ= 5N.C = 95% = .95001 - .9500 = .0500 .0500÷ 2 = .0250 z=±1.96

±zσ

√n20±1.96

5

√6420−1.225=18.77

20±1.965820+1.225=21.25

20±1.96×.625Intervalo de confianza20±1.22518 .77−21 .25

.

10

Page 11: Universidad Tecnológica de Torreón

UNIVERSIDAD TECNOLÓGICA DE TORREÓN

7.- María considera postularse para la alcaldía de la ciudad de Torreón. Antes de solicitar la postulación, decide realizar una encuesta entre los electores de Carolinas. Una muestra de de 400 electores revela que 300 la apoyarían en las elecciones de noviembre. Construya un intervalo de confianza del 99% para la proporción poblacional

.9900 = .0100 .0100÷ 2 = .0050 z=±2 .58

p±z √ p(1−p)nn = 300x = 15 p = x/n = 15/300 =0.05 N.C = 80%

.75±2.58√ .75(1−.75)400.75±2.58(.01875) .75−.0483=.7017

.75±2.58√ .1875400.75± .0483.75+ .0483=.7983

Intervalo de confianza = .7017−.7983

8.- La Doctora Burgos es profesora de inglés. Hace poco contó el número de palabras con faltas de ortografía en un grupo de ensayos de sus estudiantes. Observó que la distribución de palabras con faltas de ortografía por ensayo se regía por una distribución normal con una desviación estándar de 2.44 palabras por ensayo. En su clase de 40 alumnos de las 10 de la mañana, el número medio de las palabras con faltas de ortografía fue de 6.05. Construya un intervalo de confianza de 90%

n = 40= 6.05σ= 2.44N.C = 90% = .9000.9000 = .1000 .1000÷ 2 = .0500 z=±1.64

±zσ

√n6.05±1.64

2.44

√406.05−0.631=5.419

6.05±1.642.446.32

6.05+0.631=6.681

6.05±1.64× .385Intervalo de confianza6.05±0.6315 .419−6.68

11