lic. mata

UNIVERSIDAD TECNOLÓGICA DE TORREÓN.

Licenciado: Edgar Gerardo Mata

Ortíz

Alumna: América Iveth Valverde

Medina

Temas:

1.Pruba de Hipótesis

2.Intervalos de Confianza

Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis.

Hipótesis es una aseveración de una población elaborado con el propósito de poner aprueba, para verificar si la afirmación es razonable se usan datos.

En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.

Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.

Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco paso:

Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o no rechazar la hipótesis, pero debemos de tener cuidado con esta determinación ya que en la consideración de estadística no proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clasede prueba más allá de una duda razonable. Analizaremos cada paso en detalle

Objetivo de la prueba de hipótesis.

El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral), sino hacer

un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.

PROPÓSITO DE LA PRUEBA DE HIPÓTESIS El propósito de la prueba de hipótesis no es

cuestionar el valor calculado del estadístico (muestral), sino hacer

un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.

3.- Procedimiento sistemático para una prueba de hipótesis de una muestra

.Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1.

Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se estudian.

La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a una estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un "no" en la hipótesis nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho.

La hipótesis nula (Ho) se refiere siempre a un valor

especificado del parámetro de población, no a una

estadística de muestra. La letra H significa hipótesis

y el subíndice cero no hay diferencia. Por lo general

hay un "no" en la hipótesis nula que indica que "no

hay cambio" Podemos rechazar o aceptar Ho.

a) Prueba bilateral o de dos extremos: la hipótesis planteada se

formula con la igualdad

Ejemplo

H0 : µ = 200

H1 : µ ≠ 200

b) Pruebas unilateral o de un extremo: la hipótesis

planteada se formula con ≥ o ≤

H0 : µ ≥ 200 H0 : µ ≤ 200

H1 : µ < 200 H1 : µ > 200

En las pruebas de hipótesis para la media (μ), cuando se conoce la

desviación estándar (σ) poblacional, o cuando el valor de la muestra

es grande (30 o más), el valor estadístico de prueba es z y se

determina a partir de:

El valor estadístico z, para muestra grande y desviación estándar

poblacional desconocida se determina por la ecuación:

En la prueba para una media poblacional con muestra pequeña y

desviación estándar poblacional desconocida se utiliza el valor

estadístico t.

El jefe de la Biblioteca Especializada de la

Facultad de Ingeniería Eléctrica y Electrónica

de la UNAC manifiesta que el número

promedio de lectores por día es de 350. Para

confirmar o no este supuesto se controla la

cantidad de lectores que utilizaron la

biblioteca durante 30 días. Se considera el

nivel de significancia de 0.05

Día Usuarios Día Usuarios DíaUsuario

1 356 11 305 21 429

2 427 12 413 22 376

3 387 13 391 23 328

4 510 14 380 24 411

5 288 15 382 25 397

6 290 16 389 26 365

7 320 17 405 27 405

8 350 18 293 28 369

9 403 19 276 29 429

10 329 20 417 30 364

Se trata de un problema con una media poblacional: muestra grande y desviación estándar poblacional desconocida.

Paso 01: Seleccionamos la hipótesis nula y la hipótesis alternativa

Ho: μ═350

Ha: μ≠ 350

Paso 02: Nivel de confianza o significancia 95%

α═0.05

Paso 03: Calculamos o determinamos el valor estadístico de prueba

De los datos determinamos: que el estadístico de prueba es t, debido a que el numero de muestras es igual a 30, conocemos la media de la población, pero la desviación estándar de la población es desconocida, en este caso determinamos la desviación estándar de la muestra y la utilizamos en la formula reemplazando a la desviación estándar de la población.

Columna1

Media 372.8

Error típico 9.56951578

Mediana 381

Moda 405

Desviación estándar 52.4143965

Varianza de la muestra 2747.26897

Curtosis 0.36687081

Coeficiente de asimetría 0.04706877

Rango 234

Mínimo 276

Máximo 510

Suma 11184

Cuenta 30

Nivel de confianza (95.0%) 19.571868

Paso 04: Formulación de la regla de decisión.

La regla de decisión la formulamos teniendo en cuenta que esta es una prueba de dos colas, la mitad de 0.05, es decir 0.025, esta en cada cola. el área en la que no se rechaza Ho esta entre las dos colas, es por consiguiente 0.95. El valor critico para 0.05 da un valor de Zc = 1.96.

Por consiguiente la regla de decisión: es rechazar la hipótesis nula y aceptar la hipótesis alternativa, si el valor Z calculado no queda en la región comprendida entre -1.96 y +1.96. En caso contrario no se rechaza la hipótesis nula si Z queda entre -1.96 y +1.96.

Paso 05: Toma de decisión.

En este ultimo paso comparamos el estadístico de prueba calculado mediante el Software Minitab que es igual a Z = 2.38 y lo comparamos con el valor critico de Zc = 1.96. Como el estadístico de prueba calculado cae a la derecha del valor critico de Z, se rechaza Ho. Por tanto no se confirma el supuesto del Jefe de la Biblioteca.

One-Sample Z

Test of mu = 350 vs not = 350

The assumed standard deviation = 52.414

N Mean SE Mean 95% CI Z P

30 372.800 9.569 (354.044, 391.556) 2.38 0.017

http://www.monografias.com/Computacion/Software/

Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) es el valor hipotético del

parámetro que se compra con el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%, entonces se

rechaza la hipótesis nula solamente si el resultado muestral es tan diferente del valor hipotético que una

diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o menos.

Etapa 3.- Elegir la estadística de prueba. La estadística de prueba puede ser la estadística muestral (el

estimador no segado del parámetro que se prueba) o una versión transformada de esa estadística muestral. Por

ejemplo, para probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria de

esa distribución normal, entonces es común que se transforme la media en un valor z el cual, a su vez, sirve

como estadística de prueba.

Etapa 4.- Establecer el valor o valores críticos de la estadística de prueba. Habiendo especificado la hipótesis

nula, el nivel de significancia y la estadística de prueba que se van a utilizar, se produce a establecer el o los

valores críticos de estadística de prueba. Puede haber uno o más de esos valores, dependiendo de si se va a

realizar una prueba de uno o dos extremos.

Etapa 5.- Determinar el valor real de la estadística de prueba. Por ejemplo, al probar un valor hipotético de la

media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crítico

que se establece es un valor de z, entonces se transforma la media muestral en un valor de z.

Etapa 6.- Tomar la decisión. Se compara el valor observado de la estadística muestral con el valor (o valores)

críticos de la estadística de prueba. Después se acepta o se rechaza la hipótesis nula. Si se rechaza ésta, se

acepta la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones de los administradores

operativos, como por ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de

mercadotecnia utilizar.

La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. Si la prueba estadística cae en esta última región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente.

Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región de rechazo.

PASOS DE LA PRUEBA DE HIPÓTESIS

Expresar la hipótesis nula

Expresar la hipótesis alternativa

Especificar el nivel de significancía

Determinar el tamaño de la muestra

Establecer los valores críticos que establecen las regiones de rechazo de las de no rechazo.

Determinar la prueba estadística.

1) Una empresa está interesada en lanzar un nuevo producto al mercado.

Tras realizar una campaña publicitaria, se toma la muestra de 1 000

habitantes, de los cuales, 25 no conocían el producto. A un nivel de

significación del 1% ¿apoya el estudio las siguientes hipótesis?

a. Más del 3% de la población no conoce el nuevo producto.

b. Menos del 2% de la población no conoce el nuevo producto

Datos:

n = 1000

x = 25

Donde:

x = ocurrencias

n = observaciones

= proporción de la muestra

= proporción propuesta

a)

a = 0,01

H0 es aceptada, ya que Z prueba (-0,93) es

menor que Z tabla (2,326), por e lo que no es

cierto que más del 3% de la población no

conoce el nuevo producto.

b)

a = 0,01

Un gerente de ventas de libros universitarios afirma que en promedio sus representantes de ventas realiza 40 visitas a profesores por semana. Varios de estos representantes piensan que realizan un número de visitas promedio superior a 40. Una muestra tomada al azar durante 8 semanas reveló un promedio de 42 visitas semanales y una desviación estándar de 2 visitas. Utilice un nivel de confianza del 99% para aclarar esta cuestión.

Datos:

( = 40

n = 8

Nivel de confianza del 99%

Nivel de significación = (100%-99%)/2 = 0,5% = 0,005

Solución:

H0: ( = 40

H1: ( > 40

Grados de libertad: n-1 = 8-1 =7

a = 0,005

H0 es aceptada, ya que tprueba (2,83) es menor que ttabla (3,499), por lo que no es

acertado pensar que están realizando un número de visitas promedio superior a 40.

investigación de mercados cree que la media es

mayor y para probar su hipótesis toma una

muestra de 64 observaciones procedentes de la

misma población, obteniendo como resultado

una media de 25. Si se utiliza un nivel de

significación del 5%. Verifique si la afirmación

del investigador es realmente cierta.

Datos:

n = 64

a = 5% = 0,05

Solución:

H0: ( = 22

H1: ( > 22

a = 0,05

Cuando las ventas medias, por establecimiento autorizado, de una marca de relojes caen por debajo de las 170,000 unidades mensuales, se considera razón suficiente para lanzar una campaña publicitaria que active las ventas de esta marca. Para conocer la evolución de las ventas, el departamento de marketing realiza una encuesta a 51 establecimientos autorizados, seleccionados aleatoriamente, que facilitan la cifra de ventas del último mes en relojes de esta marca. A partir de estas cifras se obtienen los siguientes resultados: media = 169.411,8 unidades., desviación estándar = 32.827,5 unidades. Suponiendo que las ventas mensuales por establecimiento se distribuyen normalmente; con un nivel de significación del 5 % y en vista a la situación reflejada en los datos. ¿Se considerará oportuno lanzar una nueva campaña publicitaria

Datos:

n = 51

Solución:

H0: ( = 170000

H1: ( < 170000

a = 0,05

En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.

La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1- . La probabilidad de equivocarnos se llama nivel de significancia y se simboliza . Generalmente se construyen intervalos con confianza 1-=95% (o significancia =5%). Menos frecuentes son los intervalos con =10% o =1%.

Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple 1:

P(-1.96 < z < 1.96) = 0.95

(lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional que calcule probabilidades normales).

http://escuela.med.puc.cl/recursos/recepidem/EPIANAL9.HTM

http://escuela.med.puc.cl/recursos/recepidem/EPIANAL9.HTM

Luego, si una variable X tiene distribución N( , ), entonces el 95% de las veces se cumple:

Despejando en la ecuación se tiene:

El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo de confianza al 95% para la media cuando la variable X es

normal y es conocido.

II- Intervalo de confianza para un promedio:

Generalmente, cuando se quiere construir un intervalo de confianza para la

media poblacional , la varianza poblacional es desconocida, por lo que el intervalo para construido al final de II es muy poco práctico.

Si en el intervalo se reemplaza la desviación estándar poblacional por la desviación estándar muestral s, el intervalo de confianza

2

a

φ(2,31) = 1 -

2

a ; buscamos en la tabla de la distribución N(0,1) y obtenemos que φ(2,31)

= 0,9896

Luego 0,9896 = 1 -

2

a ; despejando: α = 0,0208 ; Por tanto el nivel de confianza es 1 – α = 1 –

0,0208 = 0,9792 = 97,92 %

En un hospital se ha tomado la temperatura a una muestra de 64 pacientes para estimar la temperatura media de sus enfermos. La media de la muestra ha sido 37,1 oC y se sabe que la desviacion tipica de toda la poblacion es 1,04 oC. a) Obtenga un intervalo de confianza, al 90 %, para la media poblacional. b) .Con que nivel de confianza podemos afirmar que la media de la poblacion esta comprendida entre 36,8oC y 37,4 oC? (Propuesto para selectividad Andalucia 2003) RESOLUCION X = temperatura ; n = 64 ; x = 37,1 ; X → N(μ ; 1,04) , es decir σ = 1,04 a) Nivel de confianza = 1 – α = 0,9 ; α = 0,1; Intervalo de confianza I = ( x - E , x +E) , siendo E = zα/2 . n s Sabemos que φ(zα/2) = 1 - 2 a = 1 - 0,1 2 = 0,95 ; usando la tabla de la distribucion Z → N(0,1) , obtenemos zα/2 = 1,645 E = 1,645 . 1,04 64 = 0,21385 ; I = (37,1 – 0,21385 ; 37,1 + 0,21385) ; I = (36,89 ; 37,31) ------------------------------------------------------------------------------------------------------------------- b) Nos dicen que el intervalo de confianza es I = (36,8 ; 37,4) ; tenemos que calcular el nivel de confianza = 1 - α Usamos, por ejemplo, la amplitud del intervalo: A = 2E = 2. zα/2 . n s = 2. zα/2 . 1,04 64 = 37,4 – 36,8 = 0,6 Despejando obtenemos zα/2 = 2,31 . Sustituimos en la formula φ(zα/2) = 1-

b) Queremos que se cumpla que E ≤ 0,75 a un nivel de confianza = 1 – α = 0,98 ; α = 0,02

Sabemos que φ(zα/2) = 1 -

2

a = 1 - 0,02

2

= 0,99 ; usando la tabla de la distribución Z → N(0,1) , obtenemos zα/2 = 2,33

E = zα/2 .

n

s ≤ 0,75 ; sustituimos:

2,33 . 2

n

≤ 0,75 ; 2,33 . 2

0,75

≤ n ; 6,21 ≤ n elevamos al cuadrado ; 38,6 ≤ n ; Tamaño mínimo: 39

El índice de resistencia a la rotura, expresado en kg, de un determinado tipo de cuerda sigue una distribución Normal con

desviación típica 15.6 kg. Con una muestra de 5 de estas cuerdas, seleccionadas al azar, se obtuvieron los siguientes índices:

280, 240, 270, 285, 270.

a) Obtenga un intervalo de confianza para la media del índice de resistencia a la rotura de este tipo de cuerdas, utilizando un nivel de

confianza del 95%.

b) Si, con el mismo nivel de confianza, se desea obtener un error máximo en la estimación de la media de 5 kg, .será suficiente con elegir

una muestra de 30 cuerdas? (Propuesto para selectividad Andalucia 2005)

RESOLUCION

X = Índice de resistencia a la rotura ; X → N(μ ; 15,6) ; es decir σ = 15,6 ; n = tamaño muestral = 5

La media muestral es x =

280 240 270 285 270

5

+ + + +

= 269

a) Nivel de confianza = 1 – α = 0,95 ; α = 0,05; Intervalo de confianza I = ( x - E , x +E) , siendo E = zα/2 .

n

s

Sabemos que φ(zα/2) = p(Z < zα/2 ) = 1-

2

a = 1- 0,05

2


Para calcular el tamaño muestral, n , podemos usar que la amplitud del intervalo de confianza es A = 2E

A = 2E = 2. zα/2 .

n

s = 2. 1,96 . 60

n

= 392,2 – 372,6 = 19,6 ; 2. 1,96 . 60

19,6

= n ; 12 = n ; n = 144

--------------------------------------------------------------------------------------------------------------

b) n = 225 , Nivel de confianza = 1 – α = 0,869 ; α = 0,131


2

a = 1 - 0,131

2


El error es E = zα/2 .

n

s = 1,51 . 60

225

; E = 6,04

Un fabricante de pilas alcalinas sabe que el tiempo de duracion, en horas, de las pilas que fabrica sigue una distribucion Normal de media desconocida y varianza 3 600. Con una muestra de su produccion, elegida al azar, y un nivel de confianza del 95 % ha obtenido para la media el intervalo de confianza (372,6 ; 392,2). a) Calcule el valor que obtuvo para la media de la muestra y el tamano muestral utilizado. b) .Cual seria el error de su estimacion, si hubiese utilizado una muestra de tamano 225 y un nivel de confianza del 86,9 %? (Propuesto y puesto en selectividad Andalucia 2004) RESOLUCION X = tiempo de duracion de las pilas ; X → N(μ ; 3600 ) = N(μ ; 60) ; es decir σ = 60 Intervalo de confianza = I = (372,6 ; 392,2) ; Nivel de confianza = 1 – α = 0,95 ; α = 0,05 Sabemos que φ(zα/2) = p(Z < zα/2 ) = 1- 2 a = 1 - 0,05 2 = 0,975 ; usando la tabla de la distribucion Z → N(0,1) , zα/2 = 1,96 a) Sabemos que la media de la muestra, x , es el punto medio del intervalo de confianza, luego x = 372,6 392, 2 2 + ; x = 382,4

b) Nos dicen que el intervalo de confianza es I = (36,8 ; 37,4) ; tenemos que calcular el nivel de confianza = 1 - α

Usamos, por ejemplo, la amplitud del intervalo: A = 2E = 2. zα/2 .

n

s = 2. zα/2 . 1,04

64

= 37,4 – 36,8 = 0,6

Despejando obtenemos zα/2 = 2,31 . Sustituimos en la formula φ(zα/2) = 1-

2

a

φ(2,31) = 1 -

2

a ; buscamos en la tabla de la distribucion N(0,1) y obtenemos que φ(2,31) = 0,9896

Luego 0,9896 = 1 -

2

a ; despejando: α = 0,0208 ; Por tanto el nivel de confianza es 1 – α = 1 – 0,0208 = 0,9792 = 97,92 %

En un hospital se ha tomado la temperatura a una muestra de 64 pacientes para estimar la temperatura media de sus

enfermos. La media de la muestra ha sido 37,1 oC y se sabe que la desviación típica de toda la población es 1,04 oC.

a) Obtenga un intervalo de confianza, al 90 %, para la media poblacional.

b) .Con que nivel de confianza podemos afirmar que la media de la población esta comprendida entre 36,8oC y 37,4 oC?

(Propuesto para selectividad Andalucia 2003)

RESOLUCION

X = temperatura ; n = 64 ; x = 37,1 ; X → N(μ ; 1,04) , es decir σ = 1,04

a) Nivel de confianza = 1 – α = 0,9 ; α = 0,1; Intervalo de confianza I = ( x - E , x +E) , siendo E = zα/2 .

n

s


2

a = 1 - 0,1

2


E = 1,645 . 1,04

64

= 0,21385 ; I = (37,1 – 0,21385 ; 37,1 + 0,21385) ; I = (36,89 ; 37,31)

lic. mata

Documents