lic. mata
TRANSCRIPT
UNIVERSIDAD TECNOLÓGICA DE TORREÓN.
Licenciado: Edgar Gerardo Mata
Ortíz
Alumna: América Iveth Valverde
Medina
Temas:
1.Pruba de Hipótesis
2.Intervalos de Confianza
Tenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis.
Hipótesis es una aseveración de una población elaborado con el propósito de poner aprueba, para verificar si la afirmación es razonable se usan datos.
En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera.
Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.
Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco paso:
Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o no rechazar la hipótesis, pero debemos de tener cuidado con esta determinación ya que en la consideración de estadística no proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clasede prueba más allá de una duda razonable. Analizaremos cada paso en detalle
Objetivo de la prueba de hipótesis.
El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral), sino hacer
un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.
PROPÓSITO DE LA PRUEBA DE HIPÓTESIS El propósito de la prueba de hipótesis no es
cuestionar el valor calculado del estadístico (muestral), sino hacer
un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro.
3.- Procedimiento sistemático para una prueba de hipótesis de una muestra
.Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1.
Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de las poblaciones que se estudian.
La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a una estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un "no" en la hipótesis nula que indica que "no hay cambio" Podemos rechazar o aceptar Ho.
La hipótesis nula (Ho) se refiere siempre a un valor
especificado del parámetro de población, no a una
estadística de muestra. La letra H significa hipótesis
y el subíndice cero no hay diferencia. Por lo general
hay un "no" en la hipótesis nula que indica que "no
hay cambio" Podemos rechazar o aceptar Ho.
a) Prueba bilateral o de dos extremos: la hipótesis planteada se
formula con la igualdad
Ejemplo
H0 : µ = 200
H1 : µ ≠ 200
b) Pruebas unilateral o de un extremo: la hipótesis
planteada se formula con ≥ o ≤
H0 : µ ≥ 200 H0 : µ ≤ 200
H1 : µ < 200 H1 : µ > 200
En las pruebas de hipótesis para la media (μ), cuando se conoce la
desviación estándar (σ) poblacional, o cuando el valor de la muestra
es grande (30 o más), el valor estadístico de prueba es z y se
determina a partir de:
El valor estadístico z, para muestra grande y desviación estándar
poblacional desconocida se determina por la ecuación:
En la prueba para una media poblacional con muestra pequeña y
desviación estándar poblacional desconocida se utiliza el valor
estadístico t.
El jefe de la Biblioteca Especializada de la
Facultad de Ingeniería Eléctrica y Electrónica
de la UNAC manifiesta que el número
promedio de lectores por día es de 350. Para
confirmar o no este supuesto se controla la
cantidad de lectores que utilizaron la
biblioteca durante 30 días. Se considera el
nivel de significancia de 0.05
Día Usuarios Día Usuarios DíaUsuario
1 356 11 305 21 429
2 427 12 413 22 376
3 387 13 391 23 328
4 510 14 380 24 411
5 288 15 382 25 397
6 290 16 389 26 365
7 320 17 405 27 405
8 350 18 293 28 369
9 403 19 276 29 429
10 329 20 417 30 364
Se trata de un problema con una media poblacional: muestra grande y desviación estándar poblacional desconocida.
Paso 01: Seleccionamos la hipótesis nula y la hipótesis alternativa
Ho: μ═350
Ha: μ≠ 350
Paso 02: Nivel de confianza o significancia 95%
α═0.05
Paso 03: Calculamos o determinamos el valor estadístico de prueba
De los datos determinamos: que el estadístico de prueba es t, debido a que el numero de muestras es igual a 30, conocemos la media de la población, pero la desviación estándar de la población es desconocida, en este caso determinamos la desviación estándar de la muestra y la utilizamos en la formula reemplazando a la desviación estándar de la población.
Columna1
Media 372.8
Error típico 9.56951578
Mediana 381
Moda 405
Desviación estándar 52.4143965
Varianza de la muestra 2747.26897
Curtosis 0.36687081
Coeficiente de asimetría 0.04706877
Rango 234
Mínimo 276
Máximo 510
Suma 11184
Cuenta 30
Nivel de confianza (95.0%) 19.571868
Paso 04: Formulación de la regla de decisión.
La regla de decisión la formulamos teniendo en cuenta que esta es una prueba de dos colas, la mitad de 0.05, es decir 0.025, esta en cada cola. el área en la que no se rechaza Ho esta entre las dos colas, es por consiguiente 0.95. El valor critico para 0.05 da un valor de Zc = 1.96.
Por consiguiente la regla de decisión: es rechazar la hipótesis nula y aceptar la hipótesis alternativa, si el valor Z calculado no queda en la región comprendida entre -1.96 y +1.96. En caso contrario no se rechaza la hipótesis nula si Z queda entre -1.96 y +1.96.
Paso 05: Toma de decisión.
En este ultimo paso comparamos el estadístico de prueba calculado mediante el Software Minitab que es igual a Z = 2.38 y lo comparamos con el valor critico de Zc = 1.96. Como el estadístico de prueba calculado cae a la derecha del valor critico de Z, se rechaza Ho. Por tanto no se confirma el supuesto del Jefe de la Biblioteca.
One-Sample Z
Test of mu = 350 vs not = 350
The assumed standard deviation = 52.414
N Mean SE Mean 95% CI Z P
30 372.800 9.569 (354.044, 391.556) 2.38 0.017
Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) es el valor hipotético del
parámetro que se compra con el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.
Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%, entonces se
rechaza la hipótesis nula solamente si el resultado muestral es tan diferente del valor hipotético que una
diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o menos.
Etapa 3.- Elegir la estadística de prueba. La estadística de prueba puede ser la estadística muestral (el
estimador no segado del parámetro que se prueba) o una versión transformada de esa estadística muestral. Por
ejemplo, para probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria de
esa distribución normal, entonces es común que se transforme la media en un valor z el cual, a su vez, sirve
como estadística de prueba.
Etapa 4.- Establecer el valor o valores críticos de la estadística de prueba. Habiendo especificado la hipótesis
nula, el nivel de significancia y la estadística de prueba que se van a utilizar, se produce a establecer el o los
valores críticos de estadística de prueba. Puede haber uno o más de esos valores, dependiendo de si se va a
realizar una prueba de uno o dos extremos.
Etapa 5.- Determinar el valor real de la estadística de prueba. Por ejemplo, al probar un valor hipotético de la
media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crítico
que se establece es un valor de z, entonces se transforma la media muestral en un valor de z.
Etapa 6.- Tomar la decisión. Se compara el valor observado de la estadística muestral con el valor (o valores)
críticos de la estadística de prueba. Después se acepta o se rechaza la hipótesis nula. Si se rechaza ésta, se
acepta la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones de los administradores
operativos, como por ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de
mercadotecnia utilizar.
La distribución apropiada de la prueba estadística se divide en dos regiones: una región de rechazo y una de no rechazo. Si la prueba estadística cae en esta última región no se puede rechazar la hipótesis nula y se llega a la conclusión de que el proceso funciona correctamente.
Al tomar la decisión con respecto a la hipótesis nula, se debe determinar el valor crítico en la distribución estadística que divide la región del rechazo (en la cual la hipótesis nula no se puede rechazar) de la región de rechazo. A hora bien el valor crítico depende del tamaño de la región de rechazo.
PASOS DE LA PRUEBA DE HIPÓTESIS
Expresar la hipótesis nula
Expresar la hipótesis alternativa
Especificar el nivel de significancía
Determinar el tamaño de la muestra
Establecer los valores críticos que establecen las regiones de rechazo de las de no rechazo.
Determinar la prueba estadística.
1) Una empresa está interesada en lanzar un nuevo producto al mercado.
Tras realizar una campaña publicitaria, se toma la muestra de 1 000
habitantes, de los cuales, 25 no conocían el producto. A un nivel de
significación del 1% ¿apoya el estudio las siguientes hipótesis?
a. Más del 3% de la población no conoce el nuevo producto.
b. Menos del 2% de la población no conoce el nuevo producto
Datos:
n = 1000
x = 25
Donde:
x = ocurrencias
n = observaciones
= proporción de la muestra
= proporción propuesta
a)
a = 0,01
H0 es aceptada, ya que Z prueba (-0,93) es
menor que Z tabla (2,326), por e lo que no es
cierto que más del 3% de la población no
conoce el nuevo producto.
b)
a = 0,01
Un gerente de ventas de libros universitarios afirma que en promedio sus representantes de ventas realiza 40 visitas a profesores por semana. Varios de estos representantes piensan que realizan un número de visitas promedio superior a 40. Una muestra tomada al azar durante 8 semanas reveló un promedio de 42 visitas semanales y una desviación estándar de 2 visitas. Utilice un nivel de confianza del 99% para aclarar esta cuestión.
Datos:
( = 40
n = 8
Nivel de confianza del 99%
Nivel de significación = (100%-99%)/2 = 0,5% = 0,005
Solución:
H0: ( = 40
H1: ( > 40
Grados de libertad: n-1 = 8-1 =7
a = 0,005
H0 es aceptada, ya que tprueba (2,83) es menor que ttabla (3,499), por lo que no es
acertado pensar que están realizando un número de visitas promedio superior a 40.
investigación de mercados cree que la media es
mayor y para probar su hipótesis toma una
muestra de 64 observaciones procedentes de la
misma población, obteniendo como resultado
una media de 25. Si se utiliza un nivel de
significación del 5%. Verifique si la afirmación
del investigador es realmente cierta.
Datos:
n = 64
a = 5% = 0,05
Solución:
H0: ( = 22
H1: ( > 22
a = 0,05
Cuando las ventas medias, por establecimiento autorizado, de una marca de relojes caen por debajo de las 170,000 unidades mensuales, se considera razón suficiente para lanzar una campaña publicitaria que active las ventas de esta marca. Para conocer la evolución de las ventas, el departamento de marketing realiza una encuesta a 51 establecimientos autorizados, seleccionados aleatoriamente, que facilitan la cifra de ventas del último mes en relojes de esta marca. A partir de estas cifras se obtienen los siguientes resultados: media = 169.411,8 unidades., desviación estándar = 32.827,5 unidades. Suponiendo que las ventas mensuales por establecimiento se distribuyen normalmente; con un nivel de significación del 5 % y en vista a la situación reflejada en los datos. ¿Se considerará oportuno lanzar una nueva campaña publicitaria
Datos:
n = 51
Solución:
H0: ( = 170000
H1: ( < 170000
a = 0,05
En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1- . La probabilidad de equivocarnos se llama nivel de significancia y se simboliza . Generalmente se construyen intervalos con confianza 1-=95% (o significancia =5%). Menos frecuentes son los intervalos con =10% o =1%.
Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de probabilidades o un programa computacional que calcule probabilidades normales).
Luego, si una variable X tiene distribución N( , ), entonces el 95% de las veces se cumple:
Despejando en la ecuación se tiene:
El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es un intervalo de confianza al 95% para la media cuando la variable X es
normal y es conocido.
II- Intervalo de confianza para un promedio:
Generalmente, cuando se quiere construir un intervalo de confianza para la
media poblacional , la varianza poblacional es desconocida, por lo que el intervalo para construido al final de II es muy poco práctico.
Si en el intervalo se reemplaza la desviación estándar poblacional por la desviación estándar muestral s, el intervalo de confianza
2
a
φ(2,31) = 1 -
2
a ; buscamos en la tabla de la distribución N(0,1) y obtenemos que φ(2,31)
= 0,9896
Luego 0,9896 = 1 -
2
a ; despejando: α = 0,0208 ; Por tanto el nivel de confianza es 1 – α = 1 –
0,0208 = 0,9792 = 97,92 %
En un hospital se ha tomado la temperatura a una muestra de 64 pacientes para estimar la temperatura media de sus enfermos. La media de la muestra ha sido 37,1 oC y se sabe que la desviacion tipica de toda la poblacion es 1,04 oC. a) Obtenga un intervalo de confianza, al 90 %, para la media poblacional. b) .Con que nivel de confianza podemos afirmar que la media de la poblacion esta comprendida entre 36,8oC y 37,4 oC? (Propuesto para selectividad Andalucia 2003) RESOLUCION X = temperatura ; n = 64 ; x = 37,1 ; X → N(μ ; 1,04) , es decir σ = 1,04 a) Nivel de confianza = 1 – α = 0,9 ; α = 0,1; Intervalo de confianza I = ( x - E , x +E) , siendo E = zα/2 . n s Sabemos que φ(zα/2) = 1 - 2 a = 1 - 0,1 2 = 0,95 ; usando la tabla de la distribucion Z → N(0,1) , obtenemos zα/2 = 1,645 E = 1,645 . 1,04 64 = 0,21385 ; I = (37,1 – 0,21385 ; 37,1 + 0,21385) ; I = (36,89 ; 37,31) ------------------------------------------------------------------------------------------------------------------- b) Nos dicen que el intervalo de confianza es I = (36,8 ; 37,4) ; tenemos que calcular el nivel de confianza = 1 - α Usamos, por ejemplo, la amplitud del intervalo: A = 2E = 2. zα/2 . n s = 2. zα/2 . 1,04 64 = 37,4 – 36,8 = 0,6 Despejando obtenemos zα/2 = 2,31 . Sustituimos en la formula φ(zα/2) = 1-
b) Queremos que se cumpla que E ≤ 0,75 a un nivel de confianza = 1 – α = 0,98 ; α = 0,02
Sabemos que φ(zα/2) = 1 -
2
a = 1 - 0,02
2
= 0,99 ; usando la tabla de la distribución Z → N(0,1) , obtenemos zα/2 = 2,33
E = zα/2 .
n
s ≤ 0,75 ; sustituimos:
2,33 . 2
n
≤ 0,75 ; 2,33 . 2
0,75
≤ n ; 6,21 ≤ n elevamos al cuadrado ; 38,6 ≤ n ; Tamaño mínimo: 39
El índice de resistencia a la rotura, expresado en kg, de un determinado tipo de cuerda sigue una distribución Normal con
desviación típica 15.6 kg. Con una muestra de 5 de estas cuerdas, seleccionadas al azar, se obtuvieron los siguientes índices:
280, 240, 270, 285, 270.
a) Obtenga un intervalo de confianza para la media del índice de resistencia a la rotura de este tipo de cuerdas, utilizando un nivel de
confianza del 95%.
b) Si, con el mismo nivel de confianza, se desea obtener un error máximo en la estimación de la media de 5 kg, .será suficiente con elegir
una muestra de 30 cuerdas? (Propuesto para selectividad Andalucia 2005)
RESOLUCION
X = Índice de resistencia a la rotura ; X → N(μ ; 15,6) ; es decir σ = 15,6 ; n = tamaño muestral = 5
La media muestral es x =
280 240 270 285 270
5
+ + + +
= 269
a) Nivel de confianza = 1 – α = 0,95 ; α = 0,05; Intervalo de confianza I = ( x - E , x +E) , siendo E = zα/2 .
n
s
Sabemos que φ(zα/2) = p(Z < zα/2 ) = 1-
2
a = 1- 0,05
2
= 0,975 ; usando la tabla de la distribución Z → N(0,1) , obtenemos zα/2 = 1,96
Para calcular el tamaño muestral, n , podemos usar que la amplitud del intervalo de confianza es A = 2E
A = 2E = 2. zα/2 .
n
s = 2. 1,96 . 60
n
= 392,2 – 372,6 = 19,6 ; 2. 1,96 . 60
19,6
= n ; 12 = n ; n = 144
--------------------------------------------------------------------------------------------------------------
b) n = 225 , Nivel de confianza = 1 – α = 0,869 ; α = 0,131
Sabemos que φ(zα/2) = 1 -
2
a = 1 - 0,131
2
= 0,9345 ; usando la tabla de la distribución Z → N(0,1) , obtenemos zα/2 = 1,51
El error es E = zα/2 .
n
s = 1,51 . 60
225
; E = 6,04
Un fabricante de pilas alcalinas sabe que el tiempo de duracion, en horas, de las pilas que fabrica sigue una distribucion Normal de media desconocida y varianza 3 600. Con una muestra de su produccion, elegida al azar, y un nivel de confianza del 95 % ha obtenido para la media el intervalo de confianza (372,6 ; 392,2). a) Calcule el valor que obtuvo para la media de la muestra y el tamano muestral utilizado. b) .Cual seria el error de su estimacion, si hubiese utilizado una muestra de tamano 225 y un nivel de confianza del 86,9 %? (Propuesto y puesto en selectividad Andalucia 2004) RESOLUCION X = tiempo de duracion de las pilas ; X → N(μ ; 3600 ) = N(μ ; 60) ; es decir σ = 60 Intervalo de confianza = I = (372,6 ; 392,2) ; Nivel de confianza = 1 – α = 0,95 ; α = 0,05 Sabemos que φ(zα/2) = p(Z < zα/2 ) = 1- 2 a = 1 - 0,05 2 = 0,975 ; usando la tabla de la distribucion Z → N(0,1) , zα/2 = 1,96 a) Sabemos que la media de la muestra, x , es el punto medio del intervalo de confianza, luego x = 372,6 392, 2 2 + ; x = 382,4
b) Nos dicen que el intervalo de confianza es I = (36,8 ; 37,4) ; tenemos que calcular el nivel de confianza = 1 - α
Usamos, por ejemplo, la amplitud del intervalo: A = 2E = 2. zα/2 .
n
s = 2. zα/2 . 1,04
64
= 37,4 – 36,8 = 0,6
Despejando obtenemos zα/2 = 2,31 . Sustituimos en la formula φ(zα/2) = 1-
2
a
φ(2,31) = 1 -
2
a ; buscamos en la tabla de la distribucion N(0,1) y obtenemos que φ(2,31) = 0,9896
Luego 0,9896 = 1 -
2
a ; despejando: α = 0,0208 ; Por tanto el nivel de confianza es 1 – α = 1 – 0,0208 = 0,9792 = 97,92 %
En un hospital se ha tomado la temperatura a una muestra de 64 pacientes para estimar la temperatura media de sus
enfermos. La media de la muestra ha sido 37,1 oC y se sabe que la desviación típica de toda la población es 1,04 oC.
a) Obtenga un intervalo de confianza, al 90 %, para la media poblacional.
b) .Con que nivel de confianza podemos afirmar que la media de la población esta comprendida entre 36,8oC y 37,4 oC?
(Propuesto para selectividad Andalucia 2003)
RESOLUCION
X = temperatura ; n = 64 ; x = 37,1 ; X → N(μ ; 1,04) , es decir σ = 1,04
a) Nivel de confianza = 1 – α = 0,9 ; α = 0,1; Intervalo de confianza I = ( x - E , x +E) , siendo E = zα/2 .
n
s
Sabemos que φ(zα/2) = 1 -
2
a = 1 - 0,1
2
= 0,95 ; usando la tabla de la distribución Z → N(0,1) , obtenemos zα/2 = 1,645
E = 1,645 . 1,04
64
= 0,21385 ; I = (37,1 – 0,21385 ; 37,1 + 0,21385) ; I = (36,89 ; 37,31)