test de hipotesis

41
Test de hipótesis Prof. María B. Pintarelli 75 4- Test o prueba de hipótesis 4.1 – Introducción Hasta ahora hemos estudiado el problema de estimar un parámetro desconocido a partir de una muestra aleatoria. En muchos problemas se requiere tomar una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe el nombre de hipótesis estadística, y el procedimiento de toma de decisión sobre la hipótesis se conoce como prueba o test de hipótesis. Como se emplean distribuciones de probabilidad para representar poblaciones, también podemos decir que una hipótesis estadística es una proposición sobre la distribución de probabilidad de una variable aleatoria, donde la hipótesis involucra a uno más parámetros de esta distribución. Por ejemplo, supongamos que cierto tipo de motor de automóvil emite una media de 100 mg de óxidos de nitrógeno (NO x ) por segundo con 100 caballos de fuerza. Se ha propuesto una modificación al diseño del motor para reducir las emisiones de NO x . El nuevo diseño se producirá si se demuestra que la media de su tasa de emisiones es menor de 100 mg/s. Se construye y se prueba una muestra de 50 motores modificados. La media muestral de emisiones de NO x es de 92 mg/s, y supongamos que se puede asumir que σ es 21 mg/s. La variable aleatoria de interés en este caso es X: “tasa de emisión de un motor modificado tomado al azar”. La preocupación de los fabricantes consiste en que los motores modificados no puedan reducir todas la emisiones; es decir que la media poblacional pudiera ser 100 o mayor que 100. Entonces, la pregunta es: ¿es factible que esta muestra pueda provenir de una v.a. con media 100 o mayor? Éste es el tipo de preguntas que las pruebas de hipótesis están diseñadas para responder. Veremos cómo construir una prueba de hipótesis, pero podemos decir que en general se basa en construir a partir de la muestra aleatoria un estadístico, y según el valor que tome este estadístico de prueba se aceptará o se rechazará la hipótesis. Se ha observado una muestra con media 92 = X . Hay dos interpretaciones posibles de esta observación: 1- La media poblacional es realmente mayor o igual que 100, y la media muestral es menor que 100 debido a la variabilidad propia de la variable aleatoria X 2- La media poblacional es en realidad menor que 100, y la media muestral refleja este hecho. Estas dos explicaciones tienen nombres: la primera se llama hipótesis nula; la segunda es la hipótesis alternativa. En la mayoría de las situaciones la hipótesis nula dice que el efecto que indica la muestra es atribuible solamente a la variación aleatoria del estadístico de prueba. La hipótesis alternativa establece que el efecto que indica la muestra es verdadero. Para hacer las cosas más precisas, todo se expresa mediante símbolos. La hipótesis nula se denota por 0 H , la hipótesis alternativa se denota con 1 H . Como es usual la media poblacional se anota µ . Por lo tanto se tiene 100 : 0 µ H contra 100 : 1 < µ H (hipótesis alternativa unilateral) Esencialmente, para realizar una prueba de hipótesis se pone la hipótesis nula en juicio. Se asume que 0 H es verdadera, de la misma manera como se empieza en un juicio bajo el supuesto de que un acusado es inocente. La muestra aleatoria proporciona la evidencia.

Upload: chaves-aristoteles

Post on 22-Dec-2015

291 views

Category:

Documents


13 download

DESCRIPTION

Metodo estadistico, armado y evaluacion de test de hipotesis

TRANSCRIPT

Page 1: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

75

4- Test o prueba de hipótesis

4.1 – Introducción

Hasta ahora hemos estudiado el problema de estimar un parámetro desconocido a partir de una muestra aleatoria. En muchos problemas se requiere tomar una decisión entre aceptar o rechazar una proposición sobre algún parámetro. Esta proposición recibe el nombre de hipótesis estadística, y el procedimiento de toma de decisión sobre la hipótesis se conoce como prueba o test de hipótesis. Como se emplean distribuciones de probabilidad para representar poblaciones, también podemos decir que una hipótesis estadística es una proposición sobre la distribución de probabilidad de una variable aleatoria, donde la hipótesis involucra a uno más parámetros de esta distribución. Por ejemplo, supongamos que cierto tipo de motor de automóvil emite una media de 100 mg de óxidos de nitrógeno (NOx) por segundo con 100 caballos de fuerza. Se ha propuesto una modificación al diseño del motor para reducir las emisiones de NOx. El nuevo diseño se producirá si se demuestra que la media de su tasa de emisiones es menor de 100 mg/s. Se construye y se prueba una muestra de 50 motores modificados. La media muestral de emisiones de NOx es de 92 mg/s, y supongamos que se puede asumir que σ es 21 mg/s. La variable aleatoria de interés en este caso es X: “tasa de emisión de un motor modificado tomado al azar”. La preocupación de los fabricantes consiste en que los motores modificados no puedan reducir todas la emisiones; es decir que la media poblacional pudiera ser 100 o mayor que 100. Entonces, la pregunta es: ¿es factible que esta muestra pueda provenir de una v.a. con media 100 o mayor? Éste es el tipo de preguntas que las pruebas de hipótesis están diseñadas para responder. Veremos cómo construir una prueba de hipótesis, pero podemos decir que en general se basa en construir a partir de la muestra aleatoria un estadístico, y según el valor que tome este estadístico de prueba se aceptará o se rechazará la hipótesis. Se ha observado una muestra con media 92=X . Hay dos interpretaciones posibles de esta observación: 1- La media poblacional es realmente mayor o igual que 100, y la media muestral es menor que 100

debido a la variabilidad propia de la variable aleatoria X 2- La media poblacional es en realidad menor que 100, y la media muestral refleja este hecho. Estas dos explicaciones tienen nombres: la primera se llama hipótesis nula; la segunda es la hipótesis

alternativa. En la mayoría de las situaciones la hipótesis nula dice que el efecto que indica la muestra es atribuible solamente a la variación aleatoria del estadístico de prueba. La hipótesis alternativa establece que el efecto que indica la muestra es verdadero. Para hacer las cosas más precisas, todo se expresa mediante símbolos. La hipótesis nula se denota por

0H , la hipótesis alternativa se denota con 1H . Como es usual la media poblacional se anota µ . Por lo

tanto se tiene 100:0 ≥µH contra 100:1 <µH (hipótesis alternativa unilateral)

Esencialmente, para realizar una prueba de hipótesis se pone la hipótesis nula en juicio. Se asume que

0H es verdadera, de la misma manera como se empieza en un juicio bajo el supuesto de que un acusado

es inocente. La muestra aleatoria proporciona la evidencia.

Page 2: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

76

Las hipótesis son siempre proposiciones sobre los parámetros de la población o distribución bajo

estudio, no proposiciones sobre la muestra. Otros tipos de hipótesis que podrían formularse son 100:0 ≤µH contra 100:1 >µH (hipótesis alternativa unilateral)

o 100:0 =µH contra 100:1 ≠µH (hipótesis alternativa bilateral)

En el ejemplo tenemos 5021 ,...,, XXX muestra aleatoria de la v.a. X definida anteriormente.

Como estamos haciendo una hipótesis sobre la media poblacional es razonable tomar como estadístico de prueba a X . El valor observado de la media muestral es 92=X . Si el valor de X es muy “menor” que 100 entonces se considera que hay evidencia en contra 0H y se la

rechaza, aceptando la hipótesis alternativa. Si el valor de X no es “muy menor” que 100 entonces se considera que no hay evidencia en contra 0H

y se rechaza la hipótesis alternativa. Ya veremos como construir una regla de decisión, supongamos ahora que tenemos la siguiente regla:

<

95

95

0

0

XsiHaceptase

XsiHrechazase

El intervalo

∞,95 es la zona de aceptación.

La región

∞− 95; es la zona de rechazo o región crítica.

Mientras que 95 es el punto crítico. Como estamos tomando una decisión basados en el valor de un estadístico podemos cometer dos tipos de errores: rechazar 0H cuando ésta es verdadera, es decir el estadístico toma valores en la zona de

rechazo cuando 0H es verdadera; o aceptar 0H cuando ésta es falsa, es decir que el estadístico tome

valores en la zona de aceptación cuando 0H es falsa.

El primero se conoce como error de tipo I, y el segundo como error de tipo II. Debido a que la decisión se basa en variables aleatorias es posible asociar probabilidades a los errores de tipo I y II, específicamente anotamos )( ItipodeerrorP=α

)( IItipodeerrorP=β

A )( ItipodeerrorP=α se lo conoce como nivel de significancia del test.

Para calcular estas probabilidades debemos conocer la distribución del estadístico de prueba en el caso de ser 0H verdadera, es decir debemos conocer la distribución del estadístico de prueba “bajo 0H ”.

Page 3: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

77

En el ejemplo anterior la muestra es grande, ya sabemos que por T.C.L. el estadístico

)1,0(100N

n

XZ ≈−=

σ si 0H es verdadera, o sea )1,0(

5021

100N

XZ ≈

−=

Entonces para calcular α planteamos:

( )==<=

== 100/95/)( 00 µα XPVesHHrechazarPItipodeerrorP

( ) 04648.095352.016835.1

5021

10095

5021

10095

5021

100=−=−Φ=

Φ≈

<−

=X

P

Esto significa que el 4.64% de las muestras aleatorias conducirán al rechazo de la hipótesis 100:0 ≥µH

cuando el verdadero µ sea mayor o igual que 100. En este caso el gráfico de la zona de rechazo es Del gráfico anterior vemos que podemos reducir α al aumentar la zona de aceptación. Por ejemplo supongamos que ahora la regla de decisión es

<

93

93

0

0

XsiHaceptase

XsiHrechazase

Entonces ( )==<=

== 100/93/)( 00 µα XPVesHHrechazarPItipodeerrorP

( ) 00939.099061.01357.2

5021

10093

5021

10093

5021

100=−=−Φ=

Φ≈

<−

=X

P

04648.0=α

50

21,100

2

N

Page 4: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

78

También se puede reducir α aumentando el tamaño de la muestra. Supongamos que 85=n , entonces

( )==<=

== 100/95/)( 00 µα XPVesHHrechazarPItipodeerrorP

( ) 01426.098574.01195.2

8521

10095

8521

10095

8521

100=−=−Φ=

Φ≈

<−

=X

P

También es importante examinar la probabilidad de cometer error de tipo II, esto es ) / ()( 00 falsaesHHaceptarPIItipodeerrorP ==β

Pero en este caso para llegar a un valor numérico necesitamos tener una alternativa específica pues en nuestro ejemplo:

( )

( )µβµµµ

µβ

=

Φ−=

≥−

=

=≠≥===

502195

1

502195

5021

100/95) / ()( 00

XP

XPfalsaesHHaceptarPIItipodeerrorP

Donde anotamos con µ a la verdadera media poblacional desconocida. Podemos entonces calcular β para un valor particular de µ , por ejemplo nos puede interesar como se comporta el test cuando la verdadera media es 94=µ , entonces

( ) ( ) 3707.062930.013367.01

5021

94951

5021

9495

5021

9494 =−=Φ−=

Φ−=

≥−

=X

Gráficamente:

100:0 =µHbajo

94:1 =µHbajo

3707.0)94( =β

rechazodezona

Page 5: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

79

La probabilidad β de cometer error de tipo II crece a medida que el valor verdadero de µ se acerca al valor hipotético. Por ejemplo si el verdadero valor de µ fuera 94.7 entonces

( ) ( ) 46017.053983.01101015.01

5021

7.94951

5021

7.9495

5021

7.947.94 =−=Φ−=

Φ−=

≥−

=X

Además, la probabilidad β de cometer error de tipo II disminuye a medida que el valor verdadero de µ se aleja del valor hipotético. Por ejemplo si el verdadero valor de µ fuera 90 entonces

( ) ( ) 04648.095352.016835.11

5021

90951

5021

9095

5021

9090 =−=Φ−=

Φ−=

≥−

=X

0'10:0 =µHbajo

7.94:1 =µHbajo

rechazodezona

46017.0)7.94( =β

( ) 04648.090 =β

rechazodezona

90:1 =µHbajo

100:0 =µHbajo

Page 6: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

80

También se puede reducir la probabilidad de cometer error de tipo II con el tamaño de la muestra. Por ejemplo si 85=n entonces y 94=µ

( ) ( ) 32997.067003.014390.01

8521

94951

8521

9495

8521

9494 =−=Φ−=

Φ−=

≥−

=X

Lo que se ha visto en los ejemplos anteriores se puede generalizar. Podemos recalcar los siguientes puntos importantes: 1- El tamaño de la región crítica, y en consecuencia la probabilidad α de cometer error de tipo I,

siempre pueden reducirse mediante una selección apropiada de los valores críticos. 2- Los errores tipo I y II están relacionados. Una disminución en la probabilidad en un tipo de error

siempre da como resultado un aumento en la probabilidad del otro, siempre que el tamaño de la muestra no cambie.

3- En general, un aumento en el tamaño de la muestra reduce tanto a α como a β , siempre que los valores críticos se mantengan constantes.

4- Cuando la hipótesis nula es falsa, β aumenta a medida que el valor verdadero del parámetro tiende al valor hipotético propuesto por la hipótesis nula. El valor de β disminuye a medida que aumenta la diferencia entre el verdadero valor medio y el propuesto.

En general el investigador controla la probabilidad α del error de tipo I cuando selecciona los valores críticos. Por lo tanto el rechazo de la hipótesis nula de manera errónea se puede fijar de antemano. Eso hace que rechazar la hipótesis nula sea una conclusión fuerte. La probabilidad β de error de tipo II no es constante, sino que depende del valor verdadero del paráme-tro. También depende β del tamaño de la muestra que se haya seleccionado. Como β está en función del tamaño de la muestra y del valor verdadero del parámetro, la decisión de aceptar la hipótesis nula se la considera una conclusión débil, a menos que se sepa que β es aceptablemente pequeño. Por lo tanto

cuando se acepta 0H en realidad se es incapaz de rechazar 0H . No se puede rechazar 0H pues no

hay evidencia en contra 0H .

Un concepto importante es el siguiente: La potencia de un test es la probabilidad de rechazar la hipótesis nula. La simbolizamos ( )µπ . Para los valores de µ tal que la alternativa es verdadera se tiene

( ) ( )µβµπ −=

= 1/ 00 falsaesHHrechazarP

Las pruebas estadísticas se comparan mediante la comparación de sus propiedades de potencia. La potencia es una medida de la sensibilidad del test, donde por sensibilidad se entiende la capacidad de una prueba para detectar diferencias. En el ejemplo anterior, la sensibilidad de la prueba para detectar la diferencia entre una tasa de emisión media de 100 y otra de 94 es ( ) ( ) 6293.03707.0194194 =−=−= βπ . Es decir si el valor verdadero de la

tasa de emisión media es 94, la prueba rechazará de manera correcta 0H y detectará esta diferencia el

62.93% de las veces. Si el investigador piensa que este valor es bajo entonces el investigador puede aumentar α o el tamaño de la muestra.

Page 7: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

81

4.2 – Prueba de hipótesis sobre la media, varianza conocida

Veamos ahora cómo construir una regla de decisión sobre la media de una población. Supongamos que la variable aleatoria de interés X tiene una media µ y una varianza 2σ conocida.

Asumimos que X tiene distribución normal, es decir ) ,(~ 2σµNX .

Nuevamente, como en el ejemplo introductorio, es razonable tomar como estadístico de prueba al pro-

medio muestral X . Bajo las suposiciones hechas tenemos que

nNX

2

,~σ

µ .

Supongamos que tenemos las hipótesis 00 : µµ =H contra 01 : µµ ≠H

Donde 0µ es una constante específica. Se toma una muestra aleatoria

nXXX ,...,, 21 de la población.

Si 00 : µµ =H es verdadera, entonces

nNX

2

0 ,~σ

µ , por lo tanto el estadístico

n

XZ

σµ0−

= tiene distribución )1,0(N si 00 : µµ =H es verdadera

Tomamos a Z como estadístico de prueba

Si 00 : µµ =H es verdadera entonces ααα −=

≤≤− 1

22

zZzP

Es evidente que una muestra que produce un valor del estadístico de prueba que cae en las colas de la distribución de Z será inusual si 00 : µµ =H es verdadera, por lo tanto esto es un indicador que 0H es

falsa. Entonces la regla de decisión es:

>

2

0

2

0

α

α

zZsiHaceptar

zZsiHrechazar

2

αz 2

αz− 0

)1,0(N

2

α

Zona de aceptación

Page 8: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

82

Notar que la probabilidad que la estadística de prueba tome un valor que caiga en la zona de rechazo si

0H es verdadera es igual a α , es decir la probabilidad de cometer error de tipo I es α pues

ααα

σµ

σµ

µµσ

µ

αα

α

=+=

−<

−+

>

−=

=

=>−

=

=

22

/)(

2

0

2

0

0

2

000

z

n

XPz

n

XP

z

n

XPVesHHrechazarPItipodeerrorP

Ejemplo: El porcentaje deseado de SiO2 en cierto tipo de cemento aluminoso es 5.5. Para probar si el verdadero promedio de porcentaje es 5.5 para una planta de producción en particular, se analizaron 16 muestras obtenidas de manera independiente. Supongamos que el porcentaje de SiO2 en una muestra está nor-malmente distribuido con 3=σ , y que 25.5=x . ¿Indica esto de manera concluyente que el verdadero promedio de porcentaje difiere de 5.5?. Utilice

01.0=α Solución: La v.a. de interés es X: “porcentaje de SiO2 en cierto tipo de cemento aluminoso” Asumimos que )3 ,(~ 2µNX Podemos plantear las hipótesis 5.5:0 =µH contra 5.5:1 ≠µH

Tenemos una muestra de tamaño 16=n que dio un promedio muestral 25.5=x Como 01.0=α entonces 575.2005.0

2

== zzα

Por lo tanto la regla de decisión es

≤−

>−

575.2

163

5.5

575.2

163

5.5

0

0

XsiHaceptar

XsiHrechazar

El estadístico

163

5.5−X toma el valor 333333.0

163

5.525.50 =

−=z

Como

2

01.00 575.2333333.0 zz =<= se acepta 0H

También podemos desarrollar tests o pruebas de hipótesis para el caso de que la hipótesis alternativa es unilateral.

Page 9: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

83

Supongamos las hipótesis 00 : µµ =H contra 01 : µµ >H

En este caso la región crítica debe colocarse en la cola superior de la distribución normal estándar y el rechazo de 0H se hará cuando el valor calculado de 0z sea muy grande, esto es la regla de decisión será

≤−

>−

α

α

σµ

σµ

z

n

XsiHaceptar

z

n

XsiHrechazar

00

00

De manera similar para las hipótesis 00 : µµ =H contra 01 : µµ <H

se calcula el valor del estadístico de prueba 0z y se rechaza 0H si el valor de 0z es muy pequeño, es

decir la regla de decisión será

−≥−

−<−

α

α

σµ

σµ

z

n

XsiHaceptar

z

n

XsiHrechazar

00

00

α

αz aceptaciondezona

)1,0(N

0

Page 10: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

84

Ejemplo: Se sabe que la duración, en horas, de un foco de 75 watts tiene una distribución aproximadamente nor-mal, con una desviación estándar de 25=σ horas. Se toma una muestra aleatoria de 20 focos, la cual resulta tener una duración promedio de 1040=x horas ¿Existe evidencia que apoye la afirmación de que la duración promedio del foco es mayor que 1000 horas?. Utilice 05.0=α . Solución: La v.a. de interés es X: “duración en horas de un foco tomado al azar” Asumimos )52 ,(~ 2µNX Podemos plantear las hipótesis 1000:0 =µH contra 1000:1 >µH

Tenemos una muestra de tamaño 20=n que dio un promedio muestral 1040=x Como 05.0=α entonces 645.105.0 == zzα

Por lo tanto la regla de decisión es

≤−

>−

645.1

2025

1000

645.1

2025

1000

0

0

XsiHaceptar

XsiHrechazar

El estadístico toma el valor

2025

1000−=

XZ toma el valor 1554.7

2025

100010400 =

−=z

Como 05.00 645.11554.7 zz =>= se rechaza 0H

P- valor

Hasta ahora se dieron los resultados de una prueba de hipótesis estableciendo si la hipótesis nula fue o no rechazada con un valor especificado de α o nivel de significancia. A menudo este planteamiento resulta inadecuado, ya que no proporciona ninguna idea sobre si el valor calculado del estadístico está apenas en la región de rechazo o bien ubicado dentro de ella. Además, esta forma de establecer los resultados impone a otros usuarios el nivel de significancia predeterminado.

αz− 0

α

)1,0(N

aceptaciondezona

Page 11: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

85

Para evitar estas dificultades, se adopta el enfoque del p-valor. El valor p o p-valor es la probabilidad de que el estadístico de prueba tome un valor que sea al menos tan extremo como el valor observado del estadístico de prueba cuando la hipótesis nula es verdadera. Es así como el p-valor da mucha informa-ción sobre el peso de la evidencia contra 0H , de modo que el investigador pueda llegar a una conclusión

para cualquier nivel de significancia especificado. La definición formal del p-valor es la siguiente:

Para las pruebas de distribuciones normales presentadas hasta el momento, es sencillo calcular el p-valor. Si 0z es el valor calculado del estadístico de prueba Z, entonces el p-valor es

a) si las hipótesis son 0100 : contra : µµµµ ≠= HH

( ) ( ) ( ) ( )[ ] ( )[ ] ( )[ ]000000 1212111 zzzzzZPzZPvalorp Φ−=−Φ−=−Φ−Φ−=<−=>=−

b) si las hipótesis son 0100 : contra : µµµµ >= HH

( ) ( ) ( )000 11 zzZPzZPvalorp Φ−=≤−=>=−

c) si las hipótesis son 0100 : contra : µµµµ <= HH

( ) ( )00 zzZPvalorp Φ=<=−

Un p-valor muy chico significa mucha evidencia en contra de 0H ; un p-valor alto significa que no hay

evidencia en contra 0H

Notar que: αα ciasignifican de nivelcon acepta se entonces Si 0Hvalorp −<

αα ciasignifican de nivelcon rechaza se entonces Si 0Hvalorp −>

Esto se ilustra en las siguientes figuras:

Ejemplos: 1- En el ejemplo anteúltimo referido al porcentaje deseado de SiO2 en cierto tipo de cemento aluminoso las hipótesis eran: 5.5:0 =µH contra 5.5:1 ≠µH ; y el estadístico de prueba tomó el valor

2

01.00 575.2333333.0 zz =<= ; por lo tanto se aceptaba 0H .

El valor p es el nivel de significancia más pequeño que conduce al rechazo de la hipótesis nula 0H

α

αz

valorp −

0z 0z αz

rechazodezona rechazodezona

Page 12: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

86

En esta caso ( ) ( )[ ] ( )[ ] [ ] 7414.062930.01233333.01212 00 =−=Φ−=Φ−=>=− zzZPvalorp

Como el p-valor es muy alto no hay evidencia en contra 0H . Se necesitaría tomar un valor de α

mayor a 0.7414 para rechazar 0H .

2- En el último ejemplo, sobre la duración, en horas, de un foco de 75 watts, las hipótesis eran 1000:0 =µH contra 1000:1 >µH ; y el estadístico Z tomó el valor 05.00 645.11554.7 zz =>= ;

por lo tanto se rechazaba 0H .

En este caso ( ) ( ) ( ) 01554.711 00 ≈Φ−=Φ−=>=− zzZPvalorp

Como el p-valor es casi cero hay mucha evidencia en contra de 0H . Prácticamente para ningún

valor de α se acepta 0H

Error de tipo II y selección del tamaño de la muestra

En la prueba de hipótesis el investigador selecciona directamente la probabilidad del error de tipo I. Sin embargo, la probabilidad β de cometer error de tipo II depende del tamaño de la muestra y del valor verdadero del parámetro desconocido. Supongamos las hipótesis 0100 : contra : µµµµ ≠= HH

Entonces si anotamos con µ al valor verdadero del parámetro

( )

≠≤−

== 0

2

000 µµ

σµ

β αz

n

XPfalsaesHHaceptarP

Como la hipótesis nula es falsa, entonces

n

X

σµ0−

no tiene distribución )1,0(N

Por lo tanto hacemos lo siguiente:

nn

X

n

X

n

X

σµµ

σµ

σµµµ

σµ 000 −

+−

=−+−

=−

; y ahora como )1,0(~ N

n

X

σµ−

pues se estandarizó a

X con el verdadero µ , entonces

=

≠≤

−≤−=

≠≤−

= 0

2

0

2

0

2

0 µµσ

µµµ

σµ

β ααα z

n

XzPz

n

XP

( ) ( )=

−≤−

≤−

−−=

≠≤

−+

−≤−=

n

z

n

X

n

zPz

nn

XzP

σµµ

σµ

σµµ

µµσ

µµσ

µαααα

0

2

0

2

0

2

0

2

Page 13: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

87

( ) ( ) ( ) ( )

−−−Φ−

−−Φ=

−−Φ−

−Φ= nznz

n

z

n

zσµµ

σµµ

σµµ

σµµ

αααα0

2

0

2

0

2

0

2

En consecuencia

Para un valor específico de µ y un valor de α dado, podemos preguntarnos qué tamaño de muestra se

necesita para que β sea menor que un valor dado en particular 0β .

Por ejemplo si 00 >− µµ entonces podemos aproximar ( )

00

2

−−−Φ nz

σµµ

α , y planteamos que

( ) ( )0

0

2

βσµµ

µβ α <

−−Φ= nz . Buscamos en la tabla de la )1,0(N para qué z se cumple que

( ) 0β=Φ z , lo anotamos 0βz− , y entonces podemos escribir

( ) ( )( )2

0

2

2

20

2

0

2

0

00

µµ

σ

σµµ

σµµ

βα

βαβα−

+

>⇒−

<+⇒−<−

zz

nnzzznz

En el caso de ser 00 <− µµ entonces podemos aproximar ( )

10

2

−−Φ nz

σµµ

α , y planteamos que

( ) ( )0

0

2

1 βσµµ

µβ α <

−−−Φ−= nz . Es decir ( )

−−−Φ<− nz

σµµ

β α0

2

01

Buscamos en la tabla de la )1,0(N para qué z se cumple que ( ) 01 β−=Φ z , lo anotamos 0βz , y enton-

ces podemos escribir

( ) ( ){ ( )2

0

2

2

2

0-

0

2

0

2

0

0

00

µµ

σ

σµµ

σµµ

βα

µµβαβα

+

>⇒−

−<+⇒>−

−−<

zz

nnzzznz

En consecuencia queda la misma fórmula que la anterior Por lo tanto

Si las hipótesis son 0100 : contra : µµµµ ≠= HH , entonces

( ) ( ) ( )

−−−Φ−

−−Φ= nznz

σµµ

σµµ

µβ αα0

2

0

2

Si las hipótesis son 0100 : contra : µµµµ ≠= HH , entonces

( )2

0

22

2 0

µµ

σβα

+

>zz

n

Page 14: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

88

En forma análoga se pude probar que si las hipótesis son 0100 : contra : µµµµ >= HH

Entonces

( ) =

≠≤

−== 0

000 µµ

σµ

β αz

n

XPfalsaesHHaceptarP

( ) ( ) ( )

−−Φ=

−Φ=

−≤−

=

≠≤−

+−

= nz

n

z

n

z

n

XPz

nn

XP

σµµ

σµµ

σµµ

σµ

µµσ

µµσ

µαααα

0000

0

Entonces Y si tenemos las hipótesis 0100 : contra : µµµµ <= HH

( )

( ) ( )

−−−Φ−=

−−≥−

=

≠−≥

−+

−=

=

≠−≥

−==

nz

n

z

n

XPz

nn

XP

z

n

XPfalsaesHHaceptarP

σµµ

σµµ

σµ

µµσ

µµσ

µ

µµσ

µβ

ααα

α

000

0

00

00

1

Entonces Y además con una deducción análoga al caso de alternativa bilateral:

Si las hipótesis son 0100 : contra : µµµµ >= HH , (o 01 : µµ >H ) entonces

( )

( )20

22

0

µµ

σβα

+>

zzn

Si las hipótesis son : 0100 : contra : µµµµ >= HH entonces

( ) ( )

−−Φ= nz

σµµ

µβ α0

Si las hipótesis son : 0100 : contra : µµµµ <= HH entonces

( ) ( )

−−−Φ−= nz

σµµ

µβ α01

Page 15: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

89

Ejemplos: 1- En el ejemplo referido al porcentaje deseado de SiO2 en cierto tipo de cemento aluminoso las hipótesis eran: 5.5:0 =µH contra 5.5:1 ≠µH ; y el estadístico de prueba tomó el valor

2

01.00 575.2333333.0 zz =<= ; por lo tanto se aceptaba 0H . Teníamos 16=n y 3=σ

Si el verdadero promedio de porcentaje es 6.5=µ y se realiza una prueba de nivel 01.0=α con base en n = 16, ¿cuál es la probabilidad de detectar esta desviación? ¿Qué valor de n se requiere para satisfacer 01.0=α y 01.0)6.5( =β ? Solución: La probabilidad de detectar la desviación es la potencia del test cuando 6.5=µ , es decir

( ) ( )6.51/6.5 00 βπ −=

= falsaesHHrechazarP

Como estamos con hipótesis alternativa bilateral, calculamos

( ) ( ) ( )

( ) ( ) ( ) ( )

( ) ( ) 0107.06.5 9893.099664.0199266.0

708.2441.2163

5.56.5575.216

3

5.56.5575.2

6.56.56.5 0

2

0

2

=⇒=−−=

=−Φ−Φ=

−−−Φ−

−−Φ=

=

−−−Φ−

−−Φ=

π

σµ

σµ

β αα nznz

Ahora se quiere hallar n tal que 01.0)6.5( =β , como el test es bilateral podemos usar directamente la

fórmula con 33.201.00== zzβ

( )

( )( )

21654 1225.216535.56.5

333.2575.22

22

20

2

2

20

≥⇒=−

+=

+

> n

zz

nµµ

σβα

2- En el último ejemplo, sobre la duración, en horas, de un foco de 75 watts, las hipótesis eran 1000:0 =µH contra 1000:1 >µH ; y el estadístico Z tomó el valor 05.00 645.11554.7 zz =>= ;

por lo tanto se rechazaba 0H .

En este caso 25=σ y 20=n Si la verdadera duración promedio del foco es 1050 horas, ¿cuál es la probabilidad de error de tipo II para la prueba? ¿Qué tamaño de muestra es necesario para asegurar que el error de tipo II no es mayor que 0.10 si la duración promedio verdadera del foco es 1025 hs. ? Solución: Como las hipótesis son 1000:0 =µH contra 1000:1 >µH entonces

( ) ( ) ( ) ( ) 029927.72025

10001050645.10 ≠−Φ=

−−Φ=

−−Φ= nz

σµµ

µβ α

Para hallar n tal que ( ) 1.01025 ≤β aplicamos la fórmula con 285.11.00== zzβ

Page 16: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

90

( )

( )( )

( )9 584.8

10001025

25285.1645.12

22

20

22

0 ≥⇒=−

+=

+> n

zzn

µµ

σβα

Relación entre test de hipótesis e intervalos de confianza

Existe una estrecha relación entre la prueba de hipótesis bilateral sobre un parámetro µ y el intervalo de confianza de nivel α−1 para µ . Específicamente supongamos que tenemos las hipótesis 0100 : contra : µµµµ ≠= HH

La regla de decisión es

≤−

>−

2

00

2

00

α

α

σµ

σµ

z

n

XsiHaceptar

z

n

XsiHrechazar

Aceptar 0H si 2

0ασ

µz

n

X≤

− es equivalente a: aceptar 0H si

2

0

2

αα σµ

z

n

Xz ≤

−≤− ; y esto es a

su vez equivalente, despejando 0µ , a:

aceptar 0H si n

zXn

zX σµσ αα2

02

+≤≤− ; es decir si

+−∈

nzX

nzX σσµ αα

220 ;

Pero resulta que

+−

nzX

nzX σσ αα

22; es el intervalo de confianza que se construiría

para el verdadero parámetro µ de nivel α−1 . Por lo tanto la regla de decisión queda:

+−∈

+−∉

nzX

nzXsiHaceptar

nzX

nzXsiHrechazar

σσµ

σσµ

αα

αα

2200

2200

;

;

Page 17: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

91

Ejemplo: En el ejemplo referido al porcentaje deseado de SiO2 en cierto tipo de cemento aluminoso las hipótesis eran: 5.5:0 =µH contra 5.5:1 ≠µH ;

y teníamos 16=n ; 3=σ ; un promedio muestral 25.5=x Como 01.0=α entonces 575.2005.0

2

== zzα

Construimos un intervalo de confianza de nivel 99.001.011 =−=−α

[ ]18125.7 ;31875.3163575.225.5 ;

163575.225.5;

22=

+−=

+−

nzX

nzX σσ αα

Entonces la regla de decisión es:

[ ][ ]

18125.7 ;31875.35.5

18125.7 ;31875.35.5

0

0

siHaceptar

siHrechazar

Como [ ]18125.7 ;31875.35.5 ∈ , entonces se acepta 0H .

4.3 – Prueba de hipótesis sobre la media, varianza desconocida para muestras grandes

Hasta ahora se ha desarrollado el procedimiento de test de hipótesis para la hipótesis nula

: 00 µµ =H suponiendo que 2σ es conocida, pero en la mayoría de las situaciones prácticas 2σ es

desconocida. En general si 30≥n , entonces la varianza muestral 2S está próxima a 2σ en la mayor parte de las muestras, de modo que es posible sustituir 2S por 2σ . Es decir el estadístico

)1,0(0 N

nS

XZ ≈

−=

µ aproximadamente, si 30≥n si : 00 µµ =H

Además, si no podemos decir que la muestra aleatoria proviene de una población normal, sea 2σ cono-cida o no, por T.C.L. los estadísticos

)1,0(0 N

nS

XZ ≈

−=

µ aproximadamente, si 30≥n si : 00 µµ =H

Y

)1,0(0 N

n

XZ ≈

−=

σµ

aproximadamente, si 30≥n si : 00 µµ =H

Las pruebas de hipótesis tendrán entonces un nivel de significancia aproximadamente de α

Ejemplo: Un inspector midió el volumen de llenado de una muestra aleatoria de 100 latas de jugo cuya etiqueta afirmaba que contenían 12 oz. La muestra tenía una media de volumen de 11.98 oz y desviación están-

Page 18: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

92

dar de 0.19 oz. Sea µ la verdadera media del volumen de llenado para todas las latas de jugo reciente-

mente llenadas con esta máquina. El inspector probará 12:0 =µH contra 12:1 ≠µH

a) Determinar el p-valor b) ¿Piensa que es factible que la media del volumen de llenado es de 12 oz? Solución: La v.a. de interés sería X: “volumen de llenado de una lata tomada al azar” No se especifica ninguna distribución para X. Anotamos µ=)(XE y 2)( σ=XV , ambas desconocidas. Se toma una muestra de 100=n latas y se obtiene 98.11=x y 19.0=s Las hipótesis son 12:0 =µH contra 12:1 ≠µH

El estadístico de prueba es

100

120

S

X

nS

XZ

−=

−=

µ y si 12:0 =µH es verdadera entonces )1,0(NZ ≈

El estadístico Z toma el valor 0526.1

10019.0

1298.110 −=

−=z

Como la hipótesis alternativa es bilateral entonces ( ) ( )[ ] [ ] 29372.085314.0120526.1120 =−=Φ−≈>=− zZPvalorp

Como el p-valor es mayor que 0.05 se considera que no hay evidencia en contra de 12:0 =µH

Por lo tanto es factible que la media del volumen de llenado sea de 12 oz 4.4 – Prueba de hipótesis sobre la media de una distribución normal, varianza desconocida Cuando se prueban hipótesis sobre la media µ de una población cuando 2σ es desconocida es posible utilizar los procedimientos de prueba dados anteriormente siempre y cuando el tamaño de la muestra sea grande ( 30≥n ). Estos procedimientos son aproximadamente válidos sin importar si la población de interés es normal o no. Pero si la muestra es pequeña y 2σ es desconocida debe suponerse que la distri-bución de la variable de interés es normal. Específicamente, supongamos que la v.a. de interés tiene distribución ),( 2σµN donde µ y 2σ son desconocidas. Supongamos las hipótesis 0100 : contra : µµµµ ≠= HH

Sea nXXX ,...,; 21 una muestra aleatoria de tamaño n de la v.a. X y sean X y 2S la media y la varianza

muestrales respectivamente. El procedimiento se basa en el estadístico

nS

XT

/0µ−

=

El cual, si la hipótesis nula es verdadera, tiene distribución Student con n-1 grados de libertad. Entonces, para un nivel α prefijado, la regla de decisión es

Page 19: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

93

>

1,2

0

1,2

0

n

n

tTsiHaceptar

tTsiHrechazar

α

α

es decir

≤−

>−

1,2

00

1,2

00

n

n

t

nS

XsiHaceptar

t

nS

XsiHrechazar

α

α

µ

µ

La lógica sigue siendo la misma, si el estadístico de prueba toma un valor inusual, entonces se consi-dera que hay evidencia en contra 0H y se rechaza la hipótesis nula. Como ahora la distribución del

estadístico es Student, nos fijamos si T toma un valor 0t en las colas de la distribución Student con n-1

grados de libertad.

Si la alternativa es 01 : µµ >H entonces la regla de decisión es

>

1,0

1,0

n

n

tTsiHaceptar

tTsiHrechazar

α

α

Si la alternativa es 01 : µµ <H entonces la regla de decisión es

−≥

−<

1,0

1,0

n

n

tTsiHaceptar

tTsiHrechazar

α

α

Ejemplo: Antes de que una sustancia se pueda considerar segura para enterrarse como residuo se deben caracteri-zar sus propiedades químicas. Se toman 6 muestras de lodo de una planta de tratamiento de agua resi-dual en una región y se les mide el pH obteniéndose una media muestral de 6.68 y una desviación están-dar muestral de 0.20. ¿Se puede concluir que la media del pH es menor que 7.0? Utilizar 05.0=α y suponer que la muestra fue tomada de una población normal. Solución: La v.a. de interés es X: “pH de una muestra de lodo tomada al azar” Asumimos que X tiene distribución ),( 2σµN

Las hipótesis serían 0.7: contra 0.7: 10 <= µµ HH

El estadístico de prueba es 6/

0.7

S

XT

−= y toma el valor 919.3

6/20.0

0.768.60 −=

−=t

Buscamos en la tabla de la distribución Student 015.25,05.01, ==− tt nα

Entonces como 015.2919.3 5,05.01,0 −=−=−<−= − ttt nα se rechaza 0H , por lo tanto hay evidencia que

0.7<µ P-valor de un test t

En este caso el cálculo del p- valor se realiza considerando: Si 0t es el valor calculado del estadístico de prueba T, entonces el p-valor es

a) las hipótesis son 0100 : contra : µµµµ ≠= HH

( ) ( ) ( )( )000 121 tTPtTPtTPvalorp ≤−=≤−=>=−

b) las hipótesis son 0100 : contra : µµµµ >= HH

( ) ( )00 1 tTPtTPvalorp ≤−=>=−

Page 20: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

94

c) las hipótesis son 0100 : contra : µµµµ <= HH

( )0tTPvalorp ≤=−

Para calcular el p-valor en una prueba t nos encontramos con la dificultad que las tablas de la Student no son completas, por lo tanto en algunas ocasiones se deberá acotar el p-valor En el ejemplo anterior para calcular el p-valor de la prueba como es un test con alternativa unilateral

( ) ( )919.30 −≤=≤=− TPtTPvalorp

Buscamos en la tabla de la distribución Student la fila donde figuran 5=ν grados de libertad y vemos que el valor 3.919 no está tabulado. Pero 032.4919.3365.3 << , y ( ) 01.0365.35 =>TP y ( ) 005.0032.45 =>TP

Por lo tanto ( ) 01.0919.3005.0 5 <>< TP , es decir

( ) 01.0919.3005.0 5 <−<=−< TPvalorp

Podemos deducir que existe evidencia de que la media del pH es menor que 0.7 4.5 – Prueba de hipótesis sobre la diferencia de dos medias, varianzas conocidas

Supongamos que tenemos dos variables aleatorias independientes normalmente distribuidas:

( )( )

2222

2111

σ,µN~X

σ,µN~X y suponemos que las varianzas 2

1σ y 22σ son conocidas.

Sean además ( )

111211 nX,...,X,X una muestra aleatoria de tamaño 1n de 1X

( )222221 nX,...,X,X una muestra aleatoria de tamaño 2n de 2X .

El interés recae en probar que 021 ∆=− µµ donde 0∆ es un valor fijado, por ejemplo si 00 =∆

entonces se querrá probar que 021 =− µµ es decir que las medias son iguales. Ya sabemos que bajo las suposiciones anteriores

=

=

=

=

2

1

1 2

22

222

2

1 1

21

111

1

1

1

n

i

i

n

i

i

n

σ,µN~X

nX

n

σ,µN~X

nX

Y además

+−−

2

22

1

21

2121 ,N~nn

XXσσ

µµ .

Por lo tanto

( ) ( )1,0N~

2

22

1

21

2121

nn

XXZ

σσ

µµ

+

−−−= , es decir, tiene distribución normal estandarizada.

Page 21: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

95

Si consideramos las hipótesis 02110210 : contra : ∆≠−∆=− µµµµ HH

Entonces usamos como estadístico de prueba a

2

22

1

21

021

nn

XXZ

σσ+

∆−−=

Y ( )1,0N~

2

22

1

21

021

nn

XXZ

σσ+

∆−−= si : 0210 ∆=− µµH es verdadera

Por lo tanto la regla de decisión será

>

2

0

2

0

α

α

zZsiHaceptar

zZsiHrechazar

donde

2

22

1

21

021

nn

XXZ

σσ+

∆−−=

Si 0211 : ∆>− µµH entonces la regla de decisión es

>

α

α

zZsiHaceptar

zZsiHrechazar

0

0

Si 0211 : ∆<− µµH entonces la regla de decisión es

−≥

−<

α

α

zZsiHaceptar

zZsiHrechazar

0

0

Ejemplos: 1- Un diseñador de productos está interesado en reducir el tiempo de secado de una pintura tapaporos. Se prueban dos fórmulas de pintura. La fórmula 1 tiene el contenido químico estándar, y la fórmula 2 tiene un nuevo ingrediente secante que debe reducir el tiempo de secado. De la experiencia se sabe que la desviación estándar del tiempo de secado es 8 minutos, y esta variabilidad no debe verse afectada por la adición del nuevo ingrediente. Se pintan 10 especímenes con la fórmula 1 y otros 10 con la fór-mula 2 los tiempos promedio de secado muestrales fueron 1211 =x minutos y 1122 =x minutos res-pectivamente. ¿A qué conclusiones debe llegar el diseñador del producto sobre la eficacia del nuevo ingrediente uti-lizando 05.0=α ? Solución: Aquí las hipótesis son 0: contra 0: 211210 >−=− µµµµ HH

El estadístico de prueba es

10

8

10

8 22

21

+

−=

XXZ y toma el valor 52.2

10

8

10

8

112121220 =

+

−=z

Page 22: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

96

Buscamos en la tabla de la normal estándar 645.105.0 == zzα

Como 645.152.2 05.00 ==>= zzz α se rechaza 0H al nivel 0.05 y se concluye que el nuevo ingredien-

te disminuye el tiempo de secado. El cálculo del p-valor y la deducción de β la probabilidad de cometer error de tipo II se obtienen de

manera análoga a los casos anteriores. Por ejemplo para la alternativa bilateral la expresión para β

es la siguiente donde anotamos δµµ =∆−∆=∆−− 021

( )

+

−−Φ−

+

−Φ==

2

22

1

212

2

22

1

212

00

nn

z

nn

zfalsaesHHaceptarPσσ

δ

σσ

δβ αα

En el ejemplo anterior el ( ) ( ) ( ) 0059052.2152.20 −=Φ−=>=>=− ZPzZPvalorp

También es posible obtener fórmulas para el tamaño de la muestra necesario para obtener una β espe-

cífica para una diferencia dada en las medias δµµ =∆−∆=∆−− 021 y α . Si asumimos que

nnn == 21 entonces

4.6 – Prueba de hipótesis sobre la diferencia de dos medias, varianzas desconocidas

Caso 1: 22

21 σσ ≠

Supongamos que tenemos dos variables aleatorias independientes normalmente distribuidas:

( )( )

2222

2111

σ,µN~X

σ,µN~X y las varianzas 2

1σ y 22σ son desconocidas .

y además

Para 0211 : ∆≠− µµH es ( )

2

22

21

2

2 0

δ

σσβα +

+

>zz

n

Para 0211 : ∆>− µµH o 0211 : ∆<− µµH es ( ) ( )

2

22

21

2

0

δ

σσβα ++>

zzn

Page 23: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

97

( )111211 nX,...,X,X es una muestra aleatoria de tamaño 1n de 1X

( )222221 nX,...,X,X es una muestra aleatoria de tamaño 2n de 2X .

Si las muestras aleatorias se toma de una distribución normal, donde 1σ y 2σ son desconocidos,

301 ≥n y 302 ≥n , entonces se puede probar que al reemplazar 1σ por S1 y 2σ por S2, el estadístico

)1,0()(

2

22

1

21

2121 N

n

S

n

S

XX ≈+

−−− µµ . aproximadamente

Por lo tanto si anotamos

n

S

n

S

XXZ

2

22

1

21

021

+

∆−−= valen las reglas de decisión vistas en la sección

anterior, con la diferencia que el nivel de significancia del test será aproximadamente α−1 Si ahora 1n o 2n no son mayores que 30, entonces

n

S

n

S

XXT

2

22

1

21

021*

+

∆−−=

tiene distribución aproximadamente Student con ν grados de libertad bajo la hipótesis

0210 : ∆=− µµH donde

1

22

1

1

21

22

21

2

2

2

1

2

21

2

−+

+

=

n

n

S

n

n

S

n

S

n

S

ν

si ν no es entero, se toma el entero más próximo a ν

Por lo tanto, si las hipótesis son

02110210 : contra : ∆≠−∆=− µµµµ HH entonces la regla de decisión es

>

να

να

,2

*0

,2

*0

tTsiHaceptar

tTsiHrechazar

Si 0211 : ∆>− µµH entonces la regla de decisión es

>

να

να

,*

0

,*

0

tTsiHaceptar

tTsiHrechazar

Page 24: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

98

Si 0211 : ∆<− µµH entonces la regla de decisión es

−≥

−<

να

να

,*

0

,*

0

tTsiHaceptar

tTsiHrechazar

Ejemplo: Un fabricante de monitores prueba dos diseños de microcircuitos para determinar si producen un flujo de corriente equivalente. El departamento de ingeniería ha obtenido los datos siguientes:

Diseño 1 151 =n 2.241 =x 1021 =s

Diseño 2 102 =n 9.232 =x 2022 =s

Con 10.0=α se desea determinar si existe alguna diferencia significativa en el flujo de corriente me-dio entre los dos diseños, donde se supone que las poblaciones son normales. Solución: Las variables aleatorias de interés son

:1X “flujo de corriente en diseño 1”

:2X “flujo de corriente en diseño 2”

Asumimos que ( )2111 ,N~ σµX y ( )2

222 ,N~ σµX donde los parámetros son desconocidos

Las hipótesis serían 0: contra 0: 211210 ≠−=− µµµµ HH

El estadístico de prueba es

1015

22

21

21*

SS

XXT

+

−= que en este caso toma el valor 18.0

10

20

15

10

9.232.24*0 =

+

−=t

Debemos buscar en la tabla de la distribución Student νν

α,

2

10.0,

2

tt = entonces calculamos

15933.14

1

22

1

1

21

22

21

2

2

2

1

2

21

2

≈=

−+

+

=

n

n

S

n

n

S

n

S

n

S

ν

Por lo tanto 753.115,05.0

,2

== ttν

α

Como 753.118.0 15,05.0*

0 =<= tt entonces se acepta 0: 210 =− µµH

No hay evidencia fuerte que las medias de los dos flujos de corriente sean diferentes. Si calculamos el p-valor

( ) ( ) 40.018.0**0

* >>=>=− TPtTPvalorp

Page 25: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

99

Caso 2: 222

21 σσσ ==

Supongamos que tenemos dos variables aleatorias independientes normalmente distribuidas:

( )( )

2222

2111

σ,µN~X

σ,µN~X y las varianzas 2

1σ y 22σ son desconocidas pero iguales.

y además ( )

111211 nX,...,X,X es una muestra aleatoria de tamaño 1n de 1X

( )222221 nX,...,X,X es una muestra aleatoria de tamaño 2n de 2X .

Sean 1X y 2X las medias muestrales y 21S y 2

2S las varianzas muestrales. Como 21S y 2

2S son los

estimadores de la varianza común 2σ , entonces construimos un estimador combinado de 2σ . Este estimador es

( ) ( )

2

11

21

222

2112

−+

−+−=

nn

SnSnS p

Se puede comprobar que es un estimador insesgado de 2σ . Ya vimos que se puede probar que el estadístico

21

021

11

nnS

XXT

p +

∆−−=

r

tiene distribución Student con 221 −+ nn grados de libertad

Por lo tanto, si las hipótesis son

02110210 : contra : ∆≠−∆=− µµµµ HH entonces la regla de decisión es

>

−+

−+

2,2

0

2,2

0

21

21

nn

nn

tTsiHaceptar

tTsiHrechazar

α

α

Si 0211 : ∆>− µµH entonces la regla de decisión es

>

−+

−+

2,0

2,0

21

21

nn

nn

tTsiHaceptar

tTsiHrechazar

α

α

Si 0211 : ∆<− µµH entonces la regla de decisión es

−≥

−<

−+

−+

2,0

2,0

21

21

nn

nn

tTsiHaceptar

tTsiHrechazar

α

α

Ejemplo: Se tienen las mediciones del nivel de hierro en la sangre de dos muestras de niños: un grupo de niños sanos y el otro padece fibrosis quística. Los datos obtenidos se dan en la siguiente tabla:

sanos 91 =n 9.181 =x 221 9.5=s

enfermos 132 =n 9.112 =x 222 3.6=s

Page 26: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

100

Podemos asumir que las muestras provienen de poblaciones normales independientes con iguales va-rianzas. Es de interés saber si las dos medias del nivel de hierro en sangre son iguales o distintas. Utilizar

05.0=α Solución:

Las variables de interés son :1X “nivel de hierro en sangre de un niño sano tomado al azar”

:2X “nivel de hierro en sangre de un niño con fibrosis quística tomado al azar”

Asumimos que ( )211 ,N~ σµX y ( )2

22 ,N~ σµX Consideramos las hipótesis 0: contra 0: 211210 ≠−=− µµµµ HH

Para calcular el valor del estadístico de prueba, primero calculamos

( ) ( ) ( ) ( )14.6

2139

3.61139.519

2

11 22

21

222

2112 =

−+

−+−=

−+

−+−==

nn

SnSnSS pp

El estadístico de prueba es

13

1

9

121

+

−=

pS

XXT

r

y toma el valor 63.2

13

1

9

114.6

9.119.180 =

+

−=t

Buscamos en la tabla de la distribución Student 086.220,025.0

2,2

21

==−+

ttnn

α

Como 086.263.2 20,025.00 =>= tt entonces se rechaza 0: 210 =− µµH

Si calculamos el p-valor de la prueba

( )( ) ( )( ) ( )63.2263.21212 0 >=<−=<−=− TPTPtTPvalorp

Vemos de la tabla de la Student que 528.220,01.0 =t y 845.220,005.0 =t por lo tanto

( ) 01.0263.22005.02 ×<>=−<× TPvalorp es decir 02.001.0 <−< valorp

4.7 – Prueba de hipótesis sobre la diferencia de dos medias para datos de a pares

Ya se vio el caso, cuando se habló de intervalos de confianza para una diferencia de medias, de datos dados de a pares, es decir ( ) ( ) ( )nn XXXXXX 2122122111 ,;...;,;,

1.

Las variables aleatorias 1X y 2X tienen medias 1µ y 2µ respectivamente.

Consideramos jjj XXD 21 −= con nj ,...,2,1= .

Entonces

Page 27: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

101

( ) ( ) ( ) ( ) 212121 µµ −=−=−= jjjjj XEXEXXEDE

y

( ) ( ) ( ) ( ) ( ) ( )2122

21212121 ,2,2 XXCovXXCovXVXVXXVDV jjjjjjj −+=−+=−= σσ

Estimamos ( ) 21 µµ −=jDE con ( ) 211

211

11XXXX

nD

nD

n

j

jj

n

j

j −=−== ∑∑==

En lugar de tratar de estimar la covarianza, estimamos la ( )jDV con ( )∑

=

−−

=n

j

jD DDn

S1

22

11

Anotamos 21 µµµ −=D y ( )jD DV=2σ

Asumimos que ( )2,N~ DDjD σµ con nj ,...,2,1=

Las variables aleatorias en pares diferentes son independientes, no lo son dentro de un mismo par. Para construir una regla de decisión nuevamente, consideramos el estadístico

nS

DT

D

D

/

µ−= con distribución 1−nt

Si tenemos las hipótesis 02110210 : contra : ∆≠−∆=− µµµµ HH

Entonces el estadístico de prueba es

nS

DT

D /0∆−

= y tiene distribución 1−nt si 0210 : ∆=− µµH es verdadera

Por lo tanto, la regla de decisión es

>

1,2

0

1,2

0

n

n

tTsiHaceptar

tTsiHrechazar

α

α

donde nS

DT

D /0∆−

=

Si 0211 : ∆>− µµH entonces la regla de decisión es

>

1,0

1,0

n

n

tTsiHaceptar

tTsiHrechazar

α

α

Si 0211 : ∆<− µµH entonces la regla de decisión es

−≥

−<

1,0

1,0

n

n

tTsiHaceptar

tTsiHrechazar

α

α

Ejemplo: Se comparan dos microprocesadores en una muestra de 6 códigos de puntos de referencia para determi-nar si hay una diferencia en la rapidez. Los tiempos en segundos utilizados para cada procesador en cada código están dados en la siguiente tabla:

Page 28: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

102

Código

1 2 3 4 5 6

Procesador A 27.2 18.1 27.2 19.7 24.5 22.1 Procesador B 24.1 19.3 26.8 20.1 27.6 29.8

¿Puede concluir que las medias de la rapidez de ambos procesadores son diferentes con nivel de signifi-cancia 0.05? Solución: Las variables aleatorias de interés son

:1X “rapidez del procesador A en un código tomado al azar”

:2X “rapidez del procesador B en un código tomado al azar” Como ambas variables se miden sobre un mismo código no podemos asumir que son independientes. Las hipótesis son 0: contra 0: 211210 ≠−=− µµµµ HH

Necesitamos la muestra de las diferencias jD :

3.1, -1.2; 0.4; -0.4; -3.1; -7.7 De esta muestra obtenemos 483333.1−=d y 66246.3=Ds Además 05.0=α → 571.25,025.0

1,2

==−

ttn

α

El estadístico de prueba es 6/DS

DT = y toma el valor 99206.0

6/66246.3

483333.10 =

−=t

Como 571.299206.0 5,025.01,

2

0 ==<=−

tttn

α entonces se acepta la hipótesis nula. No hay evidencia de que

las medias de la rapidez de ambos procesadores sean diferentes.

4.8 – Tests de hipótesis sobre la varianza

Supongamos que se desea probar la hipótesis de que la varianza de una población normal es igual a un

valor específico, por ejemplo 20σ .

Sea ( )nX,...,X,X 21 una muestra aleatoria de tamaño n de una v.a. X, donde ),(~ 2σµNX .

Tomamos como estimador puntual de 2σ a ( )2

11

2

1

1∑=

−−

=n

i XXn

S

Luego a partir de este estimador puntual construimos el estadístico ( )

2

21

σSn

X−

=

Este estadístico contiene al parámetro desconocido a estimar 2σ y ya sabemos que tiene una distribu-ción llamada ji-cuadrado con n-1 grados de libertad Supongamos las hipótesis 2

02

0 : σσ =H contra 20

21 : σσ ≠H

Tomamos como estadístico de prueba a

Page 29: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

103

( )2

0

21

σSn

X−

= y si 20

20 : σσ =H es verdadera , entonces

( )2

0

21

σSn

X−

= ~ 21−nχ

Nuevamente, el razonamiento es: si el estadístico X que bajo 2

02

0 : σσ =H tiene distribución 21−nχ toma

un valor “inusual”, se considera que hay evidencia en contra H0

Recordar que la distribución 21−nχ es asimétrica. Entonces la regla de decisión es

≤≤

<>

−−−

−−−

2

1,2

2

1,2

10

2

1,2

1

2

1,2

0

nn

nn

XsiHaceptar

XóXsiHrecahzar

αα

αα

χχ

χχ donde

( )2

0

21

σSn

X−

=

Si 20

21 : σσ >H entonces la regla de decisión es

>

21,0

21,0

n

n

XsiHaceptar

XsiHrecahzar

α

α

χ

χ

Si 20

21 : σσ <H entonces la regla de decisión es

<

−−

−−

21,10

21,10

n

n

XsiHaceptar

XsiHrecahzar

α

α

χ

χ

Para calcular el p-valor, si el estadístico X tomó el valor 0x , y teniendo en cuenta que no hay simetría en

la distribución ji-cuadrado, hacemos: Si 2

02

1 : σσ >H entonces ( )0xXPvalorp >=−

Si 20

21 : σσ <H entonces ( )0xXPvalorp <=−

Si 20

21 : σσ ≠H entonces ( ) ( )

><=− 00 ,min2 xXPxXPvalorp

Ejemplo: Consideremos nuevamente el ejemplo visto en la sección de intervalos de confianza para la varianza sobre la máquina de llenado de botellas. Al tomar una muestra aleatoria de 20 botellas se obtiene una varianza muestral para el volumen de llenado de 0153.02 =s oz2. Si la varianza del volumen de llenado es mayor que 0.01 oz2, entonces existe una proporción inaceptable de botellas que serán llenadas con una cantidad menor de líquido. ¿Existe evidencia en los datos mues-trales que sugiera que el fabricante tiene un problema con el llenado de las botellas? Utilice 05.0=α Solución: La variable de interés es X: “volumen de llenado de una botella tomada al azar” Asumimos ),(~ 2σµNX

Los datos son 0153.02 =s de una muestra de tamaño 20=n Las hipótesis son 01.0: 2

0 =σH contra 01.0: 21 >σH

05.0=α → 14.302

19,05.02

1, ==− χχα n

Page 30: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

104

El estadístico de prueba es ( )

01.0

191 2

20

2 SSnX

×=

−=

σ y toma el valor

07.2901.0

0153.019

01.0

19 2

0 =×

=S

x

Como <= 07.290x 14.302

19,05.0 =χ entonces no hay evidencia fuerte de que la varianza del volumen

de llenado sea menor que 0.01 Para calcular el p-valor

( ) ( )07.290 >=>=− XPxXPvalorp

Buscamos en la tabla de la distribución ji-cuadrado y vemos que en la fila con 19=ν no figura 29.07, pero 27.20 < 29.07 < 30.14, y además

( )( )

10.005.005.014.30

10.020.27<−<⇒

=>

=>valorp

XP

XP

En la figura siguiente se ilustra la situación

4.9 – Tests de hipótesis sobre la igualdad de dos varianzas

Supongamos que tenemos interés en dos poblaciones normales independientes, donde las medias y las varianzas de la población son desconocidas. Se desea probar la hipótesis sobre la igualdad de las dos varianzas, específicamente:

Supongamos que tenemos dos variables aleatorias independientes normalmente distribuidas:

( )( )

2222

2111

σ,µN~X

σ,µN~X y 1µ ; 2µ ; 2

1σ y 22σ son desconocidos

y además

Page 31: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

105

( )111211 nX,...,X,X es una muestra aleatoria de tamaño 1n de 1X

( )222221 nX,...,X,X es una muestra aleatoria de tamaño 2n de 2X .

Sean 21S y 2

2S las varianzas muestrales, 21S y 2

2S son los estimadores de 21σ y 2

2σ respectivamente. Consideramos el estadístico

22

22

21

21

σ

σ

S

S

F =

Notar que F contiene al parámetro de interés σσ

21

22 , pues

21

22

22

21

σ

σ

×

×=

S

SF

Sabemos que F tiene una distribución llamada Fisher con 11 −n y 12 −n grados de libertad.

Sean las hipótesis 22

210 : σσ =H contra 2

22

11 : σσ ≠H

Tomamos como estadístico de prueba a 22

21

S

SF =

Vemos que 22

21

S

SF = ~ 1,1 21 −− nnF si 2

22

10 : σσ =H es verdadera

Recordando que la distribución Fisher es asimétrica, la regla de decisión es

≤≤−

−<>

−−−−

−−−−

fFfsiHaceptar

fFófFsiHrechazar

nnnn

nnnn

11111

11111

2121

2121

,,2

,,2

0

,,2

,,2

0

αα

αα

Si 22

211 : σσ >H entonces la regla de decisión es

−−≤

−−>

fFsiHaceptar

fFsiHrechazar

nn

nn

11

11

21

21

,,0

,,0

α

α

Si 22

211 : σσ <H entonces la regla de decisión es

−−−≥

−−−<

fFsiHaceptar

fFsiHrecahzar

nn

nn

111

111

21

21

,,0

,,0

α

α

Para calcular el p-valor, si el estadístico F tomó el valor 0f , y teniendo en cuenta que no hay simetría

en la distribución Fisher, hacemos:

Si 22

211 : σσ >H entonces ( )0fFPvalorp >=−

Si 22

211 : σσ <H entonces ( )0fFPvalorp <=−

Si 22

211 : σσ ≠H entonces ( ) ( )

><=− 00 ,min2 fFPfFPvalorp

Ejemplo:

En una serie de experimentos para determinar la tasa de absorción de ciertos pesticidas en la piel se aplicaron cantidades medidas de dos pesticidas a algunos especímenes de piel. Después de un tiempo

Page 32: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

106

se midieron las cantidades absorbidas (en gµ ). Para el pesticida A la varianza de las cantidades absor-bidas en 6 muestras fue de 2.3; mientras que para el B la varianza de las cantidades absorbidas en 10 especímenes fue de 0.6. Suponga que para cada pesticida las cantidades absorbidas constituyen una muestra aleatoria de una población normal. ¿Se puede concluir que la varianza en la cantidad absorbi-da es mayor para el pesticida A que para el B? Utilizar 05.0=α Solución: Las variables aleatorias de interés son

:1X “cantidad absorbida de pesticida A en un espécimen de piel tomado al azar”

:2X “cantidad absorbida de pesticida B en un espécimen de piel tomado al azar”

Asumimos que ( )2111 ,N~ σµX y ( )2

222 ,N~ σµX

Las hipótesis son 22

210 : σσ =H contra 2

22

11 : σσ >H

Los datos son 3.221 =s y 6.02

2 =s

61 =n ; 102 =n

El estadístico de prueba es 22

21

S

SF = y toma el valor 83.3

6.0

3.20 ==f

Buscamos en la tabla de la distribución Fisher 48.39,5,05.0 =f

Como 9,5,05.00 48.383.36.0

3.2ff =>== se rechaza 2

22

10 : σσ =H

Para saber cuánta evidencia hay contra la hipótesis nula, calculamos el p-valor De la tabla de la Fisher vemos que 06.683.348.3 9,5,01.09,5,05.0 =<<= ff

Por lo tanto 05.001.0 <−< valorp En la figura siguiente se ilustra la situación

Page 33: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

107

4.10 – Tests de hipótesis sobre una proporción

En muchos problemas se tiene interés en una variable aleatoria que sigue una distribución binomial. Por ejemplo, un proceso de producción que fabrica artículos que son clasificados como aceptables o defectuosos. Lo más usual es modelar la ocurrencia de artículos defectuosos con la distribución bino-mial, donde el parámetro binomial p representa la proporción de artículos defectuosos producidos. En consecuencia, muchos problemas de decisión incluyen una prueba de hipótesis con respecto a p. Consideremos las hipótesis 00 : ppH = contra 01 : ppH ≠

Supongamos que consideramos una muestra aleatoria ( )nXXX ...,, 21 de tamaño n , donde Xi tiene

una distribución binomial con parámetros 1 y p: Xi ~ B(1,p). Ya sabemos que =X nXXX +++ ...21 , es una v.a. cuya distribución es binomial con parámetros n

y p: X~B(n,p). De acuerdo con esto, la variable aleatoria P̂ definida: n

XP̂ = representa la proporción

de individuos de la muestra que verifican la propiedad de interés.

Además

( ) ( ) pnpn

XEnn

XEP̂E ===

=11

, y ( ) ( ) ( )n

pppnp

nn

XVP̂V

−=−=

=1

11

2

Consideramos el estadístico de prueba

( )

n

pp

pPZ

00

0

1

ˆ

−=

Si 00 : ppH = es verdadera entonces ( )

)1,0(1

ˆ

00

0 N

n

pp

pPZ ≈

−= aproximadamente por T.C.L.

Por lo tanto la regla de decisión es

>

2

0

2

0

α

α

zZsiHaceptar

zZsiHrechazar

donde ( )

n

pp

pPZ

00

0

1

ˆ

−=

Si 01 : ppH > entonces la regla de decisión es

>

α

α

zZsiHaceptar

zZsiHrechazar

0

0

Si 01 : ppH < entonces la regla de decisión es

−≥

−<

α

α

zZsiHaceptar

zZsiHrechazar

0

0

Page 34: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

108

Observaciones: 1- La prueba descrita anteriormente requiere que la proporción muestral esté normalmente distribuida. Esta suposición estará justificada siempre que 100 >np y ( ) 101 0 >− pn , donde 0p es la proporción

poblacional que se especificó en la hipótesis nula.

2- También se podía haber tomado como estadístico de prueba a ( )00

0

1 pnp

npXZ

−= donde X~B(n,p)

Ejemplo: Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores automovilísticos. El cliente requiere que la fracción de controladores defectuosos en uno de los pasos de manufactura críticos no sea mayor que 0.05, y que el fabricante demuestre esta característica del proceso de fabricación con este nivel de calidad, utilizando 05.0=α . E fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El fabri-cante puede demostrar al cliente la calidad del proceso? Solución: Sea la v.a. X: “número de controladores defectuosos en la muestra” Entonces X ~ B(200, p) donde p es la proporción de controladores defectuosos en el proceso Las hipótesis son 05.0:0 =pH contra 05.0:1 <pH

Como 05.0=α entonces 645.105.0 −=−=− zzα

El estadístico de prueba es ( ) ( )

200

05.0105.0

05.0ˆ

1

ˆ

00

0

−=

−=

P

n

pp

pPZ y toma el valor 95.10 −=z

Como <−= 95.10z 645.105.0 −=−=− zzα entonces se rechaza 0H , y se concluye que la fracción de

controladores defectuosos es menor que 0.05. Calculamos el p-valor

( ) ( ) 0256.095.195.1 =−Φ≈−<=− ZPvalorp Valor de β y selección del tamaño de la muestra

Podemos obtener expresiones aproximadas para la probabilidad de cometer error de tipo II de manera análoga a las obtenidas para los test para la media Si 01 : ppH ≠ entonces

( )

−−−

Φ−

−+−

Φ≈

=

n

pp

n

ppzpp

n

pp

n

ppzpp

falsaesHHaceptarPp

)1(

)1(

)1(

)1( 00

20

00

20

00

αα

β

Page 35: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

109

Si 01 : ppH < entonces

( )

( )

( )

−−−

Φ−≈

=

n

pp

n

ppzpp

falsaesHHaceptarPp1

1

1

000

00

α

β

Si 01 : ppH > entonces

( )

( )

( )

−+−

Φ≈

=

n

pp

n

ppzpp

falsaesHHaceptarPp1

1 000

00

α

β

Estas ecuaciones pueden resolverse para encontrar el tamaño aproximado de la muestra n para que con un nivel de significancia de α la probabilidad de cometer error de tipo II sea menor o igual que un valor específico 0β . Las ecuaciones se deducen como en casos anteriores y son

Si 01 : ppH ≠ entonces

( ) ( )2

0

00

2

110

−+−

≥pp

ppzppz

n

βα

Si 01 : ppH < ó 01 : ppH > entonces ( ) ( )

2

0

00 110

−+−≥

pp

ppzppzn

βα

Ejemplo: Volviendo al ejemplo anterior, supongamos que la verdadera proporción de componentes defectuosos en el proceso es 03.0=p , ¿cuál es el valor de β si 200=n y 05.0=α ? Solución: Ya que la alternativa es 01 : ppH < aplicamos la fórmula

( )

( )

( )

( )

( )( ) 67.044.01

200

03.0103.0

05.0105.0645.103.005.0

1

1

1

1

000

00

=−Φ−=

−−−

Φ−=

=

−−−

Φ−≈

=

n

n

pp

n

ppzpp

falsaesHHaceptarPpα

β

Como la probabilidad de aceptar que el proceso tiene la calidad deseada cuando en realidad 03.0=p es bastante alta, podemos preguntar qué tamaño de muestra se necesita para que en el test anterior sea

Page 36: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

110

1.0<β si la verdadera proporción de defectuosos es 03.0=p . En este caso aplicamos la fórmula

donde 28.11.00== zzβ

( ) ( ) ( ) ( )832

05.003.0

03.0103.028.105.0105.0645.11122

0

00 0 ≈

−+−=

−+−≥

pp

ppzppzn

βα

La muestra requerida es muy grande, pero la diferencia a detectar 05.003.00 −=− pp es bastante pe-

queña. 4.11 – Tests de hipótesis sobre dos proporciones

Las pruebas de hipótesis sobre diferencia de medias pueden adaptarse al caso donde tenemos dos pa-rámetros binomiales 1p y 2p de interés. Específicamente, supongamos que se toman dos muestras aleatorias ( )

111211 nX,...,X,X es una muestra aleatoria de tamaño 1n de 1X

( )222221 nX,...,X,X es una muestra aleatoria de tamaño 2n de 2X

Donde ),1(~ 11 pBX ; ),1(~ 22 pBX y 1X y 2X independientes.

Ya sabemos que ∑=

=1

11

11

1ˆn

i

iXn

P y ∑=

=2

12

22

1ˆn

i

iXn

P son estimadores insesgados de 1p y 2p respecti-

vamente, con varianzas ( ) ( )1

111

1ˆn

ppPV

−= y ( ) ( )

2

222

1ˆn

ppPV

−=

Supongamos las hipótesis 0: contra 0: 211210 ≠−=− ppHppH

Notar que si la hipótesis nula es verdadera entonces ppp == 21 , donde p es desconocido.

El estadístico

( )

+−

−=

21

21

111

ˆˆ

nnpp

PPZ tiene distribución aproximadamente )1,0(N por T.C.L. si

0: 210 =− ppH es verdadera. Tomamos como estimador de p a 21

1 121

1 2

ˆnn

XX

P

n

i

n

i

ii

+

+=∑ ∑= = y lo reempla-

zamos en Z

Entonces el estadístico de prueba es

( )

+−

−=

21

21

11ˆ1ˆ

ˆˆ

nnPP

PPZ que bajo 0: 210 =− ppH se puede pro-

bar que tiene distribución aproximadamente )1,0(N

Page 37: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

111

Entonces la regla de decisión es

>

2

0

2

0

α

α

zZsiHaceptar

zZsiHrechazar

donde

( )

+−

−=

21

21

11ˆ1ˆ

ˆˆ

nnPP

PPZ

Si 0: 211 >− ppH entonces la regla de decisión es

>

α

α

zZsiHaceptar

zZsiHrechazar

0

0

Si 0: 211 <− ppH entonces la regla de decisión es

−≥

−<

α

α

zZsiHaceptar

zZsiHrechazar

0

0

Ejemplo: En una muestra de 100 lotes de un producto químico comprado al distribuidor A, 70 satisfacen una especificación de pureza. En una muestra de 70 lotes comprada al distribuidor B, 61 satisfacen la es-pecificación. ¿Pude concluir que una proporción mayor de los lotes del distribuidor B satisface la es-pecificación? Solución: Los parámetros de interés son 1p y 2p las verdaderas proporciones de lotes que cumplen las especifi-caciones de pureza.

Tenemos una muestra aleatoria ( )111211 nX,...,X,X de tamaño 1001 =n donde 7.0

100

701ˆ1

11

11 === ∑

=

n

i

iXn

P

Y otra muestra ( )222221 nX,...,X,X de tamaño 702 =n donde

70

611ˆ2

12

22 == ∑

=

n

i

iXn

P

Las hipótesis son 0: contra 0: 211210 <−=− ppHppH

El estadístico de prueba es

( )

+−

−=

21

21

11ˆ1ˆ

ˆˆ

nnPP

PPZ donde

21

1 121

1 2

ˆnn

XX

P

n

i

n

i

ii

+

+=∑ ∑= =

En este caso 170

131

70100

6170ˆ21

1 121

1 2

=++

=+

+=∑ ∑= =

nn

XX

P

n

i

n

i

ii

El estadístico toma el valor 6163.2

70

1

100

1

170

1311

170

13170

61

100

70

0 −=

+

−=z

Page 38: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

112

Para saber cuánta evidencia hay contra 0: 210 =− ppH calculamos el p-valor

( ) 0045.06163.2 =−Φ≈− valorp

Como el p-valor es menor que 0.05, se considera que hay mucha evidencia contra 0: 210 =− ppH y

se rechaza la hipótesis nula. Valor de β

Cuando 0: 210 =− ppH es falsa, la varianza de 21ˆˆ PP − es

( ) ( ) ( ) ( ) ( )2

22

1

112121

11ˆˆˆˆn

pp

n

ppPVPVPPV

−+

−=+=−

Anotamos ( ) ( ) ( ) ( ) ( )2

22

1

112121ˆˆ

11ˆˆˆˆ21 n

pp

n

ppPVPVPPV

PP

−+

−=+=−=

−σ

Entonces Si 0: 211 ≠− ppH

( ) ( )

−−

+−

Φ−

−−

+

Φ≈−− 2121

ˆˆ

2121

2

ˆˆ

2121

2

1111

PPPP

ppnn

qpzppnn

qpz

σσβ

αα

Donde Pp ˆ= y pq −=1

Si 0: 211 >− ppH entonces

( )

−−

+

Φ≈− 21

ˆˆ

2121

11

PP

ppnn

qpz

σβ

ε

Si 0: 211 <− ppH entonces

( )

−−

+−

Φ−≈− 21

ˆˆ

2121

11

1PP

ppnn

qpz

σβ

α

Podemos deducir fórmulas para el tamaño de la muestra, nuevamente asumiendo que nnn == 21

Page 39: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

113

Práctica

Test de Hipótesis

1) Se hace una prueba de la hipótesis 10: contra 10: 10 >≤ µµ HH . Para cada una de las situacio nes siguientes, determine si la decisión fue correcta u ocurrieron errores de tipo I o II: a) rechazada es H 8, verdaderoel siendo 0=µ ; b) rechazada es no H ,01 verdaderoel siendo 0=µ c) rechazada es no H ,41 verdaderoel siendo 0=µ ; d) rechazada es H ,21 verdaderoel siendo 0=µ 2) a) Se realiza una prueba de hipótesis y el P-valor es 0.03. Justificando su respuesta, diga si las si- guientes afirmaciones son verdaderas o falsas: a1) H0 se rechaza a un nivel de 5% a2) H0 se rechaza a un nivel de 2% a3) H0 no se rechaza a un nivel de 10% b) Se diseña un programa de tratamiento de aguas residuales para producir agua tratada con pH de 7. Sea µ la media del pH del agua tratada mediante dicho proceso. Se medirá el pH de 20 mues- tras de agua y se realizará una prueba de hipótesis 7: contra 7: 10 ≠= µµ HH . Suponga que se sabe por experimentos previos que el pH del agua es normal con desviación estándar 0.5. b1) Si la prueba se hace a un nivel de 5%, ¿cuál es la región de rechazo? b2) Si la media muestral del pH es 6.77, ¿se rechaza H0 a un nivel de 10%? b3) Si la media muestral del pH es 6.77, ¿se rechaza H0 a un nivel de 1%? b4) Si el valor 1.79 representa un punto crítico, ¿cuál es el nivel de la prueba?

3) Un ingeniero está probando la resistencia a la compresión del concreto. Prueba 12 muestras de con- creto y obtiene un promedio de 2.259 psi y un desvío estándar de 0.035 psi. Suponga que la resisten- cia a la compresión sigue una distribución normal. a) Construya un intervalo de confianza al 95% para la resistencia media. b) Utilizando el intervalo del inciso a) pruebe la hipótesis H0: µ =2.250 contra H1 : µ≠ 2.250 con nivel de significancia α = 0.05. 4) Se publica un informe sobre las cifras del número anual de kilowatts-hora que gastan varios apara- tos electrodomésticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatts-hora por año. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica que las aspiradoras gasta un promedio de 42 kilowatts-hora con una desviación estándar de 11.9 kilowatts- hora por año, en un nivel de significancia de 0.05, ¿esto sugiere que las aspiradoras gastan, en pro- medio, menos de 46 kilowatts- hora anualmente?. Suponga que la población de kilowatts-hora es normal. 5) Suponga que ha comprado una máquina de llenado para bolsas de dulces que contendrá 16 onzas de éstos. Suponga que los pesos de las bolsas llenas están distribuidos en forma normal. Una muestra aleatoria de diez bolsas produce los siguientes datos (en onzas): 15.87, 16.02, 15.78, 15.83, 15.69, 15.81, 16.04, 15.81, 15.92, 16.10. Con base en estos datos, ¿puede concluir que la media del peso de llenado es, en realidad, menor que 16 onzas con un nivel de significancia de 0.05? 6) Se probó la velocidad en cierta aplicación de 50 chips nuevos de computadora, con otra cantidad igual de diseño viejo. La velocidad promedio, en MHz, de los nuevos chips fue de 495.6, y la des- viación estándar de 19.4. La velocidad promedio de los chips viejos fue de 481.2, y la desviación

Page 40: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

114

estándar fue de 14.3. a) ¿Se puede concluir que la media de la velocidad de los nuevos es mayor que la de los chips vie- jos?. Establezca las hipótesis nula y alternativa adecuadas y después encuentre el p-valor. b) Una muestra de 60 chips aún más viejos tenía velocidad promedio de 391.2 MHz, con desviación estándar de 17.2 MHz. Alguien afirma que los nuevos chips tienen tienen una velocidad prome- dio mayor a 100 MHz que los más viejos. ¿Los datos proporcionan evidencias convincentes para esta afirmación? . Establezca las hipótesis nula y alternativa y después determine el p-valor. 7) Un fabricante de baterías para automóvil afirma que sus baterías durarán, en promedio, 3 años con una varianza de 1 año. Si 5 de estas baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años, construya un intervalo de confianza de 95% para la varianza. Suponga que la población de duracio- nes de las baterías se distribuye de forma aproximadamente normal. ¿Se puede concluir que la afir- mación del fabricante de que la varianza es 1 es válida? Justifique su respuesta. 8) Una muestra aleatoria de 6 vigas de acero tiene una resistencia a la compresión promedio de 58392 psi (libras por pulgada cuadrada) con una desviación estándar de 648 psi. Suponiendo normalidad a) Use esta información y el nivel de significancia 05.0=α para probar si la verdadera resistencia a la compresión media del acero del que provino la muestra es de 58000 psi. b) Pruebe la hipótesis nula 600=σ psi contra la alternativa 600>σ psi. Utilice 05.0=α . 9) Use el nivel de significancia 01.0=α para probar la hipótesis nula de que 015.0=σ pulgadas, para los diámetros de ciertos tornillos, contra la alternativa de que 015.0≠σ pulgadas, puesto que una muestra aleatoria de tamaño 15 dio como resultado s2 = 0.00011. Suponga normalidad. 10) Un fabricante de estaciones de trabajo de computadora está probando un nuevo proceso de ensam- ble automatizado. El proceso actual tiene una tasa de defectos de 5%. En una muestra de 400 esta- ciones de trabajo ensambladas con el nuevo proceso, 15 tenían defecto. ¿Se puede concluir que el nuevo proceso tiene una tasa menor de defectos?. Calcule el p-valor. 11) La directiva de una compañía de taxis está tratando de decidir si debe cambiar de neumáticos no males a neumáticos radiales para mejorar el ahorro de combustible. Se equiparon cada uno de los diez taxis con uno de los dos tipos de neumáticos y se condujeron en una trayectoria de prueba. Si cambiar de conductores, se seleccionó el tipo de neumáticos y se repitió la trayectoria de prueba. El ahorro de combustible (en milla por galón) para diez automóviles es:

Automóvil 1 2 3 4 5 6 7 8 9 10

Radial 32.1 36.1 32.3 29.5 34.3 31.9 33.4 34.6 35.2 32.7 Normal 27.1 31.5 30.4 26.9 29.9 28.7 30.2 31.8 33.6 29.9

a) Debido a que el cambio de neumáticos en la flota de taxis es caro, la directiva no quiere cam- biar a menos que una prueba de hipótesis proporcione evidencias de que mejorará el millaje. Establezca la hipótesis nula y alternativa adecuada y encuentre el p-valor. Asuma que la diferen- cia de millaje es normal. ¿Cuál es la conclusión?. b) Un análisis costo-beneficio muestra que será provechoso cambiar a neumáticos radiales si la media de la mejora del millaje es mayor a dos millas/galón. Establezca la hipótesis nula y al- ternativa adecuada y encuentre el p-valor para una prueba de hipótesis diseñada como base de la decisión de cambiar. ¿Cuál es la conclusión? 12) Se está considerando un nuevo proceso de producción para la fabricación de cojinetes de acero in- oxidable. Mediciones de los diámetros de muestras aleatorias de cojinetes de viejos y nuevos pro- cesos produjeron los siguientes datos: Viejo: 16.3 15.9 15.8 16.2 16.1 16.0 15.7 15.8 15.9 16.1 16.3 16.1 15.8 15.7 15.8 15.7

Page 41: Test de Hipotesis

Test de hipótesis Prof. María B. Pintarelli

115

Nuevo: 15.9 16.2 16.0 15.8 16.1 16.1 15.8 16.0 16.2 15.9 15.7 16.2 15.8 15.8 16.2 16.3 Asumiendo que ambas muestras provienen de poblaciones normales independientes a) ¿Puede concluir con un nivel de 5% que un proceso produce una media de los tamaños de los cojinetes diferente de la otra?. b) ¿Puede concluir que en un nivel de 5% la varianza del nuevo procedimiento es menor que con el procedimiento antiguo? 13) Una compañía grande armadora de automóviles trata de decidir si compra llantas de la marca A o de la marca B para sus modelos nuevos. Para ayudar a tomar una decisión, se realiza un experi- mento en donde se usan 12 llantas de cada marca. Las llantas se utilizan hasta que se acaban. Los resultados son: Marca A: kmx 379001 = kms 51001 = ; Marca B: kmx 398002 = kms 59002 = ¿Hay diferencia en el desgaste promedio de las dos marcas de llantas?. Suponga que las poblacio- nes son independientes y se distribuyen de forma normal con varianzas iguales. Utilice el p-valor. 14) Se encuestan 10 escuelas de ingeniería en cierto país. La muestra contiene 250 ingenieros electró- nicos, donde 80 son mujeres; y 175 ingenieros químicos, donde 40 son mujeres.¿Hay una diferen- cia significativa entre las dos proporciones de mujeres en estos dos campos de la ingeniería?. Utili- ce 05.0=α 15) El contenido de azúcar, en mg/ml, de un caldo utilizado para fabricar un producto farmacéutico fue medido varias veces en cada uno de tres días sucesivos. Día 1: 5.0, 4.8, 5.1, 5.1, 4.8, 5.1, 4.8, 4.8, 5.0, 5.2, 4.9, 4.9, 5.0 Día 2: 5.8, 4.7, 4.7, 4.9, 5.1, 4.9, 5.4, 5.3, 5.3, 4.8, 5.7, 5.1, 5.7 Día 3: 6.3, 4.7, 5.1, 5.9, 5.1, 5.9, 4.7, 6.0, 5.3, 4.9, 5.7, 5.3, 5.6 Asuma que los datos provienen de poblaciones normales independientes. a) ¿Puede concluir que la variabilidad del proceso es mayor el segundo día que el primero? b) ¿Puede concluir que la variabilidad del proceso es mayor el tercer día que el segundo?