inferencia estadistica. test de hipotesis

Statistics

Inferencial Statistics III. Test de hipótesis

OpenUepc.com 1.1.5.5.3 Ver 01:05/02/2010

NOTA

La clasificación decimal de todos los temas de este manual tienen implícito el comienzo 1.1.5.5.3 correspondiente a

1 SCIENCE

1.1 MATHEMATICS

1.1.5 STATISTICS

1.1.5.5 INFERENCIAL STATISTICS

1.1.5.5.3 TEST DE HIPOTESIS

COPYLEFT

Este material así como los applets, powerpoints, videos y archivos de sonido asociados, puede ser distribuido bajo los términos y condiciones definidos en Open Publication License versión 1.0 o posterior (La versión más reciente está disponible en http://www.opencontent.org/openpub/).

El contenido está sujeto a constantes cambios sin previo aviso. Su fin es didáctico y solo pretende la universalización de la cultura. Está escrito en base a la colaboración de las miles de personas que componen nuestra comunidad OpenUepc. Se ha exigido a los autores que referencien todas las fuentes utilizadas y figuran al final del texto. Cualquier distribución del mismo debe mencionar a OpenUepc como fuente.

Miguel Pérez Fontenla [email protected]

INDICE AUTORES

Iniciado por: Miguel Pérez Fontenla

12/12/2009

WikiMaths | Introducción 1

TABLA DE CONTENIDO

Introducción .............................................................................................................................. 2

History ................................................................................................................................... 2

Aplicaciones de los contrastes de hipótesis ........................................................................... 2

CONCEPTOS BÁSICOS .......................................................................................................... 3

Hipótesis estadística .............................................................................................................. 3

Test de hipótesis .................................................................................................................... 3

Etapas de un test de hipótesis. Región crítica ........................................................................ 3

Test de hipótesis bilaterales y unilaterales ............................................................................ 4

Tipos de error......................................................................................................................... 9

Función de potencia ............................................................................................................. 10

CONTRASTES DE HIPÓTESIS MÁS COMUNES ............................................................. 11

Contraste de hipótesis para la proporción ........................................................................... 11

Contraste de hipótesis para la varianza de una población normal ....................................... 13

Pruebas de ajuste .............................................................................................................. 13

Prueba χ2 de Pearson ........................................................................................................ 13

Prueba de ajuste de Kolmogorov-Smirnov (K-S) ............................................................ 16

Contraste de hipótesis para la diferencia de medias ............................................................ 17

WikiMaths | Introducción 2

Introducción

History

Hypothesis testing is largely the product of Ronald Fisher, Jerzy Neyman, Karl Pearson and (son) Egon Pearson. Fisher was an agricultural statistician who emphasized rigorous experimental design and methods to extract a result from few samples assuming Gaussian distributions. Neyman (who teamed with the younger Pearson) emphasized mathematical rigor and methods to obtain more results from many samples and a wider range of distributions. Modern hypothesis testing is an (extended) hybrid of the Fisher vs Neyman/Pearson formulation, methods and terminology developed in the early 20th century.

http://en.wikipedia.org/wiki/Statistical_hypothesis_testing

Aplicaciones de los contrastes de hipótesis

Los contrastes de hipótesis, como la inferencia estadística en general, son herramientas de amplio uso en la ciencia en general. En particular, la moderna Filosofía de la ciencia desarrolla el concepto de falsabilidad de las teorías científicas basándose en los conceptos de la inferencia estadística en general y de los contrastes de hipótesis. En este contexto, cuando se desea optar entre dos posibles teorías científicas para un mismo fenómeno (dos hipótesis) se debe realizar un contraste estadístico a partir de los datos disponibles sobre el fenómeno que permitan optar por una u otra.

Las técnicas de contraste de hipótesis son también de amplia aplicación en muchos otros casos, como ensayos clínicos de nuevos medicamentos, control de calidad, encuestas, etcétera .http://es.wikipedia.org/wiki/Contraste_de_hip%C3%B3tesis

WikiMaths | CONCEPTOS BÁSICOS 3

CONCEPTOS BÁSICOS

Los contrastes de hipótesis los vamos a usar para tomar decisiones acerca de las características de la población.

Hipótesis estadística

Una hipótesis estadística es cualquier afirmación que se haga referida a cualquier característica desconocida de la población, ya sea el valor que pueda tomar un determinado parámetro o el tipod e distribución que sigue la población. Puede solo tomar dos valores: Verdadera o Falsa

Test de hipótesis

Un test o contraste de hipótesis es un proceso de decisión que nos permite determinar si una hipótesis estadística debe ser aceptada o rechazada. Los contrastes de hipótesis pueden ser simples si al aceptarla queda perfectamente especificada la distribución poblacional o compuesta si al aceptarla queda todavía desconocido algún parámetro poblacional.

También podemos clasificar los contrastes de hipótesis en dos clases el contraste de

hipótesis paramétrico cuando está referida a un parámetro de la población, y contraste de

hipótesis ............. sobre el tipo de distribución que sigue una población.

El procedimiento que seguiremos es

• Formular una hipótesis; • se toma una muestra; • buscamos el estimador adecuado; • establecemos un nivel de significación; • buscamos un intervalo de aceptación y en base a los resultados • aceptamos o rechazamos la hipótesis.

El contraste no establece la veracidad o falsedad a ciencia cierta de la hipótesis sino que nos da un criterio para aceptarla o no como verdadera.

Etapas de un test de hipótesis. Región crítica

Vamos a pormenorizar más estos apartados del siguiente modo:

1. Hacemos una prueba y partimos de una Hipótesis H0, que denominamos hipótesis

nula, que suponemos Verdadera. Su complementaria es denominada hipótesis

alternativa H1. 2. Definimos la ley de probabilidad que sigue la población y la distribución muestral. 3. Establecemos un nivel de significación α que es la probabilidad con la cual

sometemos la hipótesis H0 a prueba. 4. Determinamos las zonas o regiones de aceptación (A) de H0, y regiones de rechazo

(C) de H0, también llamada región crítica. Para ello definimos valor crítico, aquel a partir del cual rechazamos la hipótesis H0.

5. Seleccionamos una muestra aleatoria y calculamos el estadístico que hayamos elegido para estimar el parámetro buscado.

6. Establecemos la regla de decisión, de aceptar o no la hipótesis nula H0. En caso de no aceptación de H0, se supone que aceptamos la hipótesis alternativa H1.


Test de hipótesis bilaterales y unilaterales

Cuando la región crítica está situada a ambos lados de la zona de aceptación de H0, el contraste se denomina bilateral o de dos colas. Por ejemplo, si se trata de estas dos hipótesis, sería bilateral

H0 : µ = 200

H1 : µ ≠ 200

Y la región crítica correspondería a un gráfico como el siguiente:

Y si la región crítica se sitúa en una de las dos colas, se denomina contraste unilateral (derecho o izquierdo según el lado). Por ejemplo:

H0 : µ1 ≤ µ2

H1 : µ1 > µ2

Y el gráfico sería


Ejemplo

Se sabe que llamando X a la v.a. que mide la tensión arterial en toda España, ésta sigue una normal N(µ = 80, σE = 12). Se sospecha que el parámetro de la media µG podría ser distinto en Galicia, es decir que en Galicia se siguiese una N(µG, σG = 12). En lenguaje de hipótesis sería H0 : µG = 80 H1 : µG ≠ 80 (µG < 80 ó µG > 80) (contraste bilateral) Para comprobarlo se toma una muestra de n = 100 gallegos . Sabemos que la media

muestral sigue una 10012

80, (80,1.2)100

X N N

=

Bien, ahora suponemos que la hipótesis nula H0 es cierta, ello implica que la media

muestral 100X estará muy cercana a µ = 80, pero no podemos ser ambiguos en matemáticas, luego ... ¿a que llamamos muy cercana? Tenemos que precisar este dato y esto se hace a través del llamado nivel de confianza (1-α), o también a través del error medio que queremos cometer que será α. Supongamos que este nivel de confianza es del 95% = 0.95 ( o que el error o también llamado nivel de significación es del 0.05)

Entonces, a pesar de que nuestras suposiciones sean de que la tensión arterial en Galicia pueda ser distinta, la evidencia estadística nos da muchas opciones a que la conclusión sea la contraria, pues el área de rechazo es muy pequeña comparada con el área de aceptación de la hipótesis. La variable normal tipificada Z0.975 vale 1.96 (hay que buscarlo en las tablas de la N(0,1) o bien con Excel mediante =DIST.NORMAL.INV(0.975,0,1)=1.95996 )


Regla de decisión: Ahora llega el momento de decidir, y lo hacemos de la siguiente manera

Si ( )801.96,1.96

1.2

X −∈ − entonces => acepto la hipótesis nula H0

Si ( ) ( )80, 1.96 1.96,

1.2

X −∈ ∞ − ∞U entonces => rechazo la hipótesis nula H0 y

aceptaríamos consecuentemente la hipótesis alternativa H1 lo que en lenguaje “coloquial” sería como decir que la tensión arterial de los gallegos sería significativamente distinta de la del resto de los españoles, y como es bilateral, podríamos aclarar si µG > 80 o µG < 80

Supongamos ahora, que calculamos la media muestral y nos da 85X = como

( )80 85 804.1667 1.96,1.96

1.2 1.2

X − −= = ∉ − en este caso rechazaríamos la hipótesis nula

H0 y concluiríamos con que los gallegos tendrían presión arterial significativamente mayor que la de la media española. Si redujésemos el error α al 0.01 el intervalo variaría pues Z0.995 = 2.58 y la regla de decisión sería ahora

Si ( )802.58,2.58

1.2

X −∈ − entonces => acepto la hipótesis nula H0

Si ( ) ( )80, 2.58 2.58,

1.2

X −∈ ∞ − ∞U entonces => rechazo la hipótesis nula H0


Y en este caso con la media muestral 85X = como

( )80 85 804.1667 2.58,2.58

1.2 1.2

X − −= = ∉ − seguiríamos rechazando la hipótesis nula

H0

Ejemplo

Se desea contrastar si es o no igual de probable que un bebé sea niño o niña. Parece ser que no, que si utilizamos rigurosamente la teoría de la probabilidad con los datos estadísticos disponibles existe una cierta probabilidad a favor de que un bebé sea niño que niña (será que la propia y sabia Naturaleza está realizando ajustes para compensar la mayor longevidad de las mujeres). Si, a modo de ejercicio, quisiésemos darle a este hecho forma de problema de contraste de hipótesis, podríamos tomar un dato estadístico cierto como el de tomar una muestra de 2130 niños recién nacidos de entre los nacimientos en Galicia en 1993 de los que resultaron 1107 varones y 1023 hembras. Consideramos la v.a. dicotónica X definida como

0 Si el bebe es niña( )

1 Si el bebe es niño

X

A X A

Ω→

→ =

donde [ ]

[ ]0 proporcion de niñas

1 1 proporcion de niños

P X p

P X p q

= =

= = − =

Sean las hipótesis H0 : p = 0.5 (igual números de nacimiento de niñas que de niños) H1 : p < 0.5 (es menos probable que nazcan niñas) Si H0 es cierta, esperaríamos que de 2130 nacimientos hayan 1065 hembras y otros tantos varones, pero en la muestra realizada el dato es 1107 varones y 1023 hembras. Lo que hay que comprobar es si esta diferencia es significativamente alta o entra dentro de unos límites razonables de azar.

Para poder realizar este contraste tenemos que establecer un hallar un valor c, llamado valor

crítico, de manera que si el número de hembras de la muestra resulta mayor o igual que c aceptamos la hipótesis H0, o bien la damos por Verdadera; y si el número de hembras es menor que c rechazamos H0, o la damos por Falsa, aceptando H1.

Este valor crítico c lo calculamos definiendo previamente el denominado nivel de

significación α, que es la probabilidad de obtener en la muestra menos hembras que varones

Ejemplo

En este ejemplo, supongamos que establecemos como α = 0.05. Como nuestra v.a. X es una binomial B(2130,0.5) la podemos aproximar por una normal

( ) ( ), 1065, 2130 0.5 0.5 (1065, 23.08)N np npq N Nσ= = ⋅ ⋅ = de donde, como hemos

establecido el nivel de significación α = 0.05


[ ] 10650.05

23.08

cP X c P Z

− < = < =

Buscamos en las tablas de la normal a quién corresponde este valor y resulta que es

para -1.65, es decir 1065

1.65 1065 23.08 1.65 1026.9323.08

cc

−= − ⇔ = − ⋅ =

Como en nuestra muestra el número de hembras es 1023 menor que el valor crítico c = 1027, rechazamos la hipótesis H0 : p = 0.5

Ejemplo

De la población de alumnos de un IES se extrae una muestra de 12 alumnos y se les mide la estatura, resultado las mediciones siguientes:

170 168 174 165 169 174 183 176 168 175 172 170

De la población completa de estudiantes sabemos que tiene media µ = 171.25 y desviación típica σ = 8.3.

¿Podemos afirmar que esta muestra procede realmente de este Instituto?

Solución

1) Llamamos hipótesis nula H0 a la afirmación de esta hipótesis, es decir afirmar que efectivamente, esta muestra pertenece a este IES, por lo que la hipótesis contraria H1 será no pertenecer al IES. Escrito en forma matemática diríamos H0 : µ0 = µ = 171.25 H1 : µ0 ≠ µ = 171.25 2) Las estaturas son clásicas distribuciones normales. En el caso de la población es una

N(171.25,8.3) y en el caso de la muestra una 8.3

171.25,12

N

3) El nivel de confianza lo establecemos nosotros mismos en un 95%. 4) Ahora elegimos un estadístico. Sabemos que el mejor estimador de la media

poblacional µ es la media muestral X , que sabemos que sigue una distribución

8.3171.25,

12N

Sabemos también que el IC para la media es 0 0.975 0 0.975

95%

,Z Zn n

σ σµ µ − ⋅ + ⋅

lo

que equivale a decir que 0 0.975 0 0.975 0.95P Z X Zn n

σ σµ µ − ⋅ ≤ ≤ + ⋅ =

, que en

nuestro caso es el intervalo


( )8.3 8.3171.25 1.96 ,171.25 1.96 166.55,175.94

12 12

− ⋅ + ⋅ =

, que constituye la zona de

aceptación. 5)

La muestra que hemos seleccionado de 12 alumnos tiene una media 172X = 6)

Cuando X pertenece al intervalo de confianza entonces está dentro de la región de aceptación, por lo tanto aceptamos la hipótesis nula H0, en caso contrario se rechaza. Como aquí

( )172 166.55,175.94X = ∈ podemos aceptar la hipótesis nula H0.

Nuestra región de aceptación es el intervalo (166.55,175.94) y la región crítica o zona de rechazo son las dos zonas laterales a este intervalo, es decir x/ x<167.37 ó x>176.65

En el ejemplo previo, podría haber ocurrido que hubiésemos tomado como muestra a 12 jugadores del equipo de baloncesto de este mismo instituto, de estaturas

180 178 184 175 179 184 195 188 180 187 184 182

cuya media muestral es 183, y como 183 no pertenece al intervalo (166.55,175.94) rechazaríamos la hipótesis nula H0, cuando realmente sí son estudiantes del instituto. Es decir, estaríamos rechazando una hipótesis verdadera.

Tipos de error

El error consistente en rechazar una hipótesis que es verdadera se denomina de tipo I. En lenguaje probabilístico esto ocurre con una probabilidad P[Test H0 Falsa/ H0 es Verdadera]=P[Rechazar H0 / H0 es Verdadera] = P[Aceptar H1 / H0] = α, siendo α el nivel de significación o el error máximo permitido del contraste

Si la situación fuese la contraria, es decir, si aceptamos como verdadera una hipótesis falsa, el error cometido se llama de tipo II, que equivale a P[Test H0 Verdadera / H0 es Falsa]=P[Aceptar H0 / H1 es Verdadera] = P[Aceptar H0 / H1] = β, donde β es el llamado nivel

de significación del error II


El contraste de hipótesis sigue la estrategia de que la aceptación o rechazo de hipótesis esté basado en un error de tipo I muy pequeño de tal manera que sea muy improbable rechazar una hipótesis cuando es cierta

Ejemplo

Un ejemplo clásico que hay que mencionar aquí para distinguir la importancia de los errores tipo I o tipo II es el error tipo judicial que describimos a continuación. Tenemos un juicio sobre un ciudadano A con las siguientes hipótesis iniciales:

H0 : A es inocente o bien A es no culpable; H1 : A es culpable o bien, A no es inocente

Cuando no existen pruebas suficientes de culpabilidad se suele aceptar H0, pero siempre se pueden cometer errores tales como Condenar a A cuando es inocente, es decir rechazar H0 siendo cierta. Error tipo I Absolver a A cuando es culpable, es decir aceptar H0 siendo falsa. Error tipo II. El primer error, desde el punto de vista moral, es terriblemente grave, por lo que toda la estrategia judicial debe orientarse a minimizar esta posibilidad, lo que en términos estadísticos sería establecer un nivel de significación suficientemente alto para que la probabilidad de equivocarnos sea lo más pequeña posible.

Función de potencia

Si denominamos β al nivel de significación del error tipo II, resulta muy importante saber cuál es la probabilidad (1 – β) de aceptar la hipótesis alternativa H1 cuando ésta es cierta. Dado un nivel de significación α decimos que un contraste de hipótesis es más potente cuanto más probable sea aceptar la hipótesis alternativa H1 en el caso de que sea cierta.

La hipótesis alternativa no tiene por qué tomar un único valor H1 , de hecho en general es compuesta del tipo H1 (θ < θ0) ó H1 (θ ≠ θ0). Es decir, que β es una función de θ, β(θ) que puede tomar una colección de valores.

Resulta muy útil considerar la siguiente tabla:

Decisión Test H0

Aceptar H0

Decisión Test H1

Rechazar H0

H0 Verdadera Acierto Tipo I

(1 - α)

Error Tipo I

Nivel significación α

H0 Falsa = H1 Verdadera Error Tipo II

β

Acierto Tipo II

Potencia (1 – β)

Ejemplo

Tenemos una población normal en la que se está estudiando el peso de sus miembros y conocemos la desviación σ = 4 Kg. Queremos trabajar con un nivel de significancia 0.05 y tenemos las hipótesis:

WikiMaths | CONTRASTES DE HIPÓTESIS MÁS COMUNES 11

H0 : (µ = 75) H1 : (µ = 80)

Si tenemos una muestra de 40 individuos de la que hemos obtenido una 78X = Kg se pide contrastar las hipótesis dadas.

Solución

Pdte

CONTRASTES DE HIPÓTESIS MÁS COMUNES

Contraste de hipótesis para la proporción

Se tiene una población de la que queremos contrastar una hipótesis sobre una determinada proporción de la misma, por ejemplo el número de habitantes con ojos azules, o farmacéuticos, o más altos de 1.90, etc.

Tomamos una muestra de tamaño n y observamos que f de esos n elementos verifican la

característica prefijada, es decir, con una proporción 0

fp

n= .

Hemos estudiado que un buen estimador de la proporción es precisamente f

pn= y que, para

muestras grandes ( n > 30 ) este estimador se distribuye según una ( )1

,p p

N pn

−

Las dos hipótesis nuestras son:

H0 : (p = p0) La proporción de la muestra es acorde con la proporción poblacional p

H1 : (p ≠ p0) La muestra no pertenece a la población estudiada

Para un nivel de significación α, el intervalo de confianza

( ) ( )1 1

2 2

1 1,

p p p pp Z p Z

n nα α− −

− − − +

constituirá la región de aceptación de la hipótesis

nula H0, con probabilidad 1 – α.

Ejemplo

Se lanza una moneda 50 veces al aire y resultan 31 caras ¿Está la moneda trucada? En este caso la proporción p = 0.5 mientras que nuestra muestra es p0 = 31/50 = 0.62.


Si establecemos el nivel de significación α = 0.05 tendremos que la región de aceptación es el intervalo

( )0.05

0.5 0.5 0.5 0.50.5 1.96 ,0.5 1.96 0.361,0.639

50 50α =

⋅ ⋅− − =

Nuestro valor p0 = 0.62 entra dentro de este intervalo por lo que aceptamos la hipótesis nula H0. Sin embargo, si hubiesen salido 32 caras, entonces p0 = 32/50 = 0.64 y habría que rechazarla.


Contraste de hipótesis para la varianza de una población normal

Pruebas de ajuste

Vamos a cambiar de registro. Hasta ahora siempre suponíamos que estábamos trabajando con poblaciones distribuidas mediante una normal N(µ,σ), lo cual efectivamente es muy habitual, pero puede ocurrir que nuestra pretensión sea saber si eso es cierto, es decir si un determinado experimento aleatoria se distribuye con una distribución de probabilidad F(x) o no.

Para construir este modelo, supongamos que obtenemos una muestra a la que corresponde una distribución de frecuencias F*

(x) y deseamos compararla con la distribución F(x).

Lo que vamos a hacer es estudiar la diferencia de ambas distribuciones F(x) – F*(x). Si esta

diferencia no es significativa aceptaremos la hipótesis nula H0 de que ambas distribuciones coinciden.

Introducimos pues una nueva v.a. F(x) – F*(x) y vamos a estudiar su distribución de

probabilidad en el caso que H0 sea verdadera. Cuando conozcamos esta distribución estableceremos un valor crítico c de tal manera que si la diferencia F(x) – F*

(x) es menor que c aceptamos la hipótesis.

Prueba χ2 de Pearson

Supongamos un espacio muestral Ω y un recubrimiento de k subconjuntos del mismo

1,..,i i kA

=(recuerda que recubrimiento implica que son todos incompatibles dos a dos

, ,i jA A i j=∅ ∀I y que 1

k

i

i

A=

=ΩU ).

Sea X una variable aleatoria ( )

X

A X A

Ω→

→

Tomamos una muestra de tamaño n mediante n observaciones de la v.a. X.

Denominamos fj a la frecuencia con que ocurre la clase Aj es decir que llamamos probabilidad

( )( )j j jp P A P X A= = ∈ con lo cual el valor esperado de que ocurra Aj es npj.

Consideramos el siguiente estadístico ( )2

1

kj j

j j

f npD

np=

−=∑ obtenido mediante las diferencias

entre la frecuencia observada y la esperanza teórica de las mismas.

Se demuestra que este estadístico sigue una χ2 de Pearson con k-1 grados de libertad y, en la práctica, su funcionamiento es eficiente cuando npj ≥ 5


Ejemplo

En uno de los resultados de los experimentos de Mendel, éste cruzó guisantes verdes con guisantes amarillos obteniendo una proporción de 25% guisantes verdes y 75% guisantes amarillos. Si realizamos nosotros nuestro experimento con 1000 guisantes, y obtenemos 275 guisantes verdes, ¿está nuestro experimento de acuerdo con la hipótesis de Mendel?

Para comprobarlo, construimos nuestra v.a. dicotómica

0 Guisante amarillo( )

1 Guisante verde

X

A X A

Ω→

→ =

donde P[X = 0] = 0.75 y P[X =1] = 0.25 . El numero de guisantes obtenidos en una muestra sigue una binomial B(n,p) y las tablas de probabilidad compradas con las frecuencias obtenidas en la muestra son:

i=1: Guisantes

verdes

i=2: Guisantes

amarillos

Teórico

n·pi

n·p1 =1000·0.25=250 n·p2 =1000·0.75=750

Muestra fi f1 = 275 f2 = 725

(fi -n·pi)2 625 625

( )2j j

j

f np

np

−

2.5 0.83

De donde ( )2

1

3.33k

j j

j j

f npD

np=

−= =∑

Esta v.a. sigue una χ2 de Pearson con 2-1=1 grados de libertad por lo que, considerando el nivel de confianza en α = 0.95 y consultando la tabla de la χ2 resulta un valor crítico c = 3.84 Como nuestro valor 3.33 < 3.84 podemos aceptar la hipótesis H0

Ejemplo 2

Se le ofrece a un estadístico una muestra de los pesos de 20 personas (el estadístico no sabe que se trata de 20 pacientes de un doctor que se encuentran en tratamiento por anorexia) y se le pide que nos diga, con un nivel de significación α = 0.05, si esta muestra pertenece a una población distribuída por una normal N(µ,σ).

La muestra es:

37 41 40 39 36 38 37 36 43 43 36 36 43 36 37 39 40 41 39 43

El estadístico calcula la media muestral y resulta 39X = Construimos una tabla de frecuencias tomando 5 intervalos: Intervalo xi fi pi n·pi (fi - n·pi )

2 (fi-n·pi)

2/n·pi

35-36 35,5 4 0,058 1,163 8,051 6,924


37-38 37,5 5 0,136 2,715 5,220 1,922

39-40 39,5 5 0,161 3,217 3,178 0,988

41-42 41,5 3 0,097 1,934 1,136 0,587

43-44 43,5 3 0,029 0,590 5,809 9,848

20

( )25

1

j j

j j

f npD

np=

−=∑ =20,270

Al ser 5 los intervalos el estadístico D tiende a una χ2 de Pearson con 5-1=4 grados de libertad, que a un nivel de significación de 0.05 consultamos en la tabla y obtenemos un valor crítico de 9.49 Como el estadístico D nos da 20.27 que es ostensiblemente mayor que el valor crítico 9.49, rechazamos la hipótesis de normalidad Sin embargo, observa que si desglosamos más y tomamos cada valor individualmente, como hay 8 valores distintos, los cálculos salen de esta manera: xi fi pi n·pi (fi - n·pi )

2 (fi-n·pi)

2/n·pi

36 4 0,077 1,532 6,093 3,978

37 3 0,117 2,341 0,435 0,186

38 2 0,151 3,019 1,038 0,344

39 3 0,164 3,286 0,082 0,025

40 2 0,151 3,019 1,038 0,344

41 3 0,117 2,341 0,435 0,186

42 0 0,077 1,532 2,346 1,532

43 3 0,042 0,846 4,640 5,486

36 4 0,077 1,532 6,093 3,978

37 3 0,117 2,341 0,435 0,186

20

( )28

1

j j

j j

f npD

np=

−=∑ =12,079

Y ahora la χ2 de Pearson tiene 8-1=7 grados de libertad, que a un nivel de significación de 0.05 consultamos en la tabla y obtenemos un valor crítico de 14.1 y en este casi, si se aceptaría la hipótesis por ser el valor de D=12.08 menor que el valor crítico.

No obstante, todos los cálculos previos no son correctos pues con una muestra de n = 20 no debemos aproximar la binomial por la normal (es aconsejable hacerlo a partir de


n > 30). Pero aparte de esto, el ejemplo es suficientemente didáctico para entender los procesos que debemos realizar.

Prueba de ajuste de Kolmogorov-Smirnov (K-S)

Esta es una prueba no paramétrica que se utiliza exclusivamente para distribuciones contínuas y calcula la distancia máxima entre una prueba teórica y otra empírica. Al igual que la prueba Prueba χ2 de Pearson sirve para comprobar la bondad del ajuste entre ellas.

Para realizar esta prueba se toma una muestra de tamaño n y se ordena de menor a mayor :

1 2 ... nx x x≤ ≤ ≤

Consideramos ahora la función de distribución de la muestra

*

1

*j 1

n

0 si x<x

( ) si x

1 si x>x

F

j

kx F x x x

n+

→

→ = ≤ ≤

Se define la hipótesis a contrastar H0 : F y F* son la misma distribución

Se define el estadístico ( ) ( )*maxD F x F x= − que está disponible tabulado

Para cada punto xk se calcula ( ) ( ) ( ) ( ) ( ) 1max ,k n k k n k kD x F x F x F x F x−= − −

Ayudándonos con las tablas y fijado un nivel de significación α, se determina el punto crítico c tal que

[ ] 1P D c α≤ = −

Si D ≤ c se rechaza la hipótesis nula H0

Ejemplo

Libro [67], página 132


Contraste de hipótesis para la diferencia de medias

Vimos que el intervalo de confianza para la diferencia de medias es

( ) ( )2 2 2 21 2 1 2

1 2 1 21 1

1 2 1 22 2

,X X Z X X Zn n n n

α α

α

σ σ σ σ

− −

− − + − + +

por tanto, este intervalo nos

permite contrastar si cuando una diferencia de medias µ1- µ2

pertenece o no a este intervalo se pueda aceptar o rechazar la hipótesis H0

Ejemplo

En el ejemplo previo de intervalos de confianza para la diferencia de muestras, habíamos calculado el intervalo de confianza para dos grupos de estudiantes de un instituto procedentes de familias con diferentes niveles económicos para intentar obtener alguna conclusión a ver si el rendimiento escolar pudiese estar relacionado con el nivel económico. Las hipótesis aquí son: H0 : Nivel económico no relacionado con rendimiento escolar H1 : Nivel económico si relacionado con rendimiento escolar El resultado del intervalod e confianza al 95% fue:

( )2 2 2 2

0.975 0.975 95

95

600 700 600 700400 ,400 80,712

40 30 40 30Z Z

− + + + =

Como el hecho de que no estén relacionados equivale a µ1- µ2 = 0 y el 0 no está incluido en el intervalo de confianza (80, 712) cabe concluir que hay algún tipo significativo de diferencias entre ambos grupos.

Ejercicio

En una muestra A de n1 = 7 enfermos se obtuvieron los siguientes tiempos de sueño 7, 5, 8, 5, 6, 7 y 8 horas. Se toma otro grupo B con n2 = 5 y se les aplica un tratamiento que ayuda a dormir y se obtienen los tiempos 9, 8.5, 9.5, 10, 8 horas. Suponiendo que la v.a. “tiempo de sueño” sigue una distribución normal N(µ,σ) calcula el IC al 95% y comprueba si el tratamiento es efectivo. Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución

Los cálculos previos son Media muestral CuasiVarianza muestral Grupo A 1 6.57X = 2

21 1.62nS − =

Grupo B 2 9X = 221 0.625nS − =

Se establece la hipótesis nula como H0 : El tratamiento es efectivo ( )2 1 0µ µ− >


Estamos en el caso de querer estimar la diferencia de medias en el caso que no conocemos la varianzas poblacionales. Sabemos que en este caso se tiene que

( ) ( )1 2

2 1 2 1

22 21 1 2 2

1 2 1 2

X X

1 1

2

n ntn S n S

n n n n

µ µ

+ −

− − −→

++

+ −

Y que el IC que se obtiene es

( ) ( )1 2 1 2

2 1 2 12 2

1 2 1 2

1 1 1 1,n n p n n pX X t S X X t S

n n n nα

+ − + −

− − + − + +

donde

2 22 1 1 2 2

1 2 2p

n S n SS

n n

+=+ −

por lo que resulta:

7 1.62 5 0.6251.2024

7 5 2pS⋅ + ⋅

= =+ −

, y la t-

Student con (7+5-2) = 10 grados de libertad al 95%, obtenida en la tabla, es

1 2 2 1.81n nt + − = , por lo que el IC resulta:

( ) ( ) ( )95%

1 1 1 19 6.57 1.81 1.2024 , 9 6.57 1.81 1.2024 1.15,3.70

7 5 7 5

− − ⋅ ⋅ + − + ⋅ ⋅ + =

La media, al estar incluída en este intervalo con un 95% de probabilidad es positiva por lo que aceptamos la hipótesis nula H0

Ejercicio

En un experimento se ha extraído una muestra de n = 1000 para establecer un patrón de lecturas normales N(µ,σ) de calcio (mg/ml sangre). Los resultados obtenidos fueron 9.5X = y una varianza 2 0.25nS = . Escribe el IC al 95% para la media

poblacional µ. Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución

( )1 195%1,1 1,1

2 2

, 9.469,9.531n n

n n

S SX t X t

n nα α

− −

− − − −

− ⋅ + ⋅ =

Ejercicio

El ara-a es una substancia orgánica que actúa de agente antivírico. Para probar su eficacia en el tratamiento de la encefalitis por virus de herpes se administró ara-a a 100 pacientes afectados de los cuales murieron 28. Construir un IC al 95% de la proporción de fallecidos En estos pacientes la mortalidad natural es del 80%. Evaluar la eficacia de este tratamiento Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución (0.532, 0.668)


Ejercicio

Dos atletas A y B van a recorrer la misma distancia de 20 Km en terreno llano . El atleta A hizo 29 pruebas con un tiempo medio 90AX = min con una 6Aσ = min y

B hizo 35 pruebas con una media de 80BX = y 8Bσ = . Decide con un IC al 95% si B es mejor que A. Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución (6.57,13.43)

Ejercicio

Se lleva a cabo un estudio para investigar la capacidad de los monocitos en destruir células halladas en pacientes con cirrosis hepática, para conocer si la destrucción es mayor en estos últimos que en personas no cirróticas. Los resultados vienen dados por la siguiente tabla Tamaño Media Desviacion

Grupo 1: Cirróticos n1 =16 1 44.2X = 1 6.17σ =

Grupo 2: No cirróticos n2 =9 2 28.22X = 2 4.11σ =

Hallar un intervalo de confianza al 95% que nos permita decidir si es o no mayor dicha destrucción Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución

En este ejercicio se trata de hacer un IC al 95% sobre la diferencia de medias µ1- µ2 y comprobar si estas pueden ser iguales Como son conocidas las varianzas dicho intervalo viene dado por

( ) ( )1 2 1 2

2 21 2

1 2

X X(0,1)N

n n

µ µ

σ σ

− − −→

+

De donde queda el IC: ( ) ( )2 2 2 21 2 1 2

1 2 1 21 1

1 2 1 22 2 95%

X X , X XZ Zn n n n

α α

σ σ σ σ

− −

− − ⋅ + − − ⋅ +

de donde:

( ) ( ) ( )2 2 2 2

0.975 0.975 95%

95%

6.17 4.11 6.17 4.1144.22 26.22 , 44.22 26.22 11.96,20.04

16 7 16 7Z Z

− − ⋅ + − + ⋅ + =


Si las medias fuesen iguales µ1= µ2 su diferencia sería µ1- µ2 = 0 y vemos que 0 no pertenece a este intervalo, luego cabe concluir que, efectivamente, la destrucción es mayor en pacientes cirróticos.

Ejercicio

Se sabe que el nivel de colesterol medio de la población española es µ = 200 y su distribución sigue una N(200, σ = 16), sin embargo, se piensa que en una determinada zona el nivel es significativamente más alto y para confirmarlo o no se toma una muestra de tamaño n = 25 y resulta una media muestral 210X = ¿Podemos afirmar con un nivel de significación (o error máximo) del 5% y con estos datos que la población de esta zona tiene el índice de colesterol significativamente más alto? Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución

16200,

25X N

y el IC al 95% es

( )0.975 0.975

95%

16 16200 , 200 193.72, 206.27

25 25Z Z

− + =

Como 210 cae fuera de este intervalo, podemos afirmar que en esta zona si tienen un colesterol más alto. Pero esta conclusión en estadística se le da la forma de un test de hipótesis de la siguiente manera: Queremos saber si la media µZ de esta zona Z de España tiene, o no, una media igual a la población global española de 200, es decir

Hipótesis nula H0 : µZ = 200

Hipótesis alternativa H1 : µZ ≠ 200 Como µZ no pertenece al intervalo IC al 95% hallado rechazamos la hipótesis nula H0 y aceptamos la alternativa H1 , es decir µZ > 200 (es un test unilateral derecho)

Ejercicio

En una población de mujeres entre 45 y 54 años se ha extraído una muestra de n = 5000 mujeres con el fin de determinar con gran precisión la prevalencia de melanoma maligno. Se ha observado que 28 mujeres de la muestra presentaban esta enfermedad. Escribir el IC al 95% y el IC al 99% para la prevalencia de mujeres con melanoma. Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución

Sabemos que la proporción se verifica que $

( )p

(0,1)1

pN

p p

n

−→

−por lo que el

intervalo es


( )0.975 0.975

95%

28 28 28 281 1

28 285000 5000 5000 5000, 0.00353,0.00767

5000 5000 5000 5000Z Z

− − − + =

Es decir que la prevalencia del melanoma en mujeres de 45 a 54 años está entre el 3.53 por mil y el 7.67 por mil con un nivel de confianza del 5% El mismo intervalo pero al 99% resultaría:

( )0.995 0.995

99%

28 28 28 281 1

28 285000 5000 5000 5000, 0.00288,0.00831

5000 5000 5000 5000Z Z

− − − + =

Ejercicio

En un hospital se opera a una serie de enfermos y, tras la operación, se quiere estudiar el efecto de un analgésico. A unos enfermos se le aplica el analgésico y a otros no y lo que se mide es el tiempo en el que el paciente deja de tener dolor, (v.a. X que supondremos normal) resultando la siguiente tabla 1 2 3 4 5 6 7 Tamaño Media

Muestral

Varianza

Muestral

Grupo 1: 7 5 8 5 6 7 8 n1 = 7 1 6.57X = 21 1.38nS =

Grupo 2: 9 8.5 9.5 10 8 n2 = 5 2 9X = 22 0.5nS =

Construir el IC al 95% para la diferencia de medias para estimar si el tratamiento es o no es efectivo. Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución

Nos encontramos en el caso de varianzas desconocidas y n pequeño, por lo que se usa

( ) ( )1 2

2 1 2 1

22 21 1 2 2

1 2

X X

2

n ntn S n S

n n

µ µ

+ −

− − −→

++ −

; con t0.975 = 2.23 y el intervalo de confianza que

resulta viene dado por


( ) ( )1 2 1 2

2 2 2 21 1 2 2 1 1 2 2

2 1 2 12 21 2 1 2 1 2 1 2

95%

10 10

1 1 1 1X X , X X ...

2 2

1 1 7 1.38 5 0.5 1 1 7 1.38 5 0.5... (9 6.57) , (9 6.57) ...

7 5 10 7 5 10

... 1.43 2.63 0.567,1.43 2.

n n n n

n S n S n S n St t

n n n n n n n n

t t

+ − + −

+ +− − + − + + =

+ − + −

⋅ + ⋅ ⋅ + ⋅= − − + − − + = = − ⋅ +( ) ( )95%63 0.567 0.94,3.92⋅ =

Como este intervalo no contiene al cero podemos afirmar que SI es efectivo

Ejercicio

Se quiere saber si dos Laboratorios de Análisis que están midiendo el grado de dureza del agua lo hacen de forma homogénea (Suponemos que este grado de dureza sigue una N(µ,σ)). Para ello se les envían las mismas muestras de agua a ambos resultando los siguientes mediciones

1 2 3 4 5 6 7 8 9 10 Tamaño Media

Muestral

CuasiVarianza

Muestral

Lab A 0.46 0.62 0.37 0.40 0.44 0.58 0.48 0.53 n1 = 8 1 0.485X = 211 0.0074nS − =

Lab B 0.82 0.61 0.89 0.51 0.33 0.48 0.23 0.25 0.67 0.88 n2 = 10 2 0.567X = 212 0.0622nS − =

Decidir con un IC al 90% si los dos analistas realizan mediciones análogas Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución

Es el mismo caso del ejercicio anterior donde hay que construir un IC para la diferencia de medias donde las muestras son pequeñas y las varianzas desconocidas. La t-Student con 16 grados de libertad y una significancia del 10% equivale a con t0.95 = 1.75 por lo que:

( ) ( )1 2 1 2

2 2 2 21 1 2 2 1 1 2 2

2 1 2 12 21 2 1 2 1 2 1 2

90%

16 16

1 1 1 1X X , X X ...

2 2

1 1 7 0.0074 9 0.062 1 1 7 0.0074 9 0.062... 0.082 ,0.082 ...

8 10 16 8 10 16

... 0.082 1.75 0.09,0.0

n n n n

n S n S n S n St t

n n n n n n n n

t t

+ − + −

+ +− − + − + + =

+ − + −

⋅ + ⋅ ⋅ + ⋅= − + + + = = − ⋅( ) ( )90%82 1.75 0.09 0.07,0.24− ⋅ = −

Revisar los calculos porque no coinciden Excel con apuntes Como el 0 está incluído en este intervalo podemos afirmar que ambos laboratorios hacen pruebas análogas.


Ejercicio

Un laboratorio farmacéutico afirma que un antibiótico tiene una efectividad de 12 horas. Sin embargo, el clínico observa que, con sus pacientes, esto no ocurre. Para confirmarlo o refutarlo, toma una muestra de n = 40 pacientes y les mide a cada uno el tiempo de efectividad resultando un promedio de 10.5X = horas. (Suponemos que la v.a. duración de la efectividad es una N(µ,σ=2) ¿Cumple el antibiótico la garantía? Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal

Solución

Tenemos dos hipótesis H0 : El laboratorio tiene razón , luego la media de las muestras debe ser µ = 12 H1: El laboratorio se equivoca µ ≠ 12 Buscamos un estadístico adecuado para este test y elegimos estimar la media con un nivel de confianza del 95%. Al usar este estadístico el contraste es bilateral. Sabemos que el mejor estimador de la media es la media muestral que para n = 40 (n

> 30) y σ conocida se tiene que X

(0,1)/

Nn

µ

σ

−→ por lo que el IC al 95% resulta ser:

( )0.975 0.975 95%95%

2 212 ,12 11.38,12.62

40 40Z Z

− + =

Nuestra media 10.5 queda fuera del intervalo pro lo que rechazo la hipótesis nula H0

Ejercicio

Se sabe que para la población de recién nacidos la media poblacional de nivel de colesterol es µ0 = 175 y sigue una distribución N(175, σ=50). Queremos contrastar este dato con la media de recién nacidos de una determinada área geográfica porque sospechamos que se supera ese valor. Elegimos una muestra de recién nacidos en nuestra área de estudio y se obtuvo para

ella una media 200X = y un Z0 = 1.58 0

X1.58 (0,1)

/Z N

n

µ

σ

−= =

¿Qué tipo de test de hipótesis usarías para contrastar esta teoría? A la vista de Z0 ¿El test ha sido significativo? Fuente Bioestadística Medicina USC. Aptes Elba Pérez Vidal Solución Nuestra hipótesis nula es

H0 : µ > 175 H1 : µ ≤ 175

Estamos ante un test unilateral derecho (la zona de rechazo es solo la cola derecha de la normal)


No conocemos el tamaño de la muestra n, pero sabemos que

0

X 1.58 501.58 3.16 10

200 175/Z n n

n

µ

σ

− ⋅= = ⇒ = = ⇒ =

−

La media poblacional se estima mediante el estadísticoX

(0,1)/

Nn

µ

σ

− y el IC al 95%

es:

( )0.975 0.975 95%95%

50 50175 ,175 144, 206

10 10Z Z

− + =

, con lo que una media de

200X = está contenida no confirma nuestra hipótesis nula, por lo que con los datos

que tenemos, debemos rechazarla y aceptar la alternativa H1 : µ ≤ 175 Esta mal ¡¡¡revisarlo!!!

Gil, J.; García, E. y Rodríguez, G. (1995). Estadística Básica Aplicada a las Ciencias de la Educación. Sevilla: Kronos.

Ω ℕℤℚℝℂℙℐΩ⇐⇒⇔∊∉∈∅⇾≈≔≤≥ ξ∞

·∩∪∼∿⊂⊃⊆⊇⊄⋂⋃⊅∧∨Ω∀ℝ ξ s N(μ = 80, σ = 10)

inferencia estadistica. test de hipotesis

Documents