exposicion estadistica

43
Distribuciones Muestrales y Teorema del Límite Central Erika Valeria Rivera Jimenez Julian Felipe Tiria Bulla. Universidad Distrital 7 de septiembre de 2014

Upload: erikas3515

Post on 18-Jan-2016

274 views

Category:

Documents


17 download

TRANSCRIPT

Distribuciones Muestrales y Teorema del LímiteCentral

Erika Valeria Rivera Jimenez Julian Felipe Tiria Bulla.

Universidad Distrital

7 de septiembre de 2014

Ejemplo

DefiniciónUn estadístico es una función de las variables aleatorias observables en unamuestra y de constantes conocidas.

ExampleUn dado sin cargar se lanza tres veces. Sean Y1,Y2 y Y3 el número depuntos vistos en la cara superior para los tiros 1, 2 y 3, respectivamente.Suponga que estamos interesados en Y = (y1+y2+y3)

3 ,el número promediode puntos vistos en una muestra de tamaño 3. ¿Cuáles son la media µY yla desviación estándar σY , de Y ? ¿Cómo podemos determinar ladistribución muestral de Y ?

SoluciónSe tiene que µ = E (Yi ) = 3,5 y σ2 = V (Yi ) = 2,9167 Entonces E (Y ) =

µ = 3,5 V (Y )σ2

3 = 2,91673 = 0,9722 σY =

√0,97220,9860 Los posibles

valores de la variable aleatoria W = Y1 + Y2 + Y3 son 3, 4, 5, ..., 18 yY = W /3 como el dado esta equilibrado, es decir, no cargado, cada unode los 63 = 216 valores distintos de la variable aleatoria multivariante(Y1,Y2,Y3) son igualmente probables y

P(Y1 = y1,Y2 = y2,Y3 = y3) = p(y1, y2, y3) = 1/216,

Y1 = 1, 2, ..., 6 i = 1, 2, 3.

Por tanto

P(Y = 1) = P(W = 3) = p(1, 1, 1) = 1/216

P(Y = 4/3) = P(W = 4) = p(1, 1, 2) + p(1, 2, 1) + p(2, 1, 1) = 3/216

P(Y = 5/3) = P(W = 5) = p(1, 1, 3) + p(1, 3, 1) + p(3, 1, 1) + p(1, 2, 2)

+p(2, 1, 2) + p(2, 2, 1) = 6/216.

Las probabilidades P(Y = i/3), i = 7, 8, ..., 18 se obtienen igual

Distribución de muestreo simulado para el ejemplo 7.1

Distribuciones muestrales relacionadas con la distribuciónnormal

TeoremaSean Y1,Y2, ...,Yn una muestra aleatoria de tamaño n de una distribuciónnormal con media µ y varianza σ2. Entonces

Y =1n

n∑i=1

Yi

está distribuida normalmente con media µY = µ y varianza σ2Y = σ2/n.

DemostraciónComo Y1,Y2, ...,Yn es una muestra aleatoria de una distribución normalcon media µ y varianza σ2, Yi , i = 1, 2, ..., n son variables independientesdistribuidas normalmente, con E (Yi ) = µ y V (Yi ) = σ2. Además

Y =1n

n∑i=1

Yi =1n (Y1) +

1n (Y2) + ...+

1n (Yn)

= a1Y1 + a2Y2 + ...+ anYn donde ai =1n ; i = 1, 2, ..., n

Así Y es una combinación lineal de y1,Y2, ...,Yn de donde podemos con-cluir que Y y se puede aplicar el Teorema 6.3

Demostraciónpara concluir que Y está distribuida normalmente con

E (Y ) = E[1n (Y1) +

1n (Y2) + ...+

1n (Yn)

]=

1n (µ)+

1n (µ)+...+

1n (µ) = µ

y

V (Y ) = V[1n (Y1) +

1n (Y2) + ...+

1n (Yn)

]=

1n2 (σ2)+

1n2 (σ2)+...+

1n2 (σ2) =f racσ2n

Esto es, la distribución muestral de Y es normal con media µY = µ yvarianza σ2

Y = σ2

n

ExampleUna máquina embotelladora puede ser regulada para que descargue unpromedio de µ onzas por botella. Se ha observado que la cantidad delíquido dosifi cado por la máquina está distribuida normalmente conσ = 1,0 onza. Una muestra de n = 9 botellas se seleccionaaleatoriamente de la producción de la máquina en un día determinado(todas embotelladas con el mismo ajuste de la máquina) y las onzas decontenido líquido se miden para cada una.Determine la probabilidad de que la media muestral se encuentre a nomás de .3 onza de la verdadera media µ para el ajuste seleccionado de lamáquina.

SoluciónSi Y1,Y2, ...,Y9 denota el contenido en onzas de las botellas que se vana observar, entonces sabemos que las Yi están distribuidas normalmentecon mediabµ y varianza σ2 = 1 para i = 1, 2, ..., 9. Por tanto, por elTeorema 7.1, Y posee una distribución muestral normal con media µT = µ

y varianza σ2Y = σ2

n = 19 . Deseamos hallar

P(|Y − µ| ≤ 0,3) = P(−0,3 ≤ (Y − µ) ≤ 0,3)

= P(−0,3σ/√

n≤ Y − µσ/√

n≤ 0,3σ/√

n

)Como (Y − µ)/σY = (Y − µ)/(σ/

√n) tiene una distribución normal

estándar, se deduce que

P(|Y − µ| ≤ 0,3) = P(−0,31/√9≤ Z ≤ 0,3

1/√9

)

SoluciónUsando la tabla 4 encontramos

P(−0,9 ≤ Z ≤ 0,9) = 1− 2P(Z > 0,9) = 1− 2(0,1841) = 0,6318

Por consiguiente, la probabilidad es sólo .6318 de que la media muestralse encuentre a no más de .3 onza de la verdadera media poblacional.

Ejemplo

ExampleConsulte el Ejemplo 7.2. ¿Cuántas observaciones deben estar incluidas enla muestra si deseamos que Y se encuentre a no más de .3 onza de µ conprobabilidad de .95?

SoluciónAhora buscamos

P(∣∣Y ≤ ,3∣∣) = P

[−,3 ≤ (Y − µ) ≤ ,3

]= 0,95

Si dividimos cada termino de la desigualdad entre σY = σ/√

n (recuerdeque σ = 1),tenemos

P[−,3σ/√

n≤(

Y − µσ/√

n≤ ,3σ/√

n

)]= P(−,3

√n ≤ Z ≤ ,3

√n) = ,95

Pero con el uso de la Tabla 4, Apendice 3, obtenemos

P(−1,96 ≤ Z ≤ 1,96) = ,95

SoluciónEsto nos dice que

,3√

n = 1,96

o bien, lo que es equivalente, n = ( 1,96,3 )2 = 42,68

Desde una perspectiva practica, es imposible tomar una muestra de tamaño42,68. Nuestra solucion indica que una muestra de tamaño 42 no es sufi-cientemente grande para llegar a nuestro objetivo. Si n = 43,P(

∣∣Y − µ∣∣ ≤,3) es ligeramente mayor que ,95

Teorema 7.2

TeoremaSi Y1,Y2, ...Yn, está definida como en el Teorema 7.1 entonces Zi = Yi−µ

σson variables aleatorias normales estándar e independientes, i = 1, 2, ..., ny

n∑i=1

Z 2i =

n∑i=1

(Yi − µσ

)2

tienen una distribución χ2 con n grados de libertad.

DemostraciónComo Y1,Y2, ...Yn es una muestra aleatoria de una distribución normal conmedia µ y varianza σ2, Zi = Yi−µ

σ tiene una distribución normal estándarpara i = 1, 2, ..., n. Además, las variables aleatorias Zi son independientesporque las Yi de las variables aleatorias son independientes, i = 1, 2, ..., nEl hecho de que

∑ni=1 Z 2

i tiene una distribución χ2 con n grados de libertadse deduce directamente del Teorema 6.4.

Ejemplo

ExampleSi Z1,Z2, ...,Z6 denota una muestra aleatoria proveniente de ladistribución normal estándar, encuentre un número b tal que

P( 6∑

i=1Z 2

i ≤ b)

= 0,95

Solución

Por el Teorema 7.2,∑6

i=1 Z 2i tiene una distribución χ2 con 6 grados de

libertad. Si vemos la Tabla 6, Apéndice 3, en la fi la con encabezado 6 gly la columna con encabezado χ2

0,5 vemos el número 12.5916. Por tanto,

P( 6∑

i=1Z 2

i

)> 12,5916 = 0,05

o bien, lo que es equivalente

P( 6∑

i=1Z 2

i

)≤ 12,5916 = 0,95

y b = 12,5916 es el cuantil 0,95 (95o. percentil) de la suma de los cua-drados de seis variables aleatorias normales estándar e independientes.

Teorema 7.3

Teoremasea Y1,Y2, ...,Yn una muestra aleatoria de una distribución normal conmedia µ y varianza σ2 entonces

(n − 1)S2

σ2 =1σ2

n∑i=1

(Yi − Y )2

tiene una distribución χ2 con (n - 1) grados de libertad. También, Y y S2

son variables aleatorias independientes

DemostraciónConsideramos para el caso n = 2 y demostraremos que (n−1)S2/σ2 tieneuna distribucion X 2 con 1 grado de libertad. En el caso de n=2,

Y = (1/2)(Y1 + y2),

y por tanto,

S2 =1

2− 1

2∑i=1

(Yi − Y )2

=

[Y1 −

12 (Y1 + Y2)

]2+

[Y2 −

12 (Y1 + Y2)

]2

=

[12 (Y1 − Y2)

]2+

[12 (Y2 − Y1)

]2

= 2[12 (Y1 − Y2)

]2=

(Y1 − Y2)2

2

DemostraciónSe deduce que, cuando n=2,

(n − 1)S2

σ2 =(Y1 − Y2)2

2σ2 =

(Y1 − Y2√

2σ2

)2

Demostraremos que esta cantidad es igual al cuadrado de una variablealeatoria normal estandar; es decir, se trata de una variable Z 2 que, comoya hemos demostrado en el ejemplo 6.11, posee una distribucion X 2 con 1grado de libertad. Como Y1−Y2 es una combinacion de variables aleatoriasindependientes distribuidas normalmente (Y1−Y2 = a1Y1 +a2Y2 con a1 =1 y a2 = −1),El teorema 6.3 nos dice que Y1 − Y2 tiene una distribucionnormal con media 1µ − 1µ = 0 y varianza (1)2σ2 + (−1)2σ2 = 2σ2. Portanto,

Z =Y1 − Y2√

2σ2

Tiene una distribucion normal estandar. Como para n = 2

(n − 1)S2

σ2 =

(Y1 − Y2√

2σ2

)2= Z 2

Demostraciónse deduce que (n − 1)S2/σ2 tiene una distribucion X 2 con 1 grado delibertad. En el ejemplo 6.13 demostramos que U1 = (Y1 + Y2)/σ y U2 =(Y1 − Y2)/σ son variables aleatorias independientes. Observe que, debidoa que n=2,

Y =Y1 + Y2

2 =σU12

y

S2 =(Y1 − Y2)2

2 =(σU2)2

2Como Y solo es una funcion de U1 y S2 es una funcion de U2, la indepen-dencia de U1 y U2 implica la independencia de Y y S2.

Ejemplo 7.5ExampleEn el ejemplo 7.2, se supone que las onzas de liquido que viere lamaquina embotelladora tienen una distribucion normal con σ2 = 1.Suponga que planeamos seleccionar una muestra aleatoria de diezbotellas y medir la cantidad de liquido en cada una. Si estas diezobservaciones se usan para calcular S2, podria ser util especificar unintervalo de valores que incluiran S2 con una probabilidad alta. Encuentrenumeros b1, b2 tales que

P(b1 ≤ S2 ≤ b2) = ,90

SoluciónObserve queP(b1 ≤ S2 ≤ b2) =

[(n−1)b1σ2 ≤ (n−1)S2

σ2 ≤ (n−1)b2σ2

]Debido a que σ2 = 1, se deduce que (n− 1)S2/σ2 = (n− 1)S2 tiene unadistribucion X 2 con (n − 1) grados de libertad. Por tanto, podemos usarla tabla 6, Apendice 3, para hallar dos numeros a1, a2 tales que

Solución

P[a1 ≤ (n − 1)S2 ≤ a2] = ,90

Un metodo para hacer esto es encontrar el valor de a2 que delimite un areade .05 en la cola superior y el valor de a1 que delimite .05 en la cola inferior( .95 en la cola superior). Como hay n− 1 = 9 grados de libertad, la tabla6 del apendice 3 indica que a2 = 16,919 y a1 = 3,325. En consecuencia,los valores para b1 y b2 que satisfacen nuestras condiciones estan dadospor

3,325 = a1 =(n − 1)b1

σ2 = 9b1..o..b1 =3,3259 = 0,369

y16,919 = a2 =

(n − 1)b2σ2 = 9b2..o..b2 =

16,9199 = 1,880

Por tanto, si deseamos tener un intervalo que incluya S2 con probabilidad.90, uno de estos intervalos es (0.369,1.880).Observe que este intervalo esbastante amplio.

Definicion 7.2Sea Z una variable aleatoria normal estandar y sea W una variable condistribucion X 2 con v grados de libertad. Entonces, si W y Z son indepen-dientes,

T =Z√W /v

se dice que tiene una distribucion t con v grados de libertad.

Ejemplo 7.6

La resistencia a la tension para un tipo de alambre esta distribuidanormalmente con media desconocida µ y varianza desconocida σ2. Seistrozos de alambre se seleccionan aleatoriamente de un rollo largo; Y1, laresistencia a la tension para el trozo i , se mide para i = 1, 2, ..., 6. Lamedia poblacional µ y la varianza σ2 pueden ser estimadas por Y y S2,respectivamente. Como σ2

Y = σ2/n, se deduce que σ2Y puede ser

estimada por S2/n. Encuentre la probabilidad aproximada de que Y estedentro de 2S/

√n de la verdadera media poblacional µ

SolucionDeseamos hallar

P[−2S√

n≤ (Y − µ) ≤ 2S√

n

]= P

[−2 ≤

√n(

Y − µS

)≤ 2]

= P(−2 ≤ T ≤ 2)

SolucionDonde T tiene una distribucion t con, en este caso n − 1 = 5 grados delibertad. Al observar la tabla 5, Apendice 3, vemos que el area de la colasuperior a la derecha de 2.015 es .05. En consecuencia.

P(−2,015 ≤ T ≤ 2,015) = ,90

Y la probabilidad de que Y este a no mas de 2 desviaciones estandar esti-madas de µ es ligeramente menor que .90. Observe que si σ2 se conociera,la probabilidad de que Y este a no mas de 2σY de µ estaria dada por

P[−2(σ√n

)≤ (Y − µ) ≤ 2

(σ√n

)]= P

[−2 ≤

√n(

Y − µσ

)≤ 2]

= P(−2 ≤ Z ≤ 2) = 0,9544

DefinicionSeam W1 y W2 variables aleatorias independientes con distribucion X 2,con V1,V2 grados de libertad, respectivamente. Entonces se dice que

F =W1/v1W2/v2

Tiene una distribucion F con v1 grados de libertad en el numerador y v2grados de libertad en el denominador.

Ejemplo 7.7

Si tomamos muestras independientes de tamaños n1 = 6 y n2 = 10 dedos poblaciones normales con la misma varianza poblacional, encuentre elnumero b tal que

p(

S21

S22≤ b)

= ,95

SolucionComo n1 = 6, n2 = 10 y las varianzas poblacionales son iguales, entonces.

S21/σ

21

S22/σ

22

=S2

1S2

2

Tiene una distribucion F con v1 = n1 − 1 = 5 grados de libertad en elnumerador y v2 = n2 − 1 = 9 grados de libertad en el denominador.Asimismo,

P(

S21

S22≤ b

)= 1− P

(S2

1S2

2� b

)

SolucionPor tanto, queremos determinar el numero b que delimita un area en elextremo superior de .05 bajo la funcion de densidad F con 5 grados delibertad en el numerador y 9 grados de libertad en el denominador. Segunlas tablas conocidas, se podra ver que el valor apropiado de b es 3.48.Aun cuando las varianzas poblacionales son iguales, la probabilidad de quela razon entre la varianzas muestrales sea mayor que 3.48 todavia es .05(suponiendo tamaños muestrales de n1 = 6 y n2 = 10)

Teorema Del Límite Central

TeoremaSean Y1,Y2, ...,Yn variables aleatorias independientes y distribuidas idén-ticamente con E (Yi ) = µ y V (Yi ) = σ2 <∞. Definamos

Un =

∑ni=1 Yi − nµσ√

n=

Y − µσ/√

n

donde Y = 1n∑n

i=1 YiEntonces la función de distribución de Un converge hacia la función dedistribución normal estándar cuando n→∞. Esto es

limn→∞P(Un ≤ u) =

∫ u

−∞

1√2π

e−t2/2dt

para toda u.

Ejemplo 7.8

ExampleLas calificaciones de exámenes para todos los estudiantes de último añode preparatoria en cierto estado tienen media de 60 y varianza de 64. Unamuestra aleatoria de n = 100 estudiantes de una escuela preparatoriagrande tuvo una califi cación media de 58. ¿Hay evidencia para sugerirque el nivel de conocimientos de esta escuela sea inferior? (Calcule laprobabilidad de que la media muestral sea a lo sumo 58 cuando n = 100.)

SoluciónDenote Y la media de una muestra aleatoria de n = 100 calificacionesde una población con µ = 60 y σ2 = 64 Deseamos calcular P(Y ≤58). Sabemos por el Teorema 7.4 que Y−µ

σ/√

n tiene una distribución quepuede aproximarse con una distribución normal estándar. En consecuencia,usando la Tabla 4, Apéndice 3, tenemos

P(Y ≤ 58) = p(

Y − 608/√100≤ 58− 60

0,8

)≈ P(Z ≤ −2,5) = 0,0062

Debido a que esta probabilidad es muy pequeña, no es probable que lamuestra de la escuela estudiada se pueda considerar como muestra aleatoriade una población con µ = 60 y σ2 = 64. La evidencia sugiere que la calificación promedio para esta preparatoria es menor que el promedio generalde µ = 60.

Ejemplo 7.9

ExampleLos tiempos de servicio para los clientes que pasan por la caja en unatienda de venta al menudeo son variables aleatorias independientes conmedia de 1.5 minutos y varianza de 1.0. Calcule la probabilidad de que100 clientes puedan ser atendidos en menos de 2 horas de tiempo totalde servicio.

SoluciónSi denotamos con Yi el tiempo de servicio para el i-ésimo cliente, entoncesqueremos calcular

P( 1∑

i=100Yi ≤ 120

)= P

(Y ≤ 120

100

)= P

(Y ≤ 1,20

)Como el tamaño muestral es grande, el teorema del límite central nosdice que Y está distribuida normalmente en forma aproximada con mediaµY = µ y varianza σ2

Y = σ2/n = 1/100. Por tanto, usando la Tabla 4,Apéndice 3, tenemos

P(Y ≤ 1,20) = P(

Y − 1,501/√100

)≤ 1,20− 1,50

1/√100

≈ P [Z ≤ (1,2− 1,5)10] = p(Z ≤ −3)00,0013

Entonces, la probabilidad de que 100 clientes puedan ser atendidos enmenos de 2 horas es aproximadamente .0013. Esta pequeña probabilidadindica que es prácticamente imposible atender a 100 clientes en menos de2 horas.

Aproximacion normal a la distribucion binomial

El teorema del limite central tambien se puede usar para aproximar proba-bilidades de algunas variables aleatorias discretas cuando las probabilidadesexactas sean dificiles de calcular.

Ejemplo 7.10

ExampleLa candidata A piensa que puede ganar las elecciones en una ciudad siobtiene por lo menos 55 porciento de los votos en el distrito electoral1.Tambien piensa que alrededor de 50 porciento de los votantes de laciudad estan a su favor. Si n=100 votantes se presentan a votar en eldistrito electoral 1, ¿Cual es la probabilidad de que la candidata A recibaal menos 55 porciento de sus votos?

SoluciónSea Y el numero de votantes del distrito electoral 1 que estan a favor de lacandidata A. Debemos calcular P(Y /n ≥ ,55) cuando p es la probabilidadde que un votante seleccionado aleatoriamente del distrito electoral 1 estea favor de la candidata A. Si consideramos los n = 100 votantes del distritoelectoral 1 como una muestra aleatoria de la ciudad, entonces Y tiene unadistribucion binomial con n = 100 y p = 0,5. Hemos visto que la fraccionde votantes que estan a favor de la candidata A es.

Yn =

1n

n∑i=1

Xi

donde Xi = 1 si el i-esimo votante esta a favor de la candidata A yXi = 0 de otro modo. Como es razonable suponer que Xi = 1, 2, ..., n sonindependientes, el teorema del limite central implica que X = Y /n estadistribuida normalmente en forma aproximada con media p = ,5 y varianzapq/n = (0,5)(0,5)/100 = 0,0025. Por tanto,

P(

Yn ≥ 0,55

)= P

(Y /n − 0,5√

0,0025≥ 0,55− 0,50

0,05

)≈ P(Z ≥ 1) = 0,1587

Ejemplo 7.11

ExampleSuponga que Y tiene una distribucion binomial con n = 25 y p = 0,4.Encuentre las probabilidades exactas de que Y ≤ 8 y Y = 8 y compareestas con los valores correspondientes determinados con el uso de laaproximacion normal.

SoluciónDe la tabla 1, Apendice 3, hallamos que

P(Y ≤ 8) = ,274

YP(y = 8) = P(Y ≤ 8)− P(Y ≤ 7) = ,274− ,154 = 0,120

Como dijimos antes, podemos considerar que Y tiene aproximadamentela misma distribucion que W , donde W esta distribuida normalmente conµw = np y σ2

w = np(1− p). Como buscamos P(Y ≤ 8), vemos el area dela curva normal localizada a la izquierda de 8.5. Asi,

P(Y ≤ 8) ≈ P(W ≤ 8,5) = P[

W − np√np(1− p)

≤ 8,5− 10√25(,4)(,6)

]= P(Z ≤ −0,64) = 0,2709

De la tabla 4, Apendice 3.

SoluciónEste valor aproximado es cercano al valor exacto para P(Y ≤ 8) = 0,274,obtenido de las tablas binomiales.Para determinar la aproximacion normal a la probabilidad binomial p(8),calcularemos el area bajo la curva normal entre los puntos 7.5 y 8.5 porqueeste es el intervalo incluido en la barra del histograma localizada sobrey = 8Que se indica en la siguiente figura.

SoluciónComo Y tiene aproximadamente la misma distribucion que W , donde Westa distribuida normalmente con µw = np = 25(0,4) = 10 y σ2

W =np(1− p) = 25(0,4)(0,6) = 6, se deduce que

P(Y = 8) ≈ P(7,5 ≤W ≤ 8,5)

= P(7,5− 10√

6≤ W − 10√

6≤ 8,5− 10√

6

)= P(−1,02 ≤ Z ≤ −0,61) = 0,2709− 0,1539 = 0,1170

Nuevamente vemos que este valor aproximado es muy cercano al valor real,P(Y = 8) = 0,120, calculado antes.

Referencias:

Wackerly Dennis D. Estadistica matemática con aplicaciones,CENGAGE learning, 2010.