distr_muestrales (1)

31
DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007 DISTRIBUCIONES MUESTRALES Página 1 de 31

Upload: santiago-sahes

Post on 14-Dec-2015

3 views

Category:

Documents


0 download

DESCRIPTION

HOLA

TRANSCRIPT

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

DISTRIBUCIONES MUESTRALES

Página 1 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

CONTENIDO

1. Introducción

2. Teorema del límite central

3. Aplicación de las distribuciones muestrales

4. Distribuciones muestrales Chi 2, t y F

Página 2 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

DISTRIBUCIONES MUESTRALES

1. Introducción

A las distribuciones de los estadísticas muestrales se les llama

distribuciones muestrales.

ESTADÍSTICA INFERENCIAL: La estadística inferencial involucra el uso

de un estadístico para sacar una conclusión o inferencia sobre el

parámetro correspondiente de la población

Por ejemplo se usa:

media de muestra para estimar la media poblacional

desv. Est. De muestra para estimar la desv. Est. poblacional

p proporción en la muestra para estimar la proporción poblacional

ERROR DE MUESTREO: es la diferencia entre el parámetro poblacional

y el estadístico de la muestra utilizado para estimar el parámetro.

Por ejemplo la diferencia entre:

y y p y

Página 3 de 22

PoblaciónCon N elementos

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

DISTRIBUCIÓN MUESTRAL: es un conjunto de todos los valores posibles

para un estadístico y la probabilidad relacionada con cada valor.

150 1/6

200 1/6

250 2/6

300 1/6

350 1/6 Tomando K=6 muestras de

1.0 tamaño n cada una

MEDIA DE LAS MEDIAS MUESTRALES o GRAN MEDIA o MEDIA DE

MEDIAS:

VARIANZA DE LA DISTRIBUCIÓN MUÉSTRAL DE LAS MEDIAS

MUESTRALES

Del ejemplo anterior:

ERROR ESTÁNDAR DE LA DISTRIBUCIÓN MUESTRAL DE LAS MEDIAS

MUESTRALES

Página 4 de 22

Xmedia 1Desv.est.1

Xmedia KDesv.est.K

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

En el caso anterior vale 64.55

Si el muestreo se realiza sin reemplazo y si el tamaño de muestra es

más del 5% de la población (n > 0.05N) debe aplicarse el factor de

corrección para poblaciones finitas (FPC) al error estándar.

2. TEOREMA DEL LÍMITE CENTRAL

La distribución de las medias de las muestras tiende a la normalidad

independientemente de la forma de la distribución poblacional de la

que sean obtenidas. Es la base de las cartas de control X-R.

F(X)

Distribución de las medias

muestrales

Distribución de valores individuales

Distribución muestral de la media

Página 5 de 22

XXs n

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

A medida que n se vuelve más grande, la distribución de las medias

muestrales se aproximará a una distribución normal con una media

Si es una muestra aleatoria de una Poblacion (X) con

distribución normal .Entonces se

distribuye normalmente con media y varianza

Por ejemplo, para los siguientes datos de la población:

DATOS DE LA POBLACIÓN PARA MOSTRAR EL TEOREMA DEL

LÍMITE CENTRAL PROMEDIO

2 7 5 5 2 4.21 7 7 9 4 5.65 8 1 1 5 4.07 1 4 1 4 3.47 6 9 8 5 7.01 6 4 7 9 5.47 3 1 7 3 4.26 7 9 4 3 5.89 7 7 6 1 6.08 3 4 4 7 5.25 3 3 4 2 3.45 9 9 1 9 6.65 5 3 9 5 5.43 1 9 1 5 3.84 3 9 5 5 5.29 1 7 7 8 6.42 1 7 8 6 4.87 7 9 8 3 6.83 4 5 6 8 5.24 8 3 4 5 4.85 3 2 2 6 3.68 1 5 5 9 5.67 5 9 6 8 7.02 2 7 2 1 2.8

Página 6 de 22

nXXX ,...,, 21

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

3 1 4 1 7 3.29 3 2 3 8 5.06 2 7 4 4 4.65 2 6 8 6 5.49 6 2 9 4 6.02 6 3 5 5 4.29 2 2 3 6 4.42 6 6 8 3 5.05 4 2 1 9 4.24 2 9 4 2 4.28 1 2 1 4 3.23 2 8 5 4 4.45 8 9 6 2 6.07 9 3 8 5 6.45 6 8 7 5 6.29 6 4 8 7 6.87 9 9 8 3 7.25 5 1 4 6 4.28 4 7 8 7 6.88 7 7 1 8 6.25 5 1 7 5 4.67 7 2 9 8 6.69 5 2 5 9 6.02 5 3 5 8 4.64 5 8 4 2 4.69 2 6 6 1 4.81 7 7 3 4 4.47 7 2 8 7 6.28 1 1 7 6 4.62 2 1 4 9 3.69 4 3 7 3 5.27 8 4 3 2 4.81 2 9 3 8 4.62 4 6 2 8 4.42 9 3 3 1 3.62 6 7 8 7 6.0

Página 7 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

El histograma de los datos de la población, es el siguiente:

8642

40

30

20

10

0

Poblacion

Frequency

Histogram of Poblacion

Al hacer una prueba de normalidad de Anderson Darling en los datos

se tiene:

151050-5

99.9

99

95

90

80706050403020

10

5

1

0.1

Poblacion

Perc

ent

Mean 5.073StDev 2.584N 300AD 5.965P-Value <0.005

Probability Plot of PoblacionNormal

Como el P value es menor a 0.05 los datos no siguen una distribución

normal.

Página 8 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

El histograma de los promedios muestrales (subgrupos de 5 datos) se

muestra a continuación:

Al hacer una prueba de normalidad de Anderson Darling se tiene:

987654321

99.9

99

95

90

80706050403020

10

5

1

0.1

Muestra

Perc

ent

Mean 5.073StDev 1.118N 60AD 0.527P-Value 0.172

Probability Plot of MuestraNormal

Como el P value es mayor a 0.05 incluso mayor a 0.10, las medias

siguen una distribución normal.

La sigma de la población estimada con la media de la muestra es:

Página 9 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

S pob. 2.5840 Raiz(n) Spob est.Sn=5 1.1181 2.2361 2.5001243

Tomando un tamaño de subgrupo de n = 10 se tiene:

PROM. N=10

4.9 4.73.7 4.26.2 3.85.0 6.25.6 6.55.0 5.74.6 6.55.8 5.65.8 5.35.0 4.74.6 5.34.9 4.14.1 5.05.0 4.55.1 4.8

6.56.05.55.04.54.03.5

9

8

7

6

5

4

3

2

1

0

PROM. N=10

Frequency

Histogram of PROM. N=10

Por lo que con un tamaño de muestra de n = 5 es suficiente para

mostrar normalidad.

3. APLICACIÓN DE LAS DISTRIBUCIONES MUESTRALES

Página 10 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

Muchas decisiones en los negocios dependen de una muestra

completa no tanto de una observación, por tanto se trabaja con la

distribución muestral de las medias o de las proporciones, para el caso

de las medias se tiene:

Con este valor se determina P(Z <= z)

Donde n es el tamaño de la muestra y si no se conoce sigma, se

estima con el valor de S. Ejemplos páginas 153 – 156.

Ejemplo:

Una empresa de constestación de llamadas telefónicas, está

interesada en conocer la probabilidad de que la media de n llamadas

dure un cierto periodo de tiempo, no le interesa una llamada

individual, ya que no le permitiría determinar la cantidad de personas

que requiere:

Las llamadas durante un mes promediaron 150 seg. Con una

desviación estándar de 15 seg.

a. ¿Cuál es la probabilidad de que una llamada en particular dure entre

150 y 155 segundos?

;

En tablas P(Z <= 0.33) = 0.6293 ; P(Z<=0) = 0.500

Por tanto P( 0 <= Z <= 0.33) = 0.1293 o 12.93%

Página 11 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

Por tanto la probabilidad de que una llamada dure entre 150 y 155

segundos es del 12.93%.

b. ¿Cuál es la probabilidad de que la media de n=50 llamadas esté

entre 150 y 155 segundos?

Ahora se aplica la distribución muestral de las medias, con:

;

En tablas P(Z <= 2.36) = 0.9909 ; P(Z<=0) = 0.500

Por tanto P( 0 <= Z <= 2.36) = 0.4909 o 49.09%

P(150 <= X < = 155)

150 155

150 155

Para el caso de las medias el área es mayor debido a que las medias

muestrales están menos dispersas que los valores individuales de

llamadas

Página 12 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

c. ¿Cuál es la probabilidad de que la media de n=35 llamadas esté

entre 145 y 155 segundos?

Ahora se aplica la distribución muestral de las medias, con:

;

En tablas P(Z <= -1.97) = 0.0244 ; P(Z<=1.97) = 0.9756

Por tanto P( -1.97 <= Z <= 1.97) = 0.9512 o 95.12%

d. ¿Cuál es la probabilidad de que la media de n=35 llamadas sea

mayor a 155 segundos?

Ahora se aplica la distribución muestral de las medias, con:

En tablas P(Z <= -1.97) = 0.0244 o 1-P(Z<=1.97) = 1 - 0.9756 =

0.0244

Por tanto P(Z >= 1.97) = 0.0244 o 2.44%

Con la información anterior ahora la empresa ya puede tomar

decisiones.

Página 13 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

Ejercicios:

1. Los choferes de camniones de una empresa recorren en promedio

8,500 km. cada trimestre, con una desviación estándar de 1,950 Km. Si

se toma una muestra de n = 100 choferes, Cuál es la probabilidad de

que la media de la muestra sea o encuentre en:

a. ¿Mayor a 8,500 Km.?

b. ¿Menor a 8,000 Km.?

c. ¿Entre 8,200 y 8,700 Km?

d. ¿Entre 8,100 y 8,400 Km.?

2. Los refrescos de una embotelladora tienen una media de 16.1 oz.,

con una desviación estándar de 1.2 oz. Si se toma una muestra de n =

200 refrescos, cuál es la probabilidad de que la media sea:

a. ¿Menor que 16.27 oz.?

b. ¿A lo más 15.93 oz.?

c. ¿Entre 15.9 y 16.3 oz.?

d. ¿Más de 16.2 oz.?

Página 14 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

Para el caso de proporciones se tiene:

Si n>0.05N puede requerirse el

FCP

Una vez calculando lo anterior ahora se determina Z

Ejemplo:

Una empresa adquiere lotes de partes de tamaño n = 200, el lote tiene

una tasa de partes con falla del 10%, la política de la empresa ahora es

que:

a. Si hay más del 12% de defectos se buscará un nuevo proveedor.

b. Entre el 10 y 12% se considerará la búsqueda de un nuevo

proveedor

c. Entre el 5 y 10%, se seguirá con el mismo proveedor

d. Menos del 5%, se incrementarán los pedidos

Solución:

a. P(p > 0.12)

P(Z >= 0.95) = 0.1711 o sea el 17.11%

b. P(0.10 <= p <= 0.12) = 0.3289 o el 32.89%

c. P(0.05 <= p <= 0.10)

Página 15 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

P(-2.38 <= Z <= 0.1) = 0.4913 o el 49.13%

d. P(p <= 0.05) = 0.0087 o el 0.87%

Por tanto como la mayor probabilidad es la del inciso c, no se cambia

al proveedor actual.

Ejercicios:

1. La proporción de personas que comen en un restaurante es del 75%.

En una muestra de 100 clientes, ¿Cuál es la probabilidad de que

menos del 20% compren comida para llevar?

2. El 60% de los empleados en una empresa vive cerca. De 100

empleados al azar, ¿Cuál es la probabilidad de que por lo menos 30

vivan cerca?

Página 16 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

4. Distribuciones muestrales derivadas de la normal:

Chi 2, t y F

Distribución Chi Cuadrada

Esta distribución se forma al sumar los cuadrados de las variables

aleatorias normales estándar.

Si Z es una variable aleatoria normal, entonces el estadístico Y

siguiente es una variable aleatoria Chi cuadrada con n grados de

libertad.

Media y varianza de una ji-cuadrada.

E(X)=k

V(X)=2k

Página 17 de 22

Población

Muestra

Aparecen distribuciones muestrales:

Normal, Chi-cuadrada, t-student, F

223

22

21 .... nzzzzy

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

Calculo de puntos críticos usando las tablas de ji-cuadrada

K=1 K=5

K=25K=50

Gráficas de la distribución ji-cuadrada

Con k grande ji-cuadrada se hace normal

Ejemplo: Calcule el valor critico que satisface

De tablas de ji-cuadrada con alfa=.05 y k=20

Página 18 de 22

)( 2,kXP

05.)( 220,05.0 XP

41.31220,05.0

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

Si es una muestra aleatoria de una Poblacion (X) con

distribución normal .Entonces se distribuye ji-

cuadrada con k= n-1 grados de libertad.

Donde S cuadrada es la varianza muestral.

Distribución t-student

Si es una muestra aleatoria de una población (X) con

distribución normal . Entonces se distribuye

t-student con n-1 grados de libertad

),(

]12/][2/[

]2/)1[()(

2/)1(2

x

xkk

kxf

k

Función de Distribución t-student

K=1K=10

K=100

Página 19 de 22

21

22

)1(

nS

n

1)/()( ntnsX

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

La media y la varianza de la distribución t son:

De una muestra aleatoria de n artículos, la probabilidad de que

Caiga entre dos valores especificados es igual al área bajo la

distribución de probabilidad t de Student con los valores

correspondientes en el eje X, con n-1 grados de libertad

Ejemplo:

La resistencia de 15 sellos seleccionados aleatoriamente son: 480,

489, 491, 508, 501, 500, 486, 499, 479, 496, 499, 504, 501, 496, 498

¿Cuál es la probabilidad de que la resistencia promedio de los sellos

sea mayor a 500?. La media es 495.13 y la desviación estándar es de

8.467.

t = -2.227 y el área es 0.0214

Página 20 de 22

0 3;2

kk

k

ns

xt

/

227.215/467.8

50013.495

t

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

Distribución F

Surge de dividir dos ji-cuadradas independientes

F=(W/u)/(Y/v)

W se distribuye ji-cuadrada con u g.l.

Y se distribuye ji-cuadrada con v g.l.

El uso de esta distribución es para comparar varianzas (Recuerde el

análisis de varianza)

Distribución F.

),0(

]1][2/[)2/(

/]2/)[()(

2/)(

1)2/(2

x

xvu

vu

xvuvuxf

vk

uu

u=10

v=5

u=20

v=20

Página 21 de 22

DISTRIBUCIONES MUESTRALES P. Reyes / Sept. 2007

Para determinar la otra cola de la distribución F se determina con la expresión.

Falfa, k1, k2 = 1 / F(1-alfa), k2, k1

Dado K1 = 8 y K2 = 10, F0.05 = 3.07, encontrar el valor de F0.05 con K1 = 10 y K2 = 8

F0.05,10,8 = 1/ F0.95,8,10 = 1/ 3.07 = 0.326.

Página 22 de 22