capítulo 7: distribuciones muestrales...distribuciones muestrales una estadística muestral...

31
Capítulo 7: Distribuciones muestrales

Upload: others

Post on 20-Sep-2020

38 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Capítulo 7: Distribuciones muestrales

Page 2: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Recordemos:

Parámetro es una medida de resumen

numérica que se calcularía usando todas

las unidades de la población.

Es un número fijo.

Generalmente no lo conocemos.

Estadística es una medida de resumen

numérica que se calcula de las unidades

de la muestra.

El valor de la estadística se conoce

cuando tomamos una muestra,

pero varia de muestra en muestra �

variación muestral

Page 3: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Inferencia estadística: es el proceso de

sacar conclusiones de la población

basados en la información de una muestra

de esa población.

Page 4: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Objetivos de la inferencia:

� estimación de parámetros,

� intervalos de confianza y

� docimasia, test de hipótesis o pruebas

de significación estadística.

Page 5: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Distribuciones muestrales

Una estadística muestral proveniente de

una muestra aleatoria simple tiene un

patrón de comportamiento (predecible) en

repetidas muestras. Este patrón es

llamado la distribución muestral de la

estadística.

Si conocemos la distribución muestral

podemos hacer inferencia.

Las distribuciones muestrales adoptan

diferentes formas según las estadísticas

investigadas y las características de la

población estudiada.

Page 6: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

7.1 Distribución muestral

de una

proporción muestral

La distribución muestral de la

proporción muestral es la distribución

de los valores de las proporciones

muestrales de todas las posibles muestras

del mismo tamaño n tomadas de la

misma población.

Page 7: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Suponga que estamos interesados

en conocer la proporción de mujeres en

Chile. Nuestro parámetro de interés

es:

Chileen habitantes de número

Chileen mujeres de número=P

La población es demasiado grande. Hacer un

censo sería demasiado caro. Decidimos

estimar el verdadero parámetro a partir de

una muestra.

La proporción muestral sería:

muestra la de tamaño

muestra laen mujeres de númeroˆ =p

Page 8: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Supongamos que sabemos que 5,0=P ¿Qué

pasa si tomamos una muestra tamaño 20=n ?

Muestra #1:

H M H H H M M M H H H M H M M H H M H M

Proporción de mujeres $p=9/20=0,45

Muestra #2:

M M H M H M M H H H H M H H M M M H M M

Proporción de mujeres $p=11/20=0,55

Muestra #3:

H H M M M H H M H M H M H M M H H M M H

Proporción de mujeres $p=10/20=0,50

Page 9: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

En la práctica el investigador toma una

muestra. El conocimiento de la

distribución muestral nos servirá de base

teórica para hacer inferencia estadística.

Para conocer la distribución muestral de

una estadística deberíamos considerar

todas las posibles muestras de un tamaño

n, de una población.

Page 10: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

En la práctica, podemos simular la

distribución muestral aproximada o

empírica, de la siguiente manera:

1. Seleccione "muchas" muestras

aleatorias de mismo tamaño de una

población.

2. En cada muestra calcule el estadístico

muestral

3. Determine la distribución muestral

aproximada

Page 11: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Recuerden que al analizar una

distribución nos interesa:

1. Forma (simétrica o sesgada)

2. Posición central - la media de una

distribución muestral nos dice si el

estadístico es un "buen" (insesgado)

estimador del parámetro o es sesgado.

3. Dispersión - nos da una idea del error

de muestreo.

Page 12: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

¿cuál es la proporción de números

pares de la tabla de números aleatorios?

Usando tabla de números aleatorios.

Asumamos que el 50% de la población es

par, es decir 5,0=P

Vamos a tomar 50 muestras de tamaño 4=n de esta población.

Seleccionamos un punto de partida y

elegimos 4 números.

Page 13: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Supongamos que el punto de partida es Fila

20:

columna

fila

1 10480 15011 01536 02011 81647 91646 69179 14194 62590 36207 20969 99570

2 22368 46573 25595 85393 30995 89198 37982 53402 93965 34095 52666 19174

3 24130 48360 22527 97265 76393 64809 15179 24830 49340 32081 30680 19655

4 42167 93093 06243 61680 07856 16376 39440 53537 71341 57004 00849 74917

5 37570 39975 81837 16656 06121 91782 60468 81305 49684 60672 14110 06927

6 77921 06907 11008 42751 27756 53498 18602 70659 90665 15053 21916 81825

7 99562 72905 56420 69994 98872 31016 71194 18738 44013 48840 63213 21069

8 96301 91977 05463 07972 18876 20922 94595 56869 69014 60045 18425 84903

9 89579 14342 63661 10228 17453 18103 57740 84378 25331 12566 58678 44947

10 85475 36857 53342 53988 53060 59533 38867 62300 08158 17983 16439 11458

11 28918 69578 88231 33276 70997 79936 56865 05859 90106 31595 01547 85590

12 63553 40961 48235 03427 49626 69445 18663 72695 52180 20847 12234 90511

13 09429 93969 52636 92737 88974 33488 36320 17617 30015 08272 84115 27156

14 10365 61129 87529 85689 48237 52267 67689 93394 01511 26358 85104 20285

15 07119 97336 71048 08178 77233 13916 47564 81056 97735 85977 29372 74461

16 51085 12765 51821 51259 77452 16308 60756 92144 49442 53900 70960 63990

17 02368 21382 52404 60268 89368 19885 55322 44819 01188 65255 64835 44919

18 01011 54092 33362 94904 31273 04146 18594 29852 71585 85030 51132 01915

19 52162 53916 46369 58586 23216 14513 83149 98736 23495 64350 94738 17752

20 07056 97628 33787 09998 42698 06691 76988 13602 51851 46104 88916 19509

21 48663 91245 85828 14346 09172 30168 90229 04734 59193 22178 30421 61666

22 54164 58492 22421 74103 47070 25306 76468 26384 58151 06646 21524 15227

23 32639 32363 05597 24200 13363 38005 94342 28728 35806 06912 17012 64161

24 29334 37001 87637 87308 58731 00256 45834 15398 46557 41135 10367 07684

25 02488 33062 28834 07351 19731 92420 60952 61280 50001 67658 32586 86679

26 81525 72295 04839 96423 24878 82651 66566 14778 76797 14780 13300 87074

27 29676 20591 68086 26432 46901 20849 89768 81536 86645 12659 92259 57102

28 00742 57392 39064 66432 84673 40027 32832 61362 98947 96067 64760 64584

29 05366 04213 25669 26422 44407 44048 37937 63904 45766 66134 75470 66520

30 91921 26418 64117 94305 26766 25940 39972 22209 71500 64568 91402 42416

31 00582 04711 87917 77341 42206 35126 74087 99547 81817 42607 43808 76655

32 00725 69884 62797 56170 86324 88072 76222 36086 84637 93161 76038 65855

33 69011 65795 95876 55293 18988 27354 26575 08625 40801 59920 29841 80150

34 25976 57948 29888 88604 67917 48708 18912 82271 65424 69774 33611 54262

35 09763 83473 73577 12908 30833 18317 28290 35797 05998 41688 34952 37888

41-45 46-50 51-55 56-601-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40

Page 14: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Resultados si el punto de partida es Fila 20:

Muestra Estadístico

1 0705 2/4

2 6976 4/4

3 2833 2/4

4 7870 2/4

5 9998 1/4

6 4269 3/4

7 8066 4/4

8 9176 1/4

9 9881 2/4

10 3602 3/4

11 5185 1/4

12 1461 2/4

13 0488 4/4

14 9161 1/4

15 9509 1/4

16 2562 3/4

17 5581 1/4

18 0448 4/4

19 6639 2/4

20 1245 2/4

21 8582 3/4

22 8143 2/4

23 4609 3/4

24 1723 1/4

25 0168 3/4

Page 15: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Muestra Estadístico

26 9022 3/4

27 9047 2/4

28 3459 1/4

29 1932 1/4

30 2178 2/4

31 3042 3/4

32 1616 2/4

33 6699 2/4

34 9043 2/4

35 2812 4/4

36 5416 2/4

37 4584 3/4

38 9222 3/4

39 4217 2/4

40 4103 2/4

41 4707 2/4

42 0253 2/4

43 0676 3/4

44 4682 4/4

45 6384 3/4

46 5815 1/4

47 1066 3/4

48 4621 3/4

49 5241 2/4

50 5227 2/4

Page 16: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Tabla:

Número de

pares

Proporción

muestral

Frecuencia

Proporción de

todas las

muestras

0 0/4 = 0,00 0

1 1/4 = 0,25 10

2 2/4 = 0,50 20

3 3/4 = 0,75 14

4 4/4 = 1,00 6

Total

a) ¿Cuál fue la proporción más frecuente?

b) Dibuje la distribución muestral

empírica. ¿Qué forma tiene?

Cada vez que tomamos una muestra tenemos

una estimación para el parámetro P .

Estas estimaciones varían entre muestras �

variación muestral

Page 17: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Se puede demostrar que si tomamos una

m.a.s. de tamaño n de una población con

parámetro P , la desviación estándar de $p

es:

que depende de la verdadera proporción P y

del tamaño muestral n .

Si el tamaño muestral es 4=n y la

proporción en la población es 5,0=P

entonces la desviación estándar de $p es:

n

PPp

)1(ˆ

−=σ

25,04

)5,01(5,0)1(ˆ

=−

=−

=n

PPpσ

Page 18: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

¿Que pasa si aumentamos el tamaño muestral?

¿Que pasa con P ? ¿Cómo afecta el valor de

P en la desviación estándar?

P P(1-P)

0,1 0,09

0,2 0,16

0,3 0,21

0,4 0,24

0,5 0,25

0,6 0,24

0,7 0,21

0,8 0,16

0,9 0,09

0

0.05

0.1

0.15

0.2

0.25

0.3

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

P

P(1-P)

Page 19: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Sesgo y Precision

Cuando estimamos un parámetro de la

población a partir de una estadística

muestral, nos va a interesar que la

estimación no tenga sesgo y sea precisa.

La figura ilustra la diferencia entre sesgo y

precisión.

Page 20: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Distribución muestral de

una proporción

Si P representa la proporción de elementos

en una población con cierta característica de

interés, es decir, la proporción de “éxitos”,

donde “éxito” corresponde a tener la

característica.

Si sacamos muestras aleatorias simples de

tamaño n de la población donde la

proporción de “éxitos” es P , entonces la

distribución muestral de la proporción

muestral tiene las siguientes propiedades:

1. El promedio de todos los valores

posibles de $p es igual al parámetroP . En

otras palabras, $p es un estimador insesgado

de P .

P=p̂

µ

Page 21: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

2. Error estándar de la proporción

muestral: Es la desviación estándar de las

posibles proporciones muestrales y mide

la dispersión de la proporción muestral.

3. Si n es “suficientemente” grande, la

distribución de la proporción muestral es

aproximadamente Normal:

))1(

,(~ˆn

PPPNp

−&

cuando nP ≥ 5 y n(1-P) ≥ 5

n

PPp

)1(ˆ

−=σ

Page 22: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)
Page 23: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Sangre

En Chile el 5,3% de la población tiene sangre factor

Rh(-). En una muestra aleatoria de 400 sujetos de esa

población, se encuentra que un 8,8% tiene factor

Rh(-).

a) ¿cuál es el valor del parámetro?

b) ¿cuál es el valor de la estadística?

c) ¿Cuál es la probabilidad de que en una nueva

muestra aleatoria de tamaño 400 de esa

población contenga al menos un 8,8% de

personas con sangre factor Rh(-)?

( ) =≥ 8,8p̂P

d) Suponga que se toma una muestra aleatoria

simple de tamaño 10 de la misma población.

Queremos calcular la probabilidad de que 8,8%

o más tenga sangre factor Rh(-).

Page 24: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Distribución muestral de la

media muestral

La distribución muestral de la media

muestral es la distribución de los valores de

las medias muestrales de todas las posibles

muestras del mismo tamaño n tomadas de la

misma población.

Page 25: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Considere una población cuya variable

aleatoria X es discreta y con la siguiente

distribución:

La media de la población esµ =

Suponga que no conocemos la población o el

valor de µ . Podemos tomar una m.a.s. de

tamaño n=2 de esta población.

¿Cuál sería una muestra de tamaño n=2 de esta

población?

¿Cuál sería la media muestral?

¿Es igual a la media de la población?

Si tomamos otra muestra de tamaño n=2,

¿obtendríamos la misma media muestral?

Page 26: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Distribución muestral de la media muestral

Si sacamos muestras aleatorias de tamaño n de

una población con media µ y desviación

estándar σ, entonces la distribución muestral de

la media muestral tiene las siguientes

propiedades:

1. El promedio de todos los valores posibles de

medias muestrales es igual al parámetro µ. En

otras palabras, la media muestral X es un

estimador insesgado de µ.

µµ =x

2. Error estándar de la media muestral: Es la

desviación estándar de las posibles medias

muestrales.

n=

x

σσ

El error estándar disminuye si el tamaño de la

muestra aumenta.

Page 27: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

3. Si la población original tiene distribución

Normal, entonces para cualquier tamaño

muestral n la distribución de la media

muestral es también Normal:

),(~ ),(~ Sin

NxNX σµσµ ⇒

4. Si la población de origen no es Normal,

pero n es “suficientemente” grande la

distribución de la media muestral es

aproximadamente Normal:

Aún si X no es:),(~ ),(n

NxN σµσµ &⇒

Page 28: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Nota:

- Un tamaño de 30 es considerado suficiente.

- El resultado en (4) se conoce como el

Teorema del Límite Central.

Page 29: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)
Page 30: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Suponga que X = peso de carga de

camionetas en kilos, tiene distribución

normal con media = 300 k y varianza = 25.

Se toma una muestra aleatoria de 25

camionetas cargadas y se calcula la media

muestral.

Esquema de las distribuciones de la variable

aleatoria X y de la media muestral:

Distribution of X

=30µµµµ

Distribution of XN(300,25)

N(300, 1 )

305295290285 310 315300

Page 31: Capítulo 7: Distribuciones muestrales...Distribuciones muestrales Una estadística muestral proveniente de una muestra aleatoria simple tiene un patrón de comportamiento (predecible)

Suponga que X = la edad de las madres

en los nacimientos en Chile el año 1995,

tiene distribución normal con media = 26,5

años y desviación estándar 6,3 años.

a) Describa la distribución de la edad de la

madre.

b) ¿Cuál es la probabilidad de que una

madre elegida al azar tenga más de 30

años?

c) Suponga que tomamos una muestra

aleatoria de n=25 madres ¿cuál es la

probabilidad de que la media muestral

sea mayor a 30?

d) ¿porqué las respuestas en (b) y (c) son

distintas?