ut-4: distribuciones fundamentales de muestreo y ... · pdf file2 organización de la...

Post on 24-Feb-2018

253 Views

Category:

Documents

5 Downloads

Preview:

Click to see full reader

TRANSCRIPT

1

UT-4: Distribuciones fundamentales de muestreo y

descripción de datosSub tema: Muestreo aleatorio. Distribuciones

muestrales. Distribuciones muestrales de medias. Teorema del límite central. Aplicaciones.

DF

2

Organización de la Clase

1. Introducción2. Distribuciones fundamentales de

muestreo3. Algunas aplicaciones al caso de

medias muestrales4. Sugerencias para la gestión del

autoaprendizaje

3

1. Introducción

Estadística

Descriptiva Inferencial

Posición del tema en la asignatura. Relaciones.

4

La cuestión del título del tema

UT-1: Estadística descriptiva y análisis de datosDistribuciones de frecuencias

(Patrón de comportamiento de los datos)

UT-3: Variables aleatoriasy distribuciones de probabilidadDistribuciones de probabilidad

(Modelos matemáticos)

UT-4: Distribuciones fundamentales de muestreo

5

Distribuciones de frecuencias en un contexto dado

Cuatro casos:1. Las bolsas de cemento2. Los derrames del Río Grande3. Los caudales del Río Mendoza4. La resistencia del hormigón

6

Distribución de frecuencias de las observaciones individuales

Se extrae una muestra de tamaño n.

x

fr

1xM1

j123...n

...

xj

x1x2x3

xn

7

Caso 1. Las bolsas de cemento

Box-and-Whisker Plot

Peso49,8 49,9 50 50,1 50,2

Histogram

Peso

frequ

ency

49,8 49,9 50 50,1 50,20

3

6

9

12

15

n = 40

Media = 49,983 kg

Desv. Est.= 0,060 kg

Información obtenida de la muestraX: Peso de las bolsas de cemento, en kg

Density Trace for Peso

49,8 49,9 50 50,1 50,2

Peso

0

1

2

3

4

5

6

dens

ityHistogram for Peso

49,8 49,9 50 50,1 50,2

Peso

0

4

8

12

16

frequ

ency

Trazado de la densidad empírica. Comparación con la Curva Normal.

8

Caso 2. Los derrames del Río Grande

Density Trace

DMAde

nsity

0 2 4 6 8(X 1000)

0

0,5

1

1,5

2

2,5

3(X 0,0001)

Normal Distribution

0 2 4 6 8(X 1000)DMA

0

0,2

0,4

0,6

0,8

1

cum

ulat

ive

prob

abili

ty

Histogram for DMA

0 2 4 6 8(X 1000)DMA

0

3

6

9

12

15

freq

uenc

y

n = 27 años

Media = 3.492,33 hm³

Mediana = 3.565 hm³

Desv. Est.= 1.135, 1 hm³

Coef. Variac. = 32,5%

Q1 =2.488 hm³

Q3 = 4.223 hm³

Información obtenida de la muestra.X: Derrame medio anual, en la estación La Gotera.Registro de 27 años.

9

Caso 3. Los caudales del Río Mendoza

n = 528 meses

Media = 44,54 m³/s

Mediana = 31,9 m³/s

Desv. Est.= 35, 3 m³/s

Coef. Variac. = 79,3%

Q1 =21 m³/s

Q3 = 55 m³/s

Box-and-Whisker Plot

0 50 100 150 200 250 300

QMMGUIDO

Histogram

-10 40 90 140 190 240 290

QMMGUIDO

0

50

100

150

200

250

300

frequ

ency

Density Trace

0 50 100 150 200 250 300

QMMGUIDO

0

2

4

6

8

10(X 0,001)

dens

ity

Información obtenida de la muestra.X: Caudal medio mensual, en la estación GuidoRegistro de 528 meses (44 años)

10

Caso 4: La resistencia del hormigón

Histograma

Tensión

frequ

ency

150 200 250 300 350 400 4500

10

20

30

40

Polígono de frecuencias

Tensión

Por

cent

aje

150 200 250 300 350 400 4500

5

10

15

20

25

Curva de densidad empírica

Tensión

dens

ity

150 200 250 300 350 400 4500

2

4

6

8(X 0,001)

Histograma y curva normal

Tensión (kg/cm²)

frequ

ency

150 200 250 300 350 400 4500

10

20

30

40

Resistencia a compresión del hormigón a la edad de 28 días, en kgf/cm². Resultados obtenidos por alumnos del ciclo 2004 en el laboratorio de ensayos del ITIEM.

¿Normalidad?

11

Distribución de las observaciones individuales: Formas

0 5 10 15 20 25

Sesgo derechoMedia > Moda

μ

SimetríaMedia = Moda

μ

0 5 10 15 20 25 30

Sesgo izquierdoMedia < Moda

μ

¿Qué tanto se aproxima a la normalidad?

12

2. Distribuciones fundamentales de muestreo

Aplicación al caso de la media muestral

13

Población & Muestra

Población(Parámetros)

Muestra(Estadísticas)

μ

x

Total de observaciones que nos interesan para el estudio(finitas – infinitas)

14

Base conceptual para muestrear poblaciones

Se extraen todas las muestras posibles de tamaño n.

i

123...k

1x2x3x

kx...

ix1x

M2

M3Mi

Mk

M1

2x

3x

kx

ixx

fr

15

1x

M2M3Mi

Mk

M1

2x

3x

kx

ix

Comparación de las distribuciones de frecuencias

x

x

j123...n

...

xj

x1x2x3

xn

i123...k

1x2x3x

kx...

ix

X

X

xM

16

Muestreo Aleatorio

Definición

Sean X1, X2, ... , Xn variables aleatorias independientes, cada una con la misma distribución de probabilidad f(x).Definimos entonces a X1, X2, ... , Xn, como una muestra aleatoria de tamaño n de la población f(x) y escribimos su distribución de probabilidad conjunta como:

f(x1, x2, ... , xn) = f(x1) f(x2) ... f(xn)

¡Nuestras inferencias acerca de una población han de ser válidas, siempre que las muestras que obtengamos sean

representativas de tal población!

17

Distribuciones muestrales

Definición

La distribución de probabilidad de una estadística se llama distribución muestral.

Dado que una estadística es una variable aleatoria que depende de la muestra observada, debe tener una

distribución de probabilidad.

18

Comparando distribuciones

xx

Distribución de las observaciones individuales de la población

Distribución de muestreo de la media

μ

Si la estadística fuese la media muestral:

n

XiX

n

i∑== 1

19

¿Se obtiene de una población normal?

Distribuciones de medias muestrales

PREGUNTAS DE INTERÉS

¿Qué tamaño tiene?

La muestra:

20

Media y varianza de la media muestralSi X1, X2, ... , Xn representan una muestra aleatoria de tamaño n, que se toma de una población con media μX y varianza σ²X, entonces:

n

XiX

n

i∑== 1

XX

n

i

n

iX n

nXiE

nXi

nEXE μμμ ==⎟

⎞⎜⎝

⎛=⎟

⎞⎜⎝

⎛== ∑∑

==

111)(11

nn

nXiV

nXi

nVXV X

X

n

i

n

iX

22

21

21

2 111)( σσσ ==⎟⎠

⎞⎜⎝

⎛=⎟

⎞⎜⎝

⎛== ∑∑

==

nX

X

σσ = Error estándar de la media muestral

21

Muestreo de poblaciones Normales( )XXxNX 2,;~ σμ

nX

X

XX2

2 σσ

μμ

=

=

( )XXxNX 2,;~ σμ

n

XiX

n

i∑== 1

0 10 20 30 40 50 600

0,03

0,06

0,09

0,12

0,15

X: Variable en estudio

X: Media muestral

22

Muestreo de poblaciones No Normales

Teorema del Límite Central: Si X es la media de una muestra aleatoria de tamaño n tomada de una población con media μX y varianza finita σ²X, entonces la forma límite de la distribución de:

Conforme n→∞, es la distribución normal estándar:

Z ~ N (0; 1)

n

XZX

X

σμ−

=

X ~ No normal o Desconocida

¿ n →∞ ? n ≥ 30 Muestras grandes y pequeñas

top related