Ensayo de Rendimiento
DISTRIBUCIÓN DEESTADÍSTICOS MUESTRALES
Objetivo: conocer propiedades de una población a partir de una muestra
Muestreo
Propiedades
Parámetros
Los estadísticos muestrales sirven como estimación (aproximación) de los parámetros
Muestreo
Los parámetros son constantes
Los estadísticos son variables aleatorias y poseen distribución asociada
Distribución de estadísticos muestrales: objetivos
•Comprender la naturaleza aleatoria de los estadísticos muestrales.•Estudiar las propiedades estadísticas de la media y la varianza muestrales.
•Adquirir destrezas en el cálculo de probabilidades asociadas a estos estadísticos.
Distribución de estadísticos muestrales
Las distribuciones de los estadísticos muestrales se estudian suponiendo poblaciones de tamaño infinito.
Distribución de los estadísticos muestrales
Muestreo aleatorio con reposición: las unidades seleccionadas pueden repetirse dentro de la muestra y entre muestras.Muestreo aleatorio sin reposición: las unidades seleccionadas no se repiten dentro de la muestra y entre muestras.
Distribución del estadístico media muestral: ejemplo
Se tiene una población (finita) de cuatro plantas de zapallos (N=4), donde la característica de interés es el número de zapallos por planta.Se realizará un muestreo aleatorio simple con reposición, para muestras de tamaño 2.
Objetivo: estudiar la distribución de la media muestral.
Distribución del estadístico media muestral
Planta X = Nº de frutos
f(xi)
P1 3 1/4
P2 2 1/4
P3 1 1/4
P4 4 1/4
1 2 3 4 Número de frutos
0.00
0.25
0.50
f(x)
Función de densidad del número de frutos en una población de 4 plantas de zapallo.
Distribución del estadístico media muestral
( )i iifx x
1 1 1 1 1 2 3 41 2 3 4 2.5
4 4 4 4 4
La esperanza será:
Distribución del estadístico media muestral
22 ( )i ii
x f x
2 2 22
2
1 1 11 2.5 2 2.5 3 2.5
4 4 41
4 2.5 1.254
= +
La varianza será:
Distribución del estadístico media muestral
Tomando muestras de dos plantas con reposición, hay N2 muestras posibles para extraer, esto es 42=16 muestras.
Distribución del estadístico media muestral
Muestra Plantas Nro. de frutos
Media muestral
Muestra Plantas Nro. de frutos
Media muestral
1 P1P1 3; 3 3.0 9 P3P1 1; 3 2.0
2 P1P2 3; 2 2.5 10 P3P2 1; 2 1.5
3 P1P3 3; 1 2.0 11 P3P3 1; 1 1.0
4 P1P4 3; 4 3.5 12 P3P4 1; 4 2.5
5 P2 P1 2; 3 2.5 13 P4P1 4; 3 3.5
6 P2 P2 2; 2 2.0 14 P4P2 4; 2 3.0
7 P2 P3 2; 1 1.5 15 P4P3 4; 1 2.5
8 P2 P4 2; 4 3.0 16 P4P4 4; 4 4.0
Espacio muestral generado por muestreo aleatorio con muestras de tamaño n=2, con reposición, de una población de cuatro plantas de zapallo.
Distribución del estadístico media muestral
Valores que asume la variable aleatoria “media muestral del número de frutos” en muestras de tamaño n=2 y sus densidades.
Media Muestral
1 1.(1/16) = 0.0625
1.5 2.(1/16) = 0.125
2 3.(1/16) = 0.1875
2.5 4.(1/16) = 0.25
3 3.(1/16) = 0.1875
3.5 2.(1/16) = 0.125
4 1.(1/16) = 0.0625
Distribución del estadístico media muestral
1.0 1.5 2.0 2.5 3.0 3.5 4.0
Medias muestrales
0.05
0.10
0.15
0.20
0.25
f(x)
Función de densidad de la variable aleatoria media muestral del número de frutos.
Distribución del estadístico media muestral
2.5x 2
2 1.250.625
2x
n
22
xEE
n
Error EstándarError Estándar
Distribución del estadístico media muestral
Si se hubieran utilizado muestras de mayor tamaño, se vería que la función de densidad se aproxima más aún a la gráfica de una densidad normal, con idéntica esperanza y varianza inversamente proporcional al tamaño muestral.
Este comportamiento no es casual sino la consecuencia de un importantísimo resultado que se resume en el siguiente teorema:
1.0 1.5 2.0 2.5 3.0 3.5 4.0
Medias muestrales
0.05
0.10
0.15
0.20
0.25
f(x)
Sea X una variable aleatoria con esperanza µ y varianza finita 2. Sea la media muestral de una muestra aleatoria de tamaño n y Z la variable aleatoria definida como:
XZ
n
Teorema Central del Límite
entonces, la distribución de Z se aproxima a la distribución normal estándar cuando n se aproxima a infinito.
X
Ejemplo de un muestreo aleatorio sin reposición desde una población finitaRendimientos de un híbrido de maíz (N=15)
99.04 94.98 101.52 95.74 96.42 85.44 102.64 111.75 112.86 107.66 103.49 104.93 104.48 101.24 104.31
= 101.77 2 = 44.67Sin reposición
Muestreo
Muestreo: todas las muestras posibles de tamaño n
Estadísticos: media y varianza muestrales
Distribución de las medias de muestras con n=2
89.00 92.43 95.86 99.29 102.71 106.14 109.57 113.00
Media (n=2)
0.00
0.09
0.19
0.28
0.37fr
ecu
en
cia
re
lativ
aAjuste: Normal(101.766,20.940)
Distribución de las medias de muestras con n=3
90.8993.22
95.5697.90
100.24102.57
104.91107.25
109.59111.92
Media (n=3)
0.00
0.06
0.13
0.19
0.26fr
ecu
en
cia
re
lativ
aAjuste: Normal(101.766,12.792)
Distribución de las medias de muestras con n=5
89.091.0
93.095.0
97.099.0
101.0103.0
105.0107.0
109.0111.0
113.0
Media (n=5)
0.00
0.05
0.10
0.15
0.20fr
ecu
en
cia
re
lativ
aAjuste: Normal(101.766,6.384)
Distribución de las medias de muestras con n=8
89.0092.43
95.8699.29
102.71106.14
109.57113.00
Media (n=8)
0.00
0.04
0.09
0.13
0.18fr
ecu
en
cia
re
lativ
aAjuste: Normal (101.766, 2.792)
Distribución del estadístico media muestral
Cuando se hace un muestreo aleatorio sin reposición desde una población finita las expresiones para obtener la esperanza y la varianza de la variable media muestral son:
x 2
2
1x
n
N n
N
Corrección por
finitud
En síntesis:
2
2
1
44.67 15 2
2 15 12 101.766 20.94
x x
N n
n Nn
2
2
1
44.67 15 3
3 15 13 101.766 12.76
x x
N n
n Nn
2
2
1
44.67 15 5
5 15 15 101.766 6.38
x x
N n
n Nn
2
2
1
44.67 15 8
8 15 18 101.766 2.76
x x
N n
n Nn
En síntesis:
90.8993.22
95.5697.90
100.24102.57
104.91107.25
109.59111.92
Media (n=3)
0.00
0.06
0.13
0.19
0.26
fre
cue
nci
a r
ela
tiva
Ajuste: Normal(101.766,12.792)
89.00 92.43 95.86 99.29 102.71 106.14 109.57 113.00
Media (n=2)
0.00
0.09
0.19
0.28
0.37
fre
cue
nci
a r
ela
tiva
Ajuste: Normal(101.766,20.940)
89.091.0
93.095.0
97.099.0
101.0103.0
105.0107.0
109.0111.0
113.0
Media (n=5)
0.00
0.05
0.10
0.15
0.20
fre
cue
nci
a r
ela
tiva
Ajuste: Normal(101.766,6.384)
89.0092.43
95.8699.29
102.71106.14
109.57113.00
Media (n=8)
0.00
0.04
0.09
0.13
0.18
fre
cue
nci
a r
ela
tiva
Ajuste: Normal (101.766, 2.792)
n=3
n=2
n=5
n=8
Conclusión
Cuando el tamaño de la muestra aumenta, la varianza de las medias disminuye
22
xEE
n
Error Estándar
Recordando…
Ejemplo
El diámetro de las tortas de girasol se distribuye normalmente con media 18 cm y desviación estándar de 6 cm.
En una muestra de 10 tortas, ¿cuál es la probabilidad de encontrar tortas con diámetro promedio inferior a 16 cm?
Ejemplo
16 1816 1.05 0.14885 0.15
610
P X P Z P Z
¿Cuál es la probabilidad, en una muestra con n=10, de encontrar tortas con diámetro inferior a 16 cm. si la distribución del diámetro se aproxima a una N (18;36/10)?
0 4 7 11 14 18 21 25 28 32 3516
Ejemplo
Tabla de Cuantiles de la Distribución Normal
z área z área z área quantil z
-3.25 0.00058 -1.00 0.15866 1.25 0.89435 0.00001 -4.265
-3.20 0.00069 -0.95 0.17106 1.30 0.90320 0.0001 -3.719
-3.15 0.00082 -0.90 0.18406 1.35 0.91149 0.001 -3.090
-3.10 0.00097 -0.85 0.19766 1.40 0.91924 0.00 -2.576
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
-1.20 0.11507 1.05 0.85314 3.30 0.99952 0.995 2.576
-1.15 0.12507 1.10 0.86433 3.35 0.99960 0.999 3.090
-1.10 0.13567 1.15 0.87493 3.40 0.99966 0.9999 3.719
-1.05 0.14686 1.20 0.88493 3.45 0.99972 0.99999 4.265
Área: P(Zz)
Distribución del estadístico media muestral
1 nX
TS
n
T
Observación: los grados de libertad de la T se corresponden con el tamaño de la muestra con la que se calculó S.
Cuando no se conoce la varianza poblacional:
Grados de
libertad
Distribución T de Student
-5 -4 -3 -2 -1 0 1 2 3 4 50.00
0.11
0.23
0.34
0.45D
ensi
dad
Dist. Normal
Dist. T
Ejemplo
Si la producción diaria de leche se aproxima a una distribución normal y se tiene la siguiente muestra de producciones diarias de leche (en litros):
67.9 69.3 70.0 74.8 75.3 69.6 67.3 65.8 70.5¿Cuál es la probabilidad que una variable T, con los grados de libertad apropiados para este problema, exceda el valor de T obtenido a partir de los datos anteriores, si se supone que la producción promedio de leche en la población es de 67 litros?
Ejemplo
70.06 672.87 0.01
3.199
XP T P T P T
Sn
70.0556 lts.
S = 3.1887 lts.
n = 9
= 67 lts.
X
-5.0 -4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0 5.0
Ejemplo
Tabla de Cuantiles de la Distribución T
0.700 0.725 0.750 0.775 0.800 0.825 0.850 0.875 0.900 0.925 0.950 0.975 0.990 0.995
1 0.727 0.854 1.000 1.171 1.376 1.632 1.963 2.414 3.078 4.165 6.314 12.71 31.82 63.66 2 0.617 0.713 0.816 0.931 1.061 1.210 1.386 1.604 1.886 2.282 2.920 4.303 6.965 9.925 . . . . . . . . . . . . . . . 8 0.546 0.624 0.706 0.794 0.889 0.993 1.108 1.240 1.397 1.592 1.860 2.306 2.896 3.355 9 0.543 0.621 0.703 0.790 0.883 0.986 1.100 1.230 1.383 1.574 1.833 2.262 2.821 3.250
10 0.542 0.619 0.700 0.786 0.879 0.980 1.093 1.221 1.372 1.559 1.812 2.228 2.764 3.169 11 0.540 0.617 0.697 0.783 0.876 0.976 1.088 1.214 1.363 1.548 1.796 2.201 2.718 3.106
. . . . . . . . . . . . . . . 49 0.528 0.602 0.680 0.762 0.849 0.944 1.048 1.164 1.299 1.462 1.677 2.010 2.405 2.680 50 0.528 0.602 0.679 0.761 0.849 0.943 1.047 1.164 1.299 1.462 1.676 2.009 2.403 2.678
0.300 0.275 0.250 0.225 0.200 0.175 0.150 0.125 0.100 0.075 0.050 0.025 0.010 0.005
Distribución asociada al estadístico varianza muestral
Espacio muestral generado por muestreo aleatorio con muestras de tamaño n=2, con reposición, de una población de cuatro plantas de zapallo.Muestra Plantas Nº de
frutosVarianza Muestra Plantas Nº de
frutosVarianza
1 P1P1 3-3 0.0 9 P3P1 1-3 2.0
2 P1P2 3-2 0.5 10 P3P2 1-2 0.5
3 P1P3 3-1 2.0 11 P3P3 1-1 0.0
4 P1P4 3-4 0.5 12 P3P4 1-4 4.5
5 P2P1 2-3 0.5 13 P4P1 4-3 0.5
6 P2P2 2-2 0.0 14 P4P2 4-2 2.0
7 P2P3 2-1 0.5 15 P4P3 4-1 4.5
8 P2P4 2-4 2.0 16 P4P4 4-4 0.0
Distribución del estadístico varianza muestral
Valores que asume la variable aleatoria “varianza muestral del número de frutos” en muestras de tamaño n=2 y sus densidades.
Varianza Muestral
0 4.(1/16) = 0.25
0.5 6.(1/16) = 0.375
2 4.(1/16) = 0.25
4.5 2.(1/16) = 0.125
22P S s
Distribución del estadístico varianza muestral
Función de densidad de la variable aleatoria varianza muestral del número de frutos.
0.00 1.50 3.00 4.50
S2
0.00
0.10
0.20
0.30
0.40
F(s2)
Distribución de las varianzas de muestras con n=3
0.028.1
56.284.3
112.4140.4
168.5196.6
224.7252.8
VarianzaC(n=3)
0.00
0.13
0.27
0.40
0.54
fre
cue
nci
a r
ela
tiva
Estadística descriptivaVariable Media Var(n) VarianzaC(n=3) 44.67 1977.49
Distribución de las varianzas de muestras con n=5
0.012.6
25.237.9
50.563.1
75.788.4
101.0113.6
126.2138.8
VarianzaC(n=5)
0.00
0.06
0.12
0.18
0.24
fre
cue
nci
a r
ela
tiva
Estadística descriptivaVariable Media Var(n) VarianzaC(n=5) 44.67 873.27
Para calcular probabilidades asociadas a varianzas muestrales se utiliza la distribución de la variable:
Distribución Chi cuadrado
2
2
21
( 1) n
S n
Grados de
libertad
Distribución Chi cuadrado
0 4 8 11 150.00
0.12
0.24
0.36
0.48D
en
sid
ad
2 gl
4 gl
6 gl
Ejemplo
Un fitomejorador desea controlar la variabilidad de los brotes comerciales de espárrago, ya que las normas de embalaje establecen una longitud máxima de cajas de 23.5 cm.
La variable largo del brote de espárrago sigue una distribución normal, con una varianza de 2.25 cm2.
Ejemplo
¿Cuál es la probabilidad que una muestra de 5 cajas, tenga una desviación estándar que exceda a 2 cm, si la verdadera desviación estándar es de 1.5 cm?
22 2 2
2
1 4 42 4
2.25
S nP S P S P P
2 27.11 1 7.11 1 0.85 0.15P P
0.0 2.0 4.0 6.0 8.1 10.1 12.1 14.1 16.1 18.1
Ejemplo
Tabla de Cuantiles de la Distribución Chi-Cuadrado
0.010 0.025 0.05 0.10 0.15 0.20 0.25 0.30 0.35 0.40 0.45 0.50
1 0.0002 0.0010 0.0039 0.0158 0.0358 0.0642 0.1015 0.1485 0.2059 0.2750 0.3573 0.4549
. . . . . . . . . . . . .
4 0.2971 0.4844 0.7107 1.0636 1.3665 1.6488 1.9226 2.1947 2.4701 2.7528 3.0469 3.3567
. . . . . . . . . . . . .
49 28.9407 31.5549 33.9303 36.8182 38.8588 40.5344 42.0104 43.3664 44.6491 45.8895 47.1114 48.3350
0.55 0.60 0.65 0.70 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.999
1 0.5707 0.7083 0.8735 1.0742 1.3233 1.6424 2.0723 2.7055 3.8415 5.0239 6.6349 10.8278
. . . . . . . . . . . . .
4 3.6871 4.0446 4.4377 4.8784 5.3853 5.9886 6.7449 7.7794 9.4877 11.1433 13.2767 18.4670
. . . . . . . . . . . . .
49 49.5796 50.8659 52.2186 53.6697 55.2653 57.0786 59.2411 62.0375 66.3386 70.2224 74.9194 85.3511