distribución de muestreo
DESCRIPTION
Distribucion de muestro estadistica 2TRANSCRIPT
-
DISTRIBUCIN DE MUESTREO
-
CONCEPTOS GENERALES En el campo de la inferencia estadstica el estadstico se
interesa en llegar a conclusiones con respecto a la poblacin cuando es imposible o poco prctico observar todo el conjunto de observaciones que constituyen la poblacin. Por tanto, debemos depender de un subconjunto de observaciones de la poblacin para ayudarnos a hacer inferencias a la misma poblacin. Esto nos lleva a considerar la nocin de muestreo.
Una muestra es un subconjunto de una poblacin , que tiene las siguientes caractersticas:
1
)(
;/
2
2
n
xx
Snxx ii
i
i
-
CONCEPTOS GENERALES
El campo de la inferencia estadstica trata bsicamente con
generalizaciones y predicciones. Un estadstico es una
variable aleatoria que depende slo de la muestra observada,
y debe tener una distribucin de probabilidad.
La distribucin de probabilidad de un estadstico se llama
distribucin muestral.
-
DISTRIBUCIONES MUESTRALES DE
MEDIAS La primera distribucin muestral importante a considerar es la de
la media
Suponga que una muestra aleatoria de n observaciones se toma de una poblacin normal con media y varianza 2 , cada observacin xi para i=1,2,3n, de la muestra tendr la misma distribucin normal que la poblacin que se muestrea.
La media y varianza de la distribucin de medias muestrales tiene las siguientes caractersticas:
22
321
321
var
...
/)...(
nianzay
n
mediaconnormalndistribuciunaTiene
nxxxxx
xx
nx
n
-
TEOREMA DEL LIMITE CENTRAL
Si es la media de una muestra aleatoria de tamao n
tomada de una poblacin con media y varianza 2 , entonces la forma lmite de la distribucin de
Conforme n , es la distribucin normal estndar n (z; 0,1 )
n
Xz
/
x
-
TEOREMA DEL LIMITE CENTRAL
La aproximacin normal para x por lo general ser buena si
n 30 sin importar la forma de la poblacin. Si n < 30, la
aproximacin es buena si la poblacin no es muy diferente de
una distribucin normal, y como se dijo antes, si se sabe que
la poblacin es normal, la distribucin muestral de x seguir
una distribucin normal exacta, no importa qu tan pequeo
sea el tamao de las muestras.
-
Ejemplo Una empresa de material elctrico fabrica bombillas de luz
que tienen una duracin que se distribuye aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 bombillas tenga una vida promedio de menos de 775 horas.
= 800
=40
16= 10
= 775
=775800
10=-2.5
P( < 775) = < 2.5 = 0.0062
-
DISTRIBUCIN MUESTRAL DE S2
Si se extrae una muestra aleatoria de tamao n de una
poblacin normal con media y varianza 2 , y se calcula la varianza muestral S2, podemos considerar la distribucin de
la estadstica :
2
1
2
2
2
1
2
2
)()1(
1
)(
n
ii
n
ii
xxSn
n
xxS
-
DISTRIBUCIN MUESTRAL DE S2
Si S2 es la varianza de una muestra aleatoria de tamao n que
se toma de una poblacin normal que tiene la varianza 2 , entonces la estadstica
libertaddegradosnvconcuadradajindistriuciunatiene
xxSnn
ii
1
)()1(2
1
2
2
2
2
-
Ejemplo Un fabricante de baterias para automvil garantiza que sus bateras
durarn, en promedio, 3 aos con una desviacin estndar de 1 ao. Si cinco de estas bateras tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 aos. el fabricante an est convencido de que sus bateras tienen un desviacin estndar de 1 ao? Suponga que la duracin de la batera sigue una distribucin normal.
Como 95% de los valores de 2 con 4 grados de libertad caen entre 0,484 y 11,143 el valor calculado con 2 = 1 es razonable. Por lo tanto, el fabricante tiene razon.
2 = ( )2
1=0,815
2 =(1)2
2=3,26
-
DISTRIBUCIN T DE STUDENT
El teorema del lmite central se utiliza para hacer inferencias
acerca de la media de la poblacin o la proporcin. Sin
embargo, para utilizar el teorema del lmite central se supuso
que la varianza o desviacin estndar de la poblacin se
conoce.
Sin embargo, en muchos casos no se conoce la desviacin
estndar y se tiene que hacer una estimacin de S. Como
resultado, una estadstica natural a considerar para tratar con
las inferencias sobre es :
n
S
xt
-
DISTRIBUCIN T DE STUDENT Para derivar la ecuacin de esta distribucin, W.S. Gosset
supone que las muestras se seleccionan de una poblacin normal. La distribucin t es similar a la distribucin z, pues ambas son simtricas alrededor de una media de cero.
Ambas distribuciones tienen forma de campana, pero la distribucin t es ms variable, debido al hecho de que los valores de t dependen de las fluctuaciones de dos cantidades, x y S2 , mientras que los valores de z dependen slo de los cambios de x de una muestra a otra.
Unicamente cuando el tamao de la muestra tiende a ser grande las dos distribuciones sern la misma.
-
DISTRIBUCIN T DE STUDENT
Curva de distribucin t para v = 10 grados de libertad
-
DISTRIBUCIN T DE STUDENT
Se acostumbra representar con t , el valor de t por arriba
del cual encontramos un rea igual a . De aqu, el valor t con 10 grados de libertad que deja un rea de 0.025 a la
derecha es, t = 2.228. Como la distribucin t es simtrica
alrededor de una media de cero, tenemos:
t1- = - t ; es decir, el valor t que deja un rea de 1-
a la derecha y por tanto un rea de a la izquierda, es igual al valor t negativo que deja un rea de en la cola derecha de la distribucin.
-
Ejemplo Un ingeniero qumico afirma que el rendimiento medio de la
poblacin de cierto proceso en lotes es 500 gramos por milmetro de materia prima. Para verificar dicha afirmacin muestrea 25 lotes cada mes. Si el valor t calculado cae entre 0.05 0.05 queda satisfecho con su afirmacin. Qu conclusin debera obtener de una muestra que tiene una media = 518 y una desviacin estndar muestral s=40 gramos? Suponga que la distribucin de rendimientos es aproximadamente normal.
=
51850040
25
=2.25
0.05 =1.711 para 24 grados de libertad. Rango de evaluacin -1.711 y 1.711. El fabricante concluye que el proceso produce un mejor producto del que pensaba.
-
DISTRIBUCIN F DE FISHER
La distribucin t de Student se utiliza cuando comparamos
dos o ms medias muestrales. Aunque es de inters que la
informacin muestral arroje luz sobre dos medias de
poblaciones, es frecuente el caso en el que una comparacin,
de la variabilidad sea igual de importante, si no es que ms.
La distribucin F encuentra enorme aplicacin en la
comparacin de varianzas muestrales.
-
DISTRIBUCIN F DE FISHER
La estadstica F se define como la razn de dos variables
aleatorias independientes ji cuadradas, divididas cada una
entre su nmero de grados de libertad.
2
2
2
2
2
1
2
1
2
2
2
2
22
1
2
1
2
11
2
2
2
1
2
1
)1()1(
)1()1(
S
S
nSn
nSn
F
-
DISTRIBUCIN F DE FISHER
Si son las varianzas de muestras aleatorias
independientes de tamao n1 y n2 tomadas de poblaciones
normales con varianza
respectivamente.
tiene una distribucin F con v1 = n1 -1 y v2 = n2 1 grados de
libertad.
2
2
2
1SyS
2
2
2
1 y
2
2
2
1
2
1
2
2
2
2
2
2
2
1
2
1
S
S
S
S
F
-
DISTRIBUCIN F DE FISHER
En muchas tablas F de Fisher se dan los valores para dos
niveles de = 0.05 y = 0.01, sin embargo, por medio del siguiente teorema podemos utilizar las tablas F de Fisher
para encontrar valores de 0.95 0.99.
),(
1),(
:
,)(
12
211
2121
ff
obtenemos
libertaddegradosyconfparayfescribirAl
-
Ejemplo
Considere las siguientes mediciones de la capacidad de
produccin de calor del carbn producido por dos minas( en
millones de caloras por tonelada):
Mina 1: 8260 8130 8350 8070 8340
Mina 2: 7950 7890 7900 8140 7920 7840
Se puede concluir que son iguales las dos varianzas de
poblacin?
-
Solucin
12 = 2
2
1 = 8230 12=15,750
2 = 7940 22=10,920
F = 1
222
2212
=1
2
22 = 1,44
90% de confianza
F0.05,4,5=5,19
F0.95,4,5=1
F0.05,5,4=
1
6,26=0,1597
0,1597