distribución de muestreo

Upload: reinaldo-pineda

Post on 05-Mar-2016

781 views

Category:

Documents


18 download

DESCRIPTION

Distribucion de muestro estadistica 2

TRANSCRIPT

  • DISTRIBUCIN DE MUESTREO

  • CONCEPTOS GENERALES En el campo de la inferencia estadstica el estadstico se

    interesa en llegar a conclusiones con respecto a la poblacin cuando es imposible o poco prctico observar todo el conjunto de observaciones que constituyen la poblacin. Por tanto, debemos depender de un subconjunto de observaciones de la poblacin para ayudarnos a hacer inferencias a la misma poblacin. Esto nos lleva a considerar la nocin de muestreo.

    Una muestra es un subconjunto de una poblacin , que tiene las siguientes caractersticas:

    1

    )(

    ;/

    2

    2

    n

    xx

    Snxx ii

    i

    i

  • CONCEPTOS GENERALES

    El campo de la inferencia estadstica trata bsicamente con

    generalizaciones y predicciones. Un estadstico es una

    variable aleatoria que depende slo de la muestra observada,

    y debe tener una distribucin de probabilidad.

    La distribucin de probabilidad de un estadstico se llama

    distribucin muestral.

  • DISTRIBUCIONES MUESTRALES DE

    MEDIAS La primera distribucin muestral importante a considerar es la de

    la media

    Suponga que una muestra aleatoria de n observaciones se toma de una poblacin normal con media y varianza 2 , cada observacin xi para i=1,2,3n, de la muestra tendr la misma distribucin normal que la poblacin que se muestrea.

    La media y varianza de la distribucin de medias muestrales tiene las siguientes caractersticas:

    22

    321

    321

    var

    ...

    /)...(

    nianzay

    n

    mediaconnormalndistribuciunaTiene

    nxxxxx

    xx

    nx

    n

  • TEOREMA DEL LIMITE CENTRAL

    Si es la media de una muestra aleatoria de tamao n

    tomada de una poblacin con media y varianza 2 , entonces la forma lmite de la distribucin de

    Conforme n , es la distribucin normal estndar n (z; 0,1 )

    n

    Xz

    /

    x

  • TEOREMA DEL LIMITE CENTRAL

    La aproximacin normal para x por lo general ser buena si

    n 30 sin importar la forma de la poblacin. Si n < 30, la

    aproximacin es buena si la poblacin no es muy diferente de

    una distribucin normal, y como se dijo antes, si se sabe que

    la poblacin es normal, la distribucin muestral de x seguir

    una distribucin normal exacta, no importa qu tan pequeo

    sea el tamao de las muestras.

  • Ejemplo Una empresa de material elctrico fabrica bombillas de luz

    que tienen una duracin que se distribuye aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 bombillas tenga una vida promedio de menos de 775 horas.

    = 800

    =40

    16= 10

    = 775

    =775800

    10=-2.5

    P( < 775) = < 2.5 = 0.0062

  • DISTRIBUCIN MUESTRAL DE S2

    Si se extrae una muestra aleatoria de tamao n de una

    poblacin normal con media y varianza 2 , y se calcula la varianza muestral S2, podemos considerar la distribucin de

    la estadstica :

    2

    1

    2

    2

    2

    1

    2

    2

    )()1(

    1

    )(

    n

    ii

    n

    ii

    xxSn

    n

    xxS

  • DISTRIBUCIN MUESTRAL DE S2

    Si S2 es la varianza de una muestra aleatoria de tamao n que

    se toma de una poblacin normal que tiene la varianza 2 , entonces la estadstica

    libertaddegradosnvconcuadradajindistriuciunatiene

    xxSnn

    ii

    1

    )()1(2

    1

    2

    2

    2

    2

  • Ejemplo Un fabricante de baterias para automvil garantiza que sus bateras

    durarn, en promedio, 3 aos con una desviacin estndar de 1 ao. Si cinco de estas bateras tienen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 aos. el fabricante an est convencido de que sus bateras tienen un desviacin estndar de 1 ao? Suponga que la duracin de la batera sigue una distribucin normal.

    Como 95% de los valores de 2 con 4 grados de libertad caen entre 0,484 y 11,143 el valor calculado con 2 = 1 es razonable. Por lo tanto, el fabricante tiene razon.

    2 = ( )2

    1=0,815

    2 =(1)2

    2=3,26

  • DISTRIBUCIN T DE STUDENT

    El teorema del lmite central se utiliza para hacer inferencias

    acerca de la media de la poblacin o la proporcin. Sin

    embargo, para utilizar el teorema del lmite central se supuso

    que la varianza o desviacin estndar de la poblacin se

    conoce.

    Sin embargo, en muchos casos no se conoce la desviacin

    estndar y se tiene que hacer una estimacin de S. Como

    resultado, una estadstica natural a considerar para tratar con

    las inferencias sobre es :

    n

    S

    xt

  • DISTRIBUCIN T DE STUDENT Para derivar la ecuacin de esta distribucin, W.S. Gosset

    supone que las muestras se seleccionan de una poblacin normal. La distribucin t es similar a la distribucin z, pues ambas son simtricas alrededor de una media de cero.

    Ambas distribuciones tienen forma de campana, pero la distribucin t es ms variable, debido al hecho de que los valores de t dependen de las fluctuaciones de dos cantidades, x y S2 , mientras que los valores de z dependen slo de los cambios de x de una muestra a otra.

    Unicamente cuando el tamao de la muestra tiende a ser grande las dos distribuciones sern la misma.

  • DISTRIBUCIN T DE STUDENT

    Curva de distribucin t para v = 10 grados de libertad

  • DISTRIBUCIN T DE STUDENT

    Se acostumbra representar con t , el valor de t por arriba

    del cual encontramos un rea igual a . De aqu, el valor t con 10 grados de libertad que deja un rea de 0.025 a la

    derecha es, t = 2.228. Como la distribucin t es simtrica

    alrededor de una media de cero, tenemos:

    t1- = - t ; es decir, el valor t que deja un rea de 1-

    a la derecha y por tanto un rea de a la izquierda, es igual al valor t negativo que deja un rea de en la cola derecha de la distribucin.

  • Ejemplo Un ingeniero qumico afirma que el rendimiento medio de la

    poblacin de cierto proceso en lotes es 500 gramos por milmetro de materia prima. Para verificar dicha afirmacin muestrea 25 lotes cada mes. Si el valor t calculado cae entre 0.05 0.05 queda satisfecho con su afirmacin. Qu conclusin debera obtener de una muestra que tiene una media = 518 y una desviacin estndar muestral s=40 gramos? Suponga que la distribucin de rendimientos es aproximadamente normal.

    =

    51850040

    25

    =2.25

    0.05 =1.711 para 24 grados de libertad. Rango de evaluacin -1.711 y 1.711. El fabricante concluye que el proceso produce un mejor producto del que pensaba.

  • DISTRIBUCIN F DE FISHER

    La distribucin t de Student se utiliza cuando comparamos

    dos o ms medias muestrales. Aunque es de inters que la

    informacin muestral arroje luz sobre dos medias de

    poblaciones, es frecuente el caso en el que una comparacin,

    de la variabilidad sea igual de importante, si no es que ms.

    La distribucin F encuentra enorme aplicacin en la

    comparacin de varianzas muestrales.

  • DISTRIBUCIN F DE FISHER

    La estadstica F se define como la razn de dos variables

    aleatorias independientes ji cuadradas, divididas cada una

    entre su nmero de grados de libertad.

    2

    2

    2

    2

    2

    1

    2

    1

    2

    2

    2

    2

    22

    1

    2

    1

    2

    11

    2

    2

    2

    1

    2

    1

    )1()1(

    )1()1(

    S

    S

    nSn

    nSn

    F

  • DISTRIBUCIN F DE FISHER

    Si son las varianzas de muestras aleatorias

    independientes de tamao n1 y n2 tomadas de poblaciones

    normales con varianza

    respectivamente.

    tiene una distribucin F con v1 = n1 -1 y v2 = n2 1 grados de

    libertad.

    2

    2

    2

    1SyS

    2

    2

    2

    1 y

    2

    2

    2

    1

    2

    1

    2

    2

    2

    2

    2

    2

    2

    1

    2

    1

    S

    S

    S

    S

    F

  • DISTRIBUCIN F DE FISHER

    En muchas tablas F de Fisher se dan los valores para dos

    niveles de = 0.05 y = 0.01, sin embargo, por medio del siguiente teorema podemos utilizar las tablas F de Fisher

    para encontrar valores de 0.95 0.99.

    ),(

    1),(

    :

    ,)(

    12

    211

    2121

    ff

    obtenemos

    libertaddegradosyconfparayfescribirAl

  • Ejemplo

    Considere las siguientes mediciones de la capacidad de

    produccin de calor del carbn producido por dos minas( en

    millones de caloras por tonelada):

    Mina 1: 8260 8130 8350 8070 8340

    Mina 2: 7950 7890 7900 8140 7920 7840

    Se puede concluir que son iguales las dos varianzas de

    poblacin?

  • Solucin

    12 = 2

    2

    1 = 8230 12=15,750

    2 = 7940 22=10,920

    F = 1

    222

    2212

    =1

    2

    22 = 1,44

    90% de confianza

    F0.05,4,5=5,19

    F0.95,4,5=1

    F0.05,5,4=

    1

    6,26=0,1597

    0,1597