cuarta

Upload: andres-mauricio-molina-mongui

Post on 18-Oct-2015

134 views

Category:

Documents


1 download

TRANSCRIPT

  • Pgina 1 de 39

    UNIDAD ACADMICA No. 04.

    Nombre de la Unidad: Distribuciones Mustrales y Estimacin por Intervalos

    Introduccin:

    Como se mencion en el captulo uno las nociones de poblacin y muestra son parte fundamental en cualquier investigacin , en este capitulo se estudiaran de manera mas amplia, en particular en el contexto del concepto de variables aleatorias, destacando la importancia de conocer la distribucin muestral de un estadgrafo ya que con esta se puede realizar el proceso de inferencia del parmetro, dado que casi nunca es posible tomar todas las muestras de una poblacin , conociendo la distribucin del estimador se puede hacer la inferencia del mismo a partir de una sola muestra , de igual forma se puede estimar el error para un tamao de muestra dado. Objetivo General de la Unidad: En los anteriores captulos se estudiaron las poblaciones y los parmetros que las describen. Estas poblaciones eran discretas o continuas , y se uso la probabilidad como una herramienta para determinar que tan probables podran ser ciertos resultados muestrales . En este captulo, el enfoque cambia ya que estudiaremos muestras y estadsticos que los describen.

    Objetivos Especficos del Unidad:

    Manejar el concepto del teorema del lmite central.

    Comprender y aplicar las distribuciones muestrales de medias , varianzas y proporciones.

    Realizar estimaciones por intervalos para la media , proporcin y para la varianza.

    RESUMEN En el presente capitulo se describirn las distribuciones mustrales de medias y varianzas en variables cuantitativas, la distribucin muestral de proporciones para variables cualitativas , con las anteriores bases realizar estimaciones por intervalos y su aplicacin en ciencias e Ingeniera.

    GLOSARIO

    MUESTRA ALEATORIA DE TAMAO n : Es un conjunto de n individuos

    tomado de tal manera que cada subconjunto de tamao n de la poblacin

    tenga la misma probabilidad de ser elegido como muestra; es decir, si la

  • Pgina 2 de 39

    poblacin tiene tamao N, cada una de las combinaciones posibles de n

    elementos debe ser equiprobable.

    PARAMETROS: Se llama parmetros poblacionales a cantidades que se

    obtienen a partir de las observaciones de la variable y sus probabilidades y

    que determinan perfectamente la distribucin de esta, as como las

    caractersticas de la poblacin, por ejemplo: La media, , la varianza 2, la

    proporcin de determinados sucesos, P.

    ESTADISTICO: Es una medida cuantitativa, derivada de un conjunto de

    datos de una muestra, con el objetivo de estimar o inferir caractersticas de

    una poblacin o modelo estadstico.

    Desarrollo temtico.

    4.1 Teorema del lmite central. 4.2 Distribucin muestral de medias 4.3 Distribucin muestral de la varianza 4.4 Distribucin muestral de las proporciones 4.5 Estimacin por intervalos

    4.1 Teorema del limite central.

    4.1.1. Error Muestral

    Cuando se calcula un estadstico a partir de una muestra llmese media, desviacin estndar o proporcin para estimar parmetros poblacionales siempre conlleva algn error , por ejemplo supongamos que en un grupo de estadstica tenemos 40 estudiantes (poblacin) y promediamos su estatura obtenindose =1,68 m ( Parmetro poblacional) si elegimos una muestra aleatoria de 15 estudiantes y calculamos la media muestral de estaturas obtenindose

    mx 72,1 (Estadstico) ,observamos que existe una diferencia entre el parmetro y

    el estadstico que denominamos error muestral

    04,072,168,1 xe

    Ejemplo: Suponga que la tabla siguiente muestra la antigedad en aos en el trabajo de cuatro profesores universitarios de matemticas:

  • Pgina 3 de 39

    Profesor de matemticas Antigedad

    A 16

    B 10

    C 8

    D 26

    Si se toman muestras de tamao 2 sin reemplazo. Calcular la media para cada muestra, la media de la distribucin muestral y el error estndar.

    1) Se pueden tener 4C2 =6 muestras posibles. La tabla lista todas las muestras posibles de tamao 2, con sus respectivas medias muestrales.

    Muestras Antigedad Media Muestral

    A,B (16,10) 13

    A,C (16,8) 12

    A,D (16,26) 21

    B,C (10,8) 9

    B,D (10,26) 18

    D,C (8,26) 17

    2) La media poblacional est dada por:

    154

    2681016

    3) La media de la distribucin muestral es:

    156

    17189211213

    x

    Con lo cual podemos deducir que :

    x

    La media poblacional es igual a la media de todas las medias muestrales.

  • Pgina 4 de 39

    4) La desviacin estndar de la poblacin est dada por:

    N

    xn

    i

    i

    1

    2

    En este caso:

    7

    4

    1526158151015162222

    5) El error estndar o la desviacin estndar de la distribucin muestral es:

    4,0414519

    6

    15171518159152115121513222222

    x

    x

    Si utilizamos la frmula del error estndar sin el factor de correccin por poblacin finita tendramos que:

    muestraladetamaoelesnDonde

    nx

    ""

    Evaluando:

    4,94974752

    7

    x

    Como se observa difiere de la desviacin estndar de las medias mustrales calculada. Por lo anterior hay que aplicar el factor de correccin para poblacin finita as:

    1

    N

    nN

    nx

  • Pgina 5 de 39

    Calculando

    4,041451914

    24

    2

    7

    x

    De lo cual concluimos que la desviacion estandart de las medias muestrales es igual a la desviacion estandart poblacional sobre la raiz del tamao de las muestras por el factor de correccion, en caso de ser poblaciones finitas.

    4.1.2. Teorema del limite central1

    Si se seleccionan muestras aleatorias de tamao n de una poblacin con media y desviacin estndar , entonces, si n es grande, la distribucin muestral de medias tendr aproximadamente una distribucin normal con una media igual a

    y una desviacin estndar de n

    x

    . La aproximacin ser cada vez

    ms exacta a medida de que n sea cada vez mayor.1 1Tomado de : http://www.itch.edu.mx/academic/industrial/estadistica1/u0102.pdf 4.2. Distribucin Muestral de medias Recordemos que en la distribucin normal la variable estandarizada nos permita calcular la probabilidad de un evento dada una variable aleatoria mediante:

    lPoblacionadartEsDesviacion

    lPoblacionaMedia

    AleatoriaVariablex

    ladexestaquedartesesdesviaciondeNZ

    Donde

    xZ

    tan

    """"tan

    Cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao de una poblacin normal, la distribucin muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede utilizar la frmula

    de la distribucin normal con x

    y n

    x

    , entonces la frmula para

  • Pgina 6 de 39

    calcular la probabilidad del comportamiento del estadstico, en este caso la media de la muestra , quedara de la siguiente manera:

    muestradeTamaon

    lPoblacionadartEsDesviacion

    muestralesmediaslasdedartEsDesviacionn

    lPoblacionaMedia

    MuestralMediax

    ladexestaquedartesesdesviaciondeNZ

    Donde

    xZ

    x

    x

    tan

    tan

    """"tan

    En general se utiliza:

    n

    xZ

    y para poblaciones finitas y muestro con reemplazo:

    1

    N

    nN

    n

    xZ

    Ejemplo: Una empresa elctrica fabrica 1000 focos diarios, que tienen una duracin que se distribuye aproximadamente en forma normal, con media de 900 horas y desviacin estndar de 50 horas. Encuentre la probabilidad de que una muestra aleatoria de 20 focos tenga una vida promedio de:

    a) Menos de 890 horas b) Ms de 920 horas c) Entre 850 y 950 horas

  • Pgina 7 de 39

    Solucin:

    a) Identificamos los elementos

    N= 1000

    =900

    n= 20

    = 50

    ?890 xP

    Grficamente:

    Al estandarizar

    89,011000

    201000

    20

    50

    900890

    Z

    Por lo tanto

    89,0890 ZPxP Que en la tabla de la distribucin normal:

    %191894,089,0 ZP Con lo que podemos concluir que hay una probabilidad del 19% de que en muestras de

    tamao 20 el promedio de la muestra sea menor de 890 horas. En otras palabras si

    tomamos 100 muestras de tamao 20 en 19 de estas muestras el promedio ser menor

    de 890 horas.

  • Pgina 8 de 39

    b)

    N= 1000

    =900

    n= 20

    = 50

    ?920 xP

    Estandarizando

    1,7711000

    201000

    20

    50

    900920

    Z

    Por lo tanto

    77,1920 ZPxP Que en la tabla de la distribucin normal:

    %40,03840,9616177,1 ZP

    c)

    N= 1000

    =900

    n= 20

    = 50

    ?950850 xP

    Estandarizando

    -4,4311000

    201000

    20

    50

    900850

    Z

    4,4311000

    201000

    20

    50

    900950

    Z

  • Pgina 9 de 39

    Por lo tanto

    43,443,4950850 ZPxP Que en la tabla de la distribucin normal:

    %10070,9999905706-4,71165E80,9999952877,1 ZP

    4.2.1. Distribucin Muestral para la diferencia de promedios

    En la anterior distribucin el cientfico o ingeniero estaba interesado en apoyar una

    conjetura de la media con una poblacin , sin embargo en muchas ocasiones el

    inters puede ser en dos o mas poblaciones y las diferencias entre ellas , situacin

    que podemos resumir asi : si se extraen al azar muestras independientes de

    tamaos n1 y n2 de dos poblaciones discretas o continuas , con medias

    poblacionales 1 y 2 y desviaciones estndar 1 y 2 respectivamente , entonces

    la distribucin muestral para la diferencia de medias estar dada por:

    2

    2

    2

    1

    2

    1

    2121

    nn

    xxZ

    Ejemplo:

    Dos tipos de pintura ofrecen un tiempo de secado promedio de 80 y 60 minutos

    respectivamente con una desviacin estndar de 15 y 13 minutos , si tomamos

    muestras aleatorias de tamaos 25 y 36 respectivamente .Encontrar la

    probabilidad de que la media muestral calculada de las 25 mediciones exceda la

    media muestral de Las 36 mediciones en por lo menos 10 minutos .

    Pintura 1

    1=80

    n1= 25

    1= 15

    Pintura 2

    2=60

    n2= 36

    2= 13

    ?1021 xxP

  • Pgina 10 de 39

    7,2

    36

    13

    25

    15

    608010

    22

    Z

    7,21021 ZPxxP Grficamente

    Que en la tabla de la distribucin normal:

    99,7%0,99650,003517,2 ZP En una prueba de aptitud la puntuacin media de los estudiantes es de 72 puntos y la desviacin estndar es de 8 puntos. Cul es la probabilidad de que dos grupos de estudiantes, formados de 28 y 36 estudiantes, respectivamente, difieran en su puntuacin media en: a. 3 ms puntos. b. 6 o ms puntos. c. Entre 2 y 5 puntos. Grupo 1

    1=72

    n1= 28

    1= 8

    Pintura 2

    2=72

    n2= 36

    2= 8

  • Pgina 11 de 39

    ?321 xxP

    36

    8

    28

    8

    03

    22Z

    4.3. Distribucin Muestral de la Varianza Si se extrae una muestra aleatoria de tamao n de una poblacin normal con media , y varianza 2 ,y se calcula la varianza muestral , se obtiene el valor del estadstico s2 que se utilizara para conocer la 2, mediante una variable aleatoria chi cuadrada con n-1 grados de libertad . Formalizando con el siguiente teorema: si s2 es la varianza de una muestra aleatoria de tamao n que se toma de una poblacin normal que tiene varianza 2 entonces el estadstico :

    2

    22 1

    sn

    Tiene una distribucin chi cuadrado con 1 nv , grados de libertad. Ejemplo:

    Un fabricante de bateras garantiza que su producto dura en promedio 2,5 aos con una desviacin estandart de 0,8 aos . Si se toma una muestra aleatoria de 8

    bateras y resulto que 8,2x y 2,1s Tiene razn el fabricante respecto a la desviacin estndar poblacional?

    1) Calculamos el estadstico

    15,75

    8,0

    2,1*182

    22

    2) Si asumimos un 95% de probabilidad central es decir a la izquierda 0,025 y

    a la derecha 0,975 , para la afirmacin del fabricante , debemos remitirnos a la distribucin chi cuadrado con v=8-1 = 7 grados de libertad, los valores crticos sern:

  • Pgina 12 de 39

    Este ser el valor critico (1,690) a la izquierda , y a la derecha ( 16,013)

  • Pgina 13 de 39

    Como el estadgrafo esta dentro de estos valores podemos afirmar con un 95% de confianza que el fabricante tiene la razn en su afirmacin respecto a la varianza

  • Pgina 14 de 39

    4.4. Distribucin Muestral de las Proporciones2

    Cuando se requiere investigar la proporcin de algn atributo en una muestra (variables cualitativas). La distribucin muestral de proporciones es la adecuada para dar respuesta a estas situaciones. Esta distribucin se genera de igual manera que la distribucin muestral de medias, a excepcin de que al extraer las muestras de la poblacin se calcula el estadstico proporcin (p=x/n en donde "x" es el nmero de xitos u observaciones de inters y "n" el tamao de la muestra) en lugar del estadstico promedio. La frmula que se utilizar para el clculo de probabilidad en una distribucin muestral de proporciones est basada en la aproximacin de la distribucin normal a la binomial . Esta frmula nos servir para calcular la probabilidad del comportamiento de la proporcin en la muestra.

    2 Con base a: http://www.itch.edu.mx/academic/industrial/estadistica1/cap01b.html#distribucionmuestral

    proporciones

    MuestradeTamaon

    PQ

    lPoblacionaoporcionP

    Muestraloporcionp

    Donde

    n

    QP

    PpZ

    :

    1

    Pr:

    Pr:

    :

    *

    Si es una poblacin finita:

    1*

    N

    nN

    n

    QP

    PpZ

  • Pgina 15 de 39

    Ejemplo: La proporcin de hogares en cierta cuidad que usa gas natural es del 45% , si se toma una muestra aleatoria de 250 hogares determinar la probabilidad de que La proporcin de la muestra de hogares con gas natural sea :

    a) menor del 40% b) Mayor del 49%

    a)

    Solucin:

    Datos:

    n=250 Hogares

    45,0

    P

    ?40,0 pP Como se esta aproximando la binomial mediante la normal se debe restar el factor de correccin

    npp

    5,0

    Por lo tanto la formula seria

    n

    QP

    PpZ

    *

    Evaluando:

    65,1

    250

    )45,01(*45,0

    45,0250

    5,04,0

    Z

    65,140,0 ZPpP 5%0,049565,1 ZP

  • Pgina 16 de 39

    b)

    Solucin:

    Datos:

    n=250 Hogares

    45,0

    P

    ?49,0 pP Como se esta aproximando la binomial mediante la normal se debe sumar el factor de correccin

    npp

    5,0

    Por lo tanto la formula seria

    n

    QP

    PpZ

    *

    Evaluando:

    1,33

    250

    )45,01(*45,0

    45,0250

    5,049,0

    Z

    33,149,0 ZPpP 9%0,09180,9082133,1 ZP

  • Pgina 17 de 39

    4.4.1. Distribucin Muestral de Diferencia de Proporciones

    Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes.

    El calculo de probabilidad del estadstico de diferencia de proporciones es:

    2

    22

    1

    11

    2121

    **

    n

    QP

    n

    QP

    PPpp

    Z

    Ejemplo

    Una encuesta de 380 trabajadores de cierta compaa que fueron despedidos entre 1990 y 1999, encontr que 25% haban estado sin trabajo durante por lo menos tres aos. Otra muestra aleatoria de 450 trabajadores de entre todos los empleados despedidos entre 1990 y 1999 arrojo que el 20% haban estado sin trabajo durante por lo menos tres aos . Cul sera la probabilidad de que el porcentaje muestral de trabajadores sin empleo durante por lo menos tres aos, difiera del porcentaje obtenido en la encuesta en 6% o ms?

    En este ejemplo solamente contamos con una poblacin de la que se seleccionan dos muestras por lo tanto:

    1

    P = 0.25

    2

    P = 0.20

    n1 = 380 trabajadores

    n2 = 450 trabajadores

    ?06,021 ppP

  • Pgina 18 de 39

    45.0

    450

    8,0*2,0

    380

    75,0*25,0

    20.025.0

    2

    450380

    5,006,0

    Z

    45.006,021 ZPppP

    3%33264.06736.0145.0 ZP

    4.5. Estimacin por intervalos El principal propsito de la presentacin de variables y sus distribuciones mustrales consiste en realizar conclusiones acerca de los parmetros poblacionales, por ejemplo en el teorema del lmite central est incluida la media poblacional que si lo despejamos quedara en trminos de los estadsticos de la muestra , en este aparte se trabajara de manera formal el propsito de la estadstica inferencial para una y dos poblaciones. 4.5.1. Intervalo de confianza

    Se define como la medida del grado de fiabilidad de la estimacin en el intervalo. Un intervalo de confianza del 95% indica que el 95% de todas las posibles muestras, la estimacin por ejemplo de una (media poblacional) estara en este intervalo y su complemento 5% de las muestras producir un intervalo errneo. Cuanto mayor sea el nivel de confianza podremos creer que el valor del parmetro que se estima est dentro del intervalo.

    4.5.2. Estimacin de la media para muestras grandes Consideremos la estimacin por intervalos para la media a partir de una muestra aleatoria grande donde se conoce la desviacin estndar poblacional. El clculo de la probabilidad esta dado por:

    n

    xZ

    Como el parmetro es el que necesitamos para un intervalo de confianza:

  • Pgina 19 de 39

    Se puede expresar as:

    1

    22

    ZZZP

    Reemplazando el estadstico Z

    122

    Z

    n

    xZP

    Despejando

    EstimaciondeErrorn

    Z

    PuntualEstimadorx

    Donde

    nZx

    nZx

    :

    :

    2

    22

    Ejemplo: Una empresa fabricante de focos que tienen duracin aproximadamente distribuida de forma normal, con una desviacin estndar de 50 horas. Si se toma una muestra aleatoria de 45 focos y se obtiene una duracin promedio de 830 horas, Encontrar en un intervalo de confianza del 95% y el 99% , para la media de todas las bombillas que produce la empresa. De qu tamao debe ser la muestra para que el error de estimacin sea de 10 horas en un intervalo de confianza del 95%? Solucin Para el primer intervalo de confianza (95%) tendremos en la distribucin normal:

  • Pgina 20 de 39

    Datos =50 horas n=45

    830x =?

    EstimaciondeError

    PuntualEstimadorx

    Donde

    :61,1445

    5096,1

    ""830:

    45

    5096,1830

    45

    5096,1830

    InferiorLimite

    SuperiorLimite

    81539,81561,14830

    84561,84461,14830

    Interpretacin: Con la evidencia tomada podemos afirmar que el 95% de todas las muestras de tamao 45 la duracin de los focos estar entre 845 y 815 horas. Para el segundo intervalo de confianza (99%)

  • Pgina 21 de 39

    EstimaciondeError

    PuntualEstimadorx

    Donde

    :16,1945

    5057,2

    ""830:

    45

    5057,2830

    45

    5057,2830

    InferiorLimite

    SuperiorLimite

    81184,81016,19830

    84916,84916,19830

    El tamao de muestra para un error dado:

    EstimaciondeErroree

    Donde

    nZee

    :

    2

    Despejando n

    9604,9610

    50*96,1

    *

    2

    2

    2

    n

    Evaluando

    ee

    Zn

    4.5.3. Estimacin de la media para muestras pequeas En la mayora de las situaciones no es fcil acceder a la desviacin estndar poblacional, motivo por el cual si tomamos evidencia y calculamos el promedio y la desviacin estndar muestral (s) de una poblacin que se comporte de forma aproximadamente normal entonces la variable aleatoria:

    n

    s

    xT

    Tiene una distribucin t de Student con n-1 grados de libertad. 3La apariencia general de la distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas y unimodales, y el valor mximo de la ordenada

    se alcanza en la media 0 Sin embargo, la distribucin t tiene colas ms

    amplias que la normal; esto es, la probabilidad de las colas es mayor que en la

  • Pgina 22 de 39

    distribucin normal. A medida que el nmero de grados de libertad tiende a infinito, la forma lmite de la distribucin t es la distribucin normal estndar. 3Tomado de: www.itch.edu.mx/academic/industrial/estadistica1/cap03.html De manera similar que con la normal podemos construir un intervalo de confianza as:

    1

    22

    tTtP

    Reemplazando el estadstico

    122

    t

    n

    s

    xtP

    Despejando

    EstimaciondeErrorn

    st

    PuntualEstimadorx

    Donde

    n

    stx

    n

    stx

    :

    :

    2

    22

    Ejemplo En cierta obra para recibir a satisfaccin una placa de entrepiso la interventora toma muestras del concreto y al fallarlas se obtuvieron los siguientes datos de resistencia a la comprensin:

  • Pgina 23 de 39

    xi

    3200 3800 2800 3500 2900 3000 3700 2600 3500 3300 2600 2500 3200 2900 3150 2700 3600

    Encontrar un intervalo de confianza del 95% para la resistencia media de toda la placa. Adems la interventora establece que si el lmite inferior de la estimacin esta por debajo de 3000 P.S.I. se tendr que demoler la placa. Solucin Calculamos la media aritmtica y la desviacin estndar muestral

    3409,177798

    23114,70588

    s

    x

    n=17 Los valores crticos para un intervalo de confianza del 95% con v=17-1 =16 grados de libertad sern :

  • Pgina 24 de 39

    En la tabla de la distribucin t el valor critico se establece asi:

  • Pgina 25 de 39

    La estimacin por intervalos ser:

  • Pgina 26 de 39

    39,210

    3114,71

    17

    409,18120,23114,71

    17

    409,18120,23114,71

    EstimaciondeError

    PuntualEstimador

    Donde

    InferiorLimite

    SuperiorLimite

    290432,290439,21071,3114

    332510,332539,21071,3114

    Por lo tanto segn los resultados obtenidos hay que demoler la placa. 4.5.4. Estimacin de la proporcin una poblacin

    Muchos experimentos o encuestas tienen como propsito estimar las proporciones poblacionales a partir de datos mustrales, recordemos el estadstico para calcular la probabilidad del comportamiento de la proporcin en la muestra.

    n

    qp

    PpZ

    *

    De la misma manera que en la estimacin de medias para muestras grandes conociendo la desviacin estandart poblacional , para un intervalo de confianza con la distribucin normal la estimacin por intervalos esta dada por:

    lPoblacionaoporcionP

    EstimaciondeErrorn

    qpZ

    pq

    PuntualEstimadormuestraloporcionp

    Donde

    n

    qpZpP

    n

    qpZp

    Pr:

    :*

    *

    1

    Pr:

    **

    **

    2

    22

  • Pgina 27 de 39

    Ejemplo: En cierta cuidad se selecciona una muestra aleatoria de 500 votantes y se encuentra que 180 aprueban la gestin del alcalde .Encuentre el intervalo de confianza del 96% para la fraccin de la poblacin votante que favorece la gestin del alcalde. De otra parte cual debe ser el tamao de la muestra para que el error de estimacin sea del 2% Solucin:

    04,0

    64,01

    36,0Pr:

    500

    500

    320*

    500

    180

    *05,2500

    180

    500

    500

    320*

    500

    180

    *05,2500

    180

    EstimaciondeError

    pq

    PuntualEstimadormuestraloporcionp

    Donde

    P

    InferiorLimite

    SuperiorLimite

    P

    %3232,004,036,0

    %4040,004,036,0

    La aprobacin del alcalde entre la poblacin votante estar entre el 40 y el 32% El tamao de muestra dado el error de estimacin ser:

    qpee

    Zn **

    2

    2

    Evaluando Es decir se necesita consultar a 2421 personas para que el error de estimacin sea del 2%.

    4.5.5. Estimacin de la diferencia entre medias de dos distribuciones normales, varianzas poblacionales desconocidas pero iguales.

    En muchos experimentos es necesario comparar dos grupos poblacionales para

    tal efecto si 21 ; xx ; s12 y s2

    2 son las medias y las varianzas de dos muestras

    aleatorias de tamao n1 y n2, respectivamente, tomadas de dos poblaciones

    24212420,64

    64,0*36,0*02,0

    05.22

    n

    n

  • Pgina 28 de 39

    normales e independientes con varianzas desconocidas pero iguales, entonces un intervalo de confianza del 1 por ciento para la diferencia entre medias es:

    ""2

    2

    11

    :11

    *

    :

    11*

    11*

    21

    21

    2

    22

    2

    112

    212

    21

    212

    2121

    212

    21

    LibertaddeGradosnnv

    nn

    snsnS

    Con

    EstimaciondeErrornn

    St

    PuntualEstimadorxx

    Donde

    nnStxx

    nnStxx

    P

    p

    pp

    Ejemplo:

    4Un experimento publicado en una revista cientfica compara las economas en combustible para dos tipos de camiones compactos a disel con similares caractersticas. Se utilizaron 12 camiones Nissan y 10 Toyota en pruebas a velocidad constante , si los camiones Nissan promediaron 16 km/litro, con una desviacin estndar de 1 km/litro y los Toyota promediaron 11 km/litro, con una desviacin estndar de 0,8 km/litro , construya un intervalo de confianza del 95% para la diferencia entre los kilmetros promedio de estos dos camiones compactos .Suponga que las distancias por litro para cada modelo de camin estn distribuidas de forma aproximadamente normal con varianzas iguales.

    4Problema Propuesto Pagina 298 ( 9.42) en el libro de : Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007

  • Pgina 29 de 39

    Solucin:

    1

    12

    16

    1

    1

    s

    n

    x

    Nissan

    8,0

    10

    11

    2

    2

    s

    n

    x

    Toyota

    Para establecer el valor critico en el intervalo de confianza dado calculamos los grados de libertad.

    2021012

    ""221

    v

    LibertaddeGradosnnv

    En la tabla el valor crtico es:

    086,22

    t

    La varianza muestral asociada:

    90,91542339

    0,838

    20

    8,01101112

    2

    11

    2

    22

    2

    21

    2

    22

    2

    112

    PS

    S

    S

    nn

    snsnS

    P

    P

    P

    El intervalo de confianza

    ""82,011

    *

    ""5

    10

    1

    12

    19154,0*086,21116

    10

    1

    12

    19154,0*086,21116

    11*

    11*

    212

    21

    21

    212

    2121

    212

    21

    EstimaciondeErrornn

    St

    PuntualEstimadorxx

    Donde

    nnStxx

    nnStxx

    p

    pp

  • Pgina 30 de 39

    InferiorLimite

    SuperiorLimite

    418,482,05

    682,582,05

    21

    La diferencia de consumo entre los camiones Nissan y Toyota estar entre 4 y 6 kilmetros por litro a favor de Nissan ( ms econmico).

    4.5.6. Estimacin de la diferencia entre medias de dos distribuciones normales, varianzas poblacionales desconocidas y diferentes.

    Para este caso se compararan dos grupos poblacionales en los cuales su variabilidad con respecto a la medias difiere. El estadstico que se usara es:

    2

    2

    2

    1

    2

    1

    2121

    n

    S

    n

    S

    xxT

    Con grados de Libertad:

    11 2

    2

    2

    2

    2

    1

    2

    1

    2

    1

    2

    2

    2

    2

    1

    2

    1

    n

    n

    s

    n

    n

    s

    n

    s

    n

    s

    v

    Si despejamos del estadstico la diferencia de medias poblacionales la estimacin por intervalos estar dada por:

  • Pgina 31 de 39

    LibertaddeGrados

    n

    n

    s

    n

    n

    s

    n

    s

    n

    s

    v

    Con

    EstimaciondeErrorn

    S

    n

    St

    PuntualEstimadorxx

    Donde

    n

    S

    n

    Stxx

    n

    S

    n

    Stxx

    :

    11

    :

    :

    2

    2

    2

    2

    2

    1

    2

    1

    2

    1

    2

    2

    2

    2

    1

    2

    1

    2

    2

    2

    1

    2

    1

    2

    21

    2

    2

    2

    1

    2

    1

    22121

    2

    2

    2

    1

    2

    1

    221

    Ejemplo: 5Una compaa de taxis trata de decidir si comprar neumticos de la marca A o de la B para su flotilla. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento utilizando 12 neumticos de cada marca .Los neumticos se utilizan hasta que se desgastan los resultados fueron:

    kms

    n

    kmx

    ANeumati

    000.5

    12

    300.36

    cos

    1

    1

    1

    kms

    n

    kmx

    BNeumati

    500.8

    12

    100.38

    cos

    2

    2

    2

    Calcule un intervalo de confianza de 95% para la diferencia de medias poblacionales asumiendo que sus varianzas poblacionales son desconocidad y diferentes.

    5Problema Propuesto Pagina 298 ( 9.43) en el libro de : Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007

  • Pgina 32 de 39

    Solucin: Los grados de libertad:

    18717,7984730

    112

    12

    8500

    112

    12

    5000

    12

    8500

    12

    5000

    22

    22

    222

    v

    El valor critico en la tabla t para estos grados de libertad.

    101,22

    t

    El intervalo de confianza

    ""5981,08858

    ""800.1

    2

    2

    2

    1

    2

    1

    2

    12

    2

    2

    2

    1

    2

    1

    21212

    2

    2

    2

    1

    2

    1

    212

    EstimaciondeErrorn

    S

    n

    St

    PuntualEstimadorxx

    Donde

    n

    S

    n

    Stxx

    n

    S

    n

    Stxx

    InferiorLimite

    SuperiorLimite

    181.4981.5800.1

    781.7981.5800.1

    21

    Con el resultado obtenido podemos concluir que como en el intervalo esta el cero , en la poblacion no hay diferencias entre la duracion de los neumaticos. Esto ocurre cuendo el error de estimacion es mayor que el estimador puntual. 4.5.7. Estimacin por intervalos para observaciones pareadas En algunos experimentos comparativos simples puede conseguirse un mejoramiento significativo de la precisin haciendo comparaciones de observaciones pareadas del material experimental es decir cuando las muestras no son independientes. 6Por ejemplo, considere una compaa de taxis que trata de decidir si el uso de llantas radiales en lugar de llantas regulares con cinturn mejora la economa de combustible. Se equipan 16 automviles con llantas radiales y se manejan por un recorrido de prueba establecido. Sin cambiar de conductores, se equipan los

  • Pgina 33 de 39

    mismos autos con llantas regulares con cinturn y se manejan una vez ms por el recorrido de prueba. Se registra el consumo de gasolina, en kilmetros por litro, de la siguiente manera:

    Automvil Llantas radiales Llantas con cinturn

    1 4.2 4.1

    2 4.7 4.9

    3 6.6 6.2

    4 7.0 6.9

    5 6.7 6.8

    6 4.5 4.4

    7 5.7 5.7

    8 6.0 5.8

    9 7.4 6.9

    10 4.9 4.9

    11 6.1 6.0

    12 5.2 4.9

    13 5.7 5.3

    14 6.9 6.5

    15 6.8 7.1

    16 4.9 4.8

    Para determinar cual ser la diferencia en el consumo de gasolina en la poblacin de llantas radiales y con cinturn tendremos:

    6Similar al propuesto en la pagina 360 (10.43) en el libro de: Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007

  • Pgina 34 de 39

    n

    Std

    n

    Std DD

    D

    22

    Donde ecombustibldeeconomialaenpoblacionlaparasdiferencialasdeMediaD

    La notacin de D es para recordar que la muestra pareada produce datos de diferencia . La media y la desviacin estandart de la muestra esta dada por:

    n

    d

    d

    n

    i

    i 1 Media de las diferencias

    1

    1

    2

    n

    dd

    S

    n

    i

    i

    D Desviacin Estandart para la diferencia de medias

    Si suponemos que la poblacin tiene distribucin normal , se puede aplicar la distribucin t con n-1 grados de libertad Evaluando en este caso tenemos:

    Automvil

    Llantas

    radiales

    Llantas con

    cinturn

    1 4,2 4,1 0,1 0,000976562 4,7 4,9 -0,2 0,10972656

    3 6,6 6,2 0,4 0,072226564 7 6,9 0,1 0,000976565 6,7 6,8 -0,1 0,053476566 4,5 4,4 0,1 0,000976567 5,7 5,7 0 0,017226568 6 5,8 0,2 0,004726569 7,4 6,9 0,5 0,1359765610 4,9 4,9 0 0,0172265611 6,1 6 0,1 0,0009765612 5,2 4,9 0,3 0,0284765613 5,7 5,3 0,4 0,0722265614 6,9 6,5 0,4 0,07222656

    15 6,8 7,1 -0,3 0,1859765616 4,9 4,8 0,1 0,00097656

    Sumas 2,1 0,774375

    id 2dd i

    13125.016

    1.21

    n

    d

    d

    n

    i

    i

    2272.0

    116

    477375.0

    1

    1

    2

    n

    dd

    S

    n

    i

    i

    D

  • Pgina 35 de 39

    El valor critico para v=16-1=15 grados de libertad

    131,22

    t

    La estimacin

    16

    23,0131,213,0

    16

    23,0131,213,0 D

    InferiorLimite

    SuperiorLimite

    D

    12,025,013,0

    38,025,013,0

    De acuerdo al resultado, podemos afirmar que no existe diferencia en el consumo de gasolina por el hecho de usar llantas radiales con cinturn. 4.5.8. Estimacin por intervalos para la varianza Para este caso se usara la distribucin chi cuadrado que no es simtrica por lo tanto los valores crticos son diferentes por ejemplo para 24 grados de libertad con un intervalo de confianza de 95% sus valores son :

    El intervalo de confianza esta dado por :

    2

    2

    22

    2

    21

    2 11

    snsn

    Ejemplo ( Tomado de Walpole Myers Pagina 307) , Probabilidad y Estadstica para Ingeniera y Ciencias , Octava edicin , Editorial Pearson)

    Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que distribuye esta compaa, suponga una poblacin normal.

    Solucin:

    Primero se calcula la desviacin estndar de la muestra:

  • Pgina 36 de 39

    al elevar este resultado al cuadrado se obtiene la varianza de la muestra s2= 0.286.

    Para obtener un intervalo de confianza de 95% se elige un = 0.05. Despus con el uso de la tabla con 9 grados de libertad se obtienen los valores de X2.

    Se puede observar en la grfica anterior que el valor de X2 corre en forma normal, esto es de izquierda a derecha.

    Por lo tanto, el intervalo de confianza de 95% para la varianza es:

  • Pgina 37 de 39

    Se observa que la varianza corre en sentido contrario, pero esto es slo en la grfica. La interpretacin quedara similar a nuestros temas anteriores referentes a estimacin. Con un nivel de confianza del 95% se sabe que la varianza de la poblacin de los pesos de los paquetes de semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.

    4.6 Autoevaluacin

    1) Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye

    normalmente con media de 2000 libras y una varianza de 25,000 lbs2. Si se

    selecciona una muestra aleatoria de 100 cuerdas; determine la probabilidad

    de que en esa muestra: La resistencia media encontrada sea de por lo

    menos 1958 libras.

    Problema Propuesto en : http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html

    2) En una prueba de aptitud la puntuacin media de los estudiantes es de 72

    puntos y la desviacin estndar es de 8 puntos. Cul es la probabilidad de

    que dos grupos de estudiantes, formados de 28 y 36 estudiantes,

    respectivamente, difieran en su puntuacin media en 3 ms puntos.

    Problema Propuesto en : http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html

    3) Un especialista en gentica ha detectado que el 26% de los hombres y el

    24% de las mujeres de cierta regin del pas tiene un leve desorden

    sanguneo; si se toman muestras de 150 hombres y 150 mujeres, determine

    la probabilidad de que la diferencia muestral de proporciones que tienen ese

    leve desorden sanguneo sea de Menos de 0.035 a favor de los hombres.

    Problema Propuesto en : http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html

    4) La vida media de una mquina para hacer pasta es de siete aos, con una

    desviacin estndar de un ao. Suponga que las vidas de estas mquinas

    siguen aproximadamente una distribucin normal, encuentre La probabilidad

    de que la vida media de una muestra aleatoria de 9 de estas mquinas sea

    mayor de 6.4 aos.

    Problema propuesto ( Pagina 252 8.25 ) en el libro de: Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007

    5) La vida media de una mquina para hacer pasta es de siete aos, con una desviacin estndar de un ao. Suponga que las vidas de estas mquinas siguen aproximadamente una distribucin normal, encuentre el valor de la a la derecha del cual caera el 15% de las medias calculadas de muestras aleatorias de tamao nueve.

  • Pgina 38 de 39

    6) Se llevan a cabo dos experimentos independientes en lo que se comparan

    dos tipos diferentes de pintura. Se pintan 18 especmenes con el tipo A y en

    cada uno se registra el tiempo de secado en horas. Lo mismo se hace con el

    tipo B. Se sabe que las desviaciones estndar de la poblacin son ambas

    1.0. Suponga que el tiempo medio de secado es igual para los dos tipo de

    pintura. Encuentre la probabilidad de que la diferencia de medias en el

    tiempo de secado sea mayor a uno a favor de la pintura A.

    Problema Propuesto en : http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html

    7) Una muestra de 6 latas de sopa producidas por dos compaas produjo los siguientes pesos netos, medidos en onzas:

    11.9 12.2 11.6 12.1 12.1 11.8 Compaa "A"

    12.9 11.8 12.0 12.3 12.8 12.0 Compaa "B"

    Si se supone normalidad en los pesos, construya un intervalo de confianza del 95% para la diferencia de los pesos promedio de todas las latas de sopa producidas por las compaas, suponga varianzas poblacionales diferentes y desconocidas.

    Similar al planteado en :

    http://www.itch.edu.mx/academic/industrial/estadistica1/cap03e.html

    8) Los siguientes datos registrados en das, representan el tiempo de recuperacin para pacientes que se tratan al azar con uno de los medicamentos para curar infecciones graves de la vejiga:

    Medicamento 1 Medicamento 2

    n1 = 14 n2 = 16

    x1 = 17 x2 = 19

    s12 = 1.5 s22 = 1.8

  • Pgina 39 de 39

    Encuentre un intervalo de confianza de 99% para la diferencia promedio en el tiempo de recuperacin para los dos medicamentos, suponga poblaciones normales con varianzas iguales.

    Problema propuesto ( Pagina 297 9.41 ) en el libro de: Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007

    9) Cierto genetista se interesa en la proporcin de hombres y mujeres en la poblacin que tienen cierto trastorno sanguneo menor. En una muestra aleatoria de 1000 hombres se encuentra que 250 lo padecen, calcule un intervalo de confianza del 95% para la proporcin entre la poblacin de de hombres que padecen el trastorno sanguneo.

    Problema propuesto ( Pagina 305 9.65 ) en el libro de: Probabilidad y Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson , edicin Octava 2007

    10)Una muestra de 12 latas de sopa producida por cierta compaa produjo los siguientes pesos netos, medidos en onzas:

    11.9 12.2 11.6 12.1 12.1 11.8 11.9 11.8 12.0 12.3 11.8 12.0

    Si se supone normalidad en los pesos, construya un intervalo de confianza del 95% para la varianza de todas las latas de sopa producidas por la compaa.

    3.6 REFERENCIAS BIBLIOGRFICAS

    Probabilidad y Estadstica para Ingeniera y Ciencias , Walpole , Myres ,

    Myres Ye .Steven, Octava Edicin , Pearson Educacion 2007. p 1-28.

    Apuntes de Clase Probabilidad y Estadstica, Ing. Nstor Humberto Agudelo

    Daz. 1998-2013.