00 libro estadisticainferencial universidad tumbes

Upload: ylderheli

Post on 03-Apr-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    1/18

    Universidad Nacional de Tumbes

    77

    CAPITULO 7: ESTADISTICA INFERENCIAL

    7.1 INTRODUCCIN

    Es evidente que un conocimiento previo por parte del investigador de las caractersticas de larealidad de la poblacin mejora o debe mejorar los resultados inferenciales que se pueden obtenerde la obtencin de una muestra; parece claro que si bien el mtodo de seleccin aleatoria conllevalos mejores resultados, quiz el adecuar la manera de extraer la muestra a las posibles distintasnaturalezas de las poblaciones puede mejorar el rendimiento, aunque slo fuere a nivel de costos.No es por tanto lo mismo intentar conocer la altura media de los habitantes de un pas, que elnmero de errores en una gran contabilidad, dado que la naturaleza de su universo y por tanto elcomportamiento poblacional son distintos. Es por ello, que para distintas "naturalezas" delproblema han de plantearse distintas soluciones, si bien todas, o casi todas, pasan por laaleatoriedad; de ah que se establezcan diversas "tcnicas" o "mtodos" de muestreo, de los quebrevemente enumeramos algunos.

    El objetivo de la estadstica inferencial es obtener la informacin acerca de una poblacin,partiendo de la informacin que contiene una muestra. El proceso que se sigue para seleccionar

    una muestra se denomina Muestreo.Las ventajas que nos brinde el muestreo son:

    - Los operativos son menores.- Posibilita analizar un mayor nmero de variables.- Permite controlar las variables en estudio.

    7.2 TIPOS DE MUESTREO

    - Muestreo Probabilstico: Cuando el muestreo o proceso para seleccionar una muestra esaleatorio. As definimos una muestra probabilstica a una muestra extrada de una poblacin detal manera que todo elemento de la poblacin conocida pueda ser incluida en la muestra. Puede

    ser a su vez:

    A. MUESTREO ALEATORIO SIMPLE: (M.A.S.): Es aquel muestreo aleatorio en el que laprobabilidad de que un elemento resulte seleccionado se mantiene constante a lo largo detodo el proceso de obtencin de la misma. La tcnica del muestreo puede asimilarse a unmodelo de extraccin de bolas de una urna con devolucin (reemplazamiento) de la bolaextrada. Un mismo dato puede, en consecuencia, resultar muestreado ms de una vez. Cadaeleccin no depender de las anteriores y, por tanto, los datos muestrales sernestocsticamente independientes.

    B. MUESTREO ALEATORIO SISTEMTICO. Esta tcnica consiste en extraer elementos de lapoblacin mediante una regla sistematizadora que previamente hemos creado (sencillamente

    cada K elementos). As; numerada la poblacin, se elige (aleatoriamente) un primer elementobase, partiendo de ste se aplica la regla para conseguir los dems hasta conseguir el tamaomuestral adecuado. Este procedimiento conlleva el riesgo de dar resultados sesgados si en lapoblacin se dan periodicidades o rachas.

    C. MUESTREO ALEATORIO ESTRATIFICADO: Consiste en considerar categoras tpicasdiferentes entre s (estratos) que poseen una gran homogeneidad interna (poca varianzainterna) y no obstante son heterogneos entre s (mucha varianza entre estratos). La muestrase distribuye (se extrae de) entre los estratos predeterminados segn la naturaleza de lapoblacin (ejemplo: sexo, lugar geogrfico, etc.). Dicha distribucin-reparto de la muestra sedenomina afijacin ; que puede ser de varias formas :- Afijacin simple: a cada estrato le corresponde igual nmero de elementos (extracciones)

    muestrales.- Afijacin proporcional: La distribucin se hace de acuerdo con el peso (tamao) relativo de

    cada estrato.

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    2/18

    Universidad Nacional de Tumbes

    78

    - Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modoque se considera la proporcin y la desviacin tpica.

    D. MUESTREO POR CONGLOMERADOS: La unidad muestral es un grupo de elementos de lapoblacin que forman previsiblemente una unidad de comportamiento representativo. Dichaunidad es el conglomerado cuyo comportamiento interno puede ser muy disperso (varianzagrande) pero que presumiblemente poseer un comportamiento prximo a otrosconglomerados (varianza entre conglomerados, pequea). Los conglomerados se estudian en

    profundidad hasta conseguir el tamao muestral adecuado.

    E. OTROS TIPOS DE MUESTREO. Es evidente que los planteados no son las nicas tcnicasde muestreo. Existen otras como las no aleatorias: Cuotas, Intencional, Incidental, bola denieve, etc. Y otras aleatorias y complicadas como el muestreo por superpoblaciones, y que eneste curso no podemos desarrollar.

    7.3 ESTIMACION DE INTERVALO

    La "estimacin por intervalo" consiste en determinar un par de valores a y b, tales que constituidosen intervalo [a ,b] ; y para una probabilidad 1- prefijada (nivel de confianza) se verifique en

    relacin al parmetro a estimar se cumpla: 1]),[( baP en otros trminos: 1)( baP .

    Podemos considerar el nivel de confianza (1- ) que hemos prefijado para la expresin anteriorcomo la probabilidad que existe (antes de tomar la muestra) de que el intervalo a construir a partirde la muestra incluya el verdadero valor del parmetro a estimar. Refleja la "confianza" en la"construccin" del intervalo y de que ste tras concretar la muestra contendr el valor a estimar.De ah que en trminos numricos dicho nivel o probabilidad haya de tomar un valor alto (0.9,0.95, 0.99).

    Evidentemente el complementario al nivel de confianza; es decir , nivel de significacin supondrlas probabilidades de cometer el error de no dar por incluido el verdadero valor del parmetro aestimar en un intervalo en el que realmente si est. De ah y dado que se trata de un error posiblea cometer, su cuantificacin en trminos de probabilidad sea muy pequea (0.1, 0.05, 0.005,..).

    En relacin a lo anterior. Obviamente, cuanto mayor sea el nivel de confianza prefijado la amplituddel intervalo de estimacin ser tambin mayor y por tanto la estimacin ser menos precisa.

    La siguiente tabla presenta las diferentes frmulas que ayudaran a crear los intervalos.

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    3/18

    Universidad Nacional de Tumbes

    79

    Para la distribucin Normal utilice la siguiente tabla:

    Nivel de confianza 2

    Z

    90% 1.64595% 1.9699% 2.576

    Ejemplo N 001

    En poblacin cuya distribucin se desconoce se obtiene una muestra (m.a.s.) de 2000 valores dela que resulta una media de 225 y una desviacin tpica de 10. Suponiendo que la varianzamuestral coincide con la poblacional, estimar un intervalo para la media de la poblacin con unnivel de confianza del 95%.

    Tendramos 1- =0.95 luego =0.05; S=10= (muestra grande n>30); n=2000, para unapoblacin normal.

    95.0)(

    22

    n

    Zxu

    n

    ZxP

    el resultado sera : [224,56 , 225,44] con el 95 % de confianza.

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    4/18

    Universidad Nacional de Tumbes

    80

    Ejemplo N 002

    Las ventas diarias de cierta oficina comercial se supone que siguen una distribucin normal. Paraestimar el volumen medio de ventas por da se realiza una muestra de 10 das escogidos al azar,resultando que la media de las ventas de esos 10 das es S/. 100 con una desviacin tpica de S/.

    4. Dar un intervalo de estimacin para el volumen medio de ventas por da con una confianza del95 %.

    Conocemos que segn la informacin que poseemos, estamos ante: Distribucin normal;n=10 (muestra pequea); S=4(poblacional desconocida); media muestral=100;Para 1- =0.95, luego =0.05 con lo que 26.2)9(

    2

    glt (segn tabla T)

    95.0)(

    22

    n

    Stxu

    n

    StxP

    El resultado sera: [S/.96,99 ; S/.103,01] con el 95 % de confianza.

    Ejemplo N 003

    Se quiere obtener un intervalo de confianza para el valor de las ventas medias por hora que seproducen en un kiosco. Para ello realizamos una muestra consistente en elegir al azar las ventasque se realizaron durante 1000 horas distintas; muestra cuyos resultados fueron: ventas mediaspor hora S/. 4000, y varianza de dicha muestra S2/. 4000. Obtener dicho intervalo con un nivel deconfianza del 95.5 %.

    Queremos construir un intervalo para la media con las siguientes caractersticas:

    Tamao muestral=n=1000, con muestreo aleatorio simple, la poblacin no es normal niconocemos su varianza.El resultado de la muestra es 4000x , S2=4000.

    Si bien se trata de un intervalo para la media con varianza desconocida y poblacin no normal,dado que el tamao muestral es grande podemos suponer normalidad y tomar como varianzapoblacional a la muestral as:

    95.0)(

    22

    n

    zxun

    zxP

    El resultado sera: [S/.399,08 ; S/.4003,92] con el 95 % de confianza.

    7.4 DETERMINACION DEL TAMAO DE LA MUESTRA

    Cuando se necesita informacin para realizar estudios con datos estadsticos y no se puedecontar un censo, porque es muy caro, o porque demora mucho o no se cuenta con el personaladecuado; entonces ser necesario obtener una muestra, ahora. Pero viene la pregunta: culser el nmero adecuado mnimo del tamao de la muestra? En principio existe todo un procesopara obtener una muestra representativa de la poblacin. Si el mtodo es aleatorio oprobabilistico, entonces el nmero adecuado de los elementos de la muestra, se pueden calcularusando las siguientes frmulas.

    1. CUANDO EL ESTUDIO ES DE CARCTER CUALITATIVO

    a. Cuando se supone que N es muy grande o cuando el muestreo es con reposicin:

    2

    2

    E

    PQZn

    http://wc2p/C:/varios/web/hip3/tex2P/5p%20inter/tex1t/5%20interval/imedia1.htmhttp://wc2p/C:/varios/web/hip3/tex2P/5p%20inter/tex1t/5%20interval/esquema.htmhttp://wc2p/C:/varios/web/hip3/tex2P/5p%20inter/tex1t/5%20interval/esquema.htmhttp://wc2p/C:/varios/web/hip3/tex2P/5p%20inter/tex1t/5%20interval/imedia1.htm
  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    5/18

    Universidad Nacional de Tumbes

    81

    b. Cuando la poblacin es finita (se conoce N) o el muestro es sin reposicin.

    PQZEN

    PQNZn

    22

    2

    )1(

    Donde:P=Proporcin de xito; que se conoce por estudios anteriores o similares.Q=(1-P). Proporcin de fracaso.

    Z=Valor que se obtiene de la distribucin normal, para un nivel de significacin a.Generalmente se toma:Z=1.96 para un nivel de significancia del 5%.Z=2.575 para un nivel de significancia del 1%.E=Error de estimacin. Valor que lo determina el investigador. Se sugiere valores en tornoal 5%.N= Nmero de los elementos de la poblacin.

    Nota:Si no se conoce P, se puede adoptar las siguientes decisiones:i) Tomar una muestra piloto y calcular el valor de P.ii) Considerar el valor de P=0.5, lo cual dar el nmero de elementos de la muestra el

    mayor posible.

    2. CUANDO EL ESTUDIO ES DE CARCTER CUANTITATIVOa) Cuando no se conoce el tamao N de la poblacin o ste es infinito:

    2

    22

    E

    Zn

    b) Cuando el tamao N de la poblacin es finito:

    222

    22

    )1(

    ZEN

    NZn

    Ejemplos N 004

    Se van a realizar un gran y desconocido nmero de ensayos para calibrar la resistencia media a larotura de un determinado azulejo en una partida de 10 000,000 unidades. Si deseamoscometer un error inferior a 10 kg/cm2, y por ensayos anteriores conocemos que la varianza en larotura ha sido de 40 (kg/cm2)2, Qu nmero de ensayos hemos de realizar si hemos decididotrabajar con un nivel de confianza del 95%?

    Si suponemos un gran nmero de ensayos, suponemos, tambin, que el tamao muestral esgrande, por lo que podemos establecer normalidad. Los datos serian los siguientes: =95%,

    E

    2

    =10 kg/cm

    2

    ,2

    =40(kg/cm

    2

    )

    2

    .Utilizando la frmula siguiente:

    2

    22

    E

    Zn

    , tenemos:

    1536.1510

    )40)(96.1(2

    n muestras de azulejos.

    Ejemplo N 005

    Para conocer la valoracin en forma de porcentaje de aceptacin hacia un determinado profesordecidimos encuestar a un determinado nmero de sus 100 alumnos. Calcular dicho nmero, si elerror que estamos dispuestos a admitir es del ms menos 3% y trabajamos con un nivel de

    confianza del 95%.

    Tenemos los siguientes datos:

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    6/18

    Universidad Nacional de Tumbes

    82

    N=100, E=3%, =95%, p=0.5. q=1-p=0.5

    Utilizando la frmula tenemos:

    9151.91)5.0)(5.0()96.1()03.0)(1100(

    )5.0)(5.0()96.1)(100(

    )1(22

    2

    22

    2

    PQZEN

    PQNZn

    alumnos.

    Ejemplo N 006Para conocer la valoracin en forma de porcentaje de aceptacin hacia un determinado profesordecidimos encuestar a un determinado nmero de sus 100 alumnos. Calcular dicho nmero, si elerror que estamos dispuestos a admitir es del ms menos 3% y trabajamos con un nivel deconfianza del 95%.

    El tamao de la poblacin es pequeo con =95%, p=0,5 q=1-p=0.5.

    Utilizando la frmula tenemos:

    9151.91)5.0)(5.0()96.1()03.0)(1100(

    )5.0)(5.0()96.1)(100(

    )1( 22

    2

    22

    2

    PQZEN

    PQNZn

    alumnos.

    7.5 CONSTRASTE DE HIPTESIS

    El problema del contraste de hiptesis consiste bsicamente en comprobar cotejar, decidir, endefinitiva, sobre la veracidad de una hiptesis prefijada previamente como supuestamente cierta.En trminos estadsticos, la o las hiptesis que formulamos lo sern lgicamente sobre lapoblacin. Bien afectando a algn parmetro de sta, lo que da origen a los contrastesparamtricos o bien a otras caractersticas de la mismas que no lo sean estrictamente, lo queorigina contrates "no" paramtricos.

    La solucin estadstica del problema de contrastacin se basar en los datos muestrales y la baseestadstica (probabilstica) de la que arrancar el contraste, de algn estadstico muestral.

    Pasemos a definir los principales conceptos implicados en nuestro problema:

    Regin crtica: Ser aquella regin del campo de variacin del estadstico tal que si contiene alvalor evaluado del mismo con los datos muestrales nos llevar a rechazar la hiptesis. Ladesignaremos por R1

    Regin de aceptacin: Es la regin complementaria de la anterior. Si el valor evaluado delestadstico pertenece a ella No rechazamosla hiptesis (las hiptesis nunca se aceptan de forma

    definitiva, slo se aceptan provisionalmente, es decir, no se rechazan, a la espera de una nuevainformacin que eventualmente pueda llevarnos a rechazarla en el futuro). La designaremos porR0. Evidentemente los conjuntos de puntos que forman ambas regiones son disjuntos.

    Una hiptesis estadstica (paramtrica): Es una conjetura sobre el valor concreto que tiene enrealidad. El establecer una hiptesis sobre un parmetro , supone dividir los posibles valores delparmetro en dos grupos disjuntos tales que unos son hipotticamente ciertos (0) y los otros (1)no lo son. A la hiptesis que se desea contrastar se la denomina "hiptesis nula", siendo, portanto, el valor o valores que hipotticamente consideramos reales, dicha hiptesis vieneexpresada como H0. Alternativamente y consecuentemente se establece la denominada"hiptesis alternativa" (H1) compuesta sta por el valor o valores 1 que en consecuencia de laeleccin y de la complementariedad de los de la hiptesis nula, son los que, en principio, noconsideramos cmo hipotticamente reales.

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    7/18

    Universidad Nacional de Tumbes

    83

    El hecho de que las hiptesis, tanto la nula cmo la alternativa puedan recoger en susplanteamientos uno o varios valores, da lugar a hiptesis de carcter simple, si el nmero devalores plausibles e hipotticos es de uno en ambas, o bien a hiptesis compuestas si dicho valorno es nico en alguna de ellas.

    Teniendo en cuenta lo dicho anteriormente, el problema de rechazar o aceptar una hiptesispuede plantearse como un problema de decisin, en el que evidentemente existe la posibilidad de

    fracasar o acertar en la eleccin o decisin a la hora de concluir que la hiptesis, bien nula o bienalternativa, son rechazables o no.

    El problema de decisin: rechazo/no rechazo, vendra expresado en las siguientes opciones enforma de tabla:

    Hiptesis/Accin No Rechazamos RechazamosEs cierta Correcto Error Tipo IEs falsa Error Tipo II Correcto

    Si la hiptesis nula (H0) es cierta y nuestra decisin es no rechazarla, la decisin ha sido

    correcta. Si la hiptesis nula (H0) es cierta y nuestra decisin es rechazarla, la decisin provoca unerror. Dicho error se denomina error tipo I.

    Si la hiptesis nula (H0) es falsa y nuestra decisin es no rechazarla, la decisin provocaun error. Dicho error se denomina error tipo II.

    Si la hiptesis nula (H0) es falsa y nuestra decisin es rechazarla, la decisin ha sidocorrecta.

    Ejemplo:

    Enunciado 1:La altura del estudiante de la Universidad Nacional de Tumbes es 1,65 m.

    Planteando las Hiptesis tenemos:H0: =1.65H1: 1.65, 1.65 1.65

    Enunciado 2:El promedio ponderado de los alumnos de la Escuela de contabilidad de la Universidad Nacionalde Tumbes es 13.5.Planteando las Hiptesis tenemos:H0: =13.5H1: 13.5, 13.5 13.5

    Enunciado 3:El porcentaje de alumnos de escuelas de la Regin que tienen caries es mayor que 0.7.Planteando las Hiptesis tenemos:H0: p0.7H1: p

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    8/18

    Universidad Nacional de Tumbes

    84

    Donde es el parmetro de la poblacin estadstica sobre la cual se esta haciendo laprueba de hiptesis.

    Ejemplo:1) H0: =1.65

    H1: 1.65

    2) H0: =13.5H1: 13.5

    - Prueba de cola superior o de lado derecho: cuyo caso la hiptesis en general toma lasiguiente forma:Ho: =0, H1: 0Donde es el parmetro de la poblacin estadstica sobre la cual se esta haciendo laprueba de hiptesis.

    Ejemplo:1) H0: =1.65

    H1: 1.65

    2) H0: =13.5H1: 13.5

    b) Pruebas de dos colas o bilateral: Que puede ser:Ho: =0, H1: 0

    Ejemplo:1) H0: =1.65

    H1: 1.65

    2) H0: =13.5H1: 13.5

    PROCEDIMIENTO PARA UNA PRUEBA DE HIPOTESISLos pasos a seguir son:

    1. Formular la hiptesis nula H0 y la alternativa H1, de acuerdo al problema.2. Escoger un nivel de significacin o riesgos .3. Elegir la estadstica de prueba apropiada, cuya distribucin por muestreo sea conocida en

    el supuesto de que Ho es cierta.4. En base a y H1, determinar el valor (o los valores) crticos y con ello se establecen las

    regiones de aceptacin o rechazo.5. Calcular los valores de la prueba estadstica a partir de una muestra aleatoria de tamao n,

    Ho y reemplazarlos en la estadstica de prueba elegida en el paso 3, para hallar el valorexperimental.

    6. Tomar la decisin de aceptar Ho si el valor experimental cae en la regin de aceptacin yrechazarla si dicho valor cae en la regin crtica o de rechazo.

    7. Opcional: Si se rechaza H0, se puede hallar un intervalo de confianza para el parmetro deinters.

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    9/18

    Universidad Nacional de Tumbes

    85

    PRUEBA DE HIPOTESIS SOBRE LA MEDIA POBLACIONALCaso A: Cuando la varianza poblacional es conocida.

    Deseamos contrastar la hiptesis de que el parmetro poblacional toma un determinadovalor Conocemos que la poblacin se distribuye normalmente y conocemos tambin suvarianza , o bien si nos es desconocida, el tamao muestral es lo suficientemente grandecmo para poder utilizar la muestral cmo poblacional.

    Hemos determinado un nivel de significacin para la realizacin del contraste y vamos aplantearlo en el supuesto de realizar una muestra aleatoria de tamao n.

    As: conocemos que

    nuNx , de lo que deducimos que ]1,0[N

    n

    ux

    de forma que

    la hiptesis nula es: H0: 0.

    El estadstico est dado por:

    n

    uxZ

    0

    .

    Ejemplo N 000

    De 100 observaciones de una poblacin normal se obtiene que x = 5 y que S=2.Contrastarcon un nivel de significacin del 5% la hiptesis de que la media de la poblacin sea 7.

    Aplicando el procedimiento para probar una hiptesis tenemos:1. H0: =7

    H1: 2. El nivel de significancia es del 5%. (=5%)

    3.

    n

    uxZ

    0

    4. Establecemos la regin de aceptacin y de rechazo:

    5. Realizamos la prueba estadstica: 10

    1002

    75

    Z

    6. Dado que Z=-10 y no pertenece a la regin de aceptacin estamos en condiciones derechazar la hiptesis nula, luego aceptar la alternativa : 7.

    Ejemplo N 00z

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    10/18

    Universidad Nacional de Tumbes

    86

    Un empresario est considerando la posibilidad de ampliar su negocio mediante la adquisicinde un pequeo bar. El dueo actual del bar afirma que el ingreso diario del establecimientosigue una distribucin normal de media 675 soles y una desviacin estndar de 75 soles. Paracomprobar si deca la verdad, tom una muestra de treinta das y sta revel un ingreso diariopromedio de 625 soles. Utilizando un nivel de significacin del 10 %. Hay evidencia de que elingreso diario promedio sea menor del que afirma el presente dueo?.

    Aplicando el procedimiento para probar una hiptesis tenemos:1. H0: 675

    H1: 2. El nivel de significancia es del 10%. (=10%)

    3.

    n

    uxZ

    0

    4. Establecemos la regin de aceptacin y de rechazo:

    5. Realizamos la prueba estadstica: 65.3

    3075

    675625

    Z

    6. Dado que Z=-3.65 y no pertenece a la regin de aceptacin estamos en condiciones de

    rechazar la hiptesis nula, luego aceptar la alternativa: 7.

    Caso B: Cuando no se conoce la varianza poblacional y para una muestra pequea.

    Deseamos contrastar la hiptesis de que el parmetro poblacional toma un determinadovalor Desconocemos la varianza de la poblacin y, dado que el tamao muestral espequeo, no podemos utilizar la muestral en su lugar.

    Hemos determinado un nivel de significacin para la realizacin del contraste y vamos a plantearloen el supuesto de realizar una muestra aleatoria de tamao n.

    As: conocemos que1

    nt

    ns

    uxde forma que la hiptesis nula es: H0: 0.

    El estadstico est dado por:

    ns

    uxt 0

    .

    Ejemplo 2.

    Se escoge a 17 individuos al azar y se les mide, resultando que su estatura media es de 1,71metros con desviacin tpica de 0,02 .Contrastar la hiptesis de que la estatura media nacionalsea de 1.75 metros si utilizamos un nivel del significacin del 5%. Se supone normalidad

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    11/18

    Universidad Nacional de Tumbes

    87

    Aplicando el procedimiento para probar una hiptesis tenemos:1. H0: =1.75

    H1: 2. El nivel de significancia es del 5%. (=5%).

    3.

    n

    s

    uxt 0

    4. Establecemos la regin de aceptacin y de rechazo:Utilizamos la tabla T.

    5. Realizamos la prueba estadstica: 25.8

    1702.0

    75.171.1

    t

    6. Dado que t=-8.25 y no pertenece a la regin de aceptacin estamos en condiciones derechazar la hiptesis nula, luego aceptar la alternativa: .

    PRUEBA DE HIPOTESIS PARA LA PROPORCIN POBLACIONAL: p

    Se trata de efectuar una prueba de hiptesis acerca de la proporcin de elementos con ciertoatributo en una poblacin, hiptesis de la forma:

    H0: pp0.H1: p p0.

    H0: pp0.H1: p>p0.

    H0: pp0.H1: p

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    12/18

    Universidad Nacional de Tumbes

    88

    H1: p 2. El nivel de significancia es del 5%. (=5%).

    3.

    n

    pp

    pPZ

    )1(00

    0

    4. Establecemos la regin de aceptacin y de rechazo:

    5. Realizamos la prueba estadstica:

    25.0200

    50P

    54.1

    200

    )3.01(3.0

    30.025.0

    )1(00

    0

    n

    pp

    pPZ

    6. Dado que Z=-1.54 y pertenece a la regin de aceptacin estamos en condiciones deacepta la hiptesis nula, es decir: p

    Ejemplo

    Un fabricante de refrescos sin burbujas desea sacar al mercado una variedad de su producto quetenga burbujas. Su director comercial opina que al menos el 50 % de los consumidores ver conbuenos ojos la innovacin. Se realiza un sondeo de mercado y resulta que de 100 consumidoresencuestados 40 son favorables a la innovacin.

    a) Contrastar la hiptesis del director comercial frente a la alternativa de que el % de aceptacines inferior, con un nivel de significacin del 1%.

    b) Si el aceptable la hiptesis de que el % de aceptacin del nuevo producto es inferior o igual al

    30 % el fabricante decidir no fabricarlo. Si es aceptable el criterio del director comercialentonces s fabricarn el refresco con burbujas. Y si ninguna de las 2 hiptesis es aceptableprocedern a hacer otro sondeo. Para tomar esta decisin trabajarn con un nivel designificacin del 5 %. Por qu optarn?.

    Para el punto a)Aplicando el procedimiento para probar una hiptesis tenemos:

    1. H0: p0.5H1: p

    2. El nivel de significancia es del 1%. (=1%).

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    13/18

    Universidad Nacional de Tumbes

    89

    3.

    n

    pp

    pPZ

    )1(00

    0

    4. Establecemos la regin de aceptacin y de rechazo:

    5. Realizamos la prueba estadstica:4.0

    100

    40P

    2

    100

    )5.01(5.0

    5.04.0

    )1(00

    0

    n

    pp

    pPZ

    6. Dado que Z=-2 y pertenece a la regin de aceptacin estamos en condiciones de aceptarla hiptesis nula, es decir: p

    Para el punto b)Aplicando el procedimiento para probar una hiptesis tenemos:1. H0: p0.3

    H1: p2. El nivel de significancia es del 1%. (=1%).

    3.

    n

    pp

    pPZ

    )1( 00

    0

    4. Establecemos la regin de aceptacin y de rechazo:

    5. Realizamos la prueba estadstica:

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    14/18

    Universidad Nacional de Tumbes

    90

    4.0100

    40P

    18.2

    100

    )3.01(3.0

    3.04.0

    )1(00

    0

    n

    pp

    pPZ

    6. Dado que Z=2.18 y pertenece a la regin de aceptacin estamos en condiciones deaceptar la hiptesis nula, es decir: pPor lo tanto se recomiendo no fabricar elrefresco.

    ESTIMACIN DE UNA DIFERENCIA ENTRE DOS MEDIAS DE POBLACIONES NORMALES(Poblacin 1 y 2)

    Para encontrar el intervalo de la diferencia de la media de dos poblaciones se considera que lasmuestras tomadas de las poblaciones son independientes.

    SI SE CONOCE LAS DESVIACIONES ESTNDAR POBLACIONALES ( 1 Y 2 ).El intervalo de %1100 , resulta ser:

    Lmite inferior: 2

    2

    2

    1

    2

    1

    21nn

    zxx tabla

    ;

    Lmite superior: 2

    2

    2

    1

    2

    1

    21nn

    zxx tabla

    Donde:

    1n : es el tamao de la muestra tomada de la poblacin 1

    1

    n

    : es el tamao de la muestra tomada de la poblacin 21

    x : es la media de la muestra tomada de la poblacin 1

    2x : es la media de la muestra tomada de la poblacin 2

    1 : es la desviacin estndar de la poblacin 1

    2 : es la desviacin estndar de la poblacin 2N es el tamao de la poblacin

    tablaz : es el valor z de la tabla N(0,1)

    SI NO SE CONOCE LAS DESVIACIONES ESTNDAR POBLACIONALES (1

    Y2

    ).

    El intervalo de %1100 , resulta ser:

    Lmite inferior:21

    2;21

    11**

    21 nnstxx pnngltabla ;

    Lmite superior:21

    2;21

    11**

    21 nnstxx pnngltabla

    Donde:

    2; ngltablat : es el valor t de la tabla t de Student, con 221 nn grados de libertad

    Donde las varianzas poblacionales, si bien son desconocidas, se considera que son iguales,

    2

    cs representa entonces la varianza comn y se calcula:

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    15/18

    Universidad Nacional de Tumbes

    91

    2

    11

    21

    2

    22

    2

    112

    nn

    snsnsp

    ESTIMACIN DE UNA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES(Poblacin 1 y 2). (Caso de muestras grandes)

    El intervalo de %1100 , resulta ser:

    Lmite inferior: 2

    22

    1

    11

    21

    n

    QP

    n

    QPzpp tabla

    ;

    Lmite superior: 2

    22

    1

    11

    21

    n

    QP

    n

    QPzpp tabla

    Donde:

    1n : es el tamao de la muestra tomada de la poblacin 1

    2n : es el tamao de la muestra tomada de la poblacin 2

    1P : es la proporcin en la muestra tomada de la poblacin 1; 11

    1

    PQ

    2

    P : es la proporcin en la muestra tomada de la poblacin 1; 22 1 PQ N es el tamao de la poblacin

    tablaz : es el valor z de la tabla N(0,1)

    PRUEBA DE HIPTESIS PARA UNA DIFERENCIA DE MEDIAS DE POBLACIONES CONDISTRIBUCIN NORMAL (Con muestras independientes).

    Aqu se tiene entonces: 2111 ;~ NX y 2222 ;~ NX

    En este caso las hiptesis son de la forma:

    1.21

    210

    :

    :

    aH

    H2.

    21

    210

    :

    :

    aH

    H3.

    En forma equivalente se puede plantear las hiptesis:

    1.0:

    0:

    21

    210

    aH

    H2.

    0:

    0:

    21

    210

    aH

    H3.

    0:

    0:

    21

    210

    aH

    H

    CASO EN QUE SE CONOCEN LAS VARIANZAS POBLACIONALES ( 21

    Y 22

    )

    El valor calculado es:

    2

    2

    2

    1

    2

    1

    21

    nn

    xxz

    calc

    Los valores crticos son: Hiptesis tipo 1: tablaz y tablaz , Hiptesis tipo 2: tablaz , Hiptesis tipo 3:

    CASO EN QUE NO SE CONOCEN LAS VARIANZAS POBLACIONALES ( 21

    Y 22

    )

    Si se considera que: 222

    1

    21

    210

    :

    :

    aH

    H

    tablaz

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    16/18

    Universidad Nacional de Tumbes

    92

    El valor calculado es:

    21

    21

    11

    nns

    xxt

    p

    calc

    Donde:

    2

    11

    21

    2

    22

    2

    112

    nn

    snsn

    sp 2

    1s y 2

    2s ; son las varianzas de las muestras sacadas de la poblacin 1 y 2 respectivamente

    1x y

    2x ; son las medias de las muestras sacadas de la poblacin 1 y 2 respectivamente

    Los valores crticos son:

    Hiptesis tipo 1: 2; 21 nngltablat y 2; 21 nngltablat

    Hiptesis tipo 2: 2; 21 nngltablat

    Hiptesis tipo 3: 2; 21 nngltablat

    SI SE CONSIDERA QUE: 222

    1

    El valor calculado es:

    2

    2

    2

    1

    2

    1

    21

    n

    s

    n

    s

    xxtcalc

    Los valores crticos son los mismos anteriores, pero, los grados de libertad estn dados por:

    2

    1

    1

    1

    12

    2

    2

    2

    2

    2

    1

    2

    1

    1

    2

    2

    2

    2

    1

    2

    1

    n

    s

    nn

    s

    n

    n

    s

    n

    s

    gl

    Ejemplo: Dos fabricantes A y B producen un artculo similar, cuyas vidas tiles tienendesviaciones estndar respectivas de 120 horas y 90 horas. Para comparar el promedio de vidatil de estos artculos se extrae una muestra aleatoria de 60 artculos de cada fabricanteencontrndose la duracin media de 1.230 horas para la marca A y de 1.190 horas para la marcaB. Se puede concluir a un nivel de significacin del 5% que los artculos de marca A tienenmayor duracin media que los artculos de marca B?

    Se tiene una prueba de hiptesis para la diferencia de dos medias con varianzas poblacionalesconocidas.Datos: 645,1z90;120;190.1;230.1;60 tabla

    22

    2

    22

    12121 xxnn

    En este problema, si bien es cierto, no se dice que las poblaciones sean normales, se tiene quelos tamaos de muestra son grandes, por lo que la estadstica de prueba:

    Tiene una distribucin aproximadamente normal estndar, por lo que se puede usar lo presentadoen el punto 4.1.

    0:

    0:

    21

    210

    aH

    H

    2

    2

    2

    1

    2

    1

    21

    nn

    xxz

    calc

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    17/18

    Universidad Nacional de Tumbes

    93

    El valor calculado es: 07,2

    60

    90

    60

    120

    190.1230.1

    22

    2

    2

    2

    1

    2

    1

    21

    nn

    xxzcalc

    Valor critico: 645,1tablaz

    La regin de rechazo es entonces:

    ;645,1RR

    Por lo tanto se rechaza Ho, se acepta Ha. Se puede decir que existen evidencias significativas, alnivel de significacin del 5%, para decir que la duracin media de los artculos de marca A esmayor a los de marca B.

    PRUEBA DE HIPTESIS PARA UNA DIFERENCIA DE PROPORCIONES (Muestras grandes).

    En este caso las hiptesis son de la forma:

    1.

    21

    210

    :

    :

    PPH

    PPH

    a

    2.

    21

    210

    :

    :

    PPH

    PPH

    a

    3.

    21

    210

    :

    :

    PPH

    PPH

    a

    En forma equivalente se puede plantear las hiptesis:

    1.0:

    0:

    21

    210

    PPH

    PPH

    a

    2.0:

    0:

    21

    210

    PPH

    PPH

    a

    3.0:

    0:

    21

    210

    PPH

    PPH

    a

    El valor calculado es:

    21

    21

    11

    1

    nnPP

    PPzcalc

    Donde:21

    2211

    nn

    PnPnP

    Los valores crticos son:

    Hiptesis tipo 1: tablaz y tablaz

    Hiptesis tipo 2: tablaz

    Hiptesis tipo 3:

    Ejemplo:

    Una muestra aleatoria de 300 hombres y otro de 400 mujeres de una determinada poblacinrevel que 120 hombres y 120 mujeres estaban a favor de cierto candidato. Se puede concluir aun nivel de significacin del 5% que la proporcin de hombres a favor del candidato es mayor quela proporcin de mujeres?

    Aqu se tiene una prueba de hiptesis para diferencias de proporciones con muestras grandes.

    Si denotamos con 1 a la poblacin de hombres y con 2 a la de mujeres, se tiene:1 Plantear las hiptesis de inters

    tablaz

  • 7/29/2019 00 Libro EstadisticaInferencial Universidad Tumbes

    18/18

    Universidad Nacional de Tumbes

    21

    210

    :

    :

    PPH

    PPH

    a

    2 Calcular la estadstica de prueba (valor calculado), bajo Ho:

    El valor calculado es:

    76,2

    400

    1

    300

    166,034,0

    3,04,0

    111

    21

    21

    nnPP

    PPz

    calc

    Donde: 34,0400300

    3,04004,0300

    21

    2211

    nn

    PnPnP

    3 Construir la regla de decisin y decidir

    El valor crtico es: 645,1tablaz

    La regin de rechazo (RR) es: ;645,1RR

    Por lo tanto se rechaza Ho, se acepta Ha

    Se puede decir entonces que existen evidencias suficientes, a un 5% de significacin, para decirque la proporcin de hombres a favor del candidato es mayor que el de las mujeres, en esapoblacin