teoria 5 - pdh [modo de compatibilidad]

Upload: adonai-sala

Post on 13-Apr-2018

228 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    1/19

    BIOESTADSTICA

    Universidad Nacional del Comahue

    Facultad de Ciencias del Ambiente y la Salud

    1er cuatrimestre 2016

    CONTENIDOS

    UNIDAD 5: Pruebas de Hiptesis. Teora general de las

    pruebas de hiptesis. Tipos de errores. Dcimas relativas a la

    media, a la variancia y a una proporcin. Comparacin de dos

    medias, dos varianzas y dos proporciones, en muestras

    independientes. Comparacin de medias en muestras apareadas.

    Pruebas de hiptesis no-paramtricas. Comparacin de una series

    de frecuencias empricas con una serie terica. Estadstico de

    Pearson. Requerimientos de aplicacin del estadstico. Pruebas deindependencia de variables y de bondad de ajustes de modelos de

    probabilidad.

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    2/19

    Pruebas de Hiptesis

    Estimacin de Parmetros Pruebas de Hiptesis

    INFERENCIA ESTADSTICA

    Qu es una hiptesis estadstica ?

    Es una proposicin o afirmacin sobre la distribucin deprobabilidad de una variable aleatoria.

    Parmetros de la distribucin

    Asociadas a una o ms poblaciones

    Forma de la distribucin

    Ejemplos:

    La edad media de los alumnos del curso es de 22 aos.

    Con la aplicacin de un determinado nutriente se obtendrn rendimientos

    medios superiores a 2.000 kg/ha, que es la produccin usual de la zona.

    El peso promedio al nacimiento de ovejas hembras es menor al de los

    machos

    La altura de almos sigue una distribucin normal

    El nmero de semillas germinadas por placa responde a una distribucin

    binomial

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    3/19

    Hiptesis acerca de los parmetros de una poblacin:

    Caso 1

    H0: = 1

    H1: =2

    Caso 3

    H0: = 0

    H1: 0

    Hiptesis nula

    Hiptesis alternativa

    Hiptesis

    puntualeso simples

    Caso 2

    H0: = 0

    H1: 0 Hiptesis compuestas

    Consideraciones importantes:

    Las hiptesis son siempre afirmaciones relativas a la poblacin odistribucin bajo estudio, no en torno a la muestra

    La hiptesis nula siempre contiene a la hiptesis =0

    Hay una estrecha relacin entre la prueba de hiptesis en tornoa un parmetroy el intervalo de confianza de

    Puedan combinarse otros casos de Hiptesis nulas e Hiptesis alternativas

    Caso 5

    H0: 0

    H1: 0

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    4/19

    Estadstico de prueba y Regla de Decisin

    Ho: = 15

    H1: 15X1

    X2...

    Xi...

    XN

    Poblacin

    Muestra

    X1...

    Xn

    Prueba de hiptesis:

    Es un procedimiento (o experiencia) que conduce a una toma dedecisin en cuanto a optar por una u otra hiptesis, a la luz de lainformacin proporcionada por una muestra aleatoria extrada

    de la poblacin bajo estudio

    7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

    Variable

    10 11 12 13 14 15 16 17 18 19 20

    x

    NO RECHAZORECHAZO RECHAZO

    obsx obsxobsx

    Conclusin sujeta a error

    Pruebas

    Bilaterales

    Unilaterales

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    5/19

    Ho es Verdadera Ho es Falsa

    Error Decisin correcta

    Tipos de error:

    DECISIN Rechazo H0

    No Rechazo H0 Decisin correcta Error

    Error de Tipo I

    Error de Tipo II

    P(Error Tipo I) = P(Rechazar H0 | H0 es Verdadera) =

    P(Error Tipo II) = P(No Rechazar H0 | H0 es Falsa) =

    Potencia = 1 - = P(Rechazar H0 | H0 es Falsa)

    1

    2critx

    Zona de rechazo de H0Zona de no rechazo de H0

    Representacin esquemtica de tipos de errores

    Ho: = 1

    H1: = 2

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    6/19

    = VEREDICTO =

    PRESUNCION

    JUICIO

    DECISION 2 DECISION 1

    H0 H1

    Procedimieno general para una prueba de hiptesis:

    Del contexto del problema identificar el parmetro de inters

    Plantear H0y H1

    Planificar una experiencia para la extraccin de la muestra

    Establecer el nivel de significacin de la prueba

    Seleccionar un estadstico de prueba e identificar su distribucinbajo H0

    Establecer regiones de rechazo y no rechazo para el estadsticode prueba

    Calcular de la muestra el valor del estadstico

    Decidir si debe o no rechazarse H0 e interpretar esto en elcontexto del problema

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    7/19

    A. Pruebas sobre una sola muestra

    A1. Pruebas de hiptesis acerca de la media de unadistribucin normal con variancia conocida

    Problema: A un productor se le ofrece un nutriente con el que obtendrrendimientos medios superiores a 2.000 kg/ha, que es la produccin usual de la

    zona. Se sabe que en esa poblacin los rendimientos tienen un desvo estndar

    de 210 kg/ha. El productor decide realizar una prueba sobre 9 parcelas, en las

    que pretende observar los rendimientos, promediarlos y de acuerdo al resultado

    optar o no por el nuevo producto.

    DATOS: 2150 1950 2170 1860 2050 2120 1920 1850 2230

    a. El parmetro de inters es, redimiento promedio con aplicacin denutriente.

    b. Informacin: 2, VA distribucin normal, redimiento promedio sinaplicacin de nutriente,n=9.

    c. Planteo H0y H1

    H0: 2.000

    H1: 2.000

    H0: 2.000

    H1: 2.000

    d. Se acuerda correr un riesgo de rechazar el nutriente cuando enrealidad ste cumple con las especificaciones promocionales, fijandopara ello una probabilidad de error de 5% ( = 0,05)

    e. Dado que se conoce 2, el estadstico de prueba es:

    Con Z0 ~ N(0;1)

    n

    xZ

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    8/19

    1800 1850 1900 1950 2000 2050 2100 2150 2200 -3 -2 -1 0 1 2 3

    f. Regiones de rechazo:

    Rechazo H0 si > 2.115,15 kgs/haobsx

    Rechazo H0 si zobs > 1,645

    g. Clculo del estadstico observado:

    2.033,33obsx Zobs = 0,476

    h. Conclusin:

    No se rechaza H0, es decir, no existe suficiente evidencia como para decir

    que efectivamente el nutriente aumenta los rendimientos.

    Comentarios:

    * P-value de un estadstico de prueba observado es la probabilidad de que

    la VA estadstico de prueba tome un valor al menos tan extremo como el

    observado dado que la hiptesis nula es verdadera.

    En nuestro ejemplo: P-value = P(Z> zobs/ H0 es Verdadera)

    * Si la VA bajo estudio no se distribuye normalmente debernconsiderarse las condiciones para la aplicacin del Teorema Central del

    Lmite

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    9/19

    A2. Pruebas de hiptesis acerca de la media de una distribucinnormal con variancia desconocida

    A3. Pruebas de hiptesis sobre la variancia de una distribucinnormal

    H0: 2 = 02

    H1: 2 02H0: 2 = 02

    H1: 2 >02H0: 2 = 02

    H1: 2

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    10/19

    B. Pruebas sobre dos muestras

    B1. Pruebas de hiptesis para la igualdad de dos variancias

    Esta prueba es un paso intermedio necesario en las pruebas decomparaciones de medias cuando se desconocen las varianzas poblacionales

    :H0

    :H0

    s

    s0F

    :H1

    Con F0 ~ F(n1-1;n2-1)

    Las pruebas unilaterales son muy usadas y constituyen la base de las pruebas

    asociadas a la tcnica ANOVA

    :H1

    Algunas caractersticas

    de Distribucin F-Snedecor:

    Emprica: F(n1-1;n2-1)

    Terica: si Uy V son dos variables aleatorias independientes con

    distribucin chi-cuadrado conn1-1 yn2-1 grados de libertad, entonces:

    F(n1-1;n2-1)

    s

    s

    F(5,5)

    F(12,12)

    F(50,50)0,0 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0

    0,0

    0,2

    0,4

    0,6

    0,8

    1,0

    1,2

    1,4

    1,6

    n

    V

    n

    W

    Mo (F) = (n2-1)(n1-3) / (n1-1)(n2-3)

    V(F) = 2(n2 -1)2(n1+n2)/(n1-1)(n2-3)2(n2-5)

    E(F) = (n2 1)/ (n2 3)

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    11/19

    B2. Pruebas de hiptesis sobre las medias de dosdistribuciones normales con variancias conocidas (muestrasindependientes)

    Ho: 1 = 2

    H1: 1

    2

    Ho: 1 -2 = 0

    H1: 1

    -2

    0

    1 ?

    X12 ?

    X2

    n1 n2

    x x

    B2. Pruebas de hiptesis sobre las medias de dosdistribuciones normales con variancias conocidas (muestrasindependientes)

    Ho: 1 = 2

    H1: 1 2

    Ho: 1 -2 = 0

    H1: 1 -2 0

    1 2 1 2

    12

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    12/19

    Estadstico de prueba se basa en la distribucin de una diferencia de medias:

    Bajo H0:

    nnXX ;N~

    nn

    XXZ Con Z0 ~ N(0;1)

    Se rechazar H0

    si:

    Z0 > Z/2 o Z0 < -Z/2

    B3. Pruebas de hiptesis sobre las medias de dosdistribuciones normales con variancias desconocidas

    Situacin 1:

    Dado que las varianzas se estiman de las muestras, antes de calcular el

    estadstico de prueba para las medias, debemos verificar mediante una

    Prueba F la igualdad de las varianzas poblacionales

    Si la conclusin es que las varianzas no son distintas, ambas variancias

    muestrales estiman la variancia comn 2, entonces podemos combinarlas

    para producir una sola estimacin, digamos:

    Este caso, al igual que el visto sobre hiptesis para una media con

    varianza desconocida, es el que usualmente debemos resolver.

    nn

    snsnsp

    )()(

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    13/19

    El estadstico de prueba ser:

    Con t0 ~ t(n1+n2-2)

    nns

    xxt

    p

    Se rechazar H0si:

    t0 > t

    /2 ; n1+n2-2 o t0 < - t

    /2 ; n1+n2-2

    Ho: 1 = 2

    H1: 1 2

    Si las hiptesis son de la forma:

    Tambin pueden plantearse pruebas unilaterales y todas las combinaciones entre H0y

    H1vistas anteriormente:Ho: 1 = 2

    H1: 1

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    14/19

    B4. Pruebas de hiptesis para muestras apareadas

    Se dicen muestras apareadas cuando las obervaciones en las dospoblaciones de inters se recaban de a pares, con la premisa que cada parse toma en condiciones homogeneas, aunque estas condiciones pueden

    cambiar de un par a otro.

    Ejemplo: considere que estamos interesados en comparar dos tipos de alimentospara cerdos (A y B). Para ello se planea una experiencia donde se suministrar

    cada alimento a 10 cerdos para luego comparar el peso ganado al cabo de cierto

    tiempo. Pero no contamos con un lote homogeneo de 20 cerdos en cuanto a su

    tamao y pensamos que el peso inicial de los animales es un factor que podra

    incidir en los aumentos de peso. Para evitar que este efecto peso inicial se pueda

    confundir con el efecto alimento se seleccionan parejas de cerdos de igual peso,

    y en cada una de ellas se asignan ambos alimentos al azar. Se han obtenido 20

    observaciones pero estas estnapareadas.

    H0: d = 0

    H1: d 0

    Para que la hiptesis contemple el efecto de apareo, se calcula una nuevavariabledque consiste en las diferencias observadas en cada par. La hiptesis

    nula a probar es que la media de las diferencias es cero

    El estadstico asociado a la prueba es:

    n

    s

    dt

    d

    Con t0 ~ t(n-1)

    La comparacin de medias dependientes surge de un muestreo que se realiz

    con restricciones en la aleatorizacin, esto constituye el paso elemental en undiseo experimental en el que las unidades experimentales no son homogneas

    (DBCA)

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    15/19

    B5. Pruebas de hiptesis sobre dos proporciones

    H0: P1 = P2

    H1: P1 P2

    H0: P1 - P2 = 0

    H1: P1 - P2 0

    nnpp

    Z

    )..(

    p-p 21

    nn

    xxp

    Las pruebas conocidas como chi-cuadrado utilizan el estadstico que dise Karl Pearson

    en 1899. Es un ndice que mide la desviacin de las frecuencias observadas en una

    muestra respecto a las esperadas bajo una hiptesis.

    Frmula de clculo

    i fobservado fesperado

    1

    2

    3

    .

    .

    .

    .k

    f1

    f2

    f3

    .

    .

    .

    .fk

    f

    1

    f

    2

    f

    3

    .

    .

    .

    .f

    k

    k

    ii

    ii

    f

    ff

    k

    i i

    ii

    e

    eo

    ne

    ok

    i i

    i

    C. Pruebas basadas en el estadstico de Pearson

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    16/19

    Pearson estudi la distribucin terica bajo Ho verdadera. Algunas caractersticas son:

    1. Tiene distribucin Chi-cuadrado con k-1 grados de libertad

    2. Si el valor del estadstico=0 significa que no hay diferencias entre las frecuencias

    observadas y esperadas. Cuanto ms se aleja de 0 mayor la discrepancia entre lasfrecuencias

    3. Si las frecuencias esperadas < 5 el estadstico se aleja de la distribucin Chi-

    Cuadrado por lo que se debe reagrupar intervalos o aumentar el numero de

    individuos estudiados.

    4. Si la frecuencia total es muy pequea (sobre todo para el caso de 1 grado de

    libertad) es aconsejable introducir el factor de correccin de Yates al calcular el

    estadstico.

    k

    i i

    ii

    e

    eo ,

    C1. Pruebas de ajuste de modelo:

    Modelo gentico (distribucin de proporciones):

    Ho: la segregacin de cierto poroto responde a la teora de Mendel 9:3:3:1

    (Lisos Amarillos Rugosos Amarilos Lisos Verdes Rugosos Verdes)

    Ho: la relacin de moscas ojos blancos respecto a moscas ojos rojos es 1 a 3

    Distribucin de probabilidad:

    Ho: la variable X sigue una distribucin Poisson con parmetro

    Ho: la variable X sigue una distribucin Poisson

    Ho: la variable X sigue una distribucin Normal

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    17/19

    X fob pesp fesp

    x1

    x2x3

    .

    .

    .

    .

    xk

    f1

    f2f3

    .

    .

    .

    .

    fk

    p1

    p2p3

    .

    .

    .

    .

    pk

    f

    1

    f

    2f

    3

    .

    .

    .

    .

    f

    k

    Ho: X Possion

    pi= P(X=xi/X Possion)

    = pi. N

    2Pearson

    2(k-1-p)

    if

    En general se prueba slo forma y para verificar valor de los parmetros se

    dejan las pruebas vistas anteriormente

    C2. Pruebas de independencia de dos factores:

    Determina si dos factores que clasifican a una poblacin o muestra son

    estadsticamente independientes. Es decir, los niveles de un determinado factor no

    afectan a los niveles del otro factor. Es la Hiptesis general de una tabla de

    contingencia y el principio de anlisis de datos categorizados.

    1. Ho:los factores A y B son independientes

    2. Proponer un Nivel de significacin

    3. Regla de Decisin: Hoes rechazada si y solo si, el valor chi-cuadrado es mayor que elvalor crtico para el nivel de significacin.

    4. Clculo del estadstico de Pearson

    5. Decisin

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    18/19

    Factor A

    Factor B

    Frecuencias observadasen cada celda porcombinacin de dosniveles de factores

    Total General

    Total columna

    Total fila

    Marginales fila

    Marginales columna

    A1 A2 ... Aa

    B1 f11 f12 ... f1a f1.

    B2 f21 f22 ... f2a f2.

    ... ... ... fij ... ...

    Bb fb1 fb1 ... fba fb.

    f.1 f.2 ... f.a f..

    A1 A2 ... Aa

    B1 f11 f12 ... f1a f1.

    B2 f21 f22 ... f2a f2.

    ... ... ... ... ... ...

    Bb fb1 fb1 ... fba fb.

    f.1 f.2 ... f.a f..

    Bajo la hiptesis nula, las frecuencias esperadas en una tabla de contingencia se puedenobtener como producto de las frecuencias marginales observadas.

    Es decir que bajo independencia de factores se cumple que:

    f11 f12 f1a f1.

    f.1 f.2 f.a f..= = ==

    11f

    ..

    1..111

    f

    fff

    2Pearson 2[(a-1).(b-1)]

  • 7/25/2019 Teoria 5 - PdH [Modo de Compatibilidad]

    19/19

    C3. Pruebas de homogeneidad de muestras

    Equivalente a las anteriores slo que aqu se determina si k muestras son

    homogeneas en cuanto a una caracterstica que tiene dos alternativas. La nica

    diferencia radica en la obtencin de la informacin (muestreo).

    A1 A2

    Muestra 1 f11 f12 f1.

    Muestra 2 f21 f22 f2.

    ... ... ... ...

    Muestra i fi1 fi2 fi.

    ... ... ... ...

    Muestra k fk1 fk1 fk.

    f.1 f.2 f..