t de student

Upload: leonel-castillo

Post on 08-Jan-2016

215 views

Category:

Documents


0 download

DESCRIPTION

Probabilidad y estadistica

TRANSCRIPT

  • T-StudentEsperanza Trenado Snchez

  • RECORDANDO

  • DISTRIBUCION t STUDENT

  • Con el trabajo del Qumico y Matemtico ingles, WilliamSealeyGosset, escrito bajo el seudnimo de Student, se dispone de otra distribucin conocida como distribucin t de student, abreviada como distribucin tLa distribucin esta dada por la cantidad:

  • PROPIEDADES:Tiene =0La variable t va de - hasta + Es una familia de distribuciones

    30 gl5 gl

    2 gl =0

  • Es menos espigada y las colas mas alargadas.En comparacin con la normal

  • PRUEBA t STUDENTComparacin de dos poblaciones independientes.Variable dicotmica y continua.

    SUPUESTOS

    Normalidad: En cada grupoVarianza desconocida: Iguales o diferentes

  • NormalidadEstadsticas descriptivas

    Grficos

    Test de normalidad

  • Continuacin .sum pad if fuma==0,d presion arterial diastolica (mmHg)------------------------------------------------------------- Percentiles Smallest 1% 46.35056 46.35056 5% 57.5482 55.0555110% 61.07764 57.41988 Obs 7725% 71.8108 57.5482 Sum of Wgt. 7750% 79.01965 Mean 79.3093 Largest Std. Dev. 12.726575% 88.69038 100.060690% 96.8728 102.9899 Variance 161.963995% 100.0606 106.0554 Skewness .015276799% 108.78 108.78 Kurtosis 2.752186. sum pad if fuma==1,d presion arterial diastolica (mmHg)------------------------------------------------------------- Percentiles Smallest 1% 71.04926 71.04926 5% 73.80067 73.8006710% 77.62933 77.62933 Obs 2325% 79.18894 78.72028 Sum of Wgt. 2350% 87.62447 Mean 87.70633 Largest Std. Dev. 9.01378975% 94.48155 99.3406290% 99.43048 99.43048 Variance 81.2483895% 100.4205 100.4205 Skewness -.039837499% 102.0454 102.0454 Kurtosis 1.918243

  • . histogram pad if fuma==0, frequency normal bin(10) title(Presion Arterial Diastolica en no fumadores)

    . histogram pad if fuma==1, frequency normal bin(8) title(Presion Arterial Diastolica en fumadores)Continuacin .

  • bysort fuma: swilk pad

    -> fuma = 0

    Shapiro-Wilk W test for normal data Variable | Obs W V z Prob>z-------------+--------------------------------- pad | 77 0.99243 0.503 -1.501 0.93330

    -> fuma = 1

    Shapiro-Wilk W test for normal data Variable | Obs W V z Prob>z-------------+--------------------------------- pad | 23 0.96218 0.989 -0.022 0.50883

    Continuacin .Ho: La variable pad tiene distribucin normalH1: La variable pad no tiene distribucin normal.

  • Varianzas iguales o diferentes. sdtest pad,by(fuma)

    Variance ratio test

    Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]---------+--------------------------------------------------- 0 | 77 79.3093 1.45032 12.7265 76.42074 82.19786 1 | 23 87.70633 1.879505 9.013789 83.80847 91.60418---------+---------------------------------------------------combined | 100 81.24062 1.245008 12.45008 78.77025 83.71098------------------------------------------------------------- ratio = sd(0) / sd(1) f = 1.9934Ho: ratio = 1 degrees of freedom = 76, 22

    Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1 Pr(F < f) = 0.9648 2*Pr(F > f) = 0.0703 Pr(F > f) = 0.0352

  • Dos formas de realizar la prueba t student:Prueba t student para varianzas iguales

    Donde:

  • en stata:. ttest pad, by(fuma)

    Two-sample t test with equal variances------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]---------+-------------------------------------------------------------------- 0 | 77 79.3093 1.45032 12.7265 76.42074 82.19786 1 | 23 87.70633 1.879505 9.013789 83.80847 91.60418---------+--------------------------------------------------------------------combined | 100 81.24062 1.245008 12.45008 78.77025 83.71098---------+-------------------------------------------------------------------- diff | -8.397025 2.849947 -14.05265 -2.741399------------------------------------------------------------------------------ diff = mean(0) - mean(1) t = -2.9464Ho: diff = 0 degrees of freedom = 98

    Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.0020 Pr(|T| > |t|) = 0.0040 Pr(T > t) = 0.9980

    Continuacin . Con una probabilidad de 0.0040 se concluye que la presin arterial diastolica es diferente en cada grupo de tabaquismo.

  • Continuacin .Prueba t student para varianzas diferentes

  • . ttest pad, by(fuma) unequal

    Two-sample t test with unequal variances------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]---------+-------------------------------------------------------------------- 0 | 77 79.3093 1.45032 12.7265 76.42074 82.19786 1 | 23 87.70633 1.879505 9.013789 83.80847 91.60418---------+--------------------------------------------------------------------combined | 100 81.24062 1.245008 12.45008 78.77025 83.71098---------+-------------------------------------------------------------------- diff | -8.397025 2.374019 -13.16355 -3.630498------------------------------------------------------------------------------ diff = mean(0) - mean(1) t = -3.5371Ho: diff = 0 Satterthwaite's degrees of freedom = 50.7872

    Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.0004 Pr(|T| > |t|) = 0.0009 Pr(T > t) = 0.9996en stata:Continuacin . Concluimos que la presin arterial diastlica es diferente entre los fumadores y los no fumadores.

  • Cmo comparara las medias entre tres o mas grupos o categoras?

    OJO...........En trminos de la prueba t student.

    .. ENTONCES

  • Comparando 2 poblaciones a la vez

    Continuacin . Por ejemplo: Comparar 5 poblaciones (suponiendo que son iguales)5C2 =10HACER 10 PRUEBAS t STUDENT

  • CONCLUSIN FALSA.Cuando se comparan dos medias a nivel de significacin , la probabilidad de cometer un error de tipo I es .Cuando se comparan de a dos a medias tenemos comparaciones posibles. Probabilidad de cometer un erro tipo I:1-[(1-) ]

  • Para 5 grupos tenemos 10 comparaciones posibles, para un = 0,05 :P(x>0)=1-[(1-0,05)^10]= 0,40Probabilidad de no rechazar una hiptesis de no diferencia en cada caso seria de 0.95.(0.95)10 = 0.5987Rechazar la hiptesis nula: Error tipo I

  • Lo mas grave: Muestras no independientes. Necesitamos un mejor mtodo para comparar mas de 2 poblaciones.ANOVA

    *********************