t de student
DESCRIPTION
Probabilidad y estadisticaTRANSCRIPT
-
T-StudentEsperanza Trenado Snchez
-
RECORDANDO
-
DISTRIBUCION t STUDENT
-
Con el trabajo del Qumico y Matemtico ingles, WilliamSealeyGosset, escrito bajo el seudnimo de Student, se dispone de otra distribucin conocida como distribucin t de student, abreviada como distribucin tLa distribucin esta dada por la cantidad:
-
PROPIEDADES:Tiene =0La variable t va de - hasta + Es una familia de distribuciones
30 gl5 gl
2 gl =0
-
Es menos espigada y las colas mas alargadas.En comparacin con la normal
-
PRUEBA t STUDENTComparacin de dos poblaciones independientes.Variable dicotmica y continua.
SUPUESTOS
Normalidad: En cada grupoVarianza desconocida: Iguales o diferentes
-
NormalidadEstadsticas descriptivas
Grficos
Test de normalidad
-
Continuacin .sum pad if fuma==0,d presion arterial diastolica (mmHg)------------------------------------------------------------- Percentiles Smallest 1% 46.35056 46.35056 5% 57.5482 55.0555110% 61.07764 57.41988 Obs 7725% 71.8108 57.5482 Sum of Wgt. 7750% 79.01965 Mean 79.3093 Largest Std. Dev. 12.726575% 88.69038 100.060690% 96.8728 102.9899 Variance 161.963995% 100.0606 106.0554 Skewness .015276799% 108.78 108.78 Kurtosis 2.752186. sum pad if fuma==1,d presion arterial diastolica (mmHg)------------------------------------------------------------- Percentiles Smallest 1% 71.04926 71.04926 5% 73.80067 73.8006710% 77.62933 77.62933 Obs 2325% 79.18894 78.72028 Sum of Wgt. 2350% 87.62447 Mean 87.70633 Largest Std. Dev. 9.01378975% 94.48155 99.3406290% 99.43048 99.43048 Variance 81.2483895% 100.4205 100.4205 Skewness -.039837499% 102.0454 102.0454 Kurtosis 1.918243
-
. histogram pad if fuma==0, frequency normal bin(10) title(Presion Arterial Diastolica en no fumadores)
. histogram pad if fuma==1, frequency normal bin(8) title(Presion Arterial Diastolica en fumadores)Continuacin .
-
bysort fuma: swilk pad
-> fuma = 0
Shapiro-Wilk W test for normal data Variable | Obs W V z Prob>z-------------+--------------------------------- pad | 77 0.99243 0.503 -1.501 0.93330
-> fuma = 1
Shapiro-Wilk W test for normal data Variable | Obs W V z Prob>z-------------+--------------------------------- pad | 23 0.96218 0.989 -0.022 0.50883
Continuacin .Ho: La variable pad tiene distribucin normalH1: La variable pad no tiene distribucin normal.
-
Varianzas iguales o diferentes. sdtest pad,by(fuma)
Variance ratio test
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]---------+--------------------------------------------------- 0 | 77 79.3093 1.45032 12.7265 76.42074 82.19786 1 | 23 87.70633 1.879505 9.013789 83.80847 91.60418---------+---------------------------------------------------combined | 100 81.24062 1.245008 12.45008 78.77025 83.71098------------------------------------------------------------- ratio = sd(0) / sd(1) f = 1.9934Ho: ratio = 1 degrees of freedom = 76, 22
Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1 Pr(F < f) = 0.9648 2*Pr(F > f) = 0.0703 Pr(F > f) = 0.0352
-
Dos formas de realizar la prueba t student:Prueba t student para varianzas iguales
Donde:
-
en stata:. ttest pad, by(fuma)
Two-sample t test with equal variances------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]---------+-------------------------------------------------------------------- 0 | 77 79.3093 1.45032 12.7265 76.42074 82.19786 1 | 23 87.70633 1.879505 9.013789 83.80847 91.60418---------+--------------------------------------------------------------------combined | 100 81.24062 1.245008 12.45008 78.77025 83.71098---------+-------------------------------------------------------------------- diff | -8.397025 2.849947 -14.05265 -2.741399------------------------------------------------------------------------------ diff = mean(0) - mean(1) t = -2.9464Ho: diff = 0 degrees of freedom = 98
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.0020 Pr(|T| > |t|) = 0.0040 Pr(T > t) = 0.9980
Continuacin . Con una probabilidad de 0.0040 se concluye que la presin arterial diastolica es diferente en cada grupo de tabaquismo.
-
Continuacin .Prueba t student para varianzas diferentes
-
. ttest pad, by(fuma) unequal
Two-sample t test with unequal variances------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]---------+-------------------------------------------------------------------- 0 | 77 79.3093 1.45032 12.7265 76.42074 82.19786 1 | 23 87.70633 1.879505 9.013789 83.80847 91.60418---------+--------------------------------------------------------------------combined | 100 81.24062 1.245008 12.45008 78.77025 83.71098---------+-------------------------------------------------------------------- diff | -8.397025 2.374019 -13.16355 -3.630498------------------------------------------------------------------------------ diff = mean(0) - mean(1) t = -3.5371Ho: diff = 0 Satterthwaite's degrees of freedom = 50.7872
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.0004 Pr(|T| > |t|) = 0.0009 Pr(T > t) = 0.9996en stata:Continuacin . Concluimos que la presin arterial diastlica es diferente entre los fumadores y los no fumadores.
-
Cmo comparara las medias entre tres o mas grupos o categoras?
OJO...........En trminos de la prueba t student.
.. ENTONCES
-
Comparando 2 poblaciones a la vez
Continuacin . Por ejemplo: Comparar 5 poblaciones (suponiendo que son iguales)5C2 =10HACER 10 PRUEBAS t STUDENT
-
CONCLUSIN FALSA.Cuando se comparan dos medias a nivel de significacin , la probabilidad de cometer un error de tipo I es .Cuando se comparan de a dos a medias tenemos comparaciones posibles. Probabilidad de cometer un erro tipo I:1-[(1-) ]
-
Para 5 grupos tenemos 10 comparaciones posibles, para un = 0,05 :P(x>0)=1-[(1-0,05)^10]= 0,40Probabilidad de no rechazar una hiptesis de no diferencia en cada caso seria de 0.95.(0.95)10 = 0.5987Rechazar la hiptesis nula: Error tipo I
-
Lo mas grave: Muestras no independientes. Necesitamos un mejor mtodo para comparar mas de 2 poblaciones.ANOVA
*********************