fundamentos de diseño y estadística - metodo.uab complementarios 09-11.pdf · ejercicios...

38
Ejercicios complementarios: Unidades 9 a 11 Pág. 1 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat ) Última revisión 17.03.2014 Fundamentos de Diseño y Estadística Ejercicios complementarios: Unidades 9 a 11 Problema 1 Factores de riesgo para el TDAH y repercusiones académicas Se efectúa un estudio transversal-analítico para determinar la epidemiología del TDAH en niños escolariza- dos en escuelas públicas de educación primaria en una comunidad de alto riesgo y valorar las consecuencias académicas de los problemas disruptivos asociados a este trastorno. Las siguientes preguntas se basan en algunos resultados de una muestra de 60 sujetos seleccionados del estudio anterior. Las variables escogidas para este problema han sido: sexo (0=femenino vs 1=masculino), hábito de fumar de la madre durante la gestación (0=no fumadoras, 1=fumadoras moderadas y 2=fumadoras excesivas), diagnóstico de TDAH (0=ausente vs 1=presente), subtipo del TDAH (1=desatento, 2=hiperactivo y 3=combinado), gravedad de los problemas disruptivos (número total de síntomas de TDAH, con rango teórico 0 a 18) y rendimiento académico (promedio de notas el último curso, con rango teórico 0 a 10). Pregunta 1. Estimar, con confianza del 95%, en la población origen de la muestra: Total 28 32 Presente 11 15 Ausente 17 17 TDAH Femenino Masculino Sexo Total 60 6.666667 4.316569 Masculino 32 7.0625 4.493275 Femenino 28 6.214286 4.139754 Sexo N mean sd La prevalencia de TDAH: La media del número de síntomas de desatención: La variancia del número de síntomas de desatención: Pregunta 2. El siguiente listado permite valorar la normalidad de la distribución de la gravedad de los problemas disruptivos (número de síntomas de TDAH): 0 2 4 6 8 10 12 14 Ausente Presente SintomADHD Graphs by TDAH SintomADHD 26 0.98818 0.338 -2.222 0.98686 Variable Obs W V z Prob>z Shapiro-Wilk W test for normal data -> TDAH = Presente SintomADHD 34 0.98660 0.468 -1.583 0.94324 Variable Obs W V z Prob>z Shapiro-Wilk W test for normal data -> TDAH = Ausente A. Estos resultados sugieren que en los sujetos con diagnóstico de TDAH presente: (A): Se vulnera la normalidad porque el boxplot tiene patas de diferente longitud. (B): Se vulnera la normalidad (p=.988). (C): No se vulnera la normalidad (p=.987). (D): No se vulnera la normalidad por tratarse de muestra grande (N=60). www.metodo.uab.cat Estudios de postgrado en Metodología de la investigación en Ciencias de la Salud

Upload: others

Post on 22-Mar-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 1 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Fundamentos de Diseño y Estadística Ejercicios complementarios: Unidades 9 a 11

Problema 1 Factores de riesgo para el TDAH y repercusiones académicas

Se efectúa un estudio transversal-analítico para determinar la epidemiología del TDAH en niños escolariza-dos en escuelas públicas de educación primaria en una comunidad de alto riesgo y valorar las consecuencias académicas de los problemas disruptivos asociados a este trastorno. Las siguientes preguntas se basan en algunos resultados de una muestra de 60 sujetos seleccionados del estudio anterior.

Las variables escogidas para este problema han sido: sexo (0=femenino vs 1=masculino), hábito de fumar de la madre durante la gestación (0=no fumadoras, 1=fumadoras moderadas y 2=fumadoras excesivas), diagnóstico de TDAH (0=ausente vs 1=presente), subtipo del TDAH (1=desatento, 2=hiperactivo y 3=combinado), gravedad de los problemas disruptivos (número total de síntomas de TDAH, con rango teórico 0 a 18) y rendimiento académico (promedio de notas el último curso, con rango teórico 0 a 10).

Pregunta 1. Estimar, con confianza del 95%, en la población origen de la muestra:

Total 28 32 Presente 11 15 Ausente 17 17 TDAH Femenino Masculino Sexo

Total 60 6.666667 4.316569 Masculino 32 7.0625 4.493275 Femenino 28 6.214286 4.139754 Sexo N mean sd

La prevalencia de TDAH:

La media del número de síntomas de desatención:

La variancia del número de síntomas de desatención:

Pregunta 2. El siguiente listado permite valorar la normalidad de la distribución de la gravedad de los problemas disruptivos (número de síntomas de TDAH):

02

46

810

1214

Ausente Presente

Sin

tom

AD

HD

Graphs by TDAH SintomADHD 26 0.98818 0.338 -2.222 0.98686 Variable Obs W V z Prob>z

Shapiro-Wilk W test for normal data

-> TDAH = Presente

SintomADHD 34 0.98660 0.468 -1.583 0.94324 Variable Obs W V z Prob>z

Shapiro-Wilk W test for normal data

-> TDAH = Ausente

A. Estos resultados sugieren que en los sujetos con diagnóstico de TDAH presente:

(A): Se vulnera la normalidad porque el boxplot tiene patas de diferente longitud. (B): Se vulnera la normalidad (p=.988). (C): No se vulnera la normalidad (p=.987). (D): No se vulnera la normalidad por tratarse de muestra grande (N=60).

www.metodo.uab.cat

Estudios de postgrado enMetodología de la investigación

en Ciencias de la Salud

Page 2: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 2 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 3. Valorar la relación entre hábito de fumar gestacional y presencia de diagnóstico de TDAH: | FumaGest TDAH | No fuma Moderada Excesiva | Total -----------+---------------------------------+---------- Presente | 6 12 8 | 26 | | 43.33 -----------+---------------------------------+---------- Ausente | 20 9 5 | 34 | | 56.67 -----------+---------------------------------+---------- Total | 26 21 13 | 60 Pearson chi2(2) = 7.7301 Pr = 0.021

| ----- Wilson ----- Ref. category: First Metric| Cases Total Risk [95% Conf. Inter.] RR 95% Conf. Inter. ------+---------------------------------------------------------------------- 0 | 6 26 0.110338 0.420516 1.000 . . 1 | 12 21 0.365466 0.755300 1.120 5.475 2 | 8 13 0.355229 0.822903 1.171 6.072 ------+---------------------------------------------------------------------- TOTAL | 26 60 0.433333 0.315724 0.558966 -------------------------------------------------- MH Test for linear Trend: Chi2(1) = 6.4487 (p= 0.0111) Deviation from linearity: Chi2(1) = (p= )

A. Completar todos los valores omitidos del listado anterior. B. ¿Estos resultados sugieren relación entre el hábito de fumar durante la gestación y el TDAH? (A): No, en absoluto (p=.021). (B): Sí, e indican una asociación lineal positiva-creciente (p=.011). (C): Sí, e indican una asociación lineal negativa-decreciente (p=.018). (D): Estos resultados no permiten contestar (hay frecuencias esperadas inferiores a 5).

Pregunta 4. Efectuar la prueba de desvío respecto a la línea recta para los datos de la pregunta anterior.

¿Qué sugieren estos nuevos resultados basados en la prueba de desvío? (A): El desvío respecto a la línea recta no es significativo (p=.26). (B): Hay un desvío significativo que indica tendencia cuadrática (p=.011). (C): Fumadoras moderadas y excesivas tienen el mismo riesgo de tener hijos con TDAH (p=.018). (D): Esta prueba es inapropiada para valorar la relación entre hábito de fumar y TDAH.

Pregunta 5. Valorar la relación entre presencia de diagnóstico de TDAH y rendimiento académico: -> TDAH = Ausente Shapiro-Wilk W test for normal data Variable | Obs W V z Prob>z -------------+-------------------------------------------------- Rendimiento | 34 0.97315 0.937 -0.135 0.55357 -> TDAH = Presente Shapiro-Wilk W test for normal data Variable | Obs W V z Prob>z -------------+-------------------------------------------------- Rendimiento | 26 0.94603 1.543 0.889 0.18700

Page 3: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 3 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Two-sample t test with equal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- Presente | 26 4.270769 .211045 1.076122 3.836114 4.705424 Ausente | 34 7.317647 .1462216 .8526112 7.020157 7.615137 ---------+-------------------------------------------------------------------- combined | 60 5.997333 .2315 1.793191 5.534103 6.460564 ---------+-------------------------------------------------------------------- diff | .2489019 . ------------------------------------------------------------------------------ diff = mean(Presente) - mean(Ausente) t = . Ho: diff = 0 degrees of freedom = . Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000 Two-sample Wilcoxon rank-sum (Mann-Whitney) test TDAH | obs rank sum expected -------------+--------------------------------- Presente | 26 368 793 Ausente | 34 1462 1037 -------------+--------------------------------- combined | 60 1830 1830 unadjusted variance 4493.67 adjustment for ties -3.75 ---------- adjusted variance 4489.92 Ho: Rendim~o(TDAH==Presente) = Rendim~o(TDAH==Ausente) z = -6.343; Prob > |z| = 0.0000

A. Completar los valores omitidos del listado anterior.

B. ¿Los resultados de la prueba de significación sugieren relación entre TDAH y rendimiento? (A): No, en absoluto (p=.554). (B): Sí, e indican que los niños con TDAH tienen menor rendimiento (to=12.2; p<.001). (C): Sí, e indican que los niños con TDAH tienen menor rendimiento (zo=6.34; p=0.000). (D): Ninguna de las opciones anteriores es correcta.

C. ¿A qué conclusión se llega con el IC 95% de la diferencia de medias? (A): El TDAH no es factor de riesgo de bajo rendimiento (el IC incluye el valor 0). (B): Los sujetos con TDAH tienen como máximo 2.53 puntos menos en el rendimiento académico. (C): Los sujetos con TDAH tienen como mínimo 3.54 menos en el rendimiento académico. (D): Los sujetos con TDAH tienen entre 2.5 y 3.5 puntos menos en rendimiento académico.

D. Si una diferencia en el rendimiento académico sólo es relevante a partir de *=2 puntos: (A): La diferencia es estadísticamente no significativa y clínicamente no importante. (B): La diferencia es estadísticamente no significativa y clínicamente sí importante. (C): La diferencia es estadísticamente significativa y clínicamente no importante. (D): La diferencia es estadísticamente significativa y clínicamente sí importante.

Page 4: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 4 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Problema 2 Epidemiología del trastorno por déficit de atención con hiperactividad

El trastorno por déficit de atención con hiperactividad (TDAH) es una alteración del comportamiento infantil con implicación de diversos factores neuropsicológicos y bio-psico-sociales que provocan en el niño alteraciones atencionales, impulsividad y sobreactividad motora. Este problema es de carácter crónico (los síntomas pueden controlarse con tratamiento adecuado, pero el trastorno no desaparece durante el período infantil). A nivel clínico se expresa con una acusada falta de autocontrol y con repercusiones importantes en el desarrollo del menor, en su capacidad de aprendizaje y en su ajuste social.

Suponer que la siguiente tabla presenta los resultados de una investigación epidemiológica prospectiva en una población de alto riesgo caracterizada por un bajo nivel sociocultural de las familias. Los datos corresponden a las evaluaciones efectuadas al inicio (enero de 2003) y al final (enero de 2004) del estudio en niños escolarizados con 9 años de edad en la primera medición. Para realizar este ejercicio, suponer que no se han producido abandonos durante el seguimiento, y que el curso del trastorno es crónico:

Diagnóstico Enero 2003 Enero 2004

TDAH Niñas Niños Niñas Niños

Presente 18 32 20 38

Ausente 92 68 90 62

Pregunta 6. Obtener los siguientes índices para la cohorte de niños y niñas:

A. Indicar los siguientes valores. Niñas Niños

Total de sujetos evaluados en el estudio:

Sujetos con diagnóstico de TDAH presente al inicio del estudio:

Sujetos con diagnóstico de TDAH presente al final del estudio:

Nuevos diagnósticos registrados durante el seguimiento:

Tiempo de duración del estudio (meses):

B. Calcular los siguientes valores. Niñas Niños

Prevalencia de TDAH en enero 2003:

Prevalencia de TDAH en enero 2004:

Odds de TDAH en enero 2004:

Riesgo de TDAH durante el año 2003:

Tasa relativa mensual de TDAH durante el 2003:

Pregunta 7. Estimar el riesgo de TDAH durante el seguimiento y el RR de niños respecto a niñas:

Riesgo Riesgo Relativo

Niños Niñas RR (niños/niñas)

Riesgo:

IC 95% asintótico:

Page 5: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 5 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 8. El siguiente listado permite valorar la relación entre sexo y TDAH al inicio (enero 2003):

ASSOCIATION MEASURES: CROSS-SECTIONAL STUDY | Exposure | | Exposed proportion |Unexposed| Exposed | TOTAL | 95% CI (Wilson) ------------------+---------+---------+---------+-------------------- Cases | A| B| C| D | | | |(,501410 to ,758613) NonCases | 92 | 68 | 160 | ,425000 | | | |(,351043 to ,502473) ------------------+---------+---------+---------+-------------------- TOTAL | E| F| G| ,476190 | | | |(,409678 to ,543559) Prevalence | H| I| J| 95% CI Lower | ,106088 | ,236691 | ,185521 | (Wilson) Upper | ,243885 | ,416626 | ,300079 | ------------------+-------------------+---------------------------------- | Estimate | 95% Confidence Interval ------------------+-------------------+---------------------------------- Prev. Diff. (PD) | K | ,041740 ,270987 Wald | | ,040691 ,268829 Newcombe Prev. Ratio (PR) | L | 1,1743 3,2566 Odds ratio (OR) | M | 1,2468 4,6399 ------------------+-------------------+---------------------------------- Association Chi2 | 7,0598 | P= N Corrected | 6,2242 | P= ,012602 ------------------+-------------------+----------------------------------

A. Completar los valores omitidos del listado anterior.

¿Estos resultados sugieren relación entre el sexo de los hijos y la presencia de TDAH?

(A): No, en absoluto (p=.0126). (B): Sí: el sexo masculino es un factor protector (p=.008). (C): Sí: ser niño aumenta la prevalencia de TDAH 1.96 veces (IC 95% PR: 1.2 a 3.3). (D): Entre las niñas podría llegar a haber hasta un 26.9% más de casos con TDAH.

Page 6: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 6 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Problema 3 Efecto de Citalopram y psicoterapia interpersonal en pacientes coronarios

Se realiza un estudio randomizado para comparar la eficacia a corto plazo del tratamiento con Citalopram y la psicoterapia interpersonal sobre los síntomas de depresión que presentan los pacientes con patología coronaria (Lespérance et al., 2007, JAMA). Todos los sujetos participantes cumplían los criterios DSM-IV de depresión mayor de al menos 4 semanas de duración. La siguiente tabla recoge algunas de las principales variables seleccionadas de este estudio para realizar este problema. Las medidas referidas a la depresión se tomaron al inicio de la investigación y al cabo de 12 semanas.

Características sociodemográficas de los pacientes: Sexo. Se registró con los valores 0=Femenino y 1=Masculino. Edad (en años cumplidos). Nivel socioeconómico. Se midió con la escala Hollingshead (1975), que permite establecer una

clasificación en tres grupos: 2=Alto, 1=Medio y 0=Bajo. Grupo de tratamiento: 0=Psicoterapia interpersonal versus 1=Citalopram.

Valoraciones clínicas al inicio: Escala IPRI (“Interpersonal Relationship Inventory”). Ofrece una valoración cuantitativa del apoyo social

que perciben los sujetos. Puntuaciones más altas son indicadoras de mayor apoyo social. Escala FPI (“Function in Daily Activities”). Ofrece una valoración cuantitativa del nivel de actividad de los

sujetos. Puntuaciones más altas son indicadoras de mayor actividad. Presión arterial sistólica (en mmHg). Presión arterial diastólica (en mmHg). Hipertensión arterial. Los valores anteriores han permitido obtener una clasificación de los pacientes en

dos grupos: 0=Normotenso versus 1=Hipertenso. Test de la función tiroidea. Permitió clasificar a los pacientes en dos grupos: 0=Función correcta versus

1=Función alterada.

Valoración de la depresión: Escala HAM-D (“Hamilton Depression Rating Scale”). Ofrece una valoración cuantitativa del nivel de

depresión de los sujetos. Los valores más altos son indicadores de mayor depresión. Se midió al inicio yal final del estudio.

Escala BDI-II (“Beck Depression Inventory II”). Ofrece una valoración cuantitativa del nivel de depresiónde los sujetos. Los valores más altos son indicadores de mayor depresión. Se midió al inicio y al final delestudio.

Presencia de depresión clínica al final del estudio. Las puntuaciones finales en las escalas anteriores permitió clasificar a los pacientes en dos grupos (1=deprimidos versus 0=no deprimidos) a partir del punto de corte 20 en el HAM-D y 18 en el BDI-II.

Cambio en las puntuaciones HAM-D y BDI-II. Se crearon dos variables que recogen la diferencia pre-post en las puntuaciones de depresión para ambas escalas (HAM-D y BDI-II).

Los siguientes listados presentan algunos resultados seleccionados de este estudio para realizar este problema, para una muestra de 80 pacientes (40 tratados con psicoterapia y 40 con Citolapram).

Listado 1

2.271138 2.584153 1.564995 5.297943 1.979483 5.602765 5.488538 5.837989 Total 8.8625 9.575 25.1375 15.5875 23.175 13.5375 9.55 9.6375 2.304399 2.496022 1.588218 4.429215 1.887713 4.948711 4.723034 5.089897 Citalopram 9.65 9.775 25.125 13.85 22.775 11.65 11.275 11.125 1.966221 2.686027 1.561557 5.57185 2.011346 5.638183 5.710483 6.212271Psicoterapia 8.075 9.375 25.15 17.325 23.575 15.425 7.825 8.15 Grupo IPRI FPI HAMpre HAMpost BDIpre BDIpost DiferHAM DiferBDI

by categories of: Grupo (Grupo)Summary statistics: mean, sd

Page 7: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 7 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Listado 2

Total 40 40 80 30 0 1 1 28 2 1 3 27 7 5 12 26 9 6 15 25 6 14 20 24 12 9 21 23 3 1 4 22 0 3 3 21 1 0 1 HAMpre Femenino Masculino Total Sexo

Listado 3

Total 40 40 Alterada 3 4 Correcta 37 36 Tiroidea Psicotera Citalopra Grupo

Total 40 40 Presente 3 5 Ausente 37 35 ón Psicotera Citalopra Hipertensi Grupo

Listado 4 | Grupo DepreHAM | Psicotera Citalopra | Total -----------+----------------------+---------- Ausente | 24 34 | 58 | | 72.50 -----------+----------------------+---------- Presente | | 22 | | 27.50 -----------+----------------------+---------- Total | | 80 Pearson chi2(1) = Pr = .

column percentage frequency Key

ASSOCIATION MEASURES: SSTUDY Valid cases: 80 (100.0%) Total cases: 80 | Grupo | DepreHAM |Psicoter~a|Citalopram| TOTAL ------------------+----------+----------+---------- Ausente | 24 | 34 | 58 Presente | | | 22 ------------------+----------+----------+---------- TOTAL | | | 80 | | | Risk | | | 95% CI Lower | 0.445959 | 0.709277 | (Wilson) Upper | 0.736517 | 0.929388 | ---------------------------------------------------------------------------- | Estimate | 95% Confidence Interval ------------------+---------------------+----------------------------------- Risk diff. (RD) | | 0.053939 0.423295 Newcombeª | | 0.062135 0.437865 Wald Risk ratio (RR) | | . Odds ratio (OR) | | . ------------------+---------------------+----------------------------------- ªNewcombe's Method 10 (Recommended CI)

Page 8: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 8 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Listado 5

W10 = 12.151971 df(1, 78) Pr > F = 0.00080826

W50 = 7.212287 df(1, 78) Pr > F = 0.00884271

W0 = 11.657058 df(1, 78) Pr > F = 0.00101749

Total 15.5875 5.2979426 80 Citalopra 13.85 4.4292154 40 Psicotera 17.325 5.57185 40 Grupo Mean Std. Dev. Freq. Summary of HAMpost

. robvar HAMpost, by(Grupo)

W10 = 8.0638192 df(1, 78) Pr > F = 0.00575636

W50 = 6.0578660 df(1, 78) Pr > F = 0.01605271

W0 = 6.7931086 df(1, 78) Pr > F = 0.01095811

Total 13.5375 5.6027655 80 Citalopra 11.65 4.9487113 40 Psicotera 15.425 5.6381826 40 Grupo Mean Std. Dev. Freq. Summary of BDIpost

. robvar BDIpost, by(Grupo)

. ttest HAMpost, by(Grupo) unequal Two-sample t test with unequal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- Psicoter | 40 17.325 .8809868 5.57185 15.54304 19.10696 Citalopr | 40 13.85 .7003204 4.429215 12.43347 15.26653 ---------+-------------------------------------------------------------------- combined | 80 15.5875 .592328 5.297943 14.4085 16.7665 ---------+-------------------------------------------------------------------- diff | 1.125427 . ------------------------------------------------------------------------------ diff = mean(Psicoter) - mean(Citalopr) t = . Ho: diff = 0 Satterthwaite's degrees of freedom = 74.2238 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.9986 Pr(|T| > |t|) = Pr(T > t) = 0.0014 . ttest BDIpost, by(Grupo) unequal Two-sample t test with unequal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- Psicoter | 40 15.425 .8914749 5.638183 13.62182 17.22818 Citalopr | 40 11.65 .78246 4.948711 10.06733 13.23267 ---------+-------------------------------------------------------------------- combined | 80 13.5375 .6264082 5.602765 12.29067 14.78433 ---------+-------------------------------------------------------------------- diff | 1.186158 . ------------------------------------------------------------------------------ diff = mean(Psicoter) - mean(Citalopr) t = . Ho: diff = 0 Satterthwaite's degrees of freedom = 76.7096 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.9989 Pr(|T| > |t|) = Pr(T > t) = 0.0011

Listado 6

Prob > |z| = 0.0032 z = 2.948Ho: HAMpost(Grupo==Psicoterapia) = HAMpost(Grupo==Citalopram)

adjusted variance 10602.53 adjustment for ties -197.47unadjusted variance 10800.00

combined 80 3240 3240 Citalopram 40 1316.5 1620Psicoterapia 40 1923.5 1620 Grupo obs rank sum expected

Two-sample Wilcoxon rank-sum (Mann-Whitney) test

. ranksum HAMpost,by(Grupo)

Prob > |z| = 0.0013 z = 3.215Ho: BDIpost(Grupo==Psicoterapia) = BDIpost(Grupo==Citalopram)

adjusted variance 10662.78 adjustment for ties -137.22unadjusted variance 10800.00

combined 80 3240 3240 Citalopram 40 1288 1620Psicoterapia 40 1952 1620 Grupo obs rank sum expected

Two-sample Wilcoxon rank-sum (Mann-Whitney) test

. ranksum BDIpost,by(Grupo)

Page 9: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 9 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 9. Se trata de dibujar el diagrama de caja (Boxplot) para la puntuación de depresión HAM-D al inicio del estudio en la muestra de mujeres.

¿A partir de qué umbral se consideran valores lejanos por la cola inferior?

¿A partir de qué umbral se consideran valores lejanos por la cola superior?

¿Qué valor corresponde a la línea que limita la caja por la cola superior?

¿Qué valor corresponde a la línea que limita la caja por la cola inferior?

¿Qué valor corresponde a la línea que se destaca dentro de la caja?

¿Qué valor alcanza la pata inferior de la caja?

¿Qué valor alcanza la pata superior de la caja?

Pregunta 10. Se trata de dibujar el diagrama de tallo y hoja (stem & leaf) para la puntuación de depresión HAM-D al inicio del estudio en la muestra de hombres.

¿Según la regla de Sturges, cuántas líneas en total debería tener el gráfico?

¿Cuántas líneas por tallo son las más indicadas para esta representación?

¿Cuántas hojas tiene la primera línea dibujada en el diagrama?

¿Cuántas hojas tiene la última línea dibujada en el diagrama?

¿Cuántas líneas en total tiene el diagrama de tallo y hoja una vez dibujado?

Pregunta 11. Estimar con confianza del 95% en la población de pacientes tratados con Citalopram.

A. La puntuación media en la escala HAM-D al final del estudio.

¿Puede utilizarse la aproximación con la ley Normal para el cálculo del IC anterior?

(A): Sí. Es más, el IC sólo se puede calcular usando la aproximación con la ley Normal. (B): Sí, el IC puede estimarse con la ley Normal porque la fórmula cumple las condiciones. (C): No, el IC sólo se puede obtener con la fórmula exacta basada en la ley Binomial. (D): Faltan datos para contestar esta pregunta.

B. La proporción de pacientes con hipertensión arterial.

¿Puede utilizarse la aproximación con la ley Normal para el cálculo del IC anterior?

(A): Sí. Es más, el IC sólo se puede calcular usando la aproximación con la ley Normal. (B): Sí, el IC puede estimarse con la ley Normal porque la fórmula cumple las condiciones. (C): No, el IC sólo se puede obtener con una fórmula exacta. (D): Faltan datos para contestar esta pregunta.

C. La proporción de remisiones de depresión (en base a la puntuación en HAM-D).

¿Puede utilizarse la aproximación con la ley Normal para el cálculo del IC anterior?

(A): Sí. Es más, el IC sólo se puede calcular usando la aproximación con la ley Normal. (B): Sí, el IC puede estimarse con la ley Normal porque la fórmula cumple las condiciones. (C): No, el IC sólo se puede obtener con una fórmula exacta. (D): Faltan datos para contestar esta pregunta.

Page 10: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 10 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 12. Valorar la relación entre el tipo de tratamiento (Citalopram/psicoterapia) y la presencia de depresión (presente/ausente) al final del estudio. (Utilizar como medida de depresión el HAM-D).

A. Completar el listado que contiene los datos para contestar.

B. ¿Qué conclusión es más correcta en base a la diferencia de riesgos (de curación)?

(A): El Citalopram consigue un 25.0% más de curaciones. (B): El Citalopram consigue entre un 5.4% y un 42.3% más de curaciones. (C): El Citalopram y la psicoterapia obtienen la misma incidencia acumulada de curaciones. (D): Ninguna de las opciones anteriores es cierta.

C. ¿Qué conclusión es más correcta en base al riesgo relativo (de curación)?

(A): El riesgo de curación es análogo para ambos tratamientos. (B): El riesgo de curación es 3.8 veces mayor para el Citalopram. (C): La incidencia acumulada de curaciones es entre 1.3 y 11.1 veces mayor para el Citalopram. (D): El riesgo de curación es entre 1.1 y 1.9 veces superior para el Citalopram.

Si un riesgo relativo sólo se considera importante si supera 2, ¿qué se puede concluir? (A): Los resultados son clínicamente no importantes. (B): Los resultados son clínicamente importantes. (C): Los resultados son no concluyentes. (D): En este estudio no tiene ninguna relevancia calcular el riesgo relativo.

D. ¿Qué conclusión es más correcta en base a la razón de odds (de curación)?

(A): La odds de curaciones es 1.4 veces mayor para el Citalopram. (B): La odds de curaciones es entre 1.3 y 11.1 veces superior para el Citalopram. (C): La posibilidad de curación es entre 1.1 y 1.9 veces superior para el Citalopram. (D): La posibilidad de curación es estadísticamente idéntica para ambos tratamientos.

Si una razón de odds sólo se considera importante si supera 2, ¿qué se puede concluir? (A): Los resultados son clínicamente no importantes. (B): Los resultados son clínicamente importantes. (C): Los resultados son no concluyentes. (D): En este estudio no tiene ninguna relevancia calcular la razón de odds.

E. Calcular el número de sujetos necesario para tratar del estudio (basado en la RD de curaciones del Citalopram frente a la psicoterapia).

Pregunta 13. Valorar la relación entre el tipo de tratamiento (Citalopram/psicoterapia) y la puntuación en la escala de depresión HAM-D al final del estudio a través de una prueba paramétrica.

A. Efectuar la prueba de significación y contestar.

¿Qué conclusión es más correcta en base a los resultados de la prueba de significación? (A): La puntuación final media HAM-D es estadísticamente igual para ambos tratamientos. (B): La puntuación final media HAM-D es 3.48 veces inferior para el Citalopram. (C): La puntuación final media HAM-D es inferior para el Citalopram (p<0.05). (D): La puntuación final media HAM-D es inferior para la psicoterapia (p<0.010).

B. Estimar el intervalo de confianza de la diferencia de medias y contestar las preguntas:

¿Qué conclusión es más correcta en base a los resultados del intervalo de confianza? (A): Ambos tratamientos obtienen una puntuación final media en el HAM-D igual. (B): Los tratados con Citalopram obtienen, en media, entre 1.2 y 5.7 puntos menos en el HAM-D. (C): Los tratados con psicoterapia obtienen, en media, 3.5 puntos menos en el HAM-D. (D): Ninguna de las opciones anteriores es correcta.

Si una diferencia en el cambio medio del HAM-D sólo es clínicamente importante a partir de 5 puntos, ¿qué se puede concluir de los resultados obtenidos?

(A): Los resultados son clínicamente no importantes. (B): Los resultados son clínicamente importantes. (C): Los resultados son no concluyentes. (D): Faltan datos para contestar esta pregunta.

Page 11: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 11 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 14. Se desea contestar la pregunta anterior, pero a través de una prueba no paramétrica.

¿Qué conclusión es más correcta en base a los obtenidos en la prueba no paramétrica? (A): La puntuación final media HAM-D es estadísticamente igual para ambos tratamientos. (B): La puntuación final media HAM-D es 3.48 veces inferior para el Citalopram. (C): La puntuación final media HAM-D es inferior para el Citalopram (p=0.003). (D): La puntuación final media HAM-D es inferior para la psicoterapia (p=0.001).

Pregunta 15. Valorar la relación entre el tipo de tratamiento (Citalopram/psicoterapia) y la puntuación en la escala de depresión BDI-II al final del estudio a través de una prueba paramétrica.

A. Realizar la prueba de significación y contestar:

¿Qué conclusión es más correcta en base a los resultados de la prueba de significación? (A): La puntuación final media BDI-II es estadísticamente igual para ambos tratamientos. (B): La puntuación final media BDI-II es 3.88 veces inferior para el Citalopram. (C): La puntuación final media BDI-II es inferior para el Citalopram (p=0.003). (D): La puntuación final media BDI-II es inferior para la psicoterapia (p<0.010).

B. Estimar el intervalo de confianza de la diferencia de medias y contestar las preguntas:

¿Qué conclusión es más correcta en base a los resultados del intervalo de confianza? (A): Ambos tratamientos obtienen una puntuación final media en el BDI-II igual. (B): Los tratados con Citalopram obtienen, en media, entre 1.4 y 6.1 puntos menos en el BDI-II. (C): Los tratados con psicoterapia obtienen, en media, 3.8 puntos menos en el BDI-II. (D): Ninguna de las opciones anteriores es correcta.

Si una diferencia en el cambio medio del BDI-II sólo es clínicamente importante a partir de 7 puntos, ¿qué se puede concluir de los resultados obtenidos? (A): Los resultados son clínicamente no importantes. (B): Los resultados son clínicamente importantes. (C): Los resultados son no concluyentes. (D): Faltan datos para contestar esta pregunta.

Pregunta 16. Calcular los siguientes índices a partir de los recuentos de la siguiente tabla, basada en la clasificación de la depresión final según la prueba BDI-II.

Total 40 40 80 Presente 17 6 23 Ausente 23 34 57 DepreBDI Psicotera Citalopra Total Grupo

A. El riesgo de curaciones para el tratamiento con Citalopram.

El riesgo de curaciones para el tratamiento con psicoterapia.

El riesgo relativo de curaciones (Citalopram frente a psicoterapia) (valor observado en el estudio e IC 95%).

B. La odds de curaciones para el tratamiento con Citalopram.

La odds de curaciones para el tratamiento con psicoterapia.

La OR de curaciones (Citalopram frente a psicoterapia) (valor observado en el estudio e IC 95%).

Page 12: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 12 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Problema 4 Hipercolesterolemia durante la gestación

Durante el embarazo los valores del colesterol aumentan para satisfacer las necesidades del feto. Durante años se consideró que esta reacción natural del organismo no requería tratamiento, ni siquiera para las mujeres que ya lo tenían previamente elevado, puesto que el feto necesita grandes cantidades de colesterol para la formación de las hormonas esteroides y sexuales. Estudios recientes indican que si bien los valores elevados de colesterol en embarazadas no tienen por qué generar alarma, no deben ser descuidados para prevenir complicaciones durante la gestación y el postparto: alteración en el desarrollo de la placenta, lesiones en los vasos sanguíneos del feto, prematuridad o lesiones de ateroesclerosis en el neonato. Investigaciones actuales también han asociado niveles altos de colesterol durante la gestación con hipertensión arterial, lo cual incrementa el riesgo de desarrollar preeclampsia durante el embarazo al depositarse el colesterol en los vasos sanguíneos (Palinski W, Nicolaides E, Liguori A, Napoli C. Influence of maternal dysmetabolic conditions during pregnancy on cardiovascular disease. J Cardiovasc Transl Res; 2009 Sep;2(3):277-85). Las siguientes preguntas incluyen datos hipotéticos de un estudio que valora los efectos de los niveles del metabolismo lipídico en 120 embarazadas que iniciaron la gestación sin hipercolesterolemia.

Pregunta 17. El siguiente listado recoge la distribución de la presión arterial sistólica media de las madres con valores anormalmente altos de valores lipídicos durante la gestación.

15. 5 15* 14. 5677799 14* 1334 13. 566789999 13* 133

Stem-and-leaf plot for PAS (PAS (mmHg))

-> HiperCOL = Sí

A. Dibujar el diagrama de caja: ¿Cuántos sujetos incluye este gráfico?

¿A partir de qué umbral se consideran valores lejanos por la cola inferior?

¿A partir de qué umbral se consideran valores lejanos por la cola superior?

¿Qué valor define la línea que limita la caja por la cola superior?

¿Qué valor define la línea que limita la caja por la cola inferior?

¿Qué valor define la línea que se destaca dentro de la caja

¿Qué valor define la pata inferior?

¿Qué valor define la pata superior?

¿Cuántos valores lejanos hay por la cola inferior?

¿Cuántos valores lejanos hay por la cola superior?

B. ¿El diagrama de caja sugiere la presencia de asimetrías relevantes? (A): No, sólo se aprecia una ligera asimetría negativa (cola inferior). (B): Sí, claramente positiva, puesto que hay valores lejanos por la cola superior. (C): Sí, pero sólo en el 50% central de la distribución, y es de tipo negativo. (D): Ninguna de las opciones anteriores es cierta.

Pregunta 18. La siguiente tabla describe los valores lipídicos durante la gestación para el total de madres gestantes del estudio (n=120).

sd 1.119408 .3394014 1.532329 mean 3.744167 1.56 5.855833 stats LDL HDL CT Estimar, con confianza del 95%, la media de

LDL-colesterol en la población origen con el valor t dado en las Tablas de estadística.

Page 13: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 13 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 19. Se ha efectuado una clasificación de las madres gestantes en dos grupos según presenten o no valores elevados del colesterol medio en la gestación (hipercolesterolemia presente/ausente). Valorar la relación entre dicha clasificación y el peso de los neonatos (en gramos). . robvar PesoNatal, by(HiperCOL) | Summary of Peso neonato (g) HiperCOL | Mean Std. Dev. Freq. ------------+------------------------------------ Sí | 2460.2917 192.2081 24 No | 2980.6042 166.88518 96 ------------+------------------------------------ Total | 2876.5417 270.28534 120 W0 = 2.0721310 df(1, 118) Pr > F = 0.15265937 W50 = 1.3941760 df(1, 118) Pr > F = 0.24007569 W10 = 2.1034634 df(1, 118) Pr > F = 0.14961886

. ttest PesoNatal, by(HiperCOL) Two-sample t test with equal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- Sí | 24 2460.292 39.23431 192.2081 2379.129 2541.454 No | 96 2980.604 17.03265 166.8852 2946.79 3014.418 ---------+-------------------------------------------------------------------- combined | 120 2876.542 24.67356 270.2853 2827.686 2925.398 ---------+-------------------------------------------------------------------- diff | 39.27937 . ------------------------------------------------------------------------------ diff = mean(Sí) - mean(No) t = . Ho: diff = 0 degrees of freedom = . Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.0000 Pr(|T| > |t|) = Pr(T > t) = 1.0000

A. Completar los valores omitidos del listado anterior. Usar el valor t exacto (con calculadora on-line).

Usando las Tablas de estadística, ¿qué valor t se utilizaría para calcular el IC 95%?

B. ¿Se cumple el supuesto de homogeneidad de variancias?

(A): No, ya que la prueba de Levene ha resultado no significativa (p=0.153). (B): No, ya que se obtiene un resultado muy significativo en el T-TEST (p=0.000). (C): Sí, ya que la prueba de Levene ha resultado no significativa (p=0.153). (D): Sí, porque el T-TEST resulta estadísticamente significativo (p<0.001).

C. Suponer que se cumplen las condiciones de aplicación del T-TEST. ¿A qué conclusión se llega? (A): No hay asociación entre el peso del neonato y la hipercolesterolemia (p=0.153). (B): Los hijos de madres con hipercolesterolemia tienen peso medio más bajo (p<0.001). (C): Los hijos de madres con hipercolesterolemia tienen diferente peso medio (p=0.153). (D): Ninguna de las opciones anteriores es cierta.

D. ¿A qué conclusión se llega con el intervalo de confianza de la diferencia de medias? (A): No tiene sentido interpretar este intervalo porque se ha aceptado la H0. (B): Los hijos de madres con hipercolesterolemia tienen un peso medio al nacer 520.3 gr. menor que los

hijos de madres sin hipercolesterolemia (IC 95%: 442.5 a 598.1). (C): Los hijos de madres con hipercolesterolemia presentan un peso medio al nacer 520.3 veces menor

(IC 95%: 433.2 a 607.4 veces) (D): Ninguna de las opciones anteriores es cierta.

E. ¿Si tuviera que publicar en una revista el anterior IC 95% con cuántos decimales daría el resultado? Elija entre las siguientes opciones la más adecuada: ( ) 0 1 ( ) 2 ( ) 3 ( )

F. Si una diferencia en los valores medios del peso neonatal es relevante a partir de 250 gr., ¿qué se puede concluir a partir de los resultados obtenidos en este estudio?

(A): Efecto estadísticamente significativo y clínicamente importante. (B): Efecto estadísticamente significativo y clínicamente no importante. (C): Efecto estadísticamente no significativo y clínicamente importante. (D): Efecto estadísticamente no significativo y clínicamente no importante.

Page 14: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 14 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Problema 5 Hipercolesterolemia durante la infancia

Diferentes estudios demuestran que los niveles lipídicos elevados en la población infantil constituyen un importante factor de riesgo para la presencia de hipercolesterolemia en la edad adulta, y por consiguiente de enfermedad cardiovascular, en especial cuando se asocian otros factores de riesgo como una vida sedentaria, obesidad e hipertensión (Bouglé D, Zunquin G, Sesbouë B, Sabatier JP. Relationships of cardiorespiratory fitness with metabolic risk factors, inflammation, and liver transaminases in overweight youths. Int J Pediatr. 2010. doi:10.1155/2010/580897).

Las siguientes preguntas incluyen resultados hipotéticos de un estudio epidemiológico realizado en 542 niñas y 528 niños preadolescentes, cuyo propósito es detectar y tratar de forma temprana la hipercolesterolemia. Se consideró que una concentración plasmática de colesterol CT > 200 mg/dl era indicadora de hipercoleste-rolemia. Se efectuaron dos mediciones, al inicio y al final del curso escolar (cuya duración es de 9 meses).

Pregunta 20. La siguiente tabla presenta los resultados obtenidos. Completar los valores omitidos. -> Sexo = Masculino | ColestINI ColestFIN | Ausente Presente | Total -----------+----------------------+---------- Ausente | A B| 422 Presente | 12 94 | 106 -----------+----------------------+---------- Total | C 126 | 528 -> Sexo = Femenino | ColestINI ColestFIN | Ausente Presente | Total -----------+----------------------+---------- Ausente | D E| 397 Presente | 15 130 | 145 -----------+----------------------+---------- Total | F 160 | 542

Pregunta 21. Contestar las preguntas por separado para niñas y niños (usar los datos de la tabla anterior).

A. Estimar, con confianza del 95%, la prevalencia de hipercolesterolemia al inicio del curso escolar, por separado para niños y niñas (estimación asintótica).

¿Se cumplen las condiciones de aplicación de la fórmula asintótica empleada anteriormente? (A): No, deberían obtenerse estimaciones con el método de Wilson. (B): Sí, pero únicamente para la estimación efectuada para la población origen de niñas. (C): Sí, pero únicamente para la estimación efectuada para la población origen de niños. (D): Sí, para ambas estimaciones.

B. Calcular el riesgo de presentar hipercolesterolemia durante el curso. Suponer que no hay recidivas.

Riesgo en niños:

Riesgo en niñas:

C. Calcular la tasa de incidencia de hipercolesterolemia. Suponer que no hay recidivas.

Tasa en niños:

Tasa en niñas:

Nota: Este cálculo se pide a modo de ejercicio ya que solo se dispone de datos agregados. Las tasas interesantes serían las obtenidas con los datos individuales.

Page 15: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 15 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 22. Valorar la asociación entre sexo y presencia de hipercolesterolemia. Utilizar los resultados obtenidos al inicio del curso escolar.

A. Efectuar los siguientes cálculos

Estimar la diferencia de prevalencias.

Estimar la razón de prevalencias.

Estimar la razón de odds.

Efectuar la prueba de significación chi-cuadrado.

Usando las Tablas de estadística, en lugar de la calculadora on-line, para hallar la significación de este valor 2 ¿qué valor p se obtiene?

B. ¿La prueba 2 de Pearson cumple las condiciones de aplicación?

(A): En este ejercicio no tiene sentido usar la prueba 2 de Pearson, es preferible emplear una prueba de tendencia (tipo Mantel-Haenszel).

(B): No, ya que hay frecuencias observadas iguales o inferiores a 5. (C): Sí, ya que todas las frecuencias observadas son iguales o superiores a 5. (D): Sí, pero por motivos diferentes de los expuestos en la opción anterior.

¿A qué conclusión se llega con la prueba de significación? (A): No hay diferencias en la proporción de niños y niñas con hipercolesterolemia (p>0.05). (B): Entre las niñas hay mayor proporción de sujetos con hipercolesterolemia (p=0.037). (C): Entre los niños hay mayor proporción de sujetos hipercolesterolemia (p=0.043). (D): El riesgo de tener hipercolesterolemia se asocia al sexo femenino (p=0.043). (E): A una concusión diferente de las anteriores.

C. ¿A qué conclusión se llega con la diferencia de proporciones?

(A): La hipercolesterolemia no se asocia al sexo ya que el IC de la diferencia de proporciones resulta no significativo.

(B): Entre las niñas hay un 5.7% más de casos con hipercolesterolemia (IC 95%: 0.35% a 10.9%). (C): Los niños tienen un 5.7% más de riesgo de hipercolesterolemia (IC 95%: 0.35% a 10.9%) (D): Ninguna de las opciones anteriores es cierta.

D. ¿A qué conclusión se llega con la razón de proporciones?

(A): La hipercolesterolemia no se asocia al sexo ya que el IC de la razón de proporciones resulta no significativo (PR=0).

(B): Las niñas presentan una prevalencia 1.24 veces mayor de hipercolesterolemia (IC 95%: 1.01 a 1.51). (C): Las niñas tienen un 1.24% más de riesgo de hipercolesterolemia (IC 95%: 1.01 a 1.51) (D): Ninguna de las opciones anteriores es cierta.

E. ¿A qué conclusión se llega con la razón de odds?

(A): La hipercolesterolemia no se asocia al sexo ya que el IC de la razón de odds resulta no significativo. (B): Las niñas presentan una prevalencia 1.34 veces mayor de hipercolesterolemia (IC 95%: 1.02 a 1.75). (C): Los niñas tienen un 1.34% más de riesgo de hipercolesterolemia (IC 95%: 1.02 a 1.75%) (D): Ninguna de las opciones anteriores es cierta.

Page 16: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 16 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Problema 6 Efecto del Captopril para el tratamiento de la hipertensión arterial infantil

En pediatría, la hipertensión arterial se define como la presión arterial sistólica (PAS) o diastólica (PAD) por encima del percentil 95 para la edad, el sexo y la talla. Las causas de hipertensión infanto-juvenil varían según la edad, aunque se suele clasificar como un proceso ligado a la presencia de sobrepeso u obesidad.

Se realiza un estudio con objeto de valorar el efecto del Captopril (del grupo de inhibidores ECA, que actúa bloqueando la proteína peptidasa) en pre-adolescentes de 10 a 12 años de edad con diagnóstico de hipertensión arterial esencial. Dos grupos fueron creados mediante asignación al azar: el primero (n1=33) recibió instrucciones para la toma diaria del fármaco con dosis de 1 mg/kg/día, en tanto que el segundo (n0=31) recibía instrucciones similares para la ingesta de un placebo. Ambos grupos recibieron pautas para fomentar la práctica de ejercicio físico aeróbico diario y efectuar modificaciones dietéticas destinadas a instaurar en los pacientes un estilo de vida más saludable. El inicio del tratamiento comenzó el 1 de febrero y el seguimiento finalizó el 30 de junio. Se efectuó una evaluación de los pacientes al final de cada mes.

Pregunta 23

A partir del siguiente listado Stata, estimar con confianza del 95% la media de la talla media inicial (medida en cm) para la población origen de participantes en el estudio.

by GRUPO, sort : tabstat PESOini TALLAini IMCini , statistics( count min max mean sd )

-> GRUPO = Placebo

stats | PESOini TALLAini IMCini ---------+------------------------------ N | 31 31 31 min | 37 136 17.5981 max | 48 156 23.97959 mean | 42.22581 144.2258 20.32104 sd | 3.062784 4.984708 1.446321 ----------------------------------------

-> GRUPO = Captopril

stats | PESOini TALLAini IMCini ---------+------------------------------ N | 33 33 33 min | 37 138 18.22222 max | 49 155 22.25558 mean | 42.30303 146.0303 19.83734 sd | 3.025773 4.927505 1.062445 ----------------------------------------

stats | PESOini TALLAini IMCini ---------+------------------------------ N | 64 64 64 min | 37 A 17.5981

max | 49 B 23.97959

mean | 42.2656 C 20.0716 sd | 3.019735 4.999107 1.276257 ----------------------------------------

1 Completar los valores omitidos del listado:

2. Estimar la talla media inicial (confianza 95%) en la población origen (método asintótico):

tdf;/2 estimación (calculadora on-line):

Límite inferior:

Límite superior:

La precisión (e) de la estimación es:

3. ¿Cuál sería la estimación anterior si la muestra se hubiera obtenido con muestreo exhaustivo de una población finita de 1246 sujetos?

Límite inferior:

Límite superior:

La precisión (e) de la estimación es:

Page 17: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 17 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 24

Completar el diagrama de tallo y hoja y el diagrama de caja de la talla inicial (en cm) para la muestra total de participantes (n=64) a partir de los gráficos que se muestran en el siguiente listado Stata.

by GRUPO, sort : stem TALLAini

-> GRUPO = Placebo Stem-and-leaf plot for TALLAini

13s | 677 13. | 89 14* | 0000011 14t | 2 14f | 4455 14s | 66777 14. | 888889 15* | 0 15t | 15f | 4 15s | 6

-> GRUPO = Captopril Stem-and-leaf plot for TALLAini

13. | 89 14* | 001111 14t | 2223 14f | 44455 14s | 667 14. | 99 15* | 000111 15t | 233 15f | 45

Stem-and-leaf plot for TALLAini

13s | 13. | 14* | 14t | 14f | 14s | 14. | 15* | 15t | 15f | 15s |

1. Diagrama de tallo y hoja:

¿Qué división considera más adecuada para esta distribución: 1, 2 o 5 líneas por tallo?

En un diagrama de 2 líneas por tallo y excluyendo una posible fila inicial con valores lejanos ¿cuántas hojas tendría la primera fila?

En un diagrama de 5 líneas por tallo y excluyendo una posible fila inicial con valores lejanos ¿cuántas hojas tendría la primera fila?

En un diagrama de 5 líneas por tallo y excluyendo una posible fila inicial con valores lejanos ¿cuántas hojas tendría la última fila?

¿Con 5 líneas por tallo, cuántas filas tendría en total el diagrama (sin los valores lejanos-muy lejanos?)

2. Diagrama de caja:

Valores que limitan la caja por la cola inferior y superior

Patillas superior e inferior (valores adyacentes)

¿El diagrama de caja sugiere asimetrías? (S): Sí (N): No

Pregunta 25

El siguiente listado Stata permite valorar la normalidad de la distribución de la PAS inicial (mmHg).

sktest PASini swilk PASini

Skewness/Kurtosis tests for Normality ------- joint ------ Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 -------------+--------------------------------------------------------------- PASini | 64 0.1579 0.6512 2.29 0.3179

Shapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z -------------+-------------------------------------------------- PASini | 64 0.97347 1.519 0.904 0.18303

Los datos de este listado sugieren que: (A): se vulnera el supuesto de simetría-curtosis (p=0.318), y también el de normalidad (p=0.183). (B): se vulnera el supuesto de simetría-curtosis (p=0.318), pero no el de normalidad (p=0.183). (C): se acepta la simetría (p=0.158) pero se vulnera la normalidad (p=0.183). (D): la forma de la distribución no se aleja significativamente de la ley Normal (p=0.183)

Page 18: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 18 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 26

El siguiente listado Stata permite estudiar la relación entre el tipo de tratamiento (Captopril vs placebo) y la hipertensión arterial (presente vs ausente) al final del seguimiento.

Preserve recode GRUPO (0=2) label define dGrupo 2 "Placebo" 1 "Captopril" label values GRUPO dGrupo recode PASbinariafinal (0=2) label define dHTA 2 "Normotenso" 1 "Hipertenso" label values PASbinariafinal dHTA tabulate PASbinariafinal GRUPO, chi2 exact expected column restore

column percentage expected frequency frequency Key

Hipertensi | GRUPO ón final | Captopril Placebo | Total -----------+---------------------+------- Hipertenso | A B| .

| C D| .

| E F| . -----------+---------------------+------- Normotenso | 22 12 | 34 | | .

| | . -----------+---------------------+------- Total | 33 31 | 64 | 33.0 31.0 | 64.0 | 100.00 100.00 | 100.00 Pearson chi2(1) = G Pr= H Fisher's exact = 0.044 1-sided Fisher's exact = 0.023

1. Completar los valores omitidos (obteniendo el valor p con la calculadora on-line):

2. ¿La prueba 2 de Pearson cumple las condiciones de aplicación?

(A): No (hay casillas con frecuencias < 5). (B): Sí (frecuencias observadas ≥ 5). (C): Sí (frecuencias esperadas ≥ 5) (D): Ninguna opción anterior es cierta

3. Los resultados de la prueba de significación sugieren:

(A): Tendencia lineal significativa y negativa entre tratamiento con Captopril e hipertensión (p=0.044). (B): Relación lineal y cuadrática (desvío significativo de la recta) entre tratamiento y respuesta (p<0.05). (C): El tratamiento con Captopril, en comparación con el placebo, disminuye la probabilidad de hipertensión al final del seguimiento (p=0.025) (D): El riesgo de hipertensión es análogo para Captopril y placebo (p>0.05)

4. ¿Sería conveniente obtener medidas de asociación-efecto para valorar la relación?

(A): No, ya que los resultados de la prueba 2 han resultado ser estadísticamente no significativos. (B): Sí, por supuesto. (C): Sí, pero siempre y cuando no existan casillas vacías (oij=0) o contiguas con baja frecuencia. (D): Sí, y además este diseño sólo puede obtenerse la razón de odds

Page 19: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 19 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 27

El siguiente listado Stata permite valorar la intensidad de la relación entre el tipo de tratamiento (Captopril vs placebo) y la hipertensión (presente vs ausente) al final del seguimiento.

ci2pi 19 11 12 22, st(ex)

ASSOCIATION MEASURES: EXPERIMENTAL STUDY

| Treat.0 | Treat.1 | TOTAL ------------------+----------+----------+---------- Events | | | . NonEvents | 22 | 12 | . ------------------+----------+----------+---------- TOTAL | 33 | 31 | . | | | Risk | A| B| 95% CI Lower | 0.197502 | 0.438241 | (Wilson) Upper | 0.503921 | 0.762669 | ---------------------------------------------------------------------------- | Estimate | 95% Confidence Interval ------------------+---------------------+----------------------------------- Risk diff. (RD) | C | 0.035424 0.481758 Newcombeª | | 0.044478 0.514662 Wald Risk ratio (RR) | D | E F

Odds ratio (OR) | G | H I ------------------+---------------------+----------------------------------- | Estimate | 95% Confidence Intervalª -----------------------+----------------+----------------------------------- Number needed to treat | J | 2.1 to 28.2 Benefit (NNTB) | | ---------------------------------------------------------------------------- ªNewcombe's Method 10 (Recommended CI)

1. Completar los valores omitidos del listado:

2. ¿Qué conclusión es más correcta para la diferencia de proporciones?

(A): En este estudio no tiene sentido obtener e interpretar esta medida de asociación. (B): El riesgo de hipertensión final es con probabilidad del 95% igual para Captopril y placebo. (C): Con riesgo de error del 5%, el Captopril multiplica por 27.96 veces la probabilidad de éxito. (D): El Captopril obtiene entre un 3.5% y 48.2% menos de pacientes con hipertensión arterial fina

3. Si la diferencia de proporciones se considera clínicamente importante a partir de *=10%:

(A): Los resultados son estadísticamente no significativos y clínicamente no relevantes. (B): Los resultados son estadísticamente no significativos y clínicamente no concluyentes. (C): Los resultados son estadísticamente significativos y clínicamente no concluyentes. (D): Los resultados son estadísticamente significativos y clínicamente importantes

4. ¿Qué conclusión es más correcta para la razón de proporciones?

(A): En este estudio no tiene sentido obtener e interpretar esta medida de asociación. (B): La probabilidad de hipertensión final es con probabilidad del 95% igual para Captopril y placebo. (C): La probabilidad de hipertensión final es entre 1.1 y 3.2 veces mayor para pacientes tratados con

placebo comparados con los tratados con Captopril. (D): Con riesgo de error del 5%, el Captopril multiplica por 3.17 veces el riesgo de éxito

Page 20: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 20 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 28

Suponer ahora que se desea realizar un nuevo estudio que valore la eficacia del Captopril, respecto al Placebo, ampliando el rango de edad de los adolescentes hasta los 15 años. Calcular el número de sujetos necesarios para detectar una diferencia del 15% en el porcentaje de éxitos (se considera éxito que el sujeto no presente hipertensión arterial al final del seguimiento), y se establece como valor de referencia en el grupo control el porcentaje de éxitos obtenidos en el estudio analizado en esta PEC (38.71%). Calcular los valores omitidos del listado

nsize co2p, p0(38.71) effect(15)

SAMPLE SIZE & POWER DETERMINATION: Two-independent proportions

Proportion (%) of events in: Group 0 = 38.71%

Group 1 = %A

Minimum expected effect size: Difference= %B | SAMPLE SIZE by group Alpha Risk=5%| Two-Sided Test | One-Sided Test METHOD Power| 80% 85% 90% | 80% 85% 90% ---------------------+----------------------+------------------ Normal n | C 197 231 | 136 158 188

Normal corrected n | 186 D 244 | 149 171 201

ArcoSinus n | 173 197 E | 136 158 188

Pregunta 29

El siguiente listado Stata permite comparar la PAS media final (registrada en mmHg) entre pacientes tratados con Captopril y Placebo mediante una prueba no paramétrica.

ranksum PASfinal, by(GRUPO)

Two-sample Wilcoxon rank-sum (Mann-Whitney) test GRUPO | obs rank sum expected ------------+----------------------------- Captopril | 33 788.5 1072.5 Placebo | 31 1291.5 1007.5 ------------+----------------------------- combined | 64 2080 2080

unadjusted variance 5541.25 adjustment for ties -20.55 ---------- adjusted variance 5520.70 Ho: PASfinal(GRUPO==Captop.)= PASfinal(GRUPO==Placebo) z = -3.822 Prob > |z| = 0.0001

1. ¿Qué conclusión es más correcta para los resultados obtenidos en este listado?

(A): No tiene sentido interpretar esta prueba ya que no se ajusta a la escala de medida de las variables que se relacionan.

(B): El riesgo de hipertensión es con probabilidad del 95% inferior con Captopril (p<0.001). (C): Con riesgo de error del 5%, el Captopril obtiene menor probabilidad de hipertensión final. (D): Los pacientes tratados con Captopril presentan valores más bajos de PAS (p<0.001)

Page 21: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 21 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 30

El siguiente listado Stata permite comparar nuevamente la PAS media (en mmHg) registrada al final del seguimiento entre pacientes tratados con Captopril y Placebo.

preserve recode GRUPO (0=2) label define dGrupo 2 "Placebo" 1 "Captopril" label values GRUPO dGrupo sdtest PASfinal, by(GRUPO) ttest PASfinal, by(GRUPO) ttest PASfinal, by(GRUPO) unequal restore

Variance ratio test ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- Captopri | 33 136.5455 1.182328 6.791957 134.1371 138.9538 Placebo | 31 143.4194 1.125247 6.265111 141.1213 145.7174 ---------+-------------------------------------------------------------------- combined | 64 139.875 .9195032 7.356025 138.0375 141.7125 ------------------------------------------------------------------------------ ratio = sd(Captopri) / sd(Placebo) f = 1.1753 Ho: ratio = 1 degrees of freedom = 32, 30 Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1 Pr(F < f) = 0.6705 2*Pr(F > f) = 0.6591 Pr(F > f) = 0.3295

Two-sample t test with equal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- Captopri | 33 136.5455 1.182328 6.791957 134.1371 138.9538 Placebo | 31 143.4194 1.125247 6.265111 141.1213 145.7174 ---------+-------------------------------------------------------------------- combined | 64 139.875 .9195032 7.356025 138.0375 141.7125 ---------+-------------------------------------------------------------------- diff | A 1.636382 E F ------------------------------------------------------------------------------ diff = mean(Captopri) - mean(Placebo) t = B

Ho: diff = 0 degrees of freedom = C Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.0000 Pr(|T| > |t|) = D Pr(T > t) = 1.0000

Two-sample t test with unequal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- Captopri | 33 136.5455 1.182328 6.791957 134.1371 138.9538 Placebo | 31 143.4194 1.125247 6.265111 141.1213 145.7174 ---------+-------------------------------------------------------------------- combined | 64 139.875 .9195032 7.356025 138.0375 141.7125 ---------+-------------------------------------------------------------------- diff | 1.632201 . ------------------------------------------------------------------------------ diff = mean(Captopri) - mean(Placebo) t = .

Ho: diff = 0 Satterthwaite's degrees of freedom = 61.9817 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.0000 Pr(|T| > |t|) = Pr(T > t) = 1.0000

Page 22: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 22 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

1. ¿Se cumple el supuesto de homogeneidad de variancias?

(A): No (p=0.671). (B): Sí (p=0.330). (C): Sí (p=0.659). (D): En el listado anterior no se comprueba este supuesto

2. Completar los valores omitidos del listado:

Prueba de significación: A= ; B= ; C =

D= (valor p directo dado por la calculadora on-line)

IC 95% diferencia medias: E= ; F= (valor tdf;/2 con calculadora on-line)

3. ¿Qué sugieren los resultados de la prueba de significación?

(A): Ausencia de relación entre tratamiento Captopril/Placebo y PAS (p=0.659). (B): El tratamiento con Captopril disminuye un 6.87% más los valores finales de la PAS (p<0.001). (C): Por cada sujeto no tratado con Captopril, un 6.87% de los sí tratados bajan los niveles de PAS

(p=0.0000). (D): El grupo tratado con Captopril presenta PAS inferior al Placebo (p<0.001)

4. ¿Qué indican los resultados del IC 95% de la diferencia de medias de la PAS final?

(A): El tratamiento con Captopril disminuye los valores medios de PAS entre 3.6 y 10.1 mmHg. (B): Los valores de PAS se disminuyen un 6.87% con Captopril (IC 95%: 3.6% y 10.1%). (C): Si no se administra Captopril hay entre un 3.6%% y un 10.1% más de sujetos con PAS elevada. (D): No tiene sentido interpretar el intervalo porque se ha llegado a un resultado no significativo

5. Si una diferencia en la media de la PAS se considera clínicamente relevante a partir de *=15 mmHg, ¿cómo se interpretan los resultados de este estudio?

(A): Estadísticamente significativos y clínicamente importantes. (B): Estadísticamente significativos y clínicamente no importantes. (C): Estadísticamente significativos y clínicamente no concluyentes. (D): Estadísticamente no significativos y clínicamente no concluyentes.

Pregunta 31

Suponer que se desea realizar un nuevo estudio ampliando el rango de edad de los adolescentes hasta los 15 años. Calcular el número de sujetos necesarios para detectar, con una prueba bilateral con riesgo =5%, una diferencia *=3 mmHg en la PAS-final de los sujetos tratados con Captopril respecto al Placebo. Como estimación de la variancia común (s2) usar los resultados obtenidos en el estudio analizado en esta PEC.

Número de sujetos por grupo para una potencia del 80%

Número de sujetos por grupo para una potencia del 85%

Número de sujetos por grupo para una potencia del 90%

Pregunta 32

Suponer ahora que se desea realizar un nuevo estudio ampliando también el rango de edad de los adolescentes hasta los 15 años. Calcular el número de sujetos necesarios para estimar la reducción en los valores de la PAS-final (en mmHg) del Captopril respecto al placebo, usando como estimación de la variancia común (s2) los resultados obtenidos en el estudio analizado en esta PEC. (Confianza 95%).

Número de sujetos por grupo para una precisión de 1 mmHg

Número de sujetos por grupo para una precisión de 2 mmHg

Número de sujetos por grupo para una precisión de 3 mmHg

Page 23: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 23 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Fundamentos de Diseño y Estadística

Soluciones de los ejercicios complementarios: Unidades 9 a 11

Problema 1. Factores de riesgo para el TDAH y repercusiones académicas

Pregunta 1. Estimación de intervalos de confianza para proporción, media y variancia.

Total 28 32 Presente 11 15 Ausente 17 17 TDAH Femenino Masculino Sexo

IC 95% : 0.4333 1.9660

5667.04333.0 = 0.308 a 0.559

Total 60 6.666667 4.316569 Masculino 32 7.0625 4.493275 Femenino 28 6.214286 4.139754 Sexo N mean sd

6.666667 .5572667 5.551579 7.781755 Mean Std. Err. [95% Conf. Interval]

IC 95% : 6.6667 2.00 4.3166 / 60 = 5.55 a 7.78

IC 95% 2: 1174.82

3166.459 2 a

6619.39

3166.459 2= 13.4 a 27.7

Pregunta 2. Valoración del supuesto de normalidad en los sujetos con diagnóstico de TDAH presente.

SintomADHD 26 0.98818 0.338 -2.222 0.98686 Variable Obs W V z Prob>z

Shapiro-Wilk W test for normal data

-> TDAH = PresenteLos resultados de la prueba de Shapiro-Wilkindican que no hay evidencias de vulneración delsupuesto de Normalidad para la distribución delnúmero de síntomas de TDAH los sujetos quetienen este diagnóstico presente, ya que el gradode significación es superior a 0.05 (p=.987).

Pregunta 3. Relación entre hábito de fumar durante la gestación y presencia del diagnóstico de TDAH:

Pearson chi2(2) = 7.7301 Pr = 0.021

100.00 100.00 100.00 100.00 Total 26 21 13 60 76.92 42.86 38.46 56.67 Ausente 20 9 5 34 23.08 57.14 61.54 43.33 Presente 6 12 8 26 TDAH No fuma Moderada Excesiva Total FumaGest

2 = 4.7

)4.75(...

3.11

)3.116( 22

= 7.73; df = 2.

Prueba tendencia: 2 = 6.449; df = 1. Conclusión: Por tratarse de una exposición ordinal y una respuesta binaria, se escoge la prueba de tendencia. Hay una tendencia creciente positiva entre el nivel de consumo de tabaco y la probabilidad de que los hijos presenten TDAH (p=.011).

Deviation from linearity: Chi2(1) = 1.2814 (p= 0.2576)MH Test for linear Trend: Chi2(1) = 6.4487 (p= 0.0111)

TOTAL 26 60 0.433333 0.315724 0.558966 2 8 13 0.615385 0.355229 0.822903 2.667 1.171 6.072 1 12 21 0.571429 0.365466 0.755300 2.476 1.120 5.475 0 6 26 0.230769 0.110338 0.420516 1.000 . . Metric Cases Total Risk [95% Conf. Inter.] RR 95% Conf. Inter. Wilson Ref. category: First

Riesgos:

6/26 = 0.2308

12/21 = 0.5714

8/13 = 0.6154

Riesgos relativos:

0.5714/0.2308 = 2.48

0.6154/0.2308 = 2.67

Page 24: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 24 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 4. Prueba del desvío respecto a la línea.

2(DT)= 7.730 – 6.449 = 1.281; df = (3 – 2) = 1.

Por tener df=1, se puede obtener el valor z: z = 281.1 = 1.13 Tabla T4a: p=0.12922 = 0.26 La prueba de desvío ha resultado no significativa (p=.26).

Pregunta 5. Prueba T-TEST de comparación de 2 medias

Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0

Ho: diff = 0 degrees of freedom = 58 diff = mean(Presente) - mean(Ausente) t = -12.2413 diff -3.046878 .2489019 -3.545109 -2.548646 combined 60 5.997333 .2315 1.793191 5.534103 6.460564 Ausente 34 7.317647 .1462216 .8526112 7.020157 7.615137Presente 26 4.270769 .211045 1.076122 3.836114 4.705424 Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] Two-sample t test with equal variances

Los valores omitidos se obtienen:

diff. = (4.2708 7.3176)

to = (4.2708 7.3176) / 0.24890

df = 34+262

IC 95% = 3.0469 2.000.24890

Conclusión: Los niños con TDAH obtienen rendimiento académico menor (to=12.2; p<.0005), entre 2.5 y 3.5 puntos. Si a nivel clínico una diferencia de medias en el rendimiento académico es importante a partir de *=2 puntos, los resultados de este estudio se consideran importantes a nivel práctico (el IC 95% de se sitúa a la derecha del umbral de relevancia). También son significativos a nivel estadístico (el IC 95% no incluye el valor 0).

Page 25: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 25 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Problema 2. Epidemiología del trastorno por déficit de atención con hiperactividad

Pregunta 6. Índices epidemiológicos.

A. Indicar los siguientes valores. Niñas Niños

Total de sujetos evaluados: 110 100

Sujetos con diagnóstico de TDAH presente al inicio: 18 32

Sujetos con diagnóstico de TDAH presente al final: 20 38

Nuevos diagnósticos durante el seguimiento: 2 6

Tiempo de duración del estudio (meses): 12 meses

B. Calcular los siguientes valores. Niñas Niños

Prevalencia de TDAH en enero 2003: 18/110 = 16.36% 32/100 = 32.00%

Prevalencia de TDAH en enero 2004: 20/110 = 18.18% 38/100 = 38.00%

Odds de TDAH en enero 2004: 20/90 = 22.22% 38/62 = 61.29%

Riesgo de TDAH durante el año 2003: 2/92 = 2.17% 6/68 = 8.82%

Tasa relativa mensual de TDAH durante el 2003: (2/91)/12 = 1.83‰ (6/65)/12 = 7.69‰

Pregunta 7. Riesgo de TDAH durante el estudio.

ASSOCIATION MEASURES: COHORT STUDY

|UnExposed| Exposed | TOTAL ------------------+---------+---------+--------- Cases | 2 | 6 | 8 NonCases | 90 | 62 | 152 ------------------+---------+---------+--------- TOTAL | 92 | 68 | 160 Risk | ,021739 | ,088235 | 95% CI Lower | ,005982 | ,041068 | (Wilson) Upper | ,075835 | ,179438 | ------------------+-------------------+------------------ | Estimate | 95% Conf Interval ------------------+-------------------+------------------ Risk ratio (RR) | 4,0588 | ,8450 19,4958 ------------------+-------------------+------------------

Riesgo para niños:

6/68 = 0.0882 (8.82%)

IC 95% asintótico: 2.08% a 15.57%

Riesgo para niñas:

2/92 = 0.0217 (2.17%)

IC 95% asintótico: 0.00% a 5.15%

(Límite inferior 0 por estar fuera de rango)

Riesgo relativo:

0.08822 / 0.0217 = 4.1

IC 95% asintótico: 0.8 a 19.50

Pregunta 8. Relación entre sexo y TDAH al inicio.

ASSOCIATION MEASURES: CROSS-SECTIONAL STUDY | Exposure | | Exposed proportion |Unexposed| Exposed | TOTAL | 95% CI (Wilson) ---------------+---------+---------+---------+-------------------- Cases | 18 | 32 | 50 | ,640000 | | | |(,501410 to ,758613) NonCases | 92 | 68 | 160 | ,425000 | | | |(,351043 to ,502473) ---------------+---------+---------+---------+-------------------- TOTAL | 110 | 100 | 210 | ,476190 | | | |(,409678 to ,543559) Prevalence | ,163636 | ,320000 | ,238095 | 95% CI Lower | ,106088 | ,236691 | ,185521 | (Wilson) Upper | ,243885 | ,416626 | ,300079 | ---------------+-------------------+------------------------------- | Estimate | 95% Confidence Interval ---------------+-------------------+------------------------------- Prev. Diff.(PD)| ,156364 | ,041740 ,270987 Wald | | ,040691 ,268829 Newcombe Prev.Ratio(PR) | 1,9556 | 1,1743 3,2566 Odds ratio(OR) | 2,4052 | 1,2468 4,6399 ---------------+-------------------+------------------------------- Associat Chi2 | 7,0598 | P= ,007883 Corrected | 6,2242 | P= ,012602 ---------------+-------------------+-------------------------------

A = 18 niñas con TDAH B = 32 niños con TDAH C = 18+32 = 50 D = 32/50 = 0.6400 E = 110 niñas F = 100 niños G = 110+100 = 210 sujetos total. H = 18 / 110 = 0.164 I = 32 / 100 = 0.320 J = 50 / 210 = 0.238 K = 0.3200 0.1636 = 0.156 L = 0.3200 / 0.1636 = 1.96 M = (32/18) / (68/92) = 2.41 *N = 20.0039=0.008 *Puesto que df=1:

z = 0598.7 =2.66 Tabla T4a

(C) Ser niño aumenta la prevalencia de TDAH 1.96 veces (IC 95% PR: 1.2 a 3.3).

Page 26: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 26 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Problema 3. Efecto de Citalopram y psicoterapia interpersonal en pacientes coronarios

Pregunta 9. Diagrama de caja para la puntuación HAM-D inicial en la muestra de mujeres.

20

22

242

62

83

0

Femenino

HA

Mp

re

Cuartos (procedimiento Tukey), para n=40:

Mediana (Md): Posición (40+1)/2= 20.5; Md = 25.

Primer cuarto (H1): Posición (20+1)/2= 10.5; H1 = 24.

Tercer cuarto (H3): Posición (21+40)/2= 30.5; H3 = 26.

Umbrales para definir valores lejanos:

Cola inferior: H1 1.5IQRT = 24 1.5(2624) = 21

Cola superior: H3 + 1.5IQRT = 26 + 1.5(2624) = 29

No hay valores lejanos, ya que ningún valor se aleja de 21 por la cola inferior ni de 29 por la cola superior.

Diagrama de caja:

La línea que limita la caja por la cola superior es el tercer cuarto (H3=26), y por la cola inferior el primer cuarto (H1=24). La línea que se dibuja dentro de la caja corresponde a la mediana (Md=25).

Puesto que no hay valores lejanos por ninguna cola, la patita inferior corresponde al mínimo de ladistribución (Mín=21) y la patita superior al máximo (Máx=28).

Pregunta 10. Diagrama de tallo y hoja para la puntuación HAM-D inicial en la muestra de hombres.

3* 0 2. 8 2s 66666677777 2f 44444444455555555555555 2t 2223

Stem-and-leaf plot for HAMpre (HAMpre)

-> Sexo = Masculino

De acuerdo a la regla de Sturges, para un tamaño de muestra 23 n 40, un gráfico de tallo y hoja debería tener aproximadamente 6 líneas. La división que mejor se ajusta a esta norma es la que se dibuja con 5 divisiones (líneas) por tallo.

Pregunta 11. Estimar con confianza del 95% en la población de pacientes tratados con Citalopram.

A. La puntuación media en la escala HAM-D al final del estudio.

HAMpost 40 13.85 4.429215 9 25 Variable Obs Mean Std. Dev. Min Max

-> Grupo = Citalopram

Citalopram 13.85 .7003204 12.45605 15.24395Psicoterapia 17.325 .8809868 15.57144 19.07856HAMpost Over Mean Std. Err. [95% Conf. Interval]

Los datos necesarios para efectuar la estimación pueden obtenerse del Listado 1.

IC 95% : ox tn1;/2SE 13.85 2.0240

429.4 12.4 a 15.3 puntos.

Por tratarse de muestra grande (N=40), el intervalo de confianza puede calcularse utilizando la ley Normal. La respuesta a la pregunta que se pregunta es, por tanto, la opción B.

Page 27: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 27 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

B-C. La proporción de pacientes con HTA y remisiones de depresión (basada en la HAM-D).

Los datos necesarios para efectuar la estimación pueden obtenerse de los Listados 3 y 4.

IC aproximado para la HTA:

po =40

5= 0.125; po z/2

n

)p1(p oo = 0.125 1.96

40

875.0125.0 = 0.0225 a 0.2275 (2.3% a 22.8%)

Las condiciones de aplicación de este primer intervalo no se cumplen, ya que 0.0225 40 = 0.9 < 5. La respuesta correcta a la pregunta que se formula es, por tanto, la C.

IC aproximado para la remisión de la depresión:

po =40

34= 0.85; po z/2

n

)p1(p oo = 0.85 1.96

40

15.085.0 = 0.7393 a 0.9607 (73.9% a 96.1%)

Las condiciones de aplicación de este primer intervalo no se cumplen, ya que 0.0393 40 = 1.6 < 5. La respuesta correcta a la pregunta que se formula es, por tanto, la C.

Pregunta 12. Relación entre tratamiento y presencia de depresión (según HAM-D).

Pearson chi2(1) = 6.2696 Pr = 0.012

100.00 100.00 100.00 Total 40 40 80 40.00 15.00 27.50 Presente 16 6 22 60.00 85.00 72.50 Ausente 24 34 58 DepreHAM Psicotera Citalopra Total Grupo El estadístico de contraste 2 se calcula:

2= 29

)2924( 2 + … +66

)116( 2 = 6.3; df = 1

Con un valor p=0.012, estos resultados sugieren que el Citalopram obtiene mayor proporción de remisiones para la depresión que la psicoterapia. La diferencia de riegos vale: 0.85 – 0.60 = 0.25 (25.0%).

El IC en el Listado 4 (Newcombe): 5.39% a 42.3%.

La opción correcta a la pregunta que se formula es la B.

ªNewcombe's Method 10 (Recommended CI) Benefit (NNTB) Number needed to treat 4.0 2.4 to 18.5 Estimate 95% Confidence Intervalª

Fisher Exact Test P= 0.022992 (2-sided) Corrected 5.0784 P= 0.024226 (2-sided) Pearson Chi2 6.2696 P= 0.012283 (2-sided)Association Odds ratio (OR) 3.7778 1.2907 11.0573 Risk ratio (RR) 1.4167 1.0658 1.8830 0.062135 0.437865 Wald Risk diff. (RD) 0.250000 0.053939 0.423295 Newcombeª Estimate 95% Confidence Interval

(Wilson) Upper 0.736517 0.929388 95% CI Lower 0.445959 0.709277 Risk 0.600000 0.850000 TOTAL 40 40 80 Presente 16 6 22 Ausente 24 34 58 DepreHAM Psicoter~a Citalopram TOTAL Grupo

Page 28: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 28 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

El riesgo relativo vale: 0.85/0.60 = 1.4167

SE(lnRR) = 40

1

24

1

40

1

34

1 = 0.1452

1.4167 e1.960.1452 = 1.4167 e0.2846 = 1.1 a 1.9.

Opción correcta: D.

Además, si un riesgo relativo es importante si supera 2, los resultados son no relevantes (opciónA).

La razón de odds vale: (34/6) / (24/16) = 3.7778.

SE(lnOR) = 6

1

16

1

34

1

24

1 = 0.5479

3.7778 e1.960.5479 = 3.7778 e1.0740 = 1.3 a 11.1.

Opción correcta: B.

Además, si razón de odds es importante si supera 2, los resultados son no concluyentes (opción C).

El NNT vale en el estudio: 1 / 0.25= 4.

El IC del 95% para NNT: Lsup: 1 / 0.4233 = 2.4 a Linf: 1 / 0.0539 = 18.5.

Preguntas 13-14-15. Relación entre tratamiento y puntuación en depresión final (según HAM-D y BDI-II).

Pr(T < t) = 0.9986 Pr(|T| > |t|) = 0.0028 Pr(T > t) = 0.0014 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0

Ho: diff = 0 Satterthwaite's degrees of freedom = 74.2238 diff = mean(Psicoter) - mean(Citalopr) t = 3.0877 diff 3.475 1.125427 1.23265 5.71735 combined 80 15.5875 .592328 5.297943 14.4085 16.7665 Citalopr 40 13.85 .7003204 4.429215 12.43347 15.26653Psicoter 40 17.325 .8809868 5.57185 15.54304 19.10696 Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] Two-sample t test with unequal variances

. ttest HAMpost, by(Grupo) unequal

Pr(T < t) = 0.9989 Pr(|T| > |t|) = 0.0021 Pr(T > t) = 0.0011 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0

Ho: diff = 0 Satterthwaite's degrees of freedom = 76.7096 diff = mean(Psicoter) - mean(Citalopr) t = 3.1825 diff 3.775 1.186158 1.412915 6.137085 combined 80 13.5375 .6264082 5.602765 12.29067 14.78433 Citalopr 40 11.65 .78246 4.948711 10.06733 13.23267Psicoter 40 15.425 .8914749 5.638183 13.62182 17.22818 Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] Two-sample t test with unequal variances

. ttest BDIpost, by(Grupo) unequal

Page 29: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 29 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Resultados para la variables criterio: depresión final según HAM-D (pregunta 13)

La diferencia de medias, en valor absoluto, vale: | 13.85 17.33 | = 3.48

Se efectúa la prueba de significación t-test para variancias diferentes ya que no se cumple el supuesto de homogeneidad (p=0.001). El SE de la prueba t-test viene dado en el listado, y vale: 1.125. También los grados de libertad: 74.2.

El estadístico de contraste vale: to = 3.48/1.125 = 3.1 (p=0.003, ES).

La respuesta a la prueba que se formula a la prueba de significación es, por lo tanto, la C.

El IC 95% de la diferencia entre ambas medias vale: 3.48 1.991.125 = 1.2 a 5.7.

La opción correcta a la pregunta que se formula al IC de la diferencia entre ambas medias es, por lo tanto, la B. Asimismo, si una diferencia entre ambas medias sólo se considera clínicamente relevante si supera 5, los resultados obtenidos son no concluyentes (opción correcta C).

Resultados para la variables criterio: depresión final según BDI-II (pregunta 15)

La diferencia de medias, en valor absoluto, vale: | 11.65 15.43 | = 3.78

Se efectúa la prueba de significación t-test para variancias diferentes ya que no se cumple el supuesto de homogeneidad (p=0.001).

El SE de la prueba t-test viene dado en el listado, y vale: 1.186. También los grados de libertad: 76.7.

El estadístico de contraste vale: to = 3.78/1.186 = 3.2 (p=0.002, ES).

La respuesta a la prueba que se formula a la prueba de significación es, por lo tanto, la C.

El IC 95% de la diferencia entre ambas medias vale: 3.78 1.991.186 = 1.4 a 6.1.

La opción correcta a la pregunta que se formula al IC de la diferencia entre ambas medias es, por lo tanto, la B. Asimismo, si una diferencia entre ambas medias sólo se considera clínicamente relevante si supera 7, los resultados obtenidos son no importantes desde un punto de vista práctico (opción correcta A).

Prueba no paramétrica. Relación entre tratamiento y puntuación en depresión final (según HAM-D).

Los resultados obtenidos en la prueba de significación (p=0.003) indican que en promedio los pacientes tratos con Citalopram obtienen puntuaciones más bajas en la prueba HAM-D al final del estudio. La opción correcta a la pregunta que se formula es, por lo tanto, la C.

Pregunta 16. Cálculo de riesgos y odds (según clasificación depresión BDI-II final).

Cálculos para los riesgos:

RC = 34/40 = 0.850; RP = 23/40 = 0.575

RR = 0.850 / 0.875 = 1.4783

SE(lnRR) = 40

1

23

1

40

1

34

1 = 0.1513

1. 4783 e1.960.1513 = 1.4783 e0.2965 = 1.1 a 2.0.

Cálculos para las OR:

OC = 34/06 = 5.6667; OP = 23/17 = 1.3529

OR = 5.6667/ 1.3529= 4.1884

SE(lnOR) = 17

1

23

1

06

1

34

1 = 0.5462

4.1884 e1.960.5462 = 4.1884 e1.0706 = 1.4 a 12.2.

Page 30: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 30 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Problema 4. Hipercolesterolemia durante la gestación

Pregunta 17. Distribución de la PAS de las madres con valores anormalmente altos de valores lipídicos.

13

01

35

14

01

45

15

01

55

PA

S (

mm

Hg

)

15. 5 15* 14. 5677799 14* 1334 13. 566789999 13* 133

Stem-and-leaf plot for PAS (PAS (mmHg))

-> HiperCOL = Sí

A. Hay 24 sujetos (contando el número de cifras del diagrama de tallo y hoja.

Para contestar el resto de las preguntas se debe obtener a partir del diagrama de tallo y hoja:

Mediana: Posición= (24+1)/2= 12.5 Md = (139+141)/2 = 140.0 (Línea dentro de la caja) Cuarto 1: Posición= (12+1)/2= 6.5 H1 = (136+137)/2 = 136.5 (Límite superior de la caja) Cuarto 3: Posición= (13+24)/2=18.5 H3 = (146+147)/2 = 146.5 (Límite inferior de la caja)

Umbral que define los valores lejanos:

Cola inferior: 136.5 1.5×(146.5136.5) = 121.5

Cola superior: 146.5 + 1.5×(146.5136.5) = 161.5 No hay valores lejanos, ya que el mínimo y el máximo, respectivamente, 131 y 155 mmHg, no superan estos límites. Por lo tanto, estos dos calores corresponden a las patillas de la caja.

B. (D). El diagrama de caja no sugiere asimetrías relevantes por las colas de la distribución, ya que no hay valores lejanos por los extremos. La pata superior es ligeramente más larga que la inferior, lo cual indica una ligera asimetría positiva. La mediana no está exactamente en el centro de la caja, sino desplazada hacia abajo (lo cual sugiere otra ligera asimetría positiva en el 50% central de la distribución).

Pregunta 18. Intervalo de confianza de una media.

LDL 3.744167 .1021875 3.541825 3.946508 Mean Std. Err. [95% Conf. Interval]

Mean estimation Number of obs = 120

IC 95% de :

Tablas de estadística: para df=119 se usa t120;0.025=1.9799 *Calculadora on-line: t119;0.025=1.98.

Con ambos valores, el resultado del IC 95% redondeado a 2 decimales es el mismo:

3.7442 1.9799 120

1194.1 3.54 a 3.95 mmol/L

(*) Calculadora on-line: http://dostat.stat.sc.edu/prototype/calculators/index.php3?dist=T

Page 31: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 31 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 19. Las siguientes tablas corresponden al resultado de la prueba t correctamente planteada.

Es muy importante tener claro que el grupo de referencia siempre es el no expuesto (salvo raras excepciones), de manera que cuando se calcula un índice basado en una diferencia el correspondiente valor se sitúa en el sustraendo (y si el índice es de razón se sitúa en el denominador). De esta manera el signo de la diferencia indicará el sentido que tiene el efecto del factor en la asociación.

En este estudio, la exposición es la hipercolesterolemia y produce una disminución del peso. Puesto que las tablas que se presentan en la PEC, por error, se han obtenido utilizando como referencia el grupo con hiper-colesterolemia, se darán como correctas tanto las respuestas tanto con signo positivo como con signo negativo.

Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0

Ho: diff = 0 degrees of freedom = 118 diff = mean(Sí) - mean(No) t = -13.2465 diff -520.3125 39.27937 -598.0963 -442.5287 combined 120 2876.542 24.67356 270.2853 2827.686 2925.398 No 96 2980.604 17.03265 166.8852 2946.79 3014.418 Sí 24 2460.292 39.23431 192.2081 2379.129 2541.454 Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] Two-sample t test with equal variances

A. Cálculo de los valores que faltan:

d o = (2460.29172980.6042) = 520.3125 g (la exposición a la hipercolesterolemia disminuye el peso)

df = 96+242 = 118; to = 520.3125 / 39.2794 = 13.2 (p<0.001)

IC 95% de la diferencia de medias (*se usa el valor t118;0.025=1.98).

520.3125 1.9839.2794 = 598.1 a 442.5 gramos.

Tablas de estadística: para df=118 se usa t120;0.025=1.9799

(*) Calculadora on-line: http://dostat.stat.sc.edu/prototype/calculators/index.php3?dist=T

Cálculo del error estándar de la diferencia. Aunque en este ejercicio se ha dado el error estándar SE(d), no es lo habitual ya que se puede obtener a partir de la tabla Group Statistics. Puesto que se asume el supuesto de homogeneidad de variancias (Prueba de Levene: p=0.153 > 0.05):

Variancia conjunta: s2 = 22496

208.192)124(885.166)196( 22

= 29623.028

SE(d) = 24

29623.028

96

29623.028 = 39.279

B. (C): Prueba de Levene no significativa (p=0.153 > 0.05)

C. (B): Los hijos de madres con hipercolesterolemia presentan pesos medios más bajos (p<0.001).

D. (B): Los hijos de madres con hipercolesterolemia presentan un peso medio al nacer 520.3 gramos menor que los hijos de madres sin hipercolesterolemia (IC 95%: 442.5 a 598.1).

E. (0): Una disminución de décimas de gramo es irrelevante.

F. (A): Si una diferencia de medias en el peso del neonato se considera relevante a partir de *=250 gramos, el resultado del estudio se considera importante porque queda claramente a la derecha del umbral de relevancia práctica. También es estadísticamente significativo porque no incluye el valor de la H0 (=0).

Page 32: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 32 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Problema 5. Hipercolesterolemia durante la infancia

Pregunta 20. Tabla completa.

Total 402 126 528 Presente 12 94 106 Ausente 390 32 422 ColestFIN Ausente Presente Total ColestINI

-> Sexo = Masculino

Total 382 160 542 Presente 15 130 145 Ausente 367 30 397 ColestFIN Ausente Presente Total ColestINI

-> Sexo = Femenino

Pregunta 21

A. Estimación asintótica del IC 95% de la prevalencia de hipercolesterolemia al inicio del curso escolar.

Niñas: po = 160/542 = 0.2952; IC 95%: 0.2952 1.96542

7048.02952.0 = 0.2952 0.0384

25.7% a 33.4%. C.A.: 0.2568×542 = 139.2 >> 5 (se cumplen)

Niños: po = 126/528 = 0.2387; IC 95%: 0.2386 1.96528

7614.02386.0 = 0.2386 0.0364

20.2% a 27.4%. C.A.: 0.2023×528 = 106.8 >> 5 (se cumplen)

B. Riesgo de presentar hipercolesterolemia durante el curso escolar.

Para realizar este cálculo se debe suponer que en los niños sin hipercolesterolemia al inicio y final tampoco han presentado hipercolesterolemia durante el curso escolar.

Niñas: Nuevos casos (ausente al inicio y presente al final) =15 Casos en riesgo al inicio del curso (ausentes al inicio) = 382 RF = 15 / 382 = 0.03927 (3.93% de casos en 9 meses)

Niños: Nuevos casos (ausente al inicio y presente al final) =12 Casos en riesgo al inicio del curso (ausentes al inicio) = 402 RM = 12 / 402 = 0.02985 (2.99% de casos en 9 meses) C. Tasa de incidencia de hipercolesterolemia durante el curso escolar (por 1000 sujetos-mes).

Niñas: IF =9)15382(5.415

15

= 0.00445 4.45 casos por 1000 niñas y mes en riesgo

Niños: IM =9)12402(5.412

12

= 0.00337 3.37 casos por 1000 niños y mes en riesgo

Page 33: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 33 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 22. La tabla que permite analizar la relación es la siguiente:

Pearson chi2(1) = 4.3697 Pr = 0.03

100.00 100.00 100.00 Total 542 528 1,070 29.52 23.86 26.73 Presente 160 126 286 70.48 76.14 73.27 Ausente 382 402 784 ColestINI Femenino Masculino Total Sexo

column percentage frequency Key

A. Para realizar estos cálculos se considera el sexo masculino como categoría de referencia.

Puesto que esta información debería haber constado en el enunciado del ejercicio, también se considerarán correctas las respuestas que hayan tomado las niñas como referencia.

Diferencia de prevalencias: PD = 0.295203 0.238636 = 0.05657 (5.66%)

SE(PD) = 542

)2952.01(2952.0

528

)2386.01(2386.0

= 0.02698

IC 95%: 0.0566 1.96×0.02698 = 0.05657 0.05288 0.37% a 10.9%

Razón de prevalencias: PR = 0.295203 / 0.238636 = 1.2370

SE(lnPR) = 528

1

126

1

542

1

160

1 = 0.10221

IC 95%: 1.2370 e1.960.10221 = 1.01 a 1.51

Razón de odds: OR = (160/126) / (382/402) = 1.3363

SE(lnRR) = 402

1

382

1

126

1

160

1 = 0.138895

IC 95%: 1.3363 e1.960.138895 = 1.02 a 1.75

Prueba 2:

2 = 13.141

)13.141126( 2+ …+

13.397

)13.397382( 2 = 4.37

df=1 p=0.0366

Cálculo del valor p con las Tablas de Estadística:

En la Unidad 10 (Figura 10-2; p. 39) se explica la equivalencia entre la distribución ji-cuadrado y la Normal:

2 = 4.37 z = 37.4 = 2.09

El valor p se obtiene con la tabla T4a (p. 12):

z=2.09 p(z2.09) = 0.0183

Puesto que la prueba es bilateral: p= 2×0.0183 = 0.0366

B. (D) Cumple las condiciones de aplicación porque todas las frecuencias esperadas son superiores a 5. La frecuencia esperada más baja es: 286×528/1070 = 141.13.

(B) Conclusión: Hay una hay mayor proporción de niñas con hipercolesterolemia (p=0.037).

C. (B) Entre las niñas hay un 5.7% más de sujetos con hipercolesterolemia (IC 95%: 0.35% a 10.9%)

D. (B) Las niñas presentan una prevalencia 1.24 veces mayor de hipercolesterolemia (IC 95%: 1.01 a 1.51).

E. (D) La odds de hipercolesterolemia es 1.34 veces mayor en las niñas (IC 95%: 1.02 a 1.75)

Page 34: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 34 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Problema 6. Efecto del Captopril para el tratamiento de la hipertensión arterial infantil

Pregunta 23 Estimación de la media de la talla inicial. (http://www.stat.tamu.edu/~west/applets/tdemo.html)

1. Los valores omitidos del listado son los siguientes:

A: valor mínimo ......................................................... 136 mmHg.

B: valor máximo: ....................................................... 156 mmHg.

C: media: ............ (144.225831 + 146.030333) / 64 = 145.156

stats | PESOini TALLAini IMCini ---------+------------------------------ N | 64 64 64 min | 37 136 17.5981 max | 49 156 23.97959 mean | 42.2656 145.156 20.0716 sd | 3.019735 4.999107 1.276257 ----------------------------------------

Mean estimation Number of obs = 64 --------------------------------------------------------- | Mean Std. Err. [95% Conf. Interval] --------+------------------------------------------------ TALLAini| 145.156 .6248884 143.9075 146.405 ---------------------------------------------------------

2. IC 95% : 145.1562 1.99864

999107.4= 143.9077 a 146.4047 (143.91 a 146.40) mmHg.

La precisión e de la estimación anterior es igual a: 1.99864

999107.4= 1.24853 (1.249) mmHg

3. IC 95% : IC 95% (población finita de 1246): 145.1562 1.99811246

641246

64

999107.4 2

= 143.94 a 146.37

La precisión e de la estimación anterior es igual a: 1.99811246

641246

64

999107.4 2

= 1.21653 (1.217) mmHg

Pregunta 24 Dibujo del diagrama de tallo y hoja y del diagrama de caja

Muestra total. Stem-and-leaf plot for TALLAini 13s | 677 13. | 8899 14* | 0000000111111 14t | 22223 14f | 444445555 14s | 66667777 14. | 88888999 15* | 0000111 15t | 233 15f | 445 15s | 6

Mediana:145 (posición 32.5) Primer cuarto (Tukey): 141 (posición 16.5) Tercer cuarto (Tukey): 149 (posición 48.5)

135

140

145

150

155

Tal

la in

icia

l (cm

)

Page 35: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 35 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

1. Diagrama de tallo y hoja:

¿Qué división considera más adecuada para esta distribución: 1, 2 o 5 líneas por tallo? ...... 2 (regla Sturges) En un diagrama de 2 líneas por tallo. ....................................... Primera fila: 13| 6778899, un total de 7 hojas

En un diagrama de 5 líneas por tallo ................................................ Primera fila: 13| 677, un total de 3 hojas

En un diagrama de 5 líneas por tallo ......................................................... Última fila: 15| 6, un total de 1 hoja

¿Con 5 líneas por tallo, cuántas filas tendría en total el diagrama (sin los valores lejanos-muy lejanos?) .... 11

2. Diagrama de caja:

Umbrales inferior y superior (valores lejanos): ....... 1411.5(149141)=129.00 ; 149+1.5(149141)= 161.00 Número total de valores lejanos o muy lejanos: ........... 0 (no hay ningún valor inferior a 129 ni superior a 161) Valores que limitan la caja por la cola inferior y superior .......................... 141.00 y 149.00 (cuartos de Tukey) Patillas superior e inferior (valores adyacentes) .......................... 156 y 136 (máximo y mínimo no alejados) ¿El diagrama de caja sugiere asimetrías? ................................................ No, ya que no hay valores alejados.

Pregunta 25 Estudio de la normalidad de la variable presión arterial sistólica inicial (mmHg).

Skewness/Kurtosis tests for Normality

------- joint ------ Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 ---------+------------------------------------------------------------- PASini | 64 0.1579 0.6512 2.29 0.3179

-----------------------------------------------------------------------

Shapiro-Wilk W test for normal data

Variable | Obs W V z Prob>z ---------+------------------------------------------------ PASini | 64 0.97347 1.519 0.904 0.18303

(D) Los resultados de las pruebas de significación sugieren que no hay desvíos significativos de la ley normal (p=0.183), y obviamente tampoco de la simetría (p=0.318).

Pregunta 26 Estudio de la relación entre tratamiento y presencia de hipertensión al final del seguimiento.

column percentage expected frequency frequency Key

Hipertensi | GRUPO ón final | Captopril Placebo | Total -----------+---------------------+-------- Hipertenso | 11 19 | 30 | 15.5 14.5 | 30.0 | 33.33 61.29 | 46.88 -----------+---------------------+-------- Normotenso | 22 12 | 34 | 17.5 16.5 | 34.0 | 66.67 38.71 | 53.13 -----------+---------------------+-------- Total | 33 31 | 64 | 33.0 31.0 | 64.0 | 100.00 100.00 | 100.00 Pearson chi2(1) = 5.0169 Pr = 0.025

1 Valores omitidos:

A: Hipertensos con Captopril: .................... 3322=11

B: Hipertensos con Placebo: ..................... 3112=19

C: Frecuencia e11 ................................ 3330/64=15.5

D: Frecuencia e12 ................................ 3130/64=14.5

E: Porcentaje observado p11........... 11/33100=33.33

F: Porcentaje observado p12 ........... 19/31100=61.29

G: 2: .. 4688.15

)4688.1511( 2+ … +

4688.16

)4688.1612( 2= 5.017

2 (C) Todas las frecuencias esperadas eij5.

3 (C) La probabilidad de HTA al final del seguimiento es inferior para los pacientes tratados con Captopril.

4 (B) Las medidas de asociación aportan una medida de la intensidad de la relación.

Page 36: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 36 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 27 Pruebas de asociación para el estudio de la relación entre tratamiento e hipertensión final.

ASSOCIATION MEASURES: EXPERIMENTAL STUDY

| Treat.0| Treat.1| TOTAL --------------+---------+---------+---------- Events | 11| 19| 30 NonEvents | 22| 12| 34 --------------+---------+---------+---------- TOTAL | 33| 31| 64 | | | Risk | 0.333333| 0.612903| 95% CI Lower | 0.197502| 0.438241| Wilson Upper | 0.503921| 0.762669| --------------------------------------------------------------- | Estimate | 95% Confidence Interval --------------+-------------------+---------------------------- Risk diff.(RD)| 0.279570 | 0.035424 0.481758Newcombeª | | 0.044478 0.514662Wald Risk ratio(RR)| 1.8387 | 1.0527 3.2117 Odds ratio(OR)| 3.1667 | 1.1387 8.8065 --------------+-------------------+---------------------------- Associa Chi2 | 5.0169 | P= 0.025101 (2-sided) --------------------------------------------------------------- | Estimate | 95% Confidence Intervalª -------------------+--------------+---------------------------- Number needed treat| 3.6 | 2.1 to 28.2 --------------------------------------------------------------- ªNewcombe's Method 10 (Recommended CI)

1 Valores omitidos del listado

A= 11/33 = 0.333333; B= 19/31=0.612903

C=0.6129030.33333333=0.279570

D, E, F: RR=0.612903/0.333333=1.8387;

SE(lnRR)= 31

1

19

1

33

1

11

1 = 0.2846;

IC95%: 1.8387e1.960.2846 = 1.05 a 3.21

G, H, I: OR = (19/12) / (11/22) = 3.1667

SE(lnOR)= 22

1

11

1

12

1

19

1 = 0.5219

IC95%: 3.1667e1.960.5219 = 1.14 a 8.81

J=1/0.279570 = 3.6

2 (D) La diferencia de riesgos indica que al final del seguimiento el grupo tratado con Captopril tiene entre un 3.5% y un 48.2% menos de pacientes con hipertensión.

3 (C) La diferencia de riesgos es estadísticamente significativa (el IC 95% no incluye el valor 0) pero a nivel práctico los resultados son no concluyentes (el IC 95% incluye el umbral *=10% de relevancia práctica).

4 (C) La probabilidad de que al final de seguimiento los pacientes presenten hipertensión es entre 1.1 y 3.2 veces mayor si han sido tratados con placebo (respecto a ser tratados con Captopril).

Otra forma de interpretar este intervalo es decir que la probabilidad de hipertensión final es entre 1.1 y 3.2 veces menor para los pacientes tratados con Captopril.

Pregunta 28 Cálculo del tamaño de muestra para comparar dos proporciones.

SAMPLE SIZE & POWER DETERMINATION:

Two-independent proportions

Proportion (%) of events in: Group 0 = 38.71% Group 1 = 53.71% Minimum expected effect size: Difference= 15%

SAMPLE SIZE by group

Alpha Risk=5% | Two-Sided Test | METHOD Power | 80% 85% 90% | ------------------+--------------------+ Normal n | 173 197 231 | Normal correct n | 186 211 244 | ArcoSinus n | 173 197 231 |

A = 38.71 + 15.00 = 53.71%; B = 15% (dado en el enunciado)

C =

2

2

15.0

4629.05371.06129.03871.08416.05379.04621.0296.1 = 172.2 173

D=

2

2

15.0

4629.05371.06129.03871.00364.15379.04621.0296.1 +

15.0

2= 210.1 211

E=2

2

)3871.0arcsen5371.0arcsen(2

)2816.196.1(

= 230.4 231

Page 37: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 37 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 29 Prueba no paramétrica que relaciona la PAS-final (mmHg) con el tipo de tratamiento.

Two-sample Wilcoxon rank-sum (Mann-Whitney) test GRUPO | obs rank sum expected ------------+----------------------------- Captopril | 33 788.5 1072.5 Placebo | 31 1291.5 1007.5 ------------+----------------------------- combined | 64 2080 2080

------------------------------------------

Ho: PASfinal(GRUPO==Captop.)= PASfinal(GRUPO==Placebo) z = -3.822 Prob > |z| = 0.0001

1 (D) La prueba Mann-Whitney compara las dos medias de la presión arterial sistólica al final del estudio, y los resultados indican que los valores registrados de la variable son más bajos en los pacientes tratados con Captopril (p=0.0001). El sentido de la relación se deduce de los rangos medios, que presenta un valor inferior en el grupo tratado con el fármaco.

Pregunta 30 Prueba T-TEST que relaciona la PAS-final (mmHg) con el tipo de tratamiento.

Variance ratio test -------------------------------------------------------------------- Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+---------------------------------------------------------- Captopri | 33 136.5455 1.182328 6.791957 134.1371 138.9538 Placebo | 31 143.4194 1.125247 6.265111 141.1213 145.7174 ---------+---------------------------------------------------------- combined | 64 139.875 .9195032 7.356025 138.0375 141.7125 -------------------------------------------------------------------- ratio = sd(Captopri) / sd(Placebo) f = 1.1753 Ho: ratio = 1 degrees of freedom = 32, 30 Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1 Pr(F < f) = 0.6705 2*Pr(F > f) = 0.6591 Pr(F > f) = 0.3295

1 (C) Los datos de la prueba de significación sugieren aceptar el supuesto de homogeneidad de variancias (p=0.659).

2 Valores omitidos del listado: A= 136.5455143.4194 = 6.8739

B = 6.8739 / 1.636382 = 4.20

C= 642 = 62

D = 20.00004 = 0.00008 (0.0001)

E y F: 6.87391.9991.636382 = 10.15 a 3.60

3 (D) La prueba de significación indica que el tratamiento con Captopril presenta PAS final media inferior (p<0.001).

4 (A) Los pacientes tratados con Captopril obtienen valores medios de PAS entre 3.6 y 10.1 mmHg inferiores el placebo.

5 (B) Los resultados son significativos (el IC95% no incluye el valor 0) pero no relevantes en la práctica (el IC 95% queda a la izquierda del umbral *=15)

Two-sample t test with equal variances -------------------------------------------------------------------- Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+---------------------------------------------------------- Captopri | 33 136.5455 1.182328 6.791957 134.1371 138.9538 Placebo | 31 143.4194 1.125247 6.265111 141.1213 145.7174 ---------+---------------------------------------------------------- combined | 64 139.875 .9195032 7.356025 138.0375 141.7125 ---------+---------------------------------------------------------- diff | -6.8739 1.636382 -10.14498 -3.602819 -------------------------------------------------------------------- diff = mean(Captopri) - mean(Placebo) t = -4.2007 Ho: diff = 0 degrees of freedom = 62 Ha: diff < 0 Ha: diff != 0 Ha: diff > 0 Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0001 Pr(T > t) = 1.0000

Page 38: Fundamentos de Diseño y Estadística - metodo.uab complementarios 09-11.pdf · Ejercicios complementarios: Unidades 9 a 11 Pág.1 de 38 Laboratori d’Estadística Aplicada () Última

Ejercicios complementarios: Unidades 9 a 11 Pág. 38 de 38 Laboratori d’Estadística Aplicada (www.metodo.uab.cat) Última revisión 17.03.2014

Pregunta 31 Cálculo del tamaño de muestra para comparar dos medias

nsize co2m, sd(7.3560) effect(3) Número de sujetos para una potencia de:

80%: (1.96+0.8416)2 2

2

3

3560.72 = 94.4 95

85%: (1.96+1.0364)2 2

2

3

3560.72 = 107.8 108

90%: (1.96+1.2816)2 2

2

3

3560.72 = 126.4 127

SAMPLE SIZE (MEAN) & POWER DETERMINATION:

Two-independent samples

Common standard deviation = 7.356 Minimum expected effect size = 3 Ratio N0/N1 = 1 Alpha Risk=5%| Two-Sided Test | Power| 80% 85% 90% | -------------+----------------------+ n0 | 95 108 127 | n1 | 95 108 127 | Total | 190 216 254 | -------------------------------------

Pregunta 32 Cálculo del tamaño de muestra para comparar dos medias

nsize ci2m, sd(7.3560) apre(1 2 3) Número de sujetos para una precisión de:

1 mmHg: 2

22

1

3560.7296.1 = 415.7 416

2 mmHg: 2

22

2

3560.7296.1 = 103.9 104

3 mmHg%:2

22

3

3560.7296.1 = 46.2 47

SAMPLE SIZE: Difference

between two means (independent samples)

Supposed Standard Deviation = 7.356 Ratio N0/N1 = 1.00 NORMAL method |NUMBER of subjects PRECISION | Confidence level of CI(±d) Group| 90% | 95% | 97.5% | ----------------+----------+----------+----------+ 1.00 n0 | 293 | 416 | 544 | n1 | 293 | 416 | 544 | Total | 586 | 832 | 1088 | ----------------+----------+----------+----------+ 2.00 n0 | 74 | 104 | 136 | n1 | 74 | 104 | 136 | Total | 148 | 208 | 272 | ----------------+----------+----------+----------+ 3.00 n0 | 33 | 47 | 61 | n1 | 33 | 47 | 61 | Total | 66 | 94 | 122 | --------------------------------------------------