Download - [email protected] 1 Problemas estadísticos habituales: confusión, missings, multiplicidad
![Page 2: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/2.jpg)
OUTLINE
![Page 3: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/3.jpg)
Outline Interacción, factores de confusión y subgrupos Multiplicidad Missing data Otros:
Análisis intermedios Ajustes por covariables Superioridad vs No-Inferioridad Meta-análisis
Med Clin (Barc.) 2005;125(Supl. 1):72-76
![Page 4: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/4.jpg)
INTERACCIÓN, FACTORES DE CONFUSIÓN Y SUBGRUPOS
![Page 5: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/5.jpg)
Interacción
Presencia de un efecto modificador de la intensidad o sentido de la relación entre diferentes estratos de una variable.
Ejemplos: Sexo con tratamiento. Centro con tratamiento. Edad con tratamiento.
![Page 6: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/6.jpg)
InteracciónIM Hábito de fumar
No Sí
Sí 9 34
No 491 466
Edad < 45 añosIM Hábito de fumar
No SíSí 4 6No 296 294
Edad >= 45 añosIM Hábito de fumar
No SíSí 5 28No 195 172
1.8% 6.8% d=5%
1.3% 2.0% d=0.7%
2.5% 14% d=11.5%
![Page 8: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/8.jpg)
Factores de confusión
Categoría especial de sesgos que cumplen:
1) Son factores de riesgo para la enfermedad (o la variable en estudio).
2) Se asocian a la exposición (o la intervención) en estudio.
3) No son pasos o factores intermedios.
![Page 9: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/9.jpg)
Factores de confusiónIM Café
No SíSí 10 40NO 490 460
No fumadoresIM Café
No SíSí 8 7No 472 413
FumadoresIM Café
No SíSí 2 7No 18 73
2% 8.7% d=6.7%
1.67% 1.67% d=0% 10% 10% d=0%
![Page 11: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/11.jpg)
Subgrupos y la Paradoja de Simpson
Experimental Controln (%) n (%)
ALL Succes 70 (70%) 60 (60%)Failure 30 (30%) 40 (40%)
100 100
![Page 12: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/12.jpg)
Paradoja de Simpson continuación
Experimental Controln (%) n (%)
MALE Succes 10 (33%) 24 (40%)Failure 20 (67%) 36 (60%)
30 60
FEMALE Succes 60 (86%) 36 (90%)Failure 10 (14%) 4 (10%)
70 40
Experimental Controln (%) n (%)
ALL Succes 70 (70%) 60 (60%)Failure 30 (30%) 40 (40%)
100 100
![Page 13: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/13.jpg)
Estudios de Subgrupos
AspirinaPlaceboMuerte vascular150
147
Total 1357 1442
11.1% 10.2%
p=0.42045 d=-0.9
Estudio ISIS-2: Muerte vascular por subgrupos de zodiacoGeminis/Libra Otros Signos
AspirinaPlacebo
Muerte vascular654 868
Total 7228 7157
9.0% 12.1%
p<0.0001 d=3.1
Interacción p = 0.019
Lancet 1988; 2: 349–60.
![Page 15: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/15.jpg)
“The answer to a randomized controlled trial that does not confirm one’s beliefs is not the conduct of several subanalyses until one can see what one believes. Rather, the answer is to re-examine one’s beliefs carefully.”
BMJ 1999; 318: 1008–09.
![Page 17: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/17.jpg)
Subgrupos
Recomendaciones: (Pocock, Simon, Peto) 1) Examinar el en subgrupos sólo si el efecto
global es significativo 2) Examinar subgrupos sólo si la interacción es
significativa 3) Plantearse ajustes de en función de los
objetivos 4) Aspectos que aumentan la credibilidad:
Pre-especificación en protocolo Evaluar la plausibilidad biológica
![Page 19: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/19.jpg)
MULTIPLICIDAD
![Page 20: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/20.jpg)
Ley de Murphy de la Investigación
Una cantidad de investigación suficiente nos
permitirá probar cualquier teoría
![Page 21: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/21.jpg)
Multiplicidad
K hipótesis independientes: H01 , H02 , ... , H0K
S resultados significativos ( p<)
Pr (S 1 | H01 H02 ... H0K = H0.) = 1 - Pr (S=0|H0.)
= 1- (1 - )K
K Pr(S>=1|Ho.) K Pr(S>=1|Ho.)
1 0.0500 10 0.4013
2 0.0975 15 0.5367
3 0.1426 20 0.6415
4 0.1855 25 0.7226
5 0.2262 30 0.7854
![Page 22: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/22.jpg)
Fuentes de Multiplicidad en EC
Múltiples criterios de evaluación
Múltiples tiempos de observación (medidas repetidas)
Múltiples análisis (intermedios, secuenciales)
Múltiples comparaciones: diseños con más de dos tratamientos subgrupos
![Page 23: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/23.jpg)
Ejemplos de multiplicidad en EC
caso A caso B caso Cvariables 2 5 5tiempos 2 4 4subgrupos 2 3 3comparaciones 1 1 3
total 8 60 180% falsos positivos 33.66% 96.61% 99.99%
![Page 24: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/24.jpg)
Multiplicidad Corrección de Bonferroni
K pruebas con un nivel de significación de Tomar como nivel de significación de cada
prueba /k
Ejemplo: 5 pruebas independientes Se pretende un nivel global del 5% Se toma como significativa una prueba si su nivel
de significación es de 5% / 5= 1%
![Page 27: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/27.jpg)
Manejo de la multiplicidad
Escenario 1: Una única variable Identificar una variable principal y el resto son
secundarias
El EC es concluyente si la variable principal es significativa (valor de p <= 0.05, p.e.)
El cálculo del tamaño de la muestra depende sólo de la variable principal.
![Page 29: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/29.jpg)
Manejo de la multiplicidad Escenario 2 Dividir el Error de Tipo IIdentificar dos o más variables principales
Dividir el error de Tipo I global, 0.05, entre estas variables principales, por ejemplo: 0.04 para la primera y 0.01 para la segunda.
El EC es concluyente si una de las variables principales es significativa.
Se calcula el tamaño de la muestra para cada una de las variables por separado, utilizando el valor de Error de Tipo I especificado para cada una de ellas, y se utiliza el mayor de todos ellos.
![Page 30: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/30.jpg)
Manejo de la multiplicidad Escenario 3 Procedimiento de Rechazo
Secuencial Identificar n variables principales, p.e. n=3
Ordenar los valores de p del mayor al menor.
Se evalúa la primera variable con el valor de p mayor, si es significativa al 0.05, se evalúa la segunda variable con el mayor valor de p con un nivel de significación de 0.05/2, en caso de ser significativa se evalúa la tercera con un valor de p de 0.05/3. El procedimiento se detiene en el momento que no se obtiene significación estadística en alguno de los pasos (Hochberg)
![Page 31: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/31.jpg)
Manejo de la multiplicidad
Escenario 3 (continuación) El EC resulta concluyente si la primera variable
es significativa. Para el cálculo del tamaño de la muestra se
utilizará un Error de Tipo I de 0.05/n y se deberá realizar para cada una de las variables que se analicen como principales. Se resuelve seleccionando el mayor de ellos.
![Page 32: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/32.jpg)
Manejo de la multiplicidad Escenario 4 Jerárquico
Se pre-especifica la jerarquía de las n variables principales.
Se evalúa si la 1ª variables es significativa al 0.05, si lo es se comprueba la 2ª al 0.05, si lo es se comprueba la 3ª al 0.05 de significación. Se detiene en el momento que una de las variables no resulta significativa.
El EC es concluyente si la primera variable principal observada resulta significativa.
Calcular la N separadamente para cada variable al 5%
![Page 33: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/33.jpg)
Variables secundarias Sentido de las variables secundarias como
“confirmatorias”: La variable primaria presenta resultados significativos
y Las comparaciones realizadas en las variables
secundarias también están ‘protegidas’ bajo el mismo Error de Tipo I que la variable principal.
Se indican también procedimientos similares a los comentados para la protección del Error de tipo I entre las variables secundarias.
![Page 34: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/34.jpg)
Análisis intermedios En EC de larga duración, se pueden planificar
inspecciones intermedias formales (interim analysis) con el fin de
Investigar evidencias abrumadoras de eficacia a favor de E, con lo que sería posible parar prematuramente el EC y concluir superioridad de E respecto a C
Investigar la inutilidad del EC, p.e. que la eficacia de E respecto a C fuese tan insignificante que no suponga una evidencia clara de obtener resultados positivos.
Por temas de seguridad, análogamente a lo comentado para eficacia.
![Page 35: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/35.jpg)
Interim Analyses in the CDP
Z ValueZ ValueZ ValueZ Value
+2+2
+1+1
00
-1-1
-2-2
+2+2
+1+1
00
-1-1
-2-210 20 30 40 50 60 70 80 90 10010 20 30 40 50 60 70 80 90 100
Month of Follow-upMonth of Follow-up
(Month 0 = March 1966, Month 100 = July 1974)
Coronary Drug Project Mortality Surveillance
Circulation. 1973;47:I-1
http://clinicaltrials.gov/ct/show/NCT00000483;jsessionid=C4EA2EA9C3351138F8CAB6AFB723820A?order=23
![Page 37: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/37.jpg)
Diseño SÍ aplicable a método secuencial
Análisis
Desarrollo total
Reclutamiento
![Page 38: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/38.jpg)
Métodos secuenciales por grupos
Pocock (1977)
Pruebas de significación repetidas K = Nº máximo de inspecciones a
realizar K fijo a priori Análisis con pruebas estadísticas
clásicas (2, t-test, ...)
![Page 39: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/39.jpg)
K z ' z ' z '1 2.782 0.005 2.576 0.010 2.178 0.0292 1.967 0.049 1.969 0.049 2.178 0.029
1 3.438 0.001 2.576 0.010 2.289 0.0222 2.431 0.015 2.576 0.010 2.289 0.0223 1.985 0.047 1.969 0.049 2.289 0.022
1 4.084 0.000 3.291 0.001 2.361 0.0182 2.888 0.004 3.291 0.001 2.361 0.0183 2.358 0.018 3.291 0.001 2.361 0.0184 2.042 0.041 1.969 0.049 2.361 0.018
1 4.555 0.000 3.291 0.001 2.413 0.0162 3.221 0.001 3.291 0.001 2.413 0.0163 2.630 0.009 3.291 0.001 2.413 0.0164 2.277 0.023 3.291 0.001 2.413 0.0165 2.037 0.042 1.969 0.049 2.413 0.016
O'Brien & Fleming Peto Pocock
Group Sequential Methods
![Page 40: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/40.jpg)
“MISSING DATA”
![Page 41: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/41.jpg)
Evolución de los sujetos
PACVisita
SelecciónVisitaBasal RND
Toma de 1a.Medicación Visita 1 Visita 2 Visita 3 Visita 4
1 X X A X X X X X
2 X X A
3 X X B X X X
4 X X A X
5 X X B X X X X/A @ X/A @
6 X X B X X
7 X X A X X X X
8 X
9 X X B X X X X X
10 X X B X X/ERR. X X X
![Page 42: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/42.jpg)
Ex: LOCF & lineal extrapolation lineal
36
32
28
24-
20
16
12
8
4 0 2 4 6 8 10 12 14 16 18 Time (months)
LOCF
Lineal Regresion
Bias
Adas-Cog
> Worse
< Better
![Page 43: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/43.jpg)
Ex: Early drop-out due to AE
Adas-Cog
36
32
28
24-
20
16
12
8
4 0 2 4 6 8 10 12 14 16 18 Time (months)
Placebo
Active
> Worse
< Better
Bias:
Favours Active
![Page 44: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/44.jpg)
Ex: Early drop-out due to lack of Efficacy
Adas-Cog
36
32
28
24-
20
16
12
8
4 0 2 4 6 8 10 12 14 16 18 Time (months)
Placebo
Active
> Worse
< Better
Bias:
Favours Placebo
![Page 45: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/45.jpg)
RND
B
Baseline Last Visit
≠ Frecuencies
A
Drop-outs and missing dataDrop-outs and missing data
A A A A A AB B A
Visit 2Visit 1
A
![Page 46: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/46.jpg)
RND
Baseline Last Visit
≠ Timing
A
Drop-outs and missing dataDrop-outs and missing data
A A A A B B
Visit 2Visit 1
B B B
![Page 47: Ferran.Torres@uab.es 1 Problemas estadísticos habituales: confusión, missings, multiplicidad](https://reader035.vdocumento.com/reader035/viewer/2022062301/5665b4251a28abb57c8f83f0/html5/thumbnails/47.jpg)
Handling of MD Methods for imputation:
Many techniques No gold standard for every situation In principle, all methods may be valid:
Simple methods to more complex: From LOCF to multiple imputation methods Worst Case, “Mean methods”
But their appropriateness has to be justified
Statistical approaches less sensitive to MD: Mixed models Survival models
They assume no relationship between treatment and the missing outcome, and generally this cannot be assumed