Conceptos básicos de estadística para clínicos
Víctor Abraira
A Coruña. Noviembre 2008
Programa
“Valor p”: ¿qué significa?AleatorizaciónPruebas de hipótesis para variables continuasPruebas de hipótesis para variables categóricasTiempo hasta un evento
V.Abraira 2
Valor p
V.Abraira 3
¿Qué son?
Reducción relativa del riesgo (RRR)Intervalo de confianza (CI)Valor p
la probabilidad de encontrar una diferencia en las proporciones de recurrencia de ictus como la que se ha encontrado, o mayor, en la hipótesis, llamada hipótesis nula, de que el tratamiento no tenga efecto.
V.Abraira 4
Ejemplo: La dama y las tazas de té
Supóngase que una dama asegura que es capaz de distinguir entre dos formas de preparar el téExperimento: se preparan 8 tazas, 4 de cada tipo, la dama lo sabe, y se le presentan al azarH0: la dama no distingueResultado: Señala todas correctamente.C8;4=70 p=1/70= 0,014
V.Abraira 5
Ejemplo: La dama y las tazas de té
Si se hubieran preparado 4 tazas; 2 y 2C4;2=6 p=1/6= 0,17No sería un experimento que aportara suficiente carga contra H0 aunque acertara todasNotar que el cálculo de p depende del diseño
V.Abraira 6
Ejemplo: La dama y las tazas de té
Si la dama no supiera cuantas tazas se preparan de cada tipo, sólo que hay, o puede haber, de los dos tipos.La variable número de aciertos en H0 es Bin(n=8,p=0,5)
( ) ( )8 08(8) 0,5 0,5 0,0039
8p f
æ ö÷ç= = ÷ =ç ÷ç ÷çè ø
V.Abraira 7
Críticas
El valor p depende sobre todo del tamaño muestral.El formalismo de los contrastes de hipótesis no contempla la información proveniente de otros estudios.
El procedimiento garantiza a la larga una frecuencia preestablecida de decisiones correctas, pero no dice nada sobre la verdad o falsedad de cada hipótesis concreta.
Ver SEMERGEN 2002; 28:374-5
V.Abraira 8
Alternativas
Hacer estimaciones con ICMisma base conceptualFeinstein AR. P-values and confidence intervals: two sides of the same unsatisfactory coin. J Clin Epidemiol 1998; 51:355-360.
Abraira V. Estimación: intervalos de confianza. SEMERGEN 2002; 28:84-85.
Alternativa Bayesiana
Abraira V. Inferencia estadística bayesiana. SEMERGEN 2005; 31:18-20.
V.Abraira 9
Aleatorización
Dos conceptos:Muestra aleatoria (afecta a toda la inferencia). Es necesaria para:
muestra sea representativa cuantificar incertidumbre muestreo
Asignación aleatoria de tratamientos (afecta a los EECC). Necesaria para igualar el pronóstico de los pacientes.
V.Abraira 10
Muestra aleatoria
Aquella en que todos sus elementos tienen la misma probabilidad y cada uno está independientemente de los demás.Cada muestra es independiente de las demás y con la misma probabilidad.En la práctica rara vez se dispone de muestras aleatorias, por la tanto la situación habitual es
V.Abraira 11
Muestra aleatoria
V.Abraira 12
Diseño ensayo clínico
Muestra pacientes
grupo 2 Resultado
Tratamiento experimental
Tratamiento control
grupo 1 Resultado
V.Abraira 13
¿Cómo se calcula la p?
PROGRESS
V.Abraira 14
¿Cómo se calcula la p?
Gran variedad de métodos (los llamados tests estadísticos) dependiendo de la hipótesis, del diseño, del tipo de variables, etc. Un amplio grupo son aquellos en que la hipótesis es la asociación entre dos variables:
Ambas categóricasUna categórica y otra continuas
Tiempo a un evento
Ambas continuas
V.Abraira 15
Dos variables categóricas
BMJ 2000;321:329-333
Lancet 2001;358:1033-1041
V.Abraira 16
Contrastes sobre diferencia de proporciones
1 2
0 01 2
ˆ ˆ(0, 1)
1 1ˆ ˆ(1 )
p pZ Nor
p pn n
-=æ ö÷ç- + ÷ç ÷ç ÷è ø
:
H0: p1=p2=p0
El estadístico para el contraste es (si se puede aproximar a la normal)
O, equivalentemente, la prueba ji-cuadrado O la prueba de Fisher si no se puede aproximar a la normal
V.Abraira 17
Ejemplo
Resultados del ensayo del BMJ:200 participantes en cada grupo; 52 con éxito en el grupo tratado y 18 en el placebo
V.Abraira 18
1 2
0 01 2
ˆ ˆ
1 1ˆ ˆ(1 )
p pZ
p pn n
-=æ ö÷ç- + ÷ç ÷÷çè ø
1 1 052 18ˆ ˆ ˆ; ; ??200 200
p p p= = =
070ˆ400
p =0,26 0,09 4,474
1 10,175 0,825200 200
Z -= =æ ö÷ç´ + ÷ç ÷çè ø
0,0000038 p =
Una categórica y otra continua
V.Abraira 19
Estadísticos para los contrastes sobre diferencias de medias
V.Abraira
Varianzas conocidas( )1 2
2 21 2
1 2
(0, 1)X X
Z = Nor
n n
-
s s+
:
Varianzas desconocidas
iguales
desiguales
( )1 2
1 22
1 2
1 1 n n
p
X XT = t
Sn n
+ --
+:
( )1 22 21 2
1 2
X XT = t
S Sn n
n-
+
:
H0: µ1=µ2
Los estadísticos para el contraste son (si las variables son normales)
20
En el ejemplo
2 2
2,7 3 2,120,1 0,1
T -= = -+
0,017 p =
V.Abraira 21
Tiempo al evento
V.Abraira 22
¿Por qué distinto?
Problemas con la medición:
0 2 4 6 8 10 12
A
B
C
D
E
F
Desconocido enPérdidas No eventos(evento competitivo)
Censuras
0 50 100 150 200
tiempo en dialisis en meses
0
50
100
150
200
250
300
Frec
uenc
ia
En general, no normal
V.Abraira 23
¿Cómo se resume?
La variable tiempo de espera, usando la información parcial de las censuras, se resume mediante:
la función de supervivencia S(t)
V.Abraira 24
Función de supervivencia
S(t) es la probabilidad de que, en un individuo, el evento ocurra en un tiempo igual o mayor que t (si el evento es muerte, sobreviva al menos t). P.e. S(100) es la probabilidad de que un individuo sobreviva 100 ó más meses.
0.00
0.25
0.50
0.75
1.00
0 100 200 300analysis time
Kaplan-Meier survival estimate
V.Abraira 25
Puntos críticos
El método asume que las “pérdidas”son al azar (no tienen información).Tiempo de seguimiento. Lo mide:
Mediana de seguimiento (más habitual)Mediana de “pérdidas”
V.Abraira 26
Estabilidad de la gráfica
Las gráficas de K-M deberían incluir algún índice de la precisión de las estimaciones:
Intervalos de confianzaTablas de individuos en riesgo
1A
Months
120100806040200
Sur
viva
l pro
pabi
lity
1,0
,9
,8
,7
,6
,5
,4
,3
,2
,1
0,0
I
II
I 185 173 132 69 20 1II 74 62 40 19 5
Eje tiempo hasta el 10% de los individuosPocock, Clayton, Altman. Lancet 2002: 359:1686-89
V.Abraira 27
A modo de resumen
VARIABLE DEPENDIENTE (Y) VARIABLE INDEPENDIENTE (X)
Categórica (2 categorías)
Categórica (más de 2 categorías)
Cuantitativa (No Normal)
Cuantitativa (Normal)
Tiempo al evento
Categórica (2 categorías)
Comparación 2 proporciones o Chi-cuadrado o Fisher
Mann-Whitney
Comparación 2 medias - t de Student/
Categórica (más de 2 categorías)
Chi-cuadrado
Chi-cuadrado
Kruskall-Wallis
ANOVA
Kaplan-Meier y log rank
Cuantitativa
Regresión logística
Correlación Spearman
Correlación Pearson/ Regresión lineal
Regresión Cox
V.Abraira 28