Download - Análisis de supervivencia
Análisis de supervivencia
Albert SorribasGrup de Bioestadística I BiomatemàticaDepartament de Ciències Mèdiques BàsiquesUniversitat de Lleida
2
Esquema general Introducción al análisis de supervivencia
Tipos de estudios El concepto de censura La curva de supervivencia
Concepto y modelos paramétricos Concepto de función de riesgo (hazard function) Estimación (Kaplan-Meier)
Comparación de curvas de supervivencia Interpretación de resultados Ejemplos de análisis utilizando el SPSS
3
Datos de supervivencia Tiempo hasta que se presenta un
determinado suceso (muerte, recidiva, etc.) En muchos casos, no disponemos de
información completa (pérdida de seguimientos, el suceso no se ha presentado en algunos pacientes al final del estudio).
En casos extremos, no disponemos de un tiempo de inicio claro.
4
Caso típico de datos de un estudio de supervivencia
TiempoInicio
del estudioFinal
del estudio
1tT
2tT
3tT
4tT
5tT
Se observa el suceso
Perdido
TiempoInicio
del estudioFinal
del estudio
1tT
2tT
3tT
4tT
5tT
Se observa el suceso
Perdido
5
Caso especial de controles en determinados instantes de tiempo
TiempoInicio
del estudioFinal
del estudio
32 tTt
2tT
4tT
1t 2t 3t
21 tTt
4t
43 tTt
TiempoInicio
del estudioFinal
del estudio
32 tTt
2tT
4tT
1t 2t 3t
21 tTt
4t
43 tTt
6
Algo de terminología Dato censurado (censored):
Siguen sin presentar el suceso al final del estudio
La causa es previa (en el tiempo) al tiempo de inicio del estudio (p.e.contagio con HIV)
Perdida de seguimiento (lost to follow-up) No se dispone de datos más allá de un
determinado tiempo. Han muerto antes de presentar el suceso de
interés.
7
¿Cómo podemos estudiar este tipo de problemas?
Estimar una función que permita establecer la probabilidad del suceso en función del tiempo
Establecer factores de riesgo respecto a un mejor o peor pronóstico de supervivencia
Comparar la supervivencia de distintos grupos
8
La función de supervivencia
La función de supervivencia es la probabilidad de que el suceso de interés se presente después de un cierto tiempo. Es decir:
t
duuftTPtS )()()(
9
Ejemplos de posibles funciones de supervivencia
t
duuftTPtS )()()(
0 5 10 15 20
0
0.2
0.4
0.6
0.8
1
10
Propiedades de la función de supervivencia
La función de supervivencia es complementaria con la función de distribución
Cumple:
)(1)(1)( tTPtFtS
)()(
0)(
1)0(
2121 tStStt
tS
St
11
Ejemplos sencillos de función de supervivencia Exponencial
Weibull
En general, esta función se desconoce y debe estimarse a partir de los datos
tetS )(
)(1)(1)( tTPtFtS
atetS )(
12
Función de riesgo(Hazard function)
La función de riesgo se define como:
En el caso continuo, se cumple:
t
tTttTtPth
Δt
|lim)(
0
)(1
)(
)(
)()(
tF
tf
tS
tfth
13
Función de riesgo(Hazard function)
La función de riesgo puede interpretarse como la probabilidad de que se presente el suceso el siguiente instante de tiempo
Si la función de riesgo es constante (caso del modelo exponencial) la probabilidad es independiente del tiempo
En muchos problemas reales, esta probabilidad varía con el tiempo
14
Riesgo acumulado
El riesgo acumulado hasta un instante determinado se calcula como:
t
duuhtH0
S(t)log)()(
15
Relación entre las distintas funciones
)()()(log)(
)()(
)()(log
)(
)()(
)(1)(
tHetStStH
thtS
tf
t
tS
tS
tfth
tFtS
16
Ejemplo: función de supervivencia exponencial
En la función de supervivencia exponencial, se cumple:
ttStH
e
e
tS
tfth
etFtS
t
t
t
)(log)(
)(
)()(
)(1)(
17
Estimación de la función de supervivencia (Caso paramétrico)
Conocemos la función de supervivencia
Expresar la función de verosimilitud Obtener los estimadores
máximo-verosímiles Calcular sus varianzas
18
Ejemplo: el modelo exponencial(datos no censurados)
n
ii
n
ii
n
ii
n
i
n
i
t
tt
t
nt
nL
tL
eL
etfetS
i
1
1
11
1
ˆ0)log(
)log()log(
)()(
nV
nL
IVL
I
2
22
2
12
2
)ˆ()log(
)ˆ()ˆ()log(
)ˆ(
Matriz de información (estimación de la varianza de los parámetros)
19
n
i
n
jji
n
i
n
jji
m
j
tn
i
t
m
jj
n
ii
tt
tt
n
w
n
wnnttnL
eeL
tStfL
etfetS
ji
1 1
1 1
11
11
ˆ
)log()log()log(
)()(
)()(
Matriz de información (estimación de la varianza de los parámetros)
Ejemplo: el modelo exponencial(censura tipo I)
nV
2
)ˆ(
20
Ejemplo
0027.06/127.0)ˆ(
127.047
6ˆ
4710)52117641(1w
6n
11 ,10 7, 6, ,5 4, ,2 1, 1, :Datos
2
V
21
Estimación no-paramétrica(Método de Kaplan-Meier)
Desconocemos la función de supervivencia
Realizamos una estimación a partir de los datos
Algunas definiciones:
ii
ii
tn
td
tiempoelen expuesta personas de Número :
tiempoelen eventos de Número :
22
Estimación no-paramétrica(Método de Kaplan-Meier)
El estimador de Kaplan-Meier se define como:
tti
iiKM
i
ndtS:
/1)(
23
Ejemplo de aplicación del método de Kaplan-Meier
1412119875221Datos:
it in id iii ndn /)( )(tS )(tS
1 10 1 9/10 9/10 0.900
2 9 2 7/9 9/10 x 7/9 0.700
8 5 1 4/5 9/10 x 7/9 x 4/5 0.560
11 3 1 2/3 9/10 x 7/9 x 4/5 x 2/3 0.373
12 2 1 1/2 9/10 x 7/9 x 4/5 x 2/3 x 1/2 0.187
24
1412119875221Datosit in id iii ndn /)( )(tS )(tS
1 10 1 9/10 9/10 0.900
2 9 2 7/9 9/10 x 7/9 0.700
8 5 1 4/5 9/10 x 7/9 x 4/5 0.560
11 3 1 2/3 9/10 x 7/9 x 4/5 x 2/3 0.373
12 2 1 1/2 9/10 x 7/9 x 4/5 x 2/3 x 1/2 0.187
Función de supervivencia
T
1614121086420
Su
pe
rviv
en
cia
acu
m
1,2
1,0
,8
,6
,4
,2
0,0
Función de supervive
ncia
Censurado
25
El método de Kaplan-Meier en SPSS
26
El método de Kaplan-Meier en SPSS Survival Analysis for TIEMPO
Time Status Cumulative Standard Cumulative Number
Survival Error Events Remaining
1 Suceso ,9000 ,0949 1 9
2 Suceso 2 8
2 Suceso ,7000 ,1449 3 7
5 Censurado o perdido 3 6
7 Censurado o perdido 3 5
8 Suceso ,5600 ,1706 4 4
9 Censurado o perdido 4 3
11 Suceso ,3733 ,1902 5 2
12 Suceso ,1867 ,1627 6 1
14 Censurado o perdido 6 0
Number of Cases: 10 Censored: 4 ( 40,00%) Events: 6
Survival Time Standard Error 95% Confidence Interval
Mean: 9 2 ( 5; 12 )
(Limited to 14 )
Median: 11 3 ( 5; 17 )
27
Comparación de curvas de supervivencia
Evaluar si la supervivencia observada permite concluir que los dos grupos tienen la misma curva de supervivencia
Ejemplo: Grupo 1: 1 2 4+ 7 10+ 11+ Grupo 2: 1 3+ 5 7 8 10+
28
Comparación de curvas de supervivencia
29
Comparación de curvas de supervivencia
Survival Analysis for TIEMPO
Factor GRUPO = 1
Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining
1 Suceso ,8333 ,1521 1 5 2 Suceso ,6667 ,1925 2 4 4 Censurado o perdido 2 3 7 Suceso ,4444 ,2222 3 2 10 Censurado o perdido 3 1 11 Censurado o perdido 3 0
Number of Cases: 6 Censored: 3 ( 50,00%) Events: 3
Survival Time Standard Error 95% Confidence Interval
Mean: 7 2 ( 4; 10 ) (Limited to 11 ) Median: 7 5 ( 0; 17 )
Survival Analysis for TIEMPO
Factor GRUPO = 2
Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining
1 Suceso ,8333 ,1521 1 5 3 Censurado o perdido 1 4 5 Suceso ,6250 ,2135 2 3 7 Suceso ,4167 ,2218 3 2 8 Suceso ,2083 ,1844 4 1 10 Censurado o perdido 4 0
Number of Cases: 6 Censored: 2 ( 33,33%) Events: 4
Survival Time Standard Error 95% Confidence Interval
Mean: 6 1 ( 4; 9 ) (Limited to 10 ) Median: 7 2 ( 3; 11 )
30
Comparación de curvas de supervivencia
Survival Analysis for TIEMPO
Total Number Number Percent Events Censored Censored
GRUPO 1 6 3 3 50,00 GRUPO 2 6 4 2 33,33
Overall 12 7 5 41,67
Test Statistics for Equality of Survival Distributions for GRUPO
Statistic df Significance
Log Rank ,11 1 ,7347 Breslow ,00 1 1,0000 Tarone-Ware ,02 1 ,8785
31
Comparación de curvas de supervivencia
Funciones de supervivencia
TIEMPO
121086420
Sup
ervi
venc
ia a
cum
1,2
1,0
,8
,6
,4
,2
0,0
GRUPO
2
2-censurado
1
1-censurado
32
Procedimiento multivariantes
Regresión de Cox Considerar el efecto de otras variables
en la supervivencia Seleccionar las variables más
importantes Comparar grupos Interpretar factores de riesgo
33
Fundamentos de la regresión de Cox (modelo de riesgos proporcionales)
)0|(
)1|(
)()1|(
)()0|(
)|(
)|(
)(log)|(log)()|(
1
1
1
1 1
1
Xth
Xthe
ethXth
thXth
th
the
ththethth
X
X
XβXX*
βXX
Xβ
*
34
Ejemplo (Cox1.sav)
35
Variables en la ecuación
-,659 ,334 3,899 1 ,048 ,517 ,269 ,995GRUPB ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
Función de supervivencia para modelos 1 - 2
T
120100806040200-20
Su
pe
rviv
en
cia
acu
mu
lad
a
1,2
1,0
,8
,6
,4
,2
0,0
-,2
GRUP
2
1
Ejemplo (Cox1.sav)
36
Ejemplo (Cox1.sav)
37
Ejemplo (Cox1.sav)
Variables en la ecuación
,000 ,064 ,000 1 1,000 1,000 ,882 1,134
,005 ,064 ,007 1 ,932 1,005 ,887 1,140
-,009 ,029 ,104 1 ,748 ,991 ,937 1,048
-,634 ,820 ,599 1 ,439 ,530 ,106 2,645
X1
X2
X3
GRUP
B ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
Función de supervivencia para modelos 1 - 2
T
120100806040200-20
Su
pe
rviv
en
cia
acu
mu
lad
a
1,2
1,0
,8
,6
,4
,2
0,0
-,2
GRUP
2
1
38
Selección de variablesEjemplo Cox1.sav
39
Selección de variablesVariables en la ecuación
-,634 ,820 ,599 1 ,439 ,530 ,106 2,645
,000 ,064 ,000 1 1,000 1,000 ,882 1,134
,005 ,064 ,007 1 ,932 1,005 ,887 1,140
-,009 ,029 ,104 1 ,748 ,991 ,937 1,048
-,635 ,343 3,434 1 ,064 ,530 ,271 1,037
,005 ,061 ,008 1 ,929 1,005 ,892 1,134
-,009 ,029 ,104 1 ,747 ,991 ,937 1,048
-,639 ,340 3,532 1 ,060 ,528 ,271 1,028
-,009 ,029 ,103 1 ,748 ,991 ,937 1,048
-,659 ,334 3,899 1 ,048 ,517 ,269 ,995
GRUP
X1
X2
X3
Paso 1
GRUP
X2
X3
Paso 2
GRUP
X3
Paso 3
GRUPPaso 4
B ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
El único factor significativo es el GRUPO
40
Ejemplo (Cox2.sav)
Variables en la ecuación
-,120 ,018 42,367 1 ,000 ,887 ,856 ,920
,128 ,069 3,494 1 ,062 1,137 ,994 1,300
-,040 ,035 1,323 1 ,250 ,960 ,896 1,029
-,386 ,404 ,912 1 ,340 ,680 ,308 1,502
X1
X2
X3
GRUP
B ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
Variables en la ecuación
-,386 ,404 ,912 1 ,340 ,680 ,308 1,502
-,120 ,018 42,367 1 ,000 ,887 ,856 ,920
,128 ,069 3,494 1 ,062 1,137 ,994 1,300
-,040 ,035 1,323 1 ,250 ,960 ,896 1,029
-,117 ,018 43,204 1 ,000 ,889 ,859 ,921
,138 ,068 4,167 1 ,041 1,148 1,006 1,311
-,048 ,034 1,944 1 ,163 ,953 ,891 1,020
-,113 ,017 43,569 1 ,000 ,893 ,864 ,924
,138 ,068 4,113 1 ,043 1,148 1,005 1,311
GRUP
X1
X2
X3
Paso1
X1
X2
X3
Paso2
X1
X2
Paso3
B ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
41
Estimación de curvas de supervivencia para determinados valores de las covariantes
Función de supervivencia en media de covariables
T
120100806040200-20
Su
pe
rviv
en
cia
acu
mu
lad
a
1,2
1,0
,8
,6
,4
,2
0,0
-,2
Función de supervivencia para modelo 1
T
120100806040200-20
Su
pe
rviv
en
cia
acu
mu
lad
a
1,2
1,0
,8
,6
,4
,2
0,0
-,2
Supervivencia en los valoresmedios de las variables
42
Ejemplo Hosmer & Lemeshow (1999)
Applied survival analysis. Wiley Series in Probability and Statistics
43
Objetivos (1)
Usando el método de Kaplan-Meier Estudiar la supervivencia en función de la
historia previa de uso de drogas IV. Estudiar la supervivencia en función de la edad
en el momento del inicio del estudio Evaluar si existe una tendencia en la
supervivencia en función de la edad
44
Supervivencia en función de la historia previa de uso de drogas IV
Funciones de supervivencia
Survival time
706050403020100
Su
pe
rviv
en
cia
acu
m
1,2
1,0
,8
,6
,4
,2
0,0
Drug=0
Drug=1
Test Statistics for Equality of Survival Distributions for DRUG
Statistic df Significance
Log Rank 11,86 1 ,0006
Breslow 10,91 1 ,0010
Tarone-Ware 12,34 1 ,0004
45
Supervivencia en función del grupo de edad
Funciones de supervivencia
Survival time
706050403020100
Su
pe
rviv
en
cia
acu
m
1,2
1,0
,8
,6
,4
,2
0,0
-,2
Test Statistics for Equality of Survival Distributions for GAGE
Statistic df Significance
Log Rank 19,91 3 ,0002
Breslow 14,14 3 ,0027
Tarone-Ware 16,96 3 ,0007
20-29 años
40-54 años
46
Supervivencia en función del grupo de edadTest de tendencia Tendencia en
función de los puntos medios de los grupos de edad
47
Supervivencia en función del grupo de edadTest de tendencia
Tendencia enfunción de los puntos medios de los grupos de edad
Funciones de supervivencia
Survival time
706050403020100
Su
pe
rviv
en
cia
acu
m
1,2
1,0
,8
,6
,4
,2
0,0
-,2
Test Statistics for Equality of Survival Distributions for GAGE with Trend,
metric = ( 25, 32,50, 37,50, 47,50 )
Statistic df Significance
Log Rank 19,07 1 ,0000
Breslow 14,08 1 ,0002
Tarone-Ware 16,67 1 ,0000
Podemos concluir queexiste una tendencia enla supervivencia en funciónde la edad. Esta tendencia esinversamente proporcionala la edad.
48
Objetivos (2)
Utilizando la regresión de Cox Evaluar el efecto de la edad en la
supervivencia Evaluar el efecto conjunto de la edad, el
uso de drogas IV y su posible interacción Selecionar qué modelo es más adecuado
49
Efecto de la edad
La edad puede considerarsecomo un factor de riesgo
Variables en la ecuación
,081 ,017 21,799 1 ,000 1,085 1,048 1,123AGEB ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
50
Efecto conjunto de la edad y del uso de drogas IV
Tanto la edad como el uso de drogas IV son
factores de riesgo
Variables en la ecuación
,092 ,018 24,512 1 ,000 1,096 1,057 1,136
,941 ,256 13,574 1 ,000 2,564 1,554 4,230
AGE
DRUG
B ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
51
Evaluación de la interacción
Variables en la ecuación
,094 ,023 16,894 1 ,000 1,099 1,051 1,149
1,186 1,257 ,891 1 ,345 3,274 ,279 38,422
-,007 ,034 ,039 1 ,843 ,993 ,930 1,061
AGE
DRUG
AGEXDRUG
B ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
La interacción no essignificativa.
En este modelo, tampocolo seria la variable DRUG
52
Función de supervivencia para modelos 1 - 2
Survival time
6050403020100-10
Su
pe
rviv
en
cia
acu
mu
lad
a
1,2
1,0
,8
,6
,4
,2
0,0
-,2
Drug=0
Drug=1
Selección de variables
La interacción no es significativa
La edad y el uso de drogas IV se asocian significativamente a la supervivencia
Variables en la ecuación
,094 ,023 16,894 1 ,000 1,099 1,051 1,149
1,186 1,257 ,891 1 ,345 3,274 ,279 38,422
-,007 ,034 ,039 1 ,843 ,993 ,930 1,061
,092 ,018 24,512 1 ,000 1,096 1,057 1,136
,941 ,256 13,574 1 ,000 2,564 1,554 4,230
AGE
DRUG
AGEXDRUG
Paso1
AGE
DRUG
Paso2
B ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
53
Comparación entre los resultados de la regresión de Cox y Kaplan-Meier
Funciones de supervivencia
Survival time
706050403020100
Sup
ervi
venc
ia a
cum
1,2
1,0
,8
,6
,4
,2
0,0
Drug=0
Drug=1
Función de supervivencia para modelos 1 - 2
Survival time
6050403020100-10
Su
pe
rviv
en
cia
acu
mu
lad
a
1,2
1,0
,8
,6
,4
,2
0,0
-,2
Drug=0
Drug=1
54
Estimación del hazard ratio en función del grupo de edad
Variables en la ecuación
16,549 3 ,001
1,197 ,451 7,043 1 ,008 3,310 1,367 8,012
1,313 ,459 8,190 1 ,004 3,718 1,513 9,140
1,860 ,469 15,714 1 ,000 6,426 2,561 16,123
GAGE
GAGE(1)
GAGE(2)
GAGE(3)
Paso1
B ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
Función de supervivencia para modelos 1 - 4
Survival time
6050403020100-10
Su
pe
rviv
en
cia
acu
mu
lad
a
1,0
,8
,6
,4
,2
0,0
Usamos la regresión de Cox
El hazard ratio se incrementa con la edad
55
Estimación del hazard ratio en función de la edad
Usamos la regresión de Cox
El hazard ratio se incrementa con la edad
Variables en la ecuación
,081 ,017 21,799 1 ,000 1,085 1,048 1,123AGEB ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
Hazard ratio correspondiente a un incremento de un año
50.1)5(
)(081.05
eHR
etHR t
56
Estimación del hazard ratio
Variables en la ecuación
,779 ,242 10,346 1 ,001 2,180 1,356 3,504DRUGPaso 1B ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
Variables en la ecuación
,941 ,256 13,574 1 ,000 2,564 1,554 4,230
,092 ,018 24,512 1 ,000 1,096 1,057 1,136
DRUG
AGE
Paso1
B ET Wald gl Sig. Exp(B) Inferior Superior
95,0% IC para Exp(B)
Hazard ratio correspondiente al efectodel uso de drogas IV, ajustado por la edad
Hazard ratio correspondiente al efectodel uso de drogas IV