departamento de estadística itamallman.rhon.itam.mx/~lnieto/index_archivos/uv2017.pdf · 2017. 10....

Post on 21-Mar-2021

2 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Algunas aplicaciones en bioestadística

Luis E. Nieto Barajas

Departamento de EstadísticaITAM

UV – 20 de octubre de 2017

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 1 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Contenido

Introducción

Ideas generales de inferencia

Aplicación 1 : Leucemia

Aplicación 2 : Transplante de corazón

Aplicación 3 : Pacientes con leucemia que se curan con transplante de médulaosea

Aplicación 4 : Cáncer de mama con microarreglos

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 2 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Definiciones

Bioestadística : (Wikipedia) Es la aplicación de la Estadística a la Biología.Comprende el diseño de experimentos biológicos, la recolección, resumen yanálisis de los datos obtenidos de los experimentos ; e interpretación e inferenciade los resultados.

Ensayos clínicos : Experimentos de investigación biomédicos o de salud enhumanos. Estos estudios siguen un determinado protocolo. Hay de dos tipos :intervencionales u observacionales. Para nuevos tratamientos hay 4 Fases :

Fase I : Identificar una dosis segura (toxicidades)Fase II : Determinar la eficacia de cierta dosisFase III : Comparar tratamiento nuevo vs. controlFase IV : Monitorear tratamiento (efectos secundarios)

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 3 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Definiciones

Bioestadística : (Wikipedia) Es la aplicación de la Estadística a la Biología.Comprende el diseño de experimentos biológicos, la recolección, resumen yanálisis de los datos obtenidos de los experimentos ; e interpretación e inferenciade los resultados.Ensayos clínicos : Experimentos de investigación biomédicos o de salud enhumanos. Estos estudios siguen un determinado protocolo. Hay de dos tipos :intervencionales u observacionales. Para nuevos tratamientos hay 4 Fases :

Fase I : Identificar una dosis segura (toxicidades)Fase II : Determinar la eficacia de cierta dosisFase III : Comparar tratamiento nuevo vs. controlFase IV : Monitorear tratamiento (efectos secundarios)

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 3 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Ideas generales

Teoría Clásica : T ∼ FParamétrica : F ∈ FΘ

FΘ = {F : F = Fθ, θ ∈ Θ}No paramétrica : dim(θ) =∞, F ∈ F

F = {F : F es una funcion de distribucion}

Teoria Bayesiana : Asignar una distribucion inicial a FParamétrica : θ ∼ π, θ ∈ Θ⇒

FΘ ∼ PNo paramétrica :

F ∼ P

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 4 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Ideas generales

Teoría Clásica : T ∼ FParamétrica : F ∈ FΘ

FΘ = {F : F = Fθ, θ ∈ Θ}No paramétrica : dim(θ) =∞, F ∈ F

F = {F : F es una funcion de distribucion}

Teoria Bayesiana : Asignar una distribucion inicial a FParamétrica : θ ∼ π, θ ∈ Θ⇒

FΘ ∼ PNo paramétrica :

F ∼ P

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 4 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Ideas generales

Inferencia Bayesiana no paramétrica :

T1, . . . ,Tn m.a.

Ti |F ∼ F definida en (IR,B)

F ∼ P definida en (F ,A)

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 5 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Estudio

T = Tiempo de remisión (en semanas) en pacientes con leucemiaEventos : Inicio=remisión, fin=recaída

Datos : (Freireich et al., 1963) n = 21 observaciones (0% censurados)

1, 1, 2, 2, 3, 4, 4, 5, 5, 8, 8, 8, 8, 11, 11, 12, 12, 15, 17, 22, 23

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 6 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Estudio

x

Den

sity

0 5 10 15 20 25

0.00

0.02

0.04

0.06

0.08

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 7 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

Supongamos T discreta con puntos de masa {τ1, τ2, . . .}Densidad : f (τj ) = P(T = τj ) = pj , j = 1 . . . , n

⇒ Θ = {p1, p2, . . .} (espacio parametral desc.)Inf. Bayesiana : definir dist. inicial π sobre Θ

En A. Supervivencia es de mayor interés estudiar las funciones de riesgo y desupervivencia

hj = P(T = τj |T ≥ τj ), j = 1, 2, . . .

S(t) =∏{j:τj≤t}

(1− hj )

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 8 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

Sea Θ′ = {h1, h2, . . .}. Como Θ′ ⇐⇒ Θ entonces una inicial sobre Θ′ induceinicial sobre Θ

Inicial 1 : (Hjort, 1990). Como hj ∈ (0, 1)⇒ hjiid∼ Be(αj , βj )

Inicial 2 : (Nieto-Barajas & Walker, 2002). Modelan {hj} mediante un procesodependiente tal que

h1u1→ h2

u2→ · · · .

En particular, para j = 1, 2, . . .

h1 ∼ Be(α1, β1)

uj |hj ∼ Bi(cj , hj )

hj+1|uj ∼ Be(αj+1 + uj , βj+1 + cj − uj )

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 9 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

Inicial 2 : Propiedades

Si cj = 0 ∀j entonces hj ’s son independientes

Si αj = α y βj = β ∀j , entonces{hj} es un proceso estacionario con hj ∼ Be(α, β)

Corr(hj , hj+1) =cj

α+β+cj

Ejemplo leucemia : especificaciones vagas en localización y dispersión con fuertecorrelación inicial αj = 0.0001, βj = 0.01, cj = 50, ∀j = 1, 2, . . .

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 10 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

Time

Haz

ard

rate

s

0 5 10 15 20

0.0

0.2

0.4

0.6

0.8

1.0

FIGURE : Estimadores Nelson-Aalen

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 11 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

Time

Haz

ard

rate

s

0 5 10 15 20

0.0

0.2

0.4

0.6

0.8

1.0

* * * * * * * * * * * * * * * * * * * * * * * *

FIGURE : Estimadores : Nelson-Aalen + iniciales

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 12 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

Time

Haz

ard

rate

s

0 5 10 15 20

0.0

0.2

0.4

0.6

0.8

1.0

FIGURE : Estimadores : Nelson-Aalen + posteriores

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 13 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

Time

Sur

viva

l fun

ctio

n

0 5 10 15 20 25

0.0

0.2

0.4

0.6

0.8

1.0

FIGURE : Estimador Kaplan-Meier

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 14 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

Time

Sur

viva

l fun

ctio

n

0 5 10 15 20 25

0.0

0.2

0.4

0.6

0.8

1.0

FIGURE : Estimadores : Kaplan-Meier + iniciales

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 15 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

Time

Sur

viva

l fun

ctio

n

0 5 10 15 20 25

0.0

0.2

0.4

0.6

0.8

1.0

FIGURE : Estimadores : Kaplan-Meier + finales

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 16 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Estudio

Estudio : Los pacientes eran aceptados cuando eran juzgados candidatos paratransplante. Cuando un donador se presentaba, los médicos seleccionaban elcandidato idóneo

T = Tiempo de supervivencia (días) de un paciente con problemas de corazón

Datos : (Cox & Oakes, 1984) n = 249 pacientes aceptados, de los cuales sólo 184

recibieron transplante (74%)

Tiempo Indicador Superviv. Statusespera transplante total final

49 0 49 1112 0 112 050 1 673 1· · · ·

22 1 3716 0

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 17 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Estudio

Existe información de covariables Wi (t)⇒ mod. regresión

Cada individuo tiene(Ti ,Wi ), i.e., fi (t), Fi (t), hi (t) y Si (t)

Modelo de riesgos proporcionales : (Cox, 1972)

hi (t) = h0(t)eWi (t)′θ

θ′ = (θ1, . . . , θp) vector de coeficientesh0(t) función de riesgo base (común)

Inf. Bayesiana : Definir iniciales sobre θ y h0(t)

Como h0(t) es cualquier función de riesgo⇒ inicial NP

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 18 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

Para una v.a. T continua :

f (t) = h(t)S(t), S(t) = e−∫ t

0 h(s)ds

donde h(t) es una función de riesgo :No negativaEl área bajo su curva es∞

⇒ Dist. inicial NP sobre h(t) : a través de un proceso estocástico

Inicial : (Nieto-Barajas & Walker, 2004). Basada en procesos de Lévy (mezcla)

h(t) =

∫IR

k(t , s)dL(s)

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 19 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

L(t) = Proceso de Lévy o proceso aditivo creciente (PAC)

PAC = proceso de saltos puros

L(t) =∑

j

Vj I(µj ≤ t)

Vj y µj son alturas y localizaciones aleatorias

L(t) se caracteriza por la medida de Lévy Nt (ν)

Dependiendo del kernel k(t , s) se pueden obtener distintas formas del procesomezcla ∫

k(t , s)dL(s) =∑

j

Vi k(t , µj )

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 20 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

time

Jumps

0 2 4 6 8 10 12

01

23

4

time

Proces

s

0 2 4 6 8 10 12

05

1015

FIGURE : Ejemplo de PAC L(t)

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 21 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

Time

Proc

ess

0 2 4 6 8 10 12

24

68

FIGURE : Ejemplo de mezcla con PAC∫

k(t, s)dL(s)

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 22 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

Time

Proc

ess

0 2 4 6 8 10 12

01

23

45

6

FIGURE : Ejemplo de mezcla con PAC∫

k(t, s)dL(s)

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 23 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

Time

Proc

ess

0 2 4 6 8 10 12

05

1015

FIGURE : Ejemplo de mezcla con PAC∫

k(t, s)dL(s)

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 24 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

En particular, la inicial para h0(t) es de la forma

h0(t) =

∫k(t , s)dL(s)

dNs(ν) = dν∫ s

0 exp{−νβ(u)}dα(u)

k(t , s) = e−a(t−s)I(s ≤ t)Para el ejemplo : Wi (t) = I(t ≥ wi )

α(·) and β(·) t.q. E{h0(t)} = 0.02 and Var{h0(t)} = 20a ∼ Ga(1/2, 1/2)θ ∼ N(0, 9)

Resultados : θ̂ = −0.88⇒ se reduce el riesgo de morir en casi 60% si se realizael transplante de corazón

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 25 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

0 1000 2000 3000

0.0

0.2

0.4

0.6

0.8

1.0

Time

Surv

ival

func

tion

FIGURE : Estimadores de Breslow (wi = ∞ & wi = 0)

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 26 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

0 1000 2000 3000

0.0

0.2

0.4

0.6

0.8

1.0

Time

Surv

ival

func

tion

FIGURE : Estimadores de Breslow + estimadores posteriores (wi = ∞ & wi = 0)

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 27 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Estudio

Estudio : Pacientes con leucemia eran sometidos a dos tipos de tratamiento BMTAlogénico (infusión de médula de otra persona compatible)Autogénico (reinfusión de la médula del mismo paciente previa extracción y limpieza)

T = Tiempo de supervivencia (días) libre de leucemiaEventos : Inicio=remisión, fin=recaída o muerte

Datos : n = 43 pacientes, 16- T.Alogénico y 27-T.Autogénico

Objetivo : Evaluar la diferencia en la supervivencia libre de leucemia de los dostipos de BMT

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 28 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Estudio

Time to death or disease relapse (days)

Sur

viva

l pro

babi

lity

0 500 1000 1500 2000

0.0

0.2

0.4

0.6

0.8

1.0

FIGURE : Estimadores K-M de las supervivencias estratificadas por grupo BMT

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 29 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

La gráfica muestra que una parte de los pacientes no presentarán el evento deinterés (recaída o muerte), por lo que se pueden considerar curados de laenfermedad

⇒ Necesitamos un modelo que permita una tasa de cura (T =∞) con probabilidadpositiva

Modelo 1 : (Berkson & Gage, 1952)

Spop(t) = π + (1− π)S(t),

donde π =prop. de cura, y S(t) =función de superv. propia

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 30 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

Modelo 2 : (Yakolev & Tsodikov, 1996)

Spop(t) = e−θF (t),

donde e−θ =prop. de cura, y F (t) =fn. de dist. propia

Estos modelos consideran la prop. de cura pero no el tiempo de cura

Modelo 3 : (Nieto-Barajas & Yin, 2008)

hpop(t) = h(t)I(t ≤ τ),

h(t) una función de riesgoexp{−

∫ τ0 h(s)ds}=prop. de cura

τ=tiempo de cura

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 31 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

Modelo 2 : (Yakolev & Tsodikov, 1996)

Spop(t) = e−θF (t),

donde e−θ =prop. de cura, y F (t) =fn. de dist. propia

Estos modelos consideran la prop. de cura pero no el tiempo de cura

Modelo 3 : (Nieto-Barajas & Yin, 2008)

hpop(t) = h(t)I(t ≤ τ),

h(t) una función de riesgoexp{−

∫ τ0 h(s)ds}=prop. de cura

τ=tiempo de cura

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 31 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

Modelo 3 + covariables :

hi (t |xi , zi ) = h(t |zi )eγ′xi (t),

Inicial : Modelamos h(t |zi ) que permita determinar una prop. de cura y un tiempode cura

h(t |zi ) =∞∑

k=1

λk I(k ≤ zi )I(τk−1 < t ≤ τk ),

{λk} es un proceso de Markov gamma en tiempo discreto común a todos losindividuouszi es un índice de cura para el individuo i t.q.

zi ∼ Po+(eδ′yi ),

con δ un vector de coeficientes y yi variables explicativas

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 32 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

El proceso de Markov gamma en tiempo discreto {λk} se define como :

λ1 ∼ Ga(α1, β1)

uk |λk ∼ Po(ckλk )

λk+1|uk ∼ Ga(αk+1 + uk , βk+1 + ck )

para k = 1, 2, . . .

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 33 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

Covariables :X1=Tipo de transplante (0-autogénico, 1-alogénico)X2=Tumor Hodgkin (0-ausente, 1-presente)X3=Coeficiente de Karnofsky (100-muy bien, 0-muerte)X4=Tiempo de espera al transplante (en meses)

Las covariables aparecen en el modelo via dos diferentes caminos :1 En una forma multiplicativa afectando el riesgo base, y2 En la media inicial de zi afectando el tiempo de cura

Especificaciones : αk = βk = 2, ck = 50

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 34 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

TABLE : Estimaciones del efecto de las covariables en el riesgo base

Our modelCovariate Mean 95% CITrans. type −0.03 (−0.92, 0.86)Hodgkin 1.17 (0.14, 2.15)Karnofsky −0.07 (−0.08,−0.05)Waiting −0.01 (−0.03, 0.008)

El tener tumor Hodgkin presente es dos veces más riesgoso

Una disminución de 10 unidades del coef. de Karnofsky aumenta el riesgo en 50%

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 35 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

TABLE : Estimaciones del efecto de las covariables en el tiempo de cura

Covariate Post. Mean 95% CITransplant type 0.10 (−0.73, 0.88)Hodgkin’s disease −0.74 (−1.70,−0.001)Karnofsky score 0.03 (0.02, 0.04)Waiting time 0.004 (−0.01, 0.02)

El tener tumor Hodgkin presente disminuye el tiempo de cura a la mitad

Una disminución de 10 unidades del coef. de Karnofsky disminuye el tiempo decura en 35%

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 36 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

TABLE : Estimaciones del tiempo de cura y de la prop. de cura para nuevos pacientes con transplanteautogénico con y sin enfermedad Hodgkin

Patient τz π(x1, x2, x3, x4) 95% quantile Post. Mean(0, 0, 90, 36) 34 months 0.64(0, 1, 90, 36) 24 months 0.50(0, 0, 60, 36) 15 months 0.27(0, 1, 60, 36) 10 months 0.15

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 37 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

Time

Haz

ard

Rat

e

0 200 400 600 800 1000

0.0

0.00

50.

010

0.01

50.

020

FIGURE : Estimaciones de la función de riesgo para pacientes con covariables (0, 0, 90, 36) linea contínua, (0, 1, 90, 36) linea pun-teada, (0, 0, 60, 36) linea punteada-rayada, y (0, 1, 60, 36) linea rayada

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 38 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

Time

Sur

viva

l Fun

ctio

n

0 200 400 600 800 1000

0.0

0.2

0.4

0.6

0.8

1.0

FIGURE : Estimaciones de la función de supervivencia para pacientes con covariables (0, 0, 90, 36) linea contínua, (0, 1, 90, 36) lineapunteada, (0, 0, 60, 36) linea punteada-rayada, y (0, 1, 60, 36) linea rayada

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 39 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Estudio

Estudio : Muestras de pacientes con cáncer de mama son analizadas mediante latécnica de arreglos de Hibridación Genómica Comparativa (aCGH). Se contabilizael número de copias de cadenas del ADN

2 = normal1 = pérdida≥3 = ganancia

Yij = Logaritmo (base 2) del cociente del número de copias de cadenas de ADNcon respecto a 2 en la sonda (base nitrogenada) i e individuo j

Datos : n = 549 sondas, J = 111 muestras clasificadas en dos tipos : ER+ (60muestras) y TN (51 muestras)

Objetivo : Determinar las regiones del cromosoma con mismo número copiado ydeterminar si existen regiones con aberraciones distintas en los dos tipos decáncer ER+ y TN

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 40 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Estudio

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●●

●●●●●●

●●

●●●●●

●●●

●●●●

●●●

●●

●●

●●●

●●

●●

●●●

●●

●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●●●

●●

●●

●●●

0 300

−10

12

Probe

log2r

atio

TN

●●●●●

●●●

●●

●●●

●●

●●●●

●●

●●●

●●●

●●●

●●

●●

●●

●●●●

●●●●●

●●

●●

●●●●●●●

●●

●●●●●●●●

●●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●●

●●●

●●●

●●

●●●

●●●

●●●

●●

●●

●●●

●●●●●●●

●●

●●●●

●●●●

●●●

●●

●●

●●

●●●

●●●●

●●

●●

●●

●●●●●

●●●

●●

●●

●●

●●

●●●

●●●

●●●●●●●

●●

●●●●

●●

●●●

●●

●●●●

●●

●●

●●●●

●●

●●●

●●●

●●●●●

●●

●●●●●●

●●●

●●●

●●

●●

●●●●●●

●●●

●●●

●●●

●●●

●●

●●●

●●

●●

●●●

●●●

●●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●●●●

●●

●●

●●

●●●

●●●

●●

0 300−2

−10

1Probe

log2r

atio

TN

●●

●●

●●

●●●

●●

●●

●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●●

●●

●●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●●

●●

●●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●●

0 300

−1.0

0.0

1.0

2.0

Probe

log2r

atio

ER

●●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●●●

●●

●●●●●

●●

●●

●●

●●●

●●●●

●●

●●●

●●●●●

●●

●●

●●

●●

●●●

●●

●●

●●●●●

●●●

●●

●●

●●●●●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●●●

●●

●●

●●●

●●

●●

●●●

●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

0 300

−0.5

0.0

0.5

1.0

Probe

log2r

atio

ER

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●

●●●

●●●●●●

●●

●●●

●●

●●

●●

●●

●●●

●●

●●●

●●

●●

●●●●

●●●●

●●

●●

●●●

●●●

●●

0 300

−0.5

0.5

1.0

1.5

2.0

Probe

log2r

atio

ER

●●

●●

●●

●●

●●

●●●

●●

●●

●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●●

●●●

●●●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●●●●

●●

●●●

●●●

●●

●●

●●●●

●●●

●●●

●●●●

●●●

●●

●●

●●

●●●

●●

●●

●●●●

●●

●●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●●●●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●●

●●

●●

●●

●●

●●●

●●

●●

0 300

−1.0

−0.5

0.0

0.5

Probe

log2r

atio

ER

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●●

●●

●●●●

●●●●

●●

●●

●●

●●●

●●

●●

●●●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

●●●

●●●

●●

●●

●●

●●

●●

●●●

●●●●

●●●

●●●

●●

●●

●●

●●

●●

0 300

−0.6

−0.2

0.2

0.6

Probe

log2r

atio

ER

●●

●●

●●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●●

●●

●●

●●●●●

●●●

●●

●●

●●

●●●●

●●

●●●●

●●

●●●●

●●

●●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●●●●

●●●●

●●●●●

●●

●●

●●●●

●●

●●

●●

●●●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

●●●●●

●●●

●●

●●●

●●

●●

●●

●●

0 300

−0.5

0.0

0.5

1.0

1.5

Probe

log2r

atio

TN

Chromosome 21 (some samples)

FIGURE : 8 primeras muestras

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 41 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Modelo

Modelo semiparamétrico : (Nieto-Barajas et al., 2016)

Yij =K∑

k=1

µkgj I(i ∈ ∆k ) +

Lj∑l=1

mlj I(i ∈ ∆lj ) + εij

donde ∆k =part. pob. y ∆lj =part. indiv.

εijiid∼ N(0, σ2

ε), σ2ε ∼ Iga(2, 1)

mljiid∼ N(0, τ2

j ), τ2j ∼ Iga(2, 1)

(µk1, µk2)|G0,G1iid∼ (1− π)G0 + πG1,

G0 ∼ DP(a0, F0), G1 ∼ DP(a1, F1), con π = 0.5a0 ∼ Ga(1, 1), a1 ∼ Ga(1, 1)

F0(µk1, µk2) = N(µk1|0, λ20)I(µk1 = µk2),

F1(µk1, µk2) = N2(µk1, µk2|0, Λ1)

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 42 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Resultados

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●●

●●●●●●

●●

●●●●●

●●●

●●●●

●●●

●●

●●

●●●

●●

●●

●●●

●●

●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●●●

●●

●●

●●●

0 300

−10

12

Probe

log2r

atio

TN

●●●●●

●●●

●●

●●●

●●

●●●●

●●

●●●

●●●

●●●

●●

●●

●●

●●●●

●●●●●

●●

●●

●●●●●●●

●●

●●●●●●●●

●●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●●

●●●

●●●

●●

●●●

●●●

●●●

●●

●●

●●●

●●●●●●●

●●

●●●●

●●●●

●●●

●●

●●

●●

●●●

●●●●

●●

●●

●●

●●●●●

●●●

●●

●●

●●

●●

●●●

●●●

●●●●●●●

●●

●●●●

●●

●●●

●●

●●●●

●●

●●

●●●●

●●

●●●

●●●

●●●●●

●●

●●●●●●

●●●

●●●

●●

●●

●●●●●●

●●●

●●●

●●●

●●●

●●

●●●

●●

●●

●●●

●●●

●●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●●●●

●●

●●

●●

●●●

●●●

●●

0 300−2

−10

1Probe

log2r

atio

TN

●●

●●

●●

●●●

●●

●●

●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●●

●●

●●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●●

●●

●●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●●

0 300

−1.0

0.0

1.0

2.0

Probe

log2r

atio

ER

●●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●●●

●●

●●●●●

●●

●●

●●

●●●

●●●●

●●

●●●

●●●●●

●●

●●

●●

●●

●●●

●●

●●

●●●●●

●●●

●●

●●

●●●●●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●●●

●●

●●

●●●

●●

●●

●●●

●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●

0 300

−0.5

0.0

0.5

1.0

Probe

log2r

atio

ER

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●●

●●●

●●●●●●

●●

●●●

●●

●●

●●

●●

●●●

●●

●●●

●●

●●

●●●●

●●●●

●●

●●

●●●

●●●

●●

0 300

−0.5

0.5

1.0

1.5

2.0

Probe

log2r

atio

ER

●●

●●

●●

●●

●●

●●●

●●

●●

●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●●

●●●

●●●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●●●●

●●

●●●

●●●

●●

●●

●●●●

●●●

●●●

●●●●

●●●

●●

●●

●●

●●●

●●

●●

●●●●

●●

●●●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●●●●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●●

●●

●●

●●

●●

●●●

●●

●●

0 300

−1.0

−0.5

0.0

0.5

Probe

log2r

atio

ER

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●●

●●

●●●●

●●●●

●●

●●

●●

●●●

●●

●●

●●●●

●●

●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

●●●

●●●

●●

●●

●●

●●

●●

●●●

●●●●

●●●

●●●

●●

●●

●●

●●

●●

0 300

−0.6

−0.2

0.2

0.6

Probe

log2r

atio

ER

●●

●●

●●●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●●

●●

●●

●●●●●

●●●

●●

●●

●●

●●●●

●●

●●●●

●●

●●●●

●●

●●●

●●

●●●

●●●

●●

●●

●●

●●

●●

●●

●●●●●

●●●●

●●●●●

●●

●●

●●●●

●●

●●

●●

●●●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●

●●

●●

●●

●●●

●●●

●●●

●●

●●

●●

●●●

●●

●●

●●

●●

●●●

●●●●●

●●●

●●

●●●

●●

●●

●●

●●

0 300

−0.5

0.0

0.5

1.0

1.5

Probe

log2r

atio

TN

Chromosome 21 (some samples)

FIGURE : Inferencia para las 8 primeras muestras

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 43 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Estudio

0 100 200 300 400 500

Probe

TN

T

N

ER

ER

ER

E

R

ER

TN

Chromosome 21 (some samples)

FIGURE : Inferencia para las 8 primeras muestras

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 44 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Estudio

0 100 200 300 400 500

Probe

pr

TN

ER

Chromosome 21

FIGURE : Resumen inferencial para las medias poblacionales

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 45 / 46

Contenido Introducción Inferencia Apl.1 Apl.2 Apl.3 Apl.4

Referencias

Nieto-Barajas, L.E. and Walker, S.G. (2002). Markov beta and gamma processesfor modeling hazard rates. Scandinavian Journal of Statistics 29, 413–424.

Nieto-Barajas, L.E. and Walker, S.G. (2004). Bayesian nonparametric survivalanalysis via Lévy driven Markov processes. Statistica Sinica 14, 1127–1146.

Nieto-Barajas, L.E. and Walker, S.G. (2005). A semiparametric Bayesian analysisof survival data based on Lévy-driven processes. Lifetime data analysis 11,529–543.

Nieto-Barajas, L.E. and Yin, G. (2008). Bayesian semiparametric cure rate modelwith an unknown threshold. Scandinavian Journal of Statistics 35, 540–556.

Nieto-Barajas, L. E., Ji, Y. and Baladandayuthapani, V. (2016). A semiparametricBayesian model for comparing DNA copy numbers. Brazilian Journal of Probabilityand Statistics 30, 345–365.

Luis E. Nieto Barajas Bioestadística UV – 20 de octubre de 2017 46 / 46

top related