![Page 1: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/1.jpg)
Análisis estadístico demicroarrays de ADN
Víctor MorenoBioestadística. Facultat Medicina. UABEpidemiologia i Registre del Càncer. ICO
![Page 2: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/2.jpg)
Advertencia
Varios materiales de esta presentación(imágenes, esquemas, textos) están
copiados y a veces modificados de otrosobtenidos en Internet sin permiso de sus
autores.Me es imposible dar crédito adecuado a losautores originales, a quienes agradezco quepongan sus materiales a disposición pública
![Page 3: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/3.jpg)
Contenido
• Qué es un microarray y para qué sirve.• Análisis estadístico:
– Análisis de imágenes– Control de calidad– Diseño de experimentos– Análisis de expresión diferencial– Reducción de la dimensionalidad– Búsqueda de patrones
![Page 4: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/4.jpg)
Fundamentos
El material genético
![Page 5: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/5.jpg)
DNA
mRNA
mRNA
proteina
genoma
expresión
![Page 6: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/6.jpg)
transcriptase
DNA to RNA
reversetranscriptase
RNA to DNA
DNApolimerase
DNA to cDNA
DNA → RNA → DNA → cDNA
T A T A
A U A T
C G C G
G C G C
![Page 7: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/7.jpg)
T C G A CT C G A C
A G C T GA G C T G
Hibridación
![Page 8: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/8.jpg)
Usos de los microarrays• Análisis masivo del nivel de expresión de
miles de genes:– Clasificación de tumores (lympho-chip).– Respuesta a fármacos.– Asignación de función a genes (ESTs).– Inferencia de redes de regulación génica.
• Otros tipos de microarrays:– genotipado (SNPs, mutaciones, …)– número de copias del ADN (CGH)– …
![Page 9: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/9.jpg)
Tipos de microarrays deexpresión
• Filtros SAGE: serial analysis of gene expression
• De oligonucleótidos, cortos y largos• De 2 colores
– Permiten medir la abundancia relativa de tránscritos deRNA
– Basados en la hibridación competitiva de 2 sondasmarcadas con diferente color con un cDNA diana
• De 4 colores: APEX SNP detection
![Page 10: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/10.jpg)
MétodoEl microarray de ADN
![Page 11: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/11.jpg)
Clones de cDNA(dianas)
Amplificación del producto por PCRPurificación
Impresión
microarray
0.1nl/spot
![Page 12: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/12.jpg)
Micrografia de un spot hibridado en un array deS. cerevisiae
![Page 13: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/13.jpg)
mRNA
DNA(Sonda:Probe)
cDNA microarray(Dianas: Targets)
![Page 14: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/14.jpg)
excitacion
laser 1laser 2
emision
scanning
analisis
sobreimponer imágenes y normalizar
Lectura
![Page 15: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/15.jpg)
A B E F G
E
D
A B E F GC D
A B
GEH
FC
ID
Labelled Target:1 gene/spot
cDNA sample 1
cDNA sample 2
Gene ArrayGene Array
![Page 16: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/16.jpg)
A B E F G
E
D
A B E F GC D
A B
GEH
FC
ID
Labelled Target:1 gene/spot
cDNA sample 1
cDNA sample 2
Gene ArrayGene Array
![Page 17: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/17.jpg)
Aspectos estadísticos
• Análisis de imagen• Control de calidad• Diseño de experimentos• Análisis de expresión diferencial• Reducción de la dimensionalidad• Búsqueda de patrones
![Page 18: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/18.jpg)
Datos crudosArrays HU4.6 de Yale• 4.592 dianas repartidas en 4x4
matrices de 24x24 puntos• 2 réplicas de cada diana• 2 hibridaciones posibles por
chip
• 2 imágenes TIFF de 16 bits, 1por color ~ 30Mb
![Page 19: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/19.jpg)
Análisis de la imagen
• Localización de los puntos.• Segmentación: decidir qué
pixels son señal y qué sonbackground.
• Cuantificación: intensidadde la señal de cada canal, elbackground y medidas decalidad.
![Page 20: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/20.jpg)
SegmentaciónSeeded Region Growing Fixed Circle
Spotspequeños
Spots nocirculares
![Page 21: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/21.jpg)
Cuantificación• Intensidad de los spots:
– Media.– Mediana.
• Valores de background:– Local.– Constante (global)– Morphological opening: estimación suavizada
localmente en 2D del background global
![Page 22: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/22.jpg)
Aspectos estadísticos
• Análisis de imagen• Control de calidad• Diseño de experimentos• Análisis de expresión diferencial• Reducción de la dimensionalidad• Búsqueda de patrones
![Page 23: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/23.jpg)
Medidas de calidad• Circularidad• Área, perímetro• Razón señal / background• Variación en las intensidades de los pixels• Identificación des spots defectuosos• Correlación entre intensidades de los spots• Porcentaje de spots sin señal• Distribución del área de los spots
Spots
Array
![Page 24: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/24.jpg)
Dificultades de la técnica
![Page 25: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/25.jpg)
Dificultades de la técnica
![Page 26: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/26.jpg)
Dificultades de la técnica
![Page 27: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/27.jpg)
![Page 28: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/28.jpg)
log10(Intensity)
Den
sity
2 3 4 5 6
0.0
0.5
1.0
1.5
2.0
2.5
log10(Intensity)
Den
sity
2 3 4 5 6
02
46
8
![Page 29: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/29.jpg)
Filtrado• Variables:
– Circularidad– Perímetro– Area
área > 30
![Page 30: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/30.jpg)
Área
Réplicas
![Page 31: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/31.jpg)
Normalización
• Objetivo: identificar y eliminar fuentes devariación sistemática que no seandiferencias de expresión:– Diferente eficiencia en el marcaje con color– Diferente cantidad de RNA en cy3 y cy5– Diferentes parámetros de escáner– Efectos espaciales del chip (aguja, zona …)
![Page 32: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/32.jpg)
Normalización
• Es necesaria para asegurar que lasdiferencias en intensidades se deben adiferencias de expresión real, no a artefactosde impresión, hibridización o escaneo …
• El ajuste es un paso previo a cualquier otroanálisis estadístico
• Se evidencia cuando se compara la mismamuestra marcada con 2 colores
![Page 33: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/33.jpg)
Visualización gráfica deintensidades
• Usual– R vs G– log2(R) vs log2(G)
• Preferible– Gráfica MA :
• M = log2(R) - log2(G) = log2(R/G)• A = (log2(R) + log2(G))/2 = (R·G)0.5
![Page 34: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/34.jpg)
Lowess/loess: regresión robustaponderada localmente: suavizado
![Page 35: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/35.jpg)
Normalización• Centrado
log2R/G← log2R/G - L
– Constante: L = media o mediana de log2(R/G)– Adaptativa: L = función de intensidad, sector …
• Regresión ponderada localmente (lowess o loess)
• Escaladolog2R/G←(log2R/G - L)/S
• Métodos 2D
![Page 36: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/36.jpg)
![Page 37: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/37.jpg)
Lowess to rank invariant gene selection
![Page 38: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/38.jpg)
Aspectos estadísticos
• Análisis de imagen• Control de calidad• Diseño de experimentos• Análisis de expresión diferencial• Reducción de la dimensionalidad• Búsqueda de patrones
![Page 39: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/39.jpg)
RNA extraction
translation to DNA
DNA labeling
hybridization
scanning
image analysis
statistical analysis
Microarray protocol
Mayorsources ofvariability
![Page 40: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/40.jpg)
Teoría ≠ realidad
![Page 41: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/41.jpg)
tissue
SA
Cy5
Cy3
Cy5
Cy3
RNA
SB
• Sample and array crossed• Array aliased with dye:sample interaction
sample dye array
Dye effect
![Page 42: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/42.jpg)
σ
σ
σ
σ
σ
σ
σ
σ
≡
≡2:
2
2
2
2
2
:
2:
2
: : :
:
:
: :
:: :
:
: :
( )
:g a
g
d
s
a
e
g s
g d
ge
gene
dyesamplearray dye sample interaction
interaction
interaction
intgene array gene dye
ne sam
gene dye
eraction
res
p
sample
idual replica
l
tes
e
: : :g d s a g d g s g ay eµ α β γ κ τ φ λ= + + + + + + + +
![Page 43: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/43.jpg)
![Page 44: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/44.jpg)
Normalised in 20quintiles. Removesdye*sample effect
![Page 45: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/45.jpg)
Variance Component estimate % % over geneinteractions
gene 2,686 86,1dye 0,000 0,0sample 0,000 0,0array = dye:sample 0,000 0,0
gene:dye 0,000 0,0 0,0gene:sample 0,252 8,1 58,1gene:array (dye:sample) 0,162 5,2 37,3
residual 0,020 0,6 4,6
100 13,9
![Page 46: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/46.jpg)
Loop
Reference
G R
R GR G
V1
V2V3
A1
A2
A3
R
G GGV2 V3V1
V0
![Page 47: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/47.jpg)
Comparison to a common controlCT1
B1
CT2
B2
CT3
B3
Var(TA-TB) =4σ2
Error df = 0
Balanced incomplete blocksT1
T2
B1
T2
T3
B2
T3
T1
B3
Var(TA-TB) =4/3σ2
Error df = 1
![Page 48: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/48.jpg)
Aspectos estadísticos
• Análisis de imagen• Control de calidad• Diseño de experimentos• Análisis de expresión diferencial• Reducción de la dimensionalidad• Búsqueda de patrones
![Page 49: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/49.jpg)
Expresión diferencial
• Identificar los genes que cambian suexpresión en función de variables de interés– Resultado clínico: supervivencia, respuesta al
tratamiento, tipo de tumor, tratamientos, grupo,dosis, ...
• Estimación: cuantificar el efecto• Test: evaluar la significación estadística
![Page 50: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/50.jpg)
Estimación
• CrudaR/G o log2R/G
• Suavizada: métodos bayesianos empíricos– Se intenta reducir la variabilidad de los valores
mediante la incorporación de informaciónexterna: distribución de probabilidad “a priori”
– Al tratarse de razones, las intensidadespequeñas suelen tener mayor variabilidad quelas grandes
![Page 51: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/51.jpg)
2 4 6 8 10 12 14
-4-2
02
A
Nor
mal
ized
M
![Page 52: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/52.jpg)
Método de Newton
• Supone que las intensidades de cada sondasiguen una distribución Gamma conparámetros (aR , θR) y (aG , θG)
• Modelo jerárquico Gamma-Gamma:– Los parámetros de escala ( θR y θG) provienen de
otra distribución Gamma con parámetros (a0 ,ν)
![Page 53: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/53.jpg)
Measurement error Actual Expression
![Page 54: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/54.jpg)
Expresión diferencial
• Con este modelo Gamma-Gamma, se puedederivar la distribución “a positeriori” de laexpresión diferencial ρ=R/G:
• Y el estimador bayesiano empírico es:
![Page 55: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/55.jpg)
Suavizado
• Los estimadores bayesianos (R+ν)/G+ν)atenúan los estimadores crudos R/G.
• La atenuación es mayor en los valoresmenores
• El orden de las intensidades puede variar
![Page 56: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/56.jpg)
![Page 57: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/57.jpg)
Los cambios ¿Son significativos?
• Métodos sin réplicas (con 1 único array)– |log2 R/G |> k
• Normalmente k = 2 • Justificación: “Porque todo el mundo lo hace así”
– Si se tiene información sobre la variabilidadesperada por azar, se pueden calcular un valorde k que asegure un tasas de falsos positivosdada (Sabatti, UCLA tr304, Math Biosci)
![Page 58: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/58.jpg)
Método de Sabatti
• Sin réplicas• Si se supone que yi ~N(θi,σ) y que hay
“pocos” θi ≠ 0, entonces• los límites k = σ[2log(n)]1/2 son adecuados
para detectar los valores de interés• σ se puede obtener de un experimento en el
que se comparen 2 muestras idénticas(normal-normal)
![Page 59: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/59.jpg)
Sabatti (II)
• Si se desea una tasa de falsos positivos dada(α), se puede mejorar el cálculo de k demanera adaptativa para considerar quenormalmente el número de valores θi ≠ 0 esdesconocido
• Basado en el método de Benhamini &Hochberg (JRSS-B 1995)
• Depende de σ, α y n
![Page 60: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/60.jpg)
Método de Sabatti
2log( )nσ
![Page 61: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/61.jpg)
Método de Newton (2)• El modelo bayesiano empírico Gamma-
Gamma se puede mejorar con una mixturapara modelar la suposición de que unaproporción de los genes no modifican suexpresión:Modelo Gamma-Gamma-Bernoulli
• Se puede estimar con el algoritmo EM• Perimite calcular para cada gen la odds de
haber cambiado de expresión
![Page 62: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/62.jpg)
2 4 6 8 10 12 14
-4-2
02
A
M
![Page 63: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/63.jpg)
Test de hipótesis• Para cada gen podemos hacer un test sobre
la H0 de que no hay expresión diferencial: t-test / ANOVA
• Posibles errores– Tipo I o falso positivo– Tipo II o falso negativo
• Problema de multiplicidad– miles de hipótesis se prueban simultáneamente– Gran aumento de la probabilidad de error tipo I
![Page 64: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/64.jpg)
Tests de hipótesis múltiples
• Definir una tasa de error de tipo I adecuada• Emplear un procedimiento que
– Asegure un control estricto del error de tipo I– Sea potente (pocos falsos negativos)– Tenga en cuenta la distribución conjunta de los
múltiples tests de hipótesis• Reportar un p-valor ajustado para cada gen
que refleje la tasa global de error de tipo I
![Page 65: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/65.jpg)
Métodos basados en réplicas
Modelos jerárquicos Tseng (2001)• Serie de experimentos en las mismas
condiciones• Réplicas de hibridaciones y de spots• Asume log-normalidad de las intensidades• Estima los hiperparámetros (Bayesiano
empírico)• Calcula la distribución a posteriori con
métodos MCMC
![Page 66: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/66.jpg)
![Page 67: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/67.jpg)
Modelos jerárquicos
• Interesante:– Captura la dependencia entre genes
• Problemas:– Basado en log-normalidad - cuestionable
– Ignora las comparaciones múltiples
![Page 68: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/68.jpg)
Métodos no paramétricos
• Dudoit 2002, Tusher 2001• Diseño:
– nC hibridaciones control-control– nD hibridaciones control-test
• Test:
• Permutaciones para evaluar la significación
![Page 69: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/69.jpg)
Permutaciones
• Se intercambian las etiquetas entre control ytest al azar
• Se calcula el test (Ti) para cada gen con elnuevo orden
• Se calcula el p-valor para cada gen según lafórmula
![Page 70: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/70.jpg)
![Page 71: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/71.jpg)
![Page 72: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/72.jpg)
![Page 73: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/73.jpg)
Web resources
• Bioconductor: www.bioconductor.org• Microarrays: www.microarrays.org• Berkeley: www.stat.berkeley.edu• Stanford: genome-www.stanford.edu
![Page 74: Análisis estadístico de microarrays de ADN › estadistica › sites › sct.uab.cat... · Análisis estadístico de microarrays de ADN Víctor Moreno Bioestadística. Facultat](https://reader031.vdocumento.com/reader031/viewer/2022011904/5f22873809954b3f803e9dda/html5/thumbnails/74.jpg)
Acknowledgments
• Miguel A. Peinado• Gabriel Capellá• Mónica Grau• Elisenda Vendrell• Gemma Tarafa• Antonia Obrador• Xavier Solé
• Institut Catalàd’Oncologia (ICO)
• Institut de RecercaOncològica (IRO)