© 2006 plataforma bioinformàtica de la uab introducción a los microarrays nuevas aproximaciones...

71
© 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes C ursd’introducció a la bioinform àtica C ursd’introducció a la bioinform àtica Plataform a Bioinform àtica de la UAB

Upload: consuelo-duarte-morales

Post on 23-Jan-2016

222 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Introducción a los microarrays

Introducción a los microarrays

Nuevas aproximaciones al estudio de la actividad de los genes

Cursd’introducció a la bioinformàticaCursd’introducció a la bioinformàticaPlataforma Bioinformàtica de la UAB

Page 2: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Esquema de la sesiónEsquema de la sesión

• Presentación• Introducción• Microarrays de expresión• Experimentos con microarrays• Análisis de los datos• Ejercicios prácticos

Page 3: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

PresentaciónPresentación

Page 4: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Y quien es él…Y quien es él…

• Alex Sánchez – Profesor titular del departamento de

Estadística, de la facultad de Biología de la Universidad de Barcelona

– “Group Leader” del grupo de investigación “Métodos Estadísticos en Bioinformática”

– Profesor de Bioinformática, aquí allá y acullá…• UB, UOC, UVic

Page 5: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

The Statistics and Bioinformatics Research GroupThe Statistics and Bioinformatics Research Group

A research group arising from the Statistics Department at the Biology School in the University of Barcelona.

Page 6: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

http://estbioinfo.stat.ub.es

Nuestra webNuestra web

Page 7: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

ObjetivosObjetivos

• Conocer la tecnología de experimentación con microarrays

• Comprender sus posibilidades y limitaciones

• Familiarizarse con el proceso de experimentacion basado en los microarrays

• Saber donde acudir para aprender más

Introducción-Objetivos

Page 8: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

ContenidosContenidos

• Introducción– Antecedentes históricos: El cambio de paradigma– Que es un microarray– Que tipos de microarrays existen– Aplicaciones de los microarrays

• Experimentos con microarrays– Cómo funciona un microarray de expresión– El ciclo de vida de un experimento con microarrays

• De los números a la interpretación biologica– Preprocesado– Análisis de los datos

• Ejercicios prácticos

Introducción-Contenidos

Page 9: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

IntroducciónIntroducción

Page 10: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Antecedentes históricosAntecedentes históricos

• La biología molecular dispone de múltiples técnicas para medir los niveles de ARN, ADN, proteínas o metabolitos– Northern Blot, differential display, SAGE– Southern Blott: [similar a los microarrays]

• Basado en el principio de hibridación selectiva del ADN

– …

• Lo que caracteriza la era post genómica no es lo que se puede medir sino la cantidad de mediciones simultaneas que se pueden realizar

Antecedentes Históricos

Page 11: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Una analogíaUna analogía

• En la era pre-genómica la biología “espiaba” los genes – Individualmente, de uno en uno– Cada gen se podía estudiar a fondo

Antecedentes Históricos

Page 12: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Una analogía (y 2)Una analogía (y 2)

• En la era prost-genómica se pueden estudiar muchos genes a la vez

• Pero, como separamos el grano de la paja?

W W W

Lo he oído todo

Antecedentes Históricos

Page 13: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

El cambio de paradigma (J. Dopazo)El cambio de paradigma (J. Dopazo)

Con los mismos recursos

Obtenemos una imagen de

menor resolución pero con una

perspectiva más general

Con los mismos recursos

Obtenemos una imagen de

menor resolución pero con una

perspectiva más general

Antecedentes Históricos

Page 14: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Pero, ¿Qué es un microarray?Pero, ¿Qué es un microarray?

• Un formato experimental,

• basado en la síntesis o fijación de sondas, que representan los genes (o proteinas, o metabolitos),

• sobre un sustrato sólido (cristal, plástico, silice,...),

• y expuestos a las molé-culas diana (la muestra).

Ques es un microarray

Page 15: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Cómo funciona un microarrayCómo funciona un microarray

• El nivel de hibridación entre– la sonda específica (probe) y– la molécula diana (target)

• se indica generalmente– mediante fluorescencia y

se– mide por análisis de imagen

• e indica el nivel de expresión del gen correspondiente a la sonda en la muestra problema

Cómo funciona un microarray

Page 16: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Que tipos de microarrays existenQue tipos de microarrays existen

• De Proteínas• De Tejidos• De DNA

– Arrays de CGH– SNPs

• De Expresión– De cDNA– De oligonucleótidos:

• GeneChip® Affymetrix

• Otras marcas

Tipos de microarrays

Page 17: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

** ***

GeneChip Affymetrix

cDNA microarray

Nylon membrane

Agilent: Long oligo Ink Jet

Illumina Bead Array

Microarrays de expresión

Tipos de microarrays de expresiónTipos de microarrays de expresión

Page 18: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Aplicaciones de los microarraysAplicaciones de los microarrays• Los microarrays se

han aplicado al estudio de casi cualquier tipo de problema biológico

• El numero de publicaciones anuales con la palabra microarray en el título es muy alto y continua creciendo (?)

1555

169

434

789

1061

13051372

0

200

400

600

800

1000

1200

1400

1600

1998

1999

2000

2001

2002

2003

2004

2005

Page 19: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Aplicaciones de los microarrays (2)Aplicaciones de los microarrays (2)• Estudio de genes que se expresan diferencialmente

entre varias condiciones– Sanos/enfermos, mutantes/salvajes, tratados/no tratados

• Clasificación molecular en enfermedades complejas• Identificación de genes característicos de una

patología (firma o “signature”)• Predicción de respuesta a un tratamiento• Detección de mutaciones y polimorfismos de un

único gen (SNP)• Etc, etc, etc…

Page 20: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Construcción y uso de los microarrays de expresiónConstrucción y uso de los microarrays de expresión

Page 21: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Microarrays de expresiónMicroarrays de expresión

• Existen muchos tipos de microarrays• Los principios en que se basan son

similares• Los detalles de su funcionamiento varían

de uno a otro caso• En este primer contacto nos centraremos

en los arrays de expresión– Arrays de 2 colores (spotted)– Arrays de oligonucleótidos sintetizados in situ

Page 22: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Microarrays de 2 colores (spotted)Microarrays de 2 colores (spotted)

1. Diseño y producción del chip2. Preparación de la muestra3. Hibridación4. Escaneado del chip 5. Análisis de la imagen

Page 23: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

1. Construcción del chip1. Construcción del chip

• Las sondas a imprimir se seleccionan de una base de datos (GenBank, dbEST,,,)

• Tras generar los cDNAs se imprimen en el array

Page 24: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

2. Preparación de la muestra2. Preparación de la muestra

• Tras extraer el RNA de las muestras se marca con un colorante fluorescente distinto (Cy-3 / Cy-5) cada miembro del par a hibridar.

• Las muestras marcadas se mezclan y preparan para hibridar sobre el array.

Page 25: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

3. Hibridación: sondas + muestras3. Hibridación: sondas + muestras

Targets labeled andmixed

Page 26: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

4. Escaneado y captura de la imagen4. Escaneado y captura de la imagen

Page 27: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

5. Análisis de la imagen y cuantización5. Análisis de la imagen y cuantización

, or g g g

CORRg g g

R R bgRM M

G G bgG

Page 28: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Visión general del procesoVisión general del proceso

Pulse este enlace para visualizar una animación del proceso

Page 29: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Microarrays de oligos sintetizados in situMicroarrays de oligos sintetizados in situ

• Diseño más avanzado que los de 2 colores • Utilizan tecnologías desarrolladas en el

entorno de la microelectrónica• Algunos rasgos distintivos

– No se basan en hibridación competitiva: cada chip contiene muestras de un solo tipo (”1 color”)

– Las sondas se sintetizan directamente sobre el chip en vez de sintetizarlas in vitro y adherirlas después

– Cada gen esta representado por un grupo de sondas cortas en vez de por una solo

Page 30: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Los GeneChips de AffymetrixLos GeneChips de Affymetrix

• Affymetrix (www.affymetrix.com) es la compañía lider en este tipo de chips

• Se denominan genericamente GeneChips• Cada gen esta representado por un conjunto

de secuencias cortas que lo caracterizan• Algunos chips contienen genomas completos

con más de 50.000 grupos de sondas!

NOTA: Grupos de sondas = Probesets

Page 31: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Probesets, probes, PM & MMProbesets, probes, PM & MM

• Un grupo de sondas se utiliza para medir niveles de mRNA de un único gen

• Cada grupo (probeset) consta de múltiples pares de celdas (probe cells)– Con millones de copias de un oligo de 25bp– Organizadas en parejas (probe pairs) con un

Perfect Match (PM) y un Mismatch (MM)• PM: coincide exactamente con una parte del gen• MM: idéntico al PM excepto en el nucleótido central

reemplazado por su complementario

Page 32: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Ejemplo de grupo de sondas para medir el nivel de expresión de un gen particular

probepair

probecell

gene sequence...TGCAATGGGTCAGAAGGACTCCTATGTGCCT...AATGGGTCAGAAGGACTCCTATGTGAATGGGTCAGAACGACTCCTATGTG

perfect match sequencemismatch sequence

probe set

Page 33: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Distintos “Pares de Sondas” representan partes distintas del mismo gen (1 gen=1 grupo de sondas)

Secuencia del gen

Las sondas se seleccionan para ser específicas del gen que representan y para tener buenas propiedades de hibridación

Page 34: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Síntesis de oligonucleótidos por fotolitografía1

Síntesis de oligonucleótidos por fotolitografía1

GeneChip

maskmaskmaskmaskmaskmaskmask

mask

A ACC

GG

TT

TA

TT A

A C C

1Animación tomada del curso de Dan Nettleton

Page 35: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Resultado de la sintesis de oligos en el chipResultado de la sintesis de oligos en el chip

Image courtesy of Affymetrix.

Cada celda contiene múltiples copias de la misma secuencia

Page 36: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Proceso de hibridaciónProceso de hibridación

Tras la síntesis de los “oligos” se realiza la hibridación, depositando el mRNA marcado del tejido a estudiar sobre cada chip

Image courtesy of Affymetrix.

Page 37: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Obtención del mRNA marcadoObtención del mRNA marcado

Page 38: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Source: www.affymetrix.com

Estimulación de la muestra hibridada

Iluminando la muestra hibridada con luz laser las secuencias marcada emiten fluorescencia

Page 39: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Source: www.affymetrix.com

Imagen de un chip de Affymetrix hibridadoImagen de un chip de Affymetrix hibridado

Page 40: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Visión general del proceso (Affy)Visión general del proceso (Affy)

@Affymetrix

Page 41: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

VENTAJAS

• Económicos• Flexibilidad en el diseño

experimental• Elevada intensidad de señal

(secs largas)

DESVENTAJAS

• Baja Reproducibilidad• Hibridación cruzada (baja

especificidad)• Elevada manipulación manual

(Posibilidad de contaminación)

VENTAJAS

• Fabricación Rápida y más robotizada• Elevada Reproducibilidad• Elevada especificidad (secuencias cortas)• Utiliza muchas sondas/gen

DESVENTAJAS

• Requiere equipamiento más especializado• Caros• Poca flexibilidad

Microarrays de cDNA Microarrays de Oligonucleótidos

Comparación entre los 2 tipos de chipsComparación entre los 2 tipos de chips

Page 42: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Experimentos con microarraysExperimentos con microarrays

Page 43: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Experimentos con microarraysExperimentos con microarrays

• Fuentes de variabilidad y su control• Ciclo de vida de un experimento con

microarrays• El diseño del experimento

– Tipos de cuestiones que se desea responder– Factores que debemos tener en cuenta

• Preprocesado: de los datos crudos al análisis– Control de calidad– Normalización

Page 44: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Experimentos con microarraysExperimentos con microarrays

• Tal y como su nombre indica un experimento con microarrays es un experimento, es decir:– Se lleva a acabo para determinar si ciertas

hipótesis previas son ciertas o falsas (aun cuando también puede llevar a generar nuevas hipótesis

• Como todo experimento está sujeto a errores que pueden provenir de múltiples fuentes y ser de tipos distintos– Aleatorios– Sistemáticos

Page 45: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Fuentes de variabilidadFuentes de variabilidad

• Biological Heterogeneity in Population.• Specimen Collection/ Handling Effects.

– Tumor: surgical bx, FNA.– Cell Line: culture condition, confluence

level.• Biological Heterogeneity in Specimen.• RNA extraction.• RNA amplification.

• Fluor labeling.

• Hybridization.

• Scanning.• – PMT voltage.• – laser power.

(Geschwind, Nature Reviews Neuroscience, 2001)

Page 46: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Tipos de variabilidadTipos de variabilidad

• La variabilidad sistemática es aquella que afecta de manera similar a todas las mediciones– Cantidad de material disponible– Instrumental de laboratorio

• La variabilidad aleatoria puede afectar de forma distinta a cada componente del experimento– Calidad del material – Eficiencia de los procedimientos de laboratorio

Page 47: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Cómo se afronta la variabilidadCómo se afronta la variabilidad

• Cada tipo se trata de forma distinta– Variabilidad Sistemática

• Podemos estimar las correciones necesarias a partir de los datos: NORMALIZACION o CALIBRACIÓN

– Variabilidad Aleatoria• Suponemos ciertos modelos de error (e.g. ei~N(0, 2)) y

recurrimos al– DISEÑO EXPERIMENTAL Para controlarla – INFERENCIA ESTADÍSTICA para extraer

conclusiones en su presencia

• Todos estos procedimientos se integran en un flujo de trabajo (“pipeline”) o ciclo de vida de un experimento con microarrays

Page 48: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

El ciclo de vida de un experimentoEl ciclo de vida de un experimento

Page 49: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

De la cuestion biologica al experimentoDe la cuestion biologica al experimento

• Una vez planteada una cuestión los implicados en el estudio deberían planearlo conjuntamente

Researchers / Core Facility/ Statisticians• Es preciso especificar

– Cual es el propósito del estudio– Que objetivos persigue– Que limitaciones y de que tipo presenta

• A partir de aquí podrá elaborarse el diseño experimental adecuado

Page 50: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Diseño experimentalDiseño experimental

• Deben tomarse decisiones relativas a aspectos diversos implicados en el experimento– Tipos de muestras

• Mezcladas (“pooled”) o individuales• Con réplicas independientes o sin ellas

– Limitaciones físicas (coste) • Número de arrays necesarios/posibles• Cantidad de material necesaria/disponible

• De aquí saldrá– La forma en que se realizará el experimento– Los métodos estadísticos que debemos aplicar

Page 51: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

1. Experimento comparativo1. Experimento comparativo

- + - + - + - +

Wild KO

… …

Page 52: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Con

trol

x5

x5

x5

x5

x5

Pro

blem x5

x5

x5

t1 t2 t3 t4

2. Estudio de evolución temporal2. Estudio de evolución temporal

Page 53: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Y por fin … el experimentoY por fin … el experimento

• Una vez realizado los pasos previos puede llevarse a cabo el experimento

• Si la ejecución es la adecuada y no surgen problemas el experimento concluye con los datos provenientes del análisis de imagen

Page 54: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Ya tengo mis datos, ¿y ahora que?Ya tengo mis datos, ¿y ahora que?

Page 55: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Análisis de bajo y alto nivelAnálisis de bajo y alto nivel

• Análisis de bajo nivel– Verificar la calidad de los datos– Ajustar los datos para poder analizarlos

• Análisis de alto nivel– Realizar las pruebas estadísticas planeadas– Buscar patrones y regularidades en los datos– Anotar los resultados en bases de datos para

contribuir a su interpretación

Page 56: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

El preprocesado de los datosEl preprocesado de los datos

Page 57: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Preprocesado (1) El control de calidadPreprocesado (1) El control de calidad

Page 58: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Preprocesado (2) NormalizaciónPreprocesado (2) Normalización

Page 59: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

El análisi de los datosEl análisi de los datos

Page 60: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Análisis de alto nivel (1)Análisis de alto nivel (1)

• Los investigadores suelen estar interesados en distintos tipos de cuestiones:.– Encontrar genes diferencialmente expresados

entre dos o más condiciones o a lo largo del tiempo.– Identificar nuevos subtipos en una población– Descubrir patrones de expresión característicos.– Predecir la respuesta al tratamiento or

clasificar un nuevo individuo utilizando información molecular.

– Identificar genes co-regulados o expresándose en la misma ruta metabólica.

Page 61: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Análisis de alto nivel (2)Análisis de alto nivel (2)

• Para cada problema existen múltiples métodos– Modelos lineales, pruebas-t con shrinkage

para estudios de expresión diferencial– Distintos tipos de análisis de conglomerados

(“clustering”) para descubrir patrones de corregulación

– Métodos de clasificación tradicionales (LDA, kNN) y modernos (SVM, PAM) para construir predictores

– Métodos de análisis basados en la GO (GSEA) para buscar significación biológica

– Y muchos más …

Page 62: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Tests para expresión diferencialTests para expresión diferencial

• Para comparar dos o más grupos: extensiones del test t – El tamaño muestral suele ser

↓– Se compensa estimando la

varianza de cada gen a partir de la de todos los genes

– SAM, Empirical Bayes, …

• Para cada gen se hace un test Problema de multiplicidad– Es preciso hacer ajustes para

mútiple testing– O estimar la tasa de falsos

positivos (FDR)

Page 63: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Análisis de conglomeradosAnálisis de conglomerados

• Los genes no varían de forma independiente

• El análisis de conglomerados permite descubrir grupos de genes que varían de forma similar

• Puede utilizarse también para agrupar muestras: (fenotipos similares) descubrimiento de subclases

Page 64: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Construcción de predictoresConstrucción de predictores

• Permiten predecir la clase a la que pertenece un individuo a partir de una muestra conocida y con los individuos clasificados

• Uso complejo con múltiples fuentes de error

• Requieren grandes tamaños muestrales y crosvalidaciones para evitar sobreajustes y/o sesgo en las predicciones

Page 65: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Análisis basados en la GOAnálisis basados en la GO

• Los resultados de los estudios de microarrays suelen ser largas listas de genes

• Para contribuir a su interpretación podemos– Proyectarse en bases de

datos de anotaciones como la GO o KEGGS

– Estudiar si hay clases funcionales enriquecidas entre los genes seleccionados

– Agrupar los genes por su similitud funcional

Page 66: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

ResultadosResultados

Page 67: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Conclusiones y perspectivasConclusiones y perspectivas

• Los experimentos con microarrays han revolucionado el estudio de la genómica funcional– Mejorando el conocimiento de la función de los genes a

partir de la similitud de patrones de expresión– Mejorando el conocimiento de las familias de genes:

• Permiten incluir nuevos genes en las familias• Descubren patrones de expresión coordinados• Aumenta el número de familias conocidas de genes

• Como toda tecnologías los tiene sus limitaciones– Algunas como la baja reproducibilidad o la calidad del

genoma se solucionaran con el tiempo– Otras como el uso adecuado de sus posibilidades

dependen del buen (o mal) uso que se haga de ellas

Page 68: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

The Promise of Microarray Technology in Treating Disease (NCBI) (1)The Promise of Microarray Technology in Treating Disease (NCBI) (1)

Now that you understand the concept behind array technology, picture this:

• A hand-held instrument that a physician could use to quickly diagnose cancer or other diseases during a routine office visit.

• What if that same instrument could also facilitate a personalized treatment regimen-exactly right for you?

Page 69: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

The Promise of Microarray Technology in Treating Disease (NCBI) (2)The Promise of Microarray Technology in Treating Disease (NCBI) (2)

Personalized drugs, Molecular diagnostics andIntegration of diagnosis and therapeutics

•These are the long-term promises of microarray technology

•Maybe not today or even tomorrow, but someday•For the first time, arrays offer hope for obtaining global views of biological processesby providing a systematic way to survey DNA and RNA variation

Page 70: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

Ejercicios prácticosEjercicios prácticos

Page 71: © 2006 Plataforma Bioinformàtica de la UAB Introducción a los microarrays Nuevas aproximaciones al estudio de la actividad de los genes

© 2006 Plataforma Bioinformàtica de la UAB

PrácticasPrácticas

• Acceso a bases de datos de microarrays• Detección de genes diferencialmente

expresados• Construcción de un predictor