© copyright ebiointel,sl 2006 introducción bioinformática la investigación biomédica in silico...

39
© Copyright Ebiointel,SL 2006 Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

Upload: claudia-poblete-herrero

Post on 03-Feb-2016

213 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

BioinformáticaLa investigación Biomédica

in silico

Introducción a la Bioinformática

Page 2: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Puntos a tratar:Puntos a tratar:

Bioinformática: Bioinformática: síntesis de la revolución de la biología molecular y de la informática

El análisis computacional de secuencias

Retos de la bioinformática: la integración de los diferentes niveles de complejidad de los sistemas biológicos

Introducción a la Bioinformática

Page 3: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

15 y 16 de Febrero 2001: Publicación secuencia borrador del genoma humano

Introducción a la Bioinformática

Page 4: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

GATTGCCTCTCATTTTCTCTCCCATATTATAGGGTGAAATATGATCGCGTATGCGAGAGTAGTGCCAACATATTGTGATCTTCGATTTTTTGGCAACCCAAAATGGAGGCGGACGAACGAGATGATAATGATAAGATGATTCAAAAAGACAATGCACGACAGAGAGAGCAGAAAAGATAATTAAATTGCCCCTCATTTTCTCTGGCAAATTGTAGGGTGAATTATGATCGCGTATGCGAGAGTGGTGCCAACATATTGTGCTCTTCGATTTTTTGGCAACCCAAAATGGAGGCGGATGAACGAGATGATAATATTTTCAAGTTGCCGCTAATCAAAAATAAATTCCTTGCAACATAAAATAAAGCACAAAATGCCCGCTCAAAAAAAGGCATGAATATATAAGCTCGAACATAGAACATAGGCTTGAACATATAATGACTGCCTTTCATTCTCTATCTTATATTACCGCAAACACAAAATGACAATGCACGACATAGAGAGAAAGAGAGATATTCAGATTGCCTCTCATTGTCTCACCCATATTATGGGAACCAAATATGAGCACGTATGCGAGAGGAGTGCCAACATATTGTGCTCTACGATTTTTTTGCAACCCAAAATGGCGGCGTACGAACGAGATGATAATATATTCAAATTGCCGCTAATCAGAAGCAAGTTTATTGCAATGTTCAGTGCAGCGCAAAATGGCCGCTCAAGAAAAGGCTCGAATATATATTGCCTGCCTCTCATTCACTCTCTTTTATTACCGCAAGACCAAAATGACAATGTACAACAGAGAGAGCAAGAGAGATATTTAGATTGCCTCTCCTTGTCTCTCCCATATTATAGAGACCGAAAATGATTGCGTATGCGAGAAGAGTGCCATTGTATTGAGCTCCTCGACCCAAAATAGCGTCGGACGAACGAGATTATATATTTAAAATGCCGATCATTTTCTCATCCATATAAATACTACCGAAAATGACTGTCTAAAGGTACTCATCGACTATATTTAAATCTGTGTATTTCTGTGAATAGATTGACCTTTGCAATTTTTAACGGCATTGTCTATTAAATTAATATAATTTTCTTTTTTGATGAATATTTAACCGAACATTTACTTGAAATTAAATTATAAAATTGGTTAAATAATGTTGAAATCTTACTTTCAGCTAAATGGGGCTATTTTGCAAGGGTTCCATCATGACATTGGTAAATAATTTTTAAAGAATTAATTGTAAGTTCCAATAGACTGGAAATTATTTTGCAATATCATTCTTATCCCTATTTCCAAAAGCGAATTATTAGTTGCGTGAAAATCAGAAGGAAAATTATTTAACGTGTTATGCCACGCCAAATAGCCGCGCAATAGGAAGCTAGACTATATAATGACTGCAACGAAAATTGTAAATTCCAATTAAAAGGATATTATTGTGCGATTTCACTTTAATTCTTATTTCAAAAAAGTTAATTATTAGTTGACGGAAATCAGAACGAATTTCACCGCAACGTCTTATGCAGCACAAAATGGCGGCGCAAAAGGATGGTTGCATATACAATAACTTCATCTCATTCAATCTCTCCTATATTACCGCAAACTCGAAAGCCAAAACACGAATGATGAAGAGGGATAGATTTTATTGGGACAAAAATGATAGGTCACGCGAGAGGAGTGGTCTAAATTTTACTCTCACAAAAATGTTGGCAATACAAAATGGCGGCGGAATGAAGAGGTGAAAATATATTAAAATTGCCGCTCATTTTCTTCGCGGTAGAATTAGGACTGAACGTTGCCGGGTATAGGATCTCTATTGATGGCCTTTACTTATAAAGTGTATTTCTACAGATCAAATTACTTTTTACTCTTTATCAATATTTAAATATTATAAATTGATTTAGTTAAAATACAATTCGAACAATCTTTTCTCCAAATAATAATAATGTTTAATACCTATTTGCGCATATGCGTTTATTTTTGGGATTTAATTTTAACATTTTTCAACAAAACCGTTACAAATGTAATTTTAAATCAGGAAACGACTTTGGTATGAAAATATGTTTTTTTGTGCGCTTTTAAACATGTAACTGCTCTTTTGTGCTGTTTTATTGAATGCTATCACAGCGTAAAATTTTAGTTTTAATACCAATACATTGGGAATAATTTGCGATTTCATTCTATTCTTATGCCCAAATAAGGAAATAGTTTCCGGCAAAAAATCAGAATTTAGCTTTTACAAAAACTAGAGAGGAGAGGACAATATTATAATTGTAGACCGTTTTAAACACTTTAAAATGTTTAACCATTTATCAATTATTCTACTAAATGTAGGTGATTTTATTTATTAGAATACGAATTCTTTATCTGAATCGAACTAAGTAAGCCTAAGCGCTTAGGAAAAATACATACTTGACGAGTAGAGTGAAATAATTACAAATATTAGACATATCCATTGCTACTCGCATGTAGAGATTTCCACTTATGTTTTCTCTACTTTCAGCAACCGAGAAGAGAACCCACGTTTGAACAAGTATCGGCGTGTGGACAACAGCTATCCCCGCTTCATAACGAATGAGGCTGCCGAGGACCTGATTTACAAGAAGTCCATGGGCGAGCGGGATCAGCCACAGAGCTCAGAGCGGATCTCAATATTTAATCCGCCAGTATACACGCAGCACCAGGTGCGCAATGAAGCCCCCTACATACCCACCACATTTGACCTCCTCTCAGACGATGAGGAGTCGTCACAGAGAGTTGCCAACGCCGGGCCATCTTTCAGGCCCTTGACTTACTCGGATGCTGTGCGTCTAAGCCAGAATGGCTTCGCCAACTCCCGCGTAAGTGGGCACTCCAGCTATACGGTGCGCAGACCACCGGCACTAGTTGACAGAAGCATTCTATCCCAGGAAATGGAGCGCATGGACCAAGAGCAGTATATCTACCTTATCCGTACCGCAGCCCAAAGTAATTCCGTGGGCAGTCACTACGCCGAACCGGTTACTGATAACTCGGAGGTCAAGAAAGTCAGTGAAACCAACAAAAGGTAAATAAATTTTTTATATCCATCCATATCCGAATCAGTGGCAATAATGCAAAATGCTGATTTTATCACCAATTAGTGACGCACCACAGCCGTTAACCCCTCAACCTACCAGACTCACCAGAACAGAATCCTTGCACCGTCGTTTTGCCAGCTGCGTCAACTTAAATGATGACTTCGCCAGCAATTTAAAGCAAGAGCGGCGGACTGTGAAGAGAAATCCAAA

Page 5: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

GENOMAS

Introducción a la Bioinformática

Page 6: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Sistemas vivos: información digital cuaternaria (A,T,G,C) en secuencias unidimensionales de monómeros

Ordenadores: información digital binaria en ristras de 0 y 1

Codificación de la información

Page 7: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Bioinformática: síntesis de la revolución de la biología molecular y de la informática

Definición:

La disciplina científica que engloba todos los aspectos de la adquisición, procesamiento, distribución, análisis, interpretación e integración de la información biológica

Biología molecularFundamentos ordenadores y programaciónFundamentos de redesBases de datosAplicaciones bioinformáticas

Bioinformática

Page 8: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Aproximación que cruza la arena tanto experimental como teórica: experimentos realizados “in silico”

Nueva disciplina Curriculum:

Licenciado en Ciencias de la Vida Máster en computación Doctor en análisis de secuencias

Nueva disciplina

Bioinformática: síntesis de la revolución de la biología molecular y de la informática

Bioinformática

Page 9: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Hitos de la

Bioinformática

Primera proteína secuenciada

Secuenciación del DNA

GenBank, EMBL, DDBJ

Secuenciación automatizada de DNA

Algoritmos FASTA y BLAST

WWW

Primer genoma completo

Primer cromosoma humano

Borrador Genoma Humano

Genoma Humano completo

HapMap, Genoma chimpancé, 387 genomas

1951

1977

1982

1986

1990

1991

1995

2000

2001

2003

2005

1951

1977

1982

1986

1990

1991

1995

2000

2001

2003

2005

1953 Estructura del DNA1953 Estructura del DNA

Bioinformática

Page 10: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

El problema

René MagritteClarividencia

DNA

Fenotipo

Page 11: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Propiedades de la información biológica

Existe una relación entre estructura molecular y función en el sentido más amplio:

DNA --> Fenotipo (todos los niveles)

La complejidad de los datos biológicos

El crecimiento explosivo de los datos biológicos

Existe una relación entre estructura molecular y función en el sentido más amplio:

DNA --> Fenotipo (todos los niveles)

La complejidad de los datos biológicos

El crecimiento explosivo de los datos biológicos

La información biológica

Bioinformática

Page 12: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

El crecimiento explosivo de datos

Hace ... Antes Ahora

Nucleótidos 26 años (1982)

680338 pb (GenBank)

> Miles de millones

Proteínas 26 años 1500 300.000

DNA continuo

16 años 73 kb > 270 Mbases

SNPs 16 años centenares 11 millones

Genomas 11 años 0microorganis

mos

387Organismos

Expresión 10 años Limitado pocos genes

Torrente de datos (microchips)

Page 13: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

mero

de p

ares

de b

ase

s (x

10

9)

Crecimiento explosivo de secuencias

Crecto bases datos

mer

o d

esec

ue

nc

ias

(x m

illó

n)

Ver la estima de hoy

Estima de Abril 2006: 130,989,342,565 bases

Bioinformática

Page 14: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

El crecimiento explosivo de datos

Hace ... Antes Ahora

Nucleótidos 26 años (1982)

680338 pb (GenBank)

> Miles de millones

Proteínas 26 años 1500 300.000

DNA continuo

16 años 73 kb > 270 Mbases

SNPs 16 años centenares 11 millones

Genomas 11 años 0microorganis

mos

387Organismos

Expresión 10 años Limitado pocos genes

Torrente de datos (microchips)

Page 15: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

La avalancha de datos

La Bioinformàtica es crucial para tranformar el torrente de datos brutos en conocimiento biológico

David B. Searls

Page 16: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Bio

logi

a C

ompu

taci

onal

Los métodos computacionales se han convertido en algo intrínseco de la investigación biológica moderna, y su importancia sólo puede incrementar conforme aumenta la importacia de los métodos a gran escala de generación de datos, la complejidad de los datos y la sofisticación de nuestras preguntas

Francis S. Collins

Bioinformática

Page 17: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Tres vertientes del análisis bioinformático:

Manejo de volúmenes masivos de datos

Análisis e interpretación de resultados experimentales

Modelo de sistemas biológicos

Page 18: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

DB

Bases de datos

http://www.ncbi.nlm.nih.gov/gquery/gquery.fcgi

Page 19: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Potencia de cálculo

Ordenador Compaq de 800 procesadores Alfa EV6 y EV7 con una arquitectura de 64 bits y más de 80 terabytes de memoria (5 veces la biblioteca del congreso)

Secuenciación del genoma (Aproximación aleatoria, Celera)

Page 20: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Translation

DatabaseSimilaritysearrch²

Proteome

All-against-allComparison

WithinProteome 1,3

ProteinComparison

BetweenProteomes 1,4

Proteome Proteome Proteome1

SearchOf

Clusters 5

SwissProtPDBsequences

TranslatedESTs

Proteome2

Proteome

Proteomedatabase

Database ofProteome 1

Database ofProteome 2

ClusterDatabase

.....OrProteome

Análisis de genomas

Genome sequence

Predicted genes

Page 21: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Genoma ratón 14% menor genoma humano (2,5 Gb vs 2,9 Gb) 90% ambos genomas presentan sintenia A nivel nucleotídico 40% GH se alinea con GR Tasa substitución neutra 0,5 por sitio. Doble ratón que humanos % genoma sometido a selec purificadora >5% Evolución no uniforme del genoma Ambos ~ mismo número genes, 30.000. 80% único ortólogo, sin

homología <1%

Genómica comparativaMetodología con una sensibilidad y precisión comparable o superior al

análisis experimental

Page 22: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Genómica comparativa

Chimpancé vs Homo sapiens

¿Qué cambios genéticos nos

hacen humanos??

Page 23: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Análisis filogenéticos Genómica evolutiva

Bioinformática

Page 24: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Base genética de la individualidad humana

SNPsA G A G T T C T G C T C G

A G G G T T A T G C G C G

A G A G T T C T G C T C GA G G G T T A T G C G C G

A G A G T T C T G C T C GA G G G T T A T G C G C G

Single Nucleotide Polymorphism

Page 25: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Base genética de la individualidad humana

International HapMap Project (http://www.hapmap.org)

Page 26: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Expresión (DNA microarrays: Molecular portraits)

Page 27: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Redes de interacción de

proteínas

(Gavin et al. Nature 2002)

Redes de interacción

Máquina multiproteínas 232 máquinas de 12 proteínas promedio

Proteómica

Page 28: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

MAKING CONNECTIONS This network graph shows causal connections among 30,512 genes, 31,459 proteins, and 5,824 small molecules in Genstruct's model, which contains 136,362 causal connections that can be evaluated to explain the molecular state changes observed in large-scale systems biology experiments.

The red connections represent inhibitions; green, activation; light blue, reaction; dark blue, a product; yellow, catalysis; orange, binding; and black, gene product

relations.COURTESY OF GENSTRUCT

Bioinformática

Page 29: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Modelo de sistemas biológicos

E-Cell (Masaru Tomita)

Bioinformática

Page 30: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Entendiendo la célula

Bioinformática

Page 31: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

¿Qué gran panorámica emergerá del océano de datos

biológicos??

a. La complejidad no es reducibleb. Nuevos principios generales de organización de lo biológico

Bioinformática

Page 32: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Sistema biológico (Organismo)

Bloques de construcción(Genes/Moléculas)

Aproximación sintética interdisciplinar

(Bioinformática: Biólogos, médicos, matemáticos, físicos, informáticos,)

Aproximación reduccionista (Experimentos)

Bioinformática

Page 33: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Nivel de análisis Definición Estatus Método análisis

Genoma Conjunto completo de los genes de un organismo o sus organelas

Independiente del contexto Secuenciación sistemática del DNA

Transcriptoma Conjunto completo de los RNA mensajeros presentes en una célula, tejido o órgano

Dependiente del contexto (el complementos de RNAs varía según cambios en la fisiología, el desarrollo o patologías

Matrices de hibridación

SAGE

Análisis Northern a gran escala

Proteoma Conjunto completo de proteínas presentes en una célula, tejido o órgano

Dependiente del contexto Electroforesis en gel bidimensional, fingerprinting de péptidos

Análisis de dihíbridos

Metaboloma Conjunto completo de metabolitos (intermediarios de bajo peso molecular) presentes en una célula, tejido o órgano

Dependiente del contexto Espectrofotometría de infrarrojos

Espectrofotometría de masas

Espectrofotometría resonancia magnético nuclear

Bioinformática

Interactoma Interactoma

-omics-omics

Page 34: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

La intersección de la genómica y bioinformática en la práctica clínica es una necesidad que debe incorporarse en la investigación médica si que quiere que la revolución genómica incida efectivamente en la medicina

Chris GunterNature 2004, 429: 439

La Bioinformática en la investigación clínica

Page 35: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

El ‘guru’ JUAN ENRIQUEZEx-Director del Harvard Business School´s Life Science Project y, actualmente, es CEO de Biotechconomy

Conocer el lenguaje de los genes es dominar el futuro

Código digital cuaternario

Perspectivas de la Biotecnología

Page 36: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

La Bioinformática hoy

Datos Conocimiento Herramientas

bioinformáticas

Page 37: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

© Copyright Ebiointel,SL 2006

Conclusiones

• El tratamiento y análisis masivo de información es parte de la práctica de la investigación biomédica actual

• El disponer de recursos bioinformático integrados y de gran capacidad para el tratamiento y análisis de información biomédica es hoy una necesidad primaria de la investigación biomédica

• Los investigadores precisan conocimientos y capacidades para el análisis e interpretación bioinformático mediante programas de formación

• Desarrollo de análisis de sistemas dinámicos complejos

• Colaboración multidisciplinar

• Estilo de vida en la red

En la era postgenómica de la investigación Biomédica

Bioinformática

Page 38: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática

Are you ready?

Page 39: © Copyright Ebiointel,SL 2006 Introducción Bioinformática La investigación Biomédica in silico Introducción a la Bioinformática