conocimiento de la realidad -...

49
16 y 17 de noviembre 2016 Data Science”: Conocimiento de la realidad a través de sus datos. Organiza: Patrocina: Colabora: José Antonio López Martín Oncología Médica Hospital Universitario 12 de Octubre Madrid. España

Upload: others

Post on 20-Mar-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

16 y 17 de noviembre 2016

“Data Science”: Conocimiento de la realidad a través de sus datos.

Organiza:

Patrocina:

Colabora:

José Antonio López Martín Oncología Médica

Hospital Universitario 12 de Octubre Madrid. España

Objetivos

• Describir con ejemplos diferentes tipos datos que sustentan el conocimiento sobre la salud y la enfermedad. • Informar sobre la existencia de repositorios públicos de datos

masivos

• Reflexionar sobre las limitaciones de la estadística clásica en la generación de modelos que expliquen la realidad observada (i.e. los datos) • Informar sobre la modelización alternativa con algoritmos de

inteligencia artificial

• Introducir el concepto del análisis de redes complejas como base de la medicina y farmacología de sistemas

1. LOS DATOS DE LA REALIDAD

Datos de salud y enfermedad

Repositorios / bases de datos biológicos

www.expasy.org

Catálogos de terminología médica unificada

UMLS

UMLS - estadísticas

UMLS - estadísticas

http://www.drugbank.ca/

Información fichero DrugBank

drugbank-id protein-binding pdb-entries

name route-of-elimination fda-label

description volume-of-distribution msds

cas-number clearance patents

unii classification food-interactions

average-mass salts drug-interaction

monoisotopic-mass synonyms sequences

State products calculated-properties

Groups international-brands experimental-properties

general-references mixtures external-identifiers

synthesis-reference packagers external-links

indication manufacturers pathways

pharmacodynamics prices reactions

mechanism-of-action categories snp-effects

toxicity affected-organisms targets

metabolism dosages enzymes

absorption atc-codes carriers

half-life ahfs-codes transporters

www.disease-ontology.org

Proyecto que tiene como objetivo generar una estructura unificada para enlazar el conocimiento de

las enfermedades humanas entre las distintas bases de

datos:

Historia clínica Secuenciación genoma

Microbioma Dianas farmacológicas

Estudios de expresión génica Modelos experimentales de enfermedad Genes humanos – variación y mutación

Vías y procesos moleculares KEGG

Ejemplos de datos no estructurados

‘Text mining’ para extracción de conocimiento en datos no estructurados

http://sideeffects.embl.de/

http://sideeffects.embl.de/

Uso de datos clínicos de vida real para reposicionamiento farmacológico

Xu et al, 2015

Uso de datos clínicos de vida real para reposicionamiento farmacológico

Xu et al, 2015

2. MODELIZADO DE LA REALIDAD

Modelización: objetivo

• Datos

– Variables ‘independientes`(x)

– Variables resultado (y)

• Modelo (y,[x])

• Objetivos

– Conocer la realidad

– Pronosticar evolución

– Predecir respuesta a intervenciones

Modelo

y

x

Modelizado de datos: dos culturas

Modelo estadístico Modelo algorítmico

función f (X) que minimice la pérdida L de información : L(Y, f(x))

Los datos permiten seleccionar el modelo que mejor los explique.

Naturaleza iterativa, buenos predictores.

• Naïve Bayes • Distancias (KNN) • Arboles de clasificación • Random Forest • Redes bayesianas, redes neuronales • Máquinas de vector soporte (SVM), etc, etc

y

x

y = f(x, azar, parámetros)

Ajustamos los datos a una función conocida. Ejemplos:

• Regresión lineal • Regresión logística • Intervalos confianza

Conformes aunque el modelo se ajuste mal

y

x

Algoritmos inteligencia artificial

https://s3.amazonaws.com/MLMastery/MachineLearningAlgorithms.png

http://www.cs.waikato.ac.nz/ml/weka/index.html

3. INTEGRACION DE NIVELES DE CONOCIMIENTO DE LA REALIDAD.

El avance tecnológico ha permitido la recolección de datos masivos en biología

Ritchie MD, Holzinger ER, Li R, Pendergrass SA, Kim D. Methods of integrating data to uncover genotype-phenotype interactions.

Nat Rev Genet. 2015;16(2):85-97.

Un sistema biológico es más que la suma de sus componentes individuales.

Generación de redes de interacción

Wang and Marcotte, J Proteomics. 2010

Biología de sistemas

• Organismo red integrada e interactiva de genes, proteínas y reacciones bioquímicas que permiten la vida.

• Redes organizan e integran la información de los diferentes niveles para crear un modelo biológico relevante.

• Redes hipótesis sobre la función biológica y bases para comprender cambios espacio-temporales dinámicos.

Oltvai and Barabási, Science. 2002 Hood and Tian, Genomics, Proteomics & Bioinformatics, 2012

node failure

Disfunción

Albert, Jeong, Barabási, Nature 406 378 (2000)

Ataque

Disfunción y disrupción de red

Limitación de la farmacoterapia actual

Wist AD, Berger SI, Iyengar R. Systems pharmacology and genome

medicine: a future perspective. Genome Medicine.

Modelizado del efecto de los fármacos

physiological process physiological process physiological process physiological process

Integración efectos

sobre el modelo

Predicción de

interacciones

moleculares en escala

genómica

Reconstrucción,

análisis y simulación

de redes biológicas

Enfoque tradicional

Enfoque farmacología de sistemas

Conocimiento

interacciones´ fármaco-proteína

Proyección de efectos ‘Off-target’ de

nelvinavir en red de vías moleculares

Identified off-target

Intermediate protein

Pathway

Cellular effect

Activation

Inhibition

PLoS Comp. Biol., 2011 7(4) e1002037

El ‘Drugome’ de M. tuberculosis http://funsite.sdsc.edu/drugome/TB/

Proximidad entre los sitios de unión de proteínas de M. tuberculosis (AZUL) y

sitios de unión de dianas de fármacos aprobados (ROJO).

•  Fármacos o modelos de enfermedad con firmas opuestas se pueden usar para descubrimiento o reposicionamiento farmacológico •  Fármacos o modelos de enfermedad con firmas similares se pueden usar para entender la biología

Descubrimiento/reposicionamiento de fármacos basado en firmas moleculares

Descubrimiento/reposicionamiento de fármacos basado en firmas moleculares

http://lincsportal.ccs.miami.edu/dcic-portal/

Conclusiones (1)

• El desarrollo tecnológico en biología ha permitido la disección de los fenómenos de la vida, salud y enfermedad en múltiples pequeños componentes

• El desarrollo de las ciencias de computación y de la bioinformática permite extraer y estructurar la información de datos masivos.

• Esta visión ‘reduccionista’ ha permitido obtener grandes avances biomédicos, pero podría estar limitando otros.

• El desarrollo de la capacidad computacional permite utilizar algoritmos alternativos de inteligencia artificial que modelizan los datos sin asumir su ajuste a funciones conocidas

Conclusiones (2)

• El análisis de redes complejas permite extraer hipótesis de interacciones entre sus componentes, no detectables mediante la aproximación reduccionista.

• La Biología de sistemas da pie al nacimiento de la Medicina y Farmacología de sistemas, que pueden enriquecer el conjunto de conocimientos obtenidos en la Medicina Genómica.

• El desarrollo de la bioinformática y de la biología computacional se apoya en el uso compartido de datos masivos y desarrollo de aplicaciones de uso libre (GNU)

¿Preguntas?

[email protected]

José Antonio López Martín Oncología Médica

Hospital Universitario 12 de Octubre Madrid. España

Ciclo de expectativas de tecnologías emergentes

Data Scientist

http://drewconway.com

blog.revolutionanalytics.com

Tratamiento médico:

Reduccionismo versus Sistemas

Ahn AC, Tewari M, Poon CS, Phillips RS (2006) The Clinical Applications of a Systems Approach. PLOS Medicine 3(7): e209.

doi:10.1371/journal.pmed.0030209

http://journals.plos.org/plosmedicine/article?id=10.1371/journal.pmed.0030209

Reposicionamiento farmacológico por proximidad de eventos adversos

• Si dos fármacos tienen efectos secundarios similares, tienen “targets” similares

• Drug Target Identification Using Side-Effect Similarity (Campillos et al, 2008)

Campillos et al, 2008

Reposicionamiento farmacológico por proximidad de eventos adversos