redes de interacción de proteínas

44
Redes de Interacción de Proteínas Redes de Interacción de Proteínas David A. Juan [email protected] CNIO. Grupo de Biología Computacional Estructural.

Upload: dinhdieu

Post on 07-Jan-2017

216 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Redes de Interacción de Proteínas

Redes de Interacción de ProteínasRedes de Interacción de Proteínas

David A. Juan [email protected]

CNIO. Grupo de Biología Computacional Estructural.

Page 2: Redes de Interacción de Proteínas

Interacciones entre proteínasInteracciones entre proteínas

Fundamentales para comprender la función de las proteínas.➢ Intervienen en el control del ciclo celular, diferenciación celular, plegamiento de

proteínas, señalización, transcripción, traducción, modificación post-traduccionales y transporte.

➢Las interacciones pueden alterar las propiedades cinéticas de los enzimas, permitir la canalización de secuencias de reacciones, crear nuevos sitios de unión, inactivar o destruir una proteína, cambiar su especificidad, tener un papel regulatorio, etc.

Se pueden clasificar en:➢ Interacciones estables: asociados a los complejos con múltiples subunidades

(Hemoglobina, RNA polimerasa, etc).➢ Interacciones transitorias: implicadas en el control de la mayoria de los procesos

celulares. Normalmente requieren de un conjunto de condiciones que provocan la reacción.

Page 3: Redes de Interacción de Proteínas

Interacciones entre proteínasInteracciones entre proteínasEl estudio de proteínas o interacciones concretas no es suficiente para explicar

algunos fenotipos o procesos biológicos, en los que intervienen un número variado de ellos, interrelacionados mediante una red característica de interacciones.

Análisis basados en la agrupación de enfermedades por fenotipos sugieren relaciones a nivel de sub-redes inesperadas.

LimLim et al. et al. Cell. 2006. Cell. 2006.

Page 4: Redes de Interacción de Proteínas

Conjuntos masivos de interacciones detectadas experimentalmente

Uetz et al. Nature. 2000 (YEAST)Ito et al. PNAS. 2001 (YEAST)

Gavin et al. Nature. 2002 (YEAST)Ho et al. Nature. 2002 (YEAST)Giot et al. Science. 2003 (FLY)Li et al. Science. 2004 (WORM)

Butland et al. Nature. 2005 (E. coli)Barrios-Rodiles et al. Science. 2005 (MAMMALIAN)

Rual et al. Nature. 2005 (HUMAN)

Page 5: Redes de Interacción de Proteínas

Yeast two-hybrid

Fields & Song.Fields & Song. Nature. 1989. Nature. 1989.

Page 6: Redes de Interacción de Proteínas

Yeast two-hybrid & localizaciónn celular

Page 7: Redes de Interacción de Proteínas

Yeast two-hybridAlgunos problemas

➢Falsos negativos:➢ Interferencia de los dominios fusionados.➢ Interacciones 1 Vs 1, no tiene en cuenta efectos cooperativos.

➢Falsos positivos:➢ Interacciones mediadas por terceras proteínas.➢ Es capaz de obtener interacciones lábiles, pero esto lo hace más

vulnerable a uniones inexpecíficas. ➢ Aunque el ensayo es in vivo, las condiciones no suelen serlo (sobre-

expresión, forzado en el núcleo, etc)➢ Baja reproducibilidad.

Page 8: Redes de Interacción de Proteínas

Purificación de complejos (TAP-MS y HMS-PCI)

Page 9: Redes de Interacción de Proteínas

Purificación de complejosSe generan redes diferentes de las de y2hNodos = complejos; Enlaces=comparten elementosSe desconoce la topología (interacciones prot-prot) de los complejos.

Modos de representación binaria de los datos obtenidos de complejos

Page 10: Redes de Interacción de Proteínas

Purificación de complejosAlgunos problemas

➢Falsos negativos:➢Interferencia del TAP-cassette en la interacción (~18% de las proteínas no son funcionalmente viables).➢Proteína no expresada en el momento de la lisis (se ha relacionado con la concentración de mRNA).➢Sesgo en contra de proteínas pequeñas (<15K).➢Detecta principalmente interacciones estables (se pierde las lábiles).➢En mamíferos requiere sobre-expresión.

➢Falsos positivos:➢Proteínas pegajosas.➢Se estima un 70% de complejos reproducibles.➢Interacciones establecidas durante la lisis.

Page 11: Redes de Interacción de Proteínas

Solapamiento de los datos experimentales

Complejos gran escalaY2H gran escalaText MiningExperimentos pequeña escala

Page 12: Redes de Interacción de Proteínas

Combinando estrategias

Page 13: Redes de Interacción de Proteínas

Redes de interacciones predichas

Una revisión: Valencia & Pazos.Curr. Op. Struct. Biol. 2002

Page 14: Redes de Interacción de Proteínas

Algunas ideas de partida

➢Se sabe que proteínas funcionalmente relacionadas Se sabe que proteínas funcionalmente relacionadas tienden a presentar una tienden a presentar una evolución coordinada.evolución coordinada.

➢La interacción es una forma muy fuerte de relación La interacción es una forma muy fuerte de relación funcional.funcional.

➢Esto implica que la detección de proteínas que hayan Esto implica que la detección de proteínas que hayan evolucionado coordinadamente puede ayudarnos a evolucionado coordinadamente puede ayudarnos a predecir interaccionespredecir interacciones

Page 15: Redes de Interacción de Proteínas

➢ La evolución se estudia a través de la La evolución se estudia a través de la comparación de secuencias comparación de secuencias homólogashomólogas con funciones comparables con funciones comparables..

➢ Tanto la evolución génica, como la interacción de proteínas se han de Tanto la evolución génica, como la interacción de proteínas se han de estudiar en el contexto de los organismos.estudiar en el contexto de los organismos.

➢ Las trazas de evolución coordinada se encuentran por la Las trazas de evolución coordinada se encuentran por la acumulaciónacumulaciónde señales en un número alto de organismos.de señales en un número alto de organismos.

➢ Nos interesa identificar las proteínas que estan históricamente Nos interesa identificar las proteínas que estan históricamente relacionadas (relacionadas (homólogashomólogas), y desarrollan la ), y desarrollan la misma funciónmisma función(equivalogas).(equivalogas).

Algunas ideas de partida

Page 16: Redes de Interacción de Proteínas

Buscando conservación de interacciónInterologs

➔ Se definen los ortólogos de proteínas que Se definen los ortólogos de proteínas que interaccionan en organismos diferentes interaccionan en organismos diferentes ((S. cerevisiaeS. cerevisiae) del de interés () del de interés (C. elegansC. elegans).).

➔ Se predice una interacción si se ha encontrado en los Se predice una interacción si se ha encontrado en los ortólogos de alguno de los organismos.ortólogos de alguno de los organismos.

➔ Es una evidencia muy directa y la predicción más Es una evidencia muy directa y la predicción más fiable entre organismos próximos.fiable entre organismos próximos.

C.elegansC.elegansGenomeGenome

BLASTBLAST10 E- 1 010 E- 10

10 E- 1 010 E- 1 0

Best hit

Best hitVery strict homology assignment

(same ancestor, different organism and the best possible coupling)

S. cerevisiaeS. cerevisiae GenomeGenome

Matthews et al. Genome. Res. 2001

Page 17: Redes de Interacción de Proteínas

Buscando evolución coordinadaPerfiles filogenéticos

➔ Un perfil filogenético es un vector que define la Un perfil filogenético es un vector que define la ausencia/presencia de un representante de un conjunto de ausencia/presencia de un representante de un conjunto de equivalogos en cada organismo.equivalogos en cada organismo.

➔ Las proteínas que interaccionan han de estar en los mismos Las proteínas que interaccionan han de estar en los mismos organismosorganismos

➔ La evolución tiende a eliminar proteínas innecesariasLa evolución tiende a eliminar proteínas innecesarias➔ Estos perfiles se pueden extender a parecidos entre una Estos perfiles se pueden extender a parecidos entre una

secuencia de referencia y sus ortólogos.secuencia de referencia y sus ortólogos.

Page 18: Redes de Interacción de Proteínas

Buscando evolución coordinadaGene neighbourhood

➔ Dos genes se consideran vecinos cuando están Dos genes se consideran vecinos cuando están próximos en un genoma (menos de 600bp)próximos en un genoma (menos de 600bp)

➔ Se sabe que en procariotas esta vecindad se Se sabe que en procariotas esta vecindad se usa para para optimizar la coordinación de su usa para para optimizar la coordinación de su expresión.expresión.

➔ Además genes próximos pueden ser eliminados Además genes próximos pueden ser eliminados y transferidos juntos.y transferidos juntos.

➔ La conservación de esta proximidad a lo largo La conservación de esta proximidad a lo largo de diferentes organismos es una señal de de diferentes organismos es una señal de evolución coordinada.evolución coordinada.

Dandekar Dandekar et al.et al. TIBS. 1998. TIBS. 1998.Overbeek Overbeek et al.et al. PNAS. 1999. PNAS. 1999.

Page 19: Redes de Interacción de Proteínas

Buscando evolución coordinada

Gene fusion

➔ La evolución genera secuencias La evolución genera secuencias híbridas por fusión de otras más híbridas por fusión de otras más simples.simples.

➔ Esto permite una mayor Esto permite una mayor coordinación de las funciones coordinación de las funciones desempeñadas por ambas proteínas.desempeñadas por ambas proteínas.

➔ Además permite el incremento de la Además permite el incremento de la complejidad de los organismos por complejidad de los organismos por combinación y especialización de combinación y especialización de dominios (eucariotas).dominios (eucariotas).

➔ La presencia de estas fusiones La presencia de estas fusiones sugiere una interacción entre las sugiere una interacción entre las secuencias homólogas no secuencias homólogas no fusionadas.fusionadas. Marcot te et al. Science 1999

Marcot te et al. Natu re 1999Enrigh t et al. Natu re 1999.

Page 20: Redes de Interacción de Proteínas

Buscando evolución coordinadaMétodos basados en secuencia

➔Hay otro nivel de coordinación posible: Hay otro nivel de coordinación posible: coevolución de secuencias.coevolución de secuencias.➔Buscamos paralelismos históricos que Buscamos paralelismos históricos que deberían ser detectables comparando la deberían ser detectables comparando la evolución de las secuencias de diferentes evolución de las secuencias de diferentes conjuntos de equivalogos. conjuntos de equivalogos. ➔Para ello, construímos alineamientos múltiples Para ello, construímos alineamientos múltiples de secuencias de estos conjuntos.de secuencias de estos conjuntos. ➔Después hacemos pares de alineamientos Después hacemos pares de alineamientos comparables extrayendo aquellas secuencias comparables extrayendo aquellas secuencias de los mismos organismos para ambos de los mismos organismos para ambos conjuntos.conjuntos.

Fully sequenced Fully sequenced GenomesGenomes BLASTBLAST

10E- 510 E- 5

1 0E- 510 E- 5

Best hit

Best hitVery strict homology assignment

(same ancestor, different organism and the best possible coupling)

Practical definition of equivalogySet of equivalogsSet of equivalogs

MSAsMSAs

MUSCLEMUSCLE

ReferenceReferenceGenomeGenome

Page 21: Redes de Interacción de Proteínas

Buscando evolución coordinada

MirrorTree

➔ Las proteínas que interaccionan tienden a compartir un conjunto de Las proteínas que interaccionan tienden a compartir un conjunto de restricciones evolutivas comunes.restricciones evolutivas comunes.

➔ Este método intenta detectar la coevolución al nivel de secuencias comparando Este método intenta detectar la coevolución al nivel de secuencias comparando una simplificación de los árboles evolutivos de pares de alineamientos.una simplificación de los árboles evolutivos de pares de alineamientos.

Paz os & Valencia. Protein s . 2002

HIS4_ECOLIHISX_ECOLI

Pazos & Valencia. Prot. Eng. 2001

Page 22: Redes de Interacción de Proteínas

Buscando evolución coordinada

In silico two-hybrid➔ Para un número de casos se ha mostrado la Para un número de casos se ha mostrado la

existencia de patrones de substituciones existencia de patrones de substituciones correlacionados entre diferentes posiciones correlacionados entre diferentes posiciones de una secuencia (relacionado con de una secuencia (relacionado con proximidad espacial). proximidad espacial).

➔ Se cree que esto se debe a la coevolución Se cree que esto se debe a la coevolución de estas posiciones (mutaciones de estas posiciones (mutaciones recíprocas).recíprocas).

➔ Siguiendo esta lógica, buscamos estos Siguiendo esta lógica, buscamos estos comportamientos, no intra-proteína, sino comportamientos, no intra-proteína, sino inter-proteína en pares de alineamientos inter-proteína en pares de alineamientos comparables.comparables.

➔ Una ventaja de este método es que apunta a Una ventaja de este método es que apunta a resíduos relacionados con la interacción.resíduos relacionados con la interacción.

Pazos & Valencia. Proteis. 2002

Page 23: Redes de Interacción de Proteínas

Algunos problemas generales de

los métodos de predicción

-> Falsos negativos:-> Se requiere una señal clara a lo largo de varios organismos.-> Si la detección de proteínas equiválogas falla, no se encuentra la señal.-> Una interacción dada no necesariamente debe mostrar ninguno de los indicios usados.

-> Falsos positivos:-> Las relaciones filogenéticas entre los organismos, suponen sesgos que pueden producir señales erróneas.-> La evolución coordinada tiene problemas para distinguir entre interacción física y asociación funcional.-> La evolución coordinada sufre de cierta transitividad (si a-b y b-c entonces a-c).-> El nivel de especificidad depende de la similitud entre las secuencias (distancias globales).

Page 24: Redes de Interacción de Proteínas

EciD (E. coli interaction Database)http://www.pdg.cnb.uam.es/ecidhttp://www.pdg.cnb.uam.es/ecid

Page 25: Redes de Interacción de Proteínas

STRING

http://string.embl.de/

Page 26: Redes de Interacción de Proteínas

Otras redes relacionadas con interacción(basadas en literatura)

Blaschke & Valencia. Genome Inform Ser Workshop Genome Inform. 2001

Hoffmann & Valencia. Nat. Genetics. 2004

Page 27: Redes de Interacción de Proteínas

c

SUISEKI

Extraction o f the interactions Hum an expert

m anipulation

Pubm e d15 M entrie s

Extraction of prote in nam es

* [protein A] ... verbindicating an action ... [protein B]“After extens iv e purification, Cdk2 w as s till bound to cy clin D1”

Rules (fram es ) to identify the interactions

Se lecting term s that indicate interaction

activate, associated with, bind, interact, phosphorylate, regulateAction w ords are for exam ple :

Se lection o f the text corpus

Page 28: Redes de Interacción de Proteínas

Hoffm ann & Valencia Nat Genet 2004

Page 29: Redes de Interacción de Proteínas

Algunas evaluaciones de conjuntosde interacciones

von Mering et al. Nature. 2002Lee et al. Science. 2004

Page 30: Redes de Interacción de Proteínas

Otra comparación de métodos (respecto a complejos)

Page 31: Redes de Interacción de Proteínas

Comparación más reciente (funcional)+

Predicción funcional

Page 32: Redes de Interacción de Proteínas

Aprendiendo de las redes de interacciónAprendiendo de las redes de interacción

Una revisión: Una revisión: Barabasi & Oltvai. Nat. Rev. Genetics. 2004Barabasi & Oltvai. Nat. Rev. Genetics. 2004Otros: Otros:

Lee et al. Science. 2004Lee et al. Science. 2004He & Zhang. PLoS Gen. 2006He & Zhang. PLoS Gen. 2006

Page 33: Redes de Interacción de Proteínas

Algunas carácterísticas

➢Conectividad: número de enlaces de un nodo.➢ Distribución Power-Law de conectividades

-> p(k)~k-γ (¿Scale-free?).➢Camino mínimo: el mínimo número de enlaces que hay que recorrer para ir de un nodo a otro.

➢ Camino mínimo medio es mucho más corto que la de redes con topología generada al azar (Small world).

Page 34: Redes de Interacción de Proteínas

Algunas carácterísticas

➢Conectividad: número de enlaces de un nodo.➢ Distribución Power-Law de conectividades

-> p(k)~k-γ (Scale-free).➢Coeficiente de clustering: mide la densidad de conexiones alrededor de un nodo: 2n1/(k*(k-1))

➢ Los nodos más conectados (hubs), parecen tener menores coeficientes de clustering (¿redes jerárquicas?).

➢ Presenta módulos difíciles de detectar (¿Jerárquica?, ¿ruido?. ¿?).

➢Assortativity: tendencia de un elemento a sociarce con otro similar a él (en conectividad).

➢ Los nodos más conectados suelen estar unidos a otros con pocas interacciones (disassortativity -> ¿ruido?).

Page 35: Redes de Interacción de Proteínas

Algunas carácterísticas➢Robustez: capacidad para mantener su estructura global ante delecciones de nodos o enlaces.

➢ En las redes de interacciones los hubs tienden a ser esenciales.

➢ Mayor robustez ante fallos aleatorios (eliminación de nodos al azar)

➢ Menor robustez ante ataques dirigidos a los hubs.

➢Explicación alternativa: lo esencial son las interacciones, y los hubs tienen más probabilidades de estar implicados en una interacción esencial.

Page 36: Redes de Interacción de Proteínas

Motivos, Función y Conservación

➔Se pueden describir motivos de un número pequeño de nodos y unas conexiones determinadas entre ellos.➔Algunos de estos motivos están sobre-representados en las redes de interacción (y2h).➔Se puede ver que existe relación entre los motivos y el tipo de proceso celular.➔Además, los motivos más conectados están más conservados entre organismos (relacionado con la robustez de la red)

Wutchty, Oltvai & Barabasi. Nat. Genet. 2003.

Page 37: Redes de Interacción de Proteínas

Añadiendo la variable temporalInteracciones + Expresión

Han et al. Nature. 2005

➢Comparando los perfiles de expresión de las proteínas que interaccionan se distinguen dos tipos de hubs:

➢“Party hubs”: Aquellos que tienden a co-expresar con sus interactores“Date hubs”: No co-expresan con sus interactores.

➢“Date hubs” son centrales en las redes de interacción y aunque fundamentales para la conexión entre módulos funcionalmente homogéneos, tienden a ser menos esenciales.

Page 38: Redes de Interacción de Proteínas

Añadiendo la variable temporalInteracciones + Expresión

Ulrik de Lichtenberg,Lars Juhl Jensen,Søren Brunak,Peer Bork.Dynamic Complex Formation During the Yeast Cell Cycle. Science.2005.307,724-7

Page 39: Redes de Interacción de Proteínas

➔Estructura de la red: Red libre de escala.➔Coherente con un crecimiento por unión preferencial.➔Se han desarrollado simulaciones incluyendo crecimiento de la red por duplicación génica.

Evolución de las redes

Page 40: Redes de Interacción de Proteínas

Añadiendo información estructural

➢ Las interacciones no son sólo relaciones entre nodos.➢ Las interacciones tienen superficies de distinto tamaño y pueden ser solapantes (mutuamente excluyentes).

➢ Teniendo esto en cuenta, se ve que:➢ Mayor superficie de interacción supone

menor velocidad de evolución.➢ Los “date hubs” son aquellos con

interacciones mutuamente excluyentes.➢ La duplicación sólo explica el crecimiento de

los “date hubs” (contienen homólogos).

Kim et al. Science 2006.

Page 41: Redes de Interacción de Proteínas

Prediciendo función con redes de interacción

➔Contexto de red o dime con quien andas y te diré quien eres.➔Se asigna función basándose en la función de los nodos vecinos.➔Se reduce el número de enlaces entre proteínas con función diferente.

Vazquez et al, Nat Biotech. 2003

Page 42: Redes de Interacción de Proteínas

Predicción de función integrando información

Aproximación bayesiana estableciencio confianzas en función de rutas metabólicas.

Lee et al. Science. 2004.

Page 43: Redes de Interacción de Proteínas

Futuro

➔ Los conjuntos de interacciones están lejos de ser completos. ¿Hasta dónde pueden ayudar los métodos de predicción?

➔ Las interacciones entre proteínas son importantes, pero sólo parte del sistema (regulación, reacciones enzimáticas, interacciones con otras y entre otras moléculas, ...).

➔ El análisis de las redes es muy joven, por lo que se requieren nuevos estudios para llegar a comprenderlas.

➔ Estos avances ayudarán a mejorar las predicciones de función, relevancia de las proteínas, etc.

➔ El estudio dinámico de los sistemas biológicos y de sus respuestas a determinadas condiciones (estrés, enfermedades, envejecimiento, etc) debe apoyarse en el conocimiento de las redes de interacción, regulación, rutas metabólicas, ...

➔ El uso de las redes debe combinarse con el conocimiento más detallado de los sistemas comcretos, ninguna interpretación puede ser completa sin este.

Page 44: Redes de Interacción de Proteínas

Ruegos y preguntas

¡Manos arriba!

y/o

[email protected]