pfam

19
UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLÁN DEPARTAMENTO-CIENCIAS BIOLÓGICAS SECCIÓN-BIOQUÍMICA Y FARMACOLOGÍA HUMANAS LIC. BIOQUÍMICA DIAGNÓSTICA Bioinformática  Pfam Grupo: 2001 Medina Velázquez Laura Quetzally 412063619 Profesora: M. en C. Maritere Domínguez Rojas p.BQD Larisa Andrea González Salcedo

Upload: quetzally-medina

Post on 12-Oct-2015

40 views

Category:

Documents


0 download

DESCRIPTION

Bases de datos bionformáticas de proteínas.

TRANSCRIPT

  • UNIVERSIDAD NACIONAL AUTNOMA DE

    MXICO

    FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLN

    DEPARTAMENTO-CIENCIAS BIOLGICAS

    SECCIN-BIOQUMICA Y FARMACOLOGA HUMANAS

    LIC. BIOQUMICA DIAGNSTICA

    Bioinformtica

    Pfam

    Grupo: 2001

    Medina Velzquez Laura Quetzally 412063619

    Profesora:

    M. en C. Maritere Domnguez Rojas

    p.BQD Larisa Andrea Gonzlez Salcedo

  • Pfam es una base de datos de familias de protenas que incluye sus anotaciones y

    alineamientos de mltiples secuencias.

    En la pgina principal de Pfam se puede observar la siguiente pantalla.

    A continuacin se explicarn cada una de los diferentes links de entrada.

    1

    2

    3

    4

    5

    6

  • 1

    En el primer link se puede buscar una secuencia en

    especfico. Al dar click en Go Pfam muestra los

    dominios que tiene la secuencia introducida. En

    este caso muestra 4 dominios diferentes; sin

    embargo, debido a que ya se ha estudiado esta

    secuencia anteriormente; se da click en los

    dominios correspondientes a los dedos de zinc y al

    dominio BRCT. Al hacerlo se accede a la pgina de

    cada una de las familias de dominios

    seleccionados.

  • En el siguiente link se puede buscar por familias de protenas.

    El siguiente link da la opcin de buscar por clanes; sin embargo, como en este caso se

    desconoce el clan al que pertenece alguno de los dos dominios de la protena del BRCA1;

    se dar click en la opcin de browse, es decir, navegar a travs de una lista de clanes.

    2

    En este caso se busca

    directamente por la familia

    del dominio BRCT y se

    obtiene como resultado la

    misma entrada que en la

    anterior forma de bsqueda.

    3

  • Al dar click en el link se muestra la pgina del clan. En sta se observa que al clan solo

    pertenecen dos familias de dominios: BRCT y PTCB-BRCT.

    Los links view a sequense y view a estructure Van a permitir buscar la informacin de

    los dominios de una secuencia proteica utilizando indicadores de secuencia o nmeros de

    acceso y encontrar los dominios de una estructura de PDB mediante el identificador PDB,

    respectivamente.

    4

    5

    Secuencia obtenida de

    UniProt.

    Secuencia obtenida

    de Protein Data Bank

  • El siguiente link Keyword search permite encontrar toda la informacin relacionada con

    una palabra clave especfica.

    En la seccin Jump to Se puede introducir cualquier nmero de acceso o ID para

    acceder a la pgina correspondiente, ya sea de la familia Pfam, del clan, de la secuencia

    UniProt, estructura de PDB.

    En este caso, se escribir el nmero de acceso de UniProt para la protena de

    susceptibilidad al cncer de mama; la cual ya se ha revisado en numerosas ocasiones

    anteriores.

    6

  • Para poder entender toda la informacin arrojada es necesario explicar algunas

    caractersticas.

    Architecture: Es la combinacin de dominios presentes en una protena.

    Sequence: Se refiere a la secuencia de aminocidos que contiene esta protena.

    Interactions: Indica las interacciones que pueden tener los dominios de esta

    protena con otros dominios.

    Varios de estos enlaces, son los mismos a los que se tienen en el men izquierdo. Solo

    que se muestran de forma grfica en la parte superior derecha. La seccin de Summary y

    Features, se explicaran a continuacin.

    Summary se encuentra divida en dos secciones. La primera es un resumen de la entrada

    de donde se obtuvo la protena, en este caso de UniProt. Aqu se observa informacin

    como descripcin de la protena, organismo fuente y longitud de la protena.

    La seccin de Pfam domains contiene una tabla con las caractersticas ms relevantes,

    de la estructura proteica, as como el formato Graphics, que muestra de forma

    representativa los dominios, motivos, etc.

    Graphics es una de las partes ms importantes de Pfam. Ya que en esta herramienta se

    muestra de una forma visual la estructura de una protena o una secuencia, indicando los

    dominios, motivos, etc.

    En la estructura de la protena del gen BRCA1 se pueden apreciar varios dominios. Cabe

    mencionar que en Pfam aparecen dos dominios relevantes que en Prosite no se haban

    indicado.

    La secuencia base, sin dominios ni otras caractersticas se muestra con una barra gris.

    Esta barra es proporcional a la longitud de la secuencia.

  • En Pfam-A, se pueden encontrar cuatro tipos de secuencias: familia, dominio, repeat y

    motivo.

    Cada uno tiene diferente simbologa; para el caso de la protena BRCA1:

    Zinc finger, C3CH4 type (RING finger) Es un motivo en

    la secuencia proteica, que para distinguirse de las familias

    y dominios, es representado por un rectngulo con las

    orillas rectas. Al no tener sus bordes en zig-zag indica que

    se encuentra su match de forma completa.

    BRCT_assoc: Dominio rico en serina, asociado

    con BRCT Se reconoce que es un dominio

    debido a sus bordes curveados, de igual forma se

    puede observar que es un match parcial ya que

    no incluye el final de la secuencia. Es por eso que

    se observa en una lnea zig-zag.

    EIN3: Insensibilidad al etileno 3 El match

    de este dominio se encuentra completo. Si

    se da click al dominio, se redirige a la pgina

    de familia del mismo.

    BRCT: BRCA 1 C dominio terminal BRCT El

    match de este dominio no incluye la primera

    posicin del HMM, por ello el extremo N terminal

    se muestra con un borde en zigzag. El dominio

    se encuentra repetido, como se observa en la

    imagen.

    Las regiones Pfam-B son clusters generados

    automticamente para suplementar las

    regiones Pfam-A. Se representan con

    rectngulos pequeos con tres lneas de

    colores. Motivos pequeos como pptidos de

    seal, regiones de baja complejidad, hlices

    superenrrolladas y regiones

    transmembranales se representan en Pfam.

    Los colores de cada uno son naranjas, cian,

    verde limn y rojo, respectivamente.

  • En la tabla se puede observar de forma resumida las caractersticas de los dominios,

    familias y motivos de la protena.

  • Features incluye caractersticas de la secuencia. En ellas se muestra una representacin

    grfica de la secuencia con los dominios y debajo de la imagen de Pfam se encuentran

    otras lneas. Estas lneas reflejan caractersticas en la secuencia que se encontraron en

    otras bases de datos como UniProt, InterPro, Superfamily, entre otros. Cuando la

    secuencia es muy larga se puede desplazar con las barras para observarla

    detalladamente de forma completa. Si se coloca el cursor sobre una de las lneas y en

    alguno de los fragmentos, se puede obtener informacin de esa parte de la secuencia.

    La pestaa de Sequence muestra la secuencia proteica obtenida con el nmero de

    acceso de UniProt.

  • En Interactions se muestran las interacciones de los dominios o familias, sin embargo, no

    muestra ninguna interaccin para BRCA1.

    En Structures se muestra una tabla que contiene la asignacin entre los dominios Pfam,

    UniProt y la estructura tridimensional correspondiente. (BRCA1). Para aquellas

    secuencias que tienen una estructura en The Bank Data Protein, se utiliza la asignacin

    entre UniProt, PDB y Pfam para coordinar los sistemas del grupo MSD, que permita

    mapear dominios Pfam en UniProt con estructuras tridimensionales.

    Se observa el nmero de

    acceso a PDB; se

    observa que para esta

    protena, se tienen varias

    estructuras definidas,

    pero solo para su dos

    dominios ms

    importantes: BRCT y

    zf_C3CH4

  • Al dar click en la secuencia sealada se despliega la informacin sobre esta estructura en

    particular.

    En la pestaa Summary se muestra informacin experimental de la protena, as como

    una imagen del modelo tridimensional de esta, y los links pertinentes a diferentes bases

    de datos.

    En la seccin de TreeFam se puede observar la filogentica de los genes; incluye genes

    ortlogos y parolgos. As como los dominios de las protenas.

    Se puede dar click en uno de los dominios, para poder estudiar especficamente a su

    familia.

    En este caso se da click sobre el dominio BRCT.

  • En la seccin de Summary se tienen 3 pestaas:

    La primera es una entrada de Wikipedia, la segunda es una entrada realizada por Pfam y

    la tercera es un link a la base de datos InterPro.

    En Domain organization se observan las organizaciones nicas de dominios o

    arquitectura en la que un dominio se encuentra. En este apartado se observa informacin

    como: Nmero de secuencias que la presentan, descripcin textual de la arquitectura, link

    a la pgina de Pfam donde se muestra la informacin sobre la secuencia que la grfica

    describe, descripcin de UniProt de la secuencia proteica, el nmero de residuos de la

    secuencia y la grfica Pfam.

  • En la seccin de Clan muestra el clan al que la familia pertenece. As como las otras

    familias que pertenecen a ste.

    En la seccin de Alignment se almacena una gama de diferentes alineamientos de

    secuencias para las familias. Si se da click en las palomas se puede visualizar el

    alineamiento almacenado deseado y disponible.

  • La seccin HMM logo permite visualizar los perfiles HMM, de una forma similar a la

    secuencia logo en Prosite. El tamao de la letra indicar la frecuencia con la que un

    aminocido determinado se encuentra en una posicin y el mismo perfil muestra los

    aminocidos ms conservados.

  • En la seccin de Trees se muestra el rbol filogentico para la alineacin de la simiente

    de esta familia.

  • La seccin de Curation and family details muestra la informacin detallada acerca de la

    familia Pfam.

    La seccin de Species distribution proporciona una representacin grfica sencilla de la

    distribucin de la familia a travs de especies.

  • En la pestaa de Interactions se muestra que la familia de la protena BRCT tiene dos

    interacciones.

    Y por ltimo en la seccin de Estructures muestra las estructuras disponibles para esta

    familia en PDB.

  • Por ltimo, se puede acceder a la pgina de informacin del clan del dominio estudiado,

    ya sea por medio de la navegacin entre otras pginas de informacin o directamente con

    el nmero de acceso del clan.

    La seccin de Clan contiene las mismas pestaas que cuando se revis, dominio y

    familia. En este caso la pestaa nueva es Relationships

    Relationships muestra la relacin entre miembros del clan. Los apareamientos de familias

    menos cercanas, con E-values entre 10-3 y 10-1 se muestran con una lnea punteada. Si

    uno pasa el cursor encima de algn cuadro, puede observar qu miembro est en ese

    punto.