pfam
DESCRIPTION
Bases de datos bionformáticas de proteínas.TRANSCRIPT
-
UNIVERSIDAD NACIONAL AUTNOMA DE
MXICO
FACULTAD DE ESTUDIOS SUPERIORES CUAUTITLN
DEPARTAMENTO-CIENCIAS BIOLGICAS
SECCIN-BIOQUMICA Y FARMACOLOGA HUMANAS
LIC. BIOQUMICA DIAGNSTICA
Bioinformtica
Pfam
Grupo: 2001
Medina Velzquez Laura Quetzally 412063619
Profesora:
M. en C. Maritere Domnguez Rojas
p.BQD Larisa Andrea Gonzlez Salcedo
-
Pfam es una base de datos de familias de protenas que incluye sus anotaciones y
alineamientos de mltiples secuencias.
En la pgina principal de Pfam se puede observar la siguiente pantalla.
A continuacin se explicarn cada una de los diferentes links de entrada.
1
2
3
4
5
6
-
1
En el primer link se puede buscar una secuencia en
especfico. Al dar click en Go Pfam muestra los
dominios que tiene la secuencia introducida. En
este caso muestra 4 dominios diferentes; sin
embargo, debido a que ya se ha estudiado esta
secuencia anteriormente; se da click en los
dominios correspondientes a los dedos de zinc y al
dominio BRCT. Al hacerlo se accede a la pgina de
cada una de las familias de dominios
seleccionados.
-
En el siguiente link se puede buscar por familias de protenas.
El siguiente link da la opcin de buscar por clanes; sin embargo, como en este caso se
desconoce el clan al que pertenece alguno de los dos dominios de la protena del BRCA1;
se dar click en la opcin de browse, es decir, navegar a travs de una lista de clanes.
2
En este caso se busca
directamente por la familia
del dominio BRCT y se
obtiene como resultado la
misma entrada que en la
anterior forma de bsqueda.
3
-
Al dar click en el link se muestra la pgina del clan. En sta se observa que al clan solo
pertenecen dos familias de dominios: BRCT y PTCB-BRCT.
Los links view a sequense y view a estructure Van a permitir buscar la informacin de
los dominios de una secuencia proteica utilizando indicadores de secuencia o nmeros de
acceso y encontrar los dominios de una estructura de PDB mediante el identificador PDB,
respectivamente.
4
5
Secuencia obtenida de
UniProt.
Secuencia obtenida
de Protein Data Bank
-
El siguiente link Keyword search permite encontrar toda la informacin relacionada con
una palabra clave especfica.
En la seccin Jump to Se puede introducir cualquier nmero de acceso o ID para
acceder a la pgina correspondiente, ya sea de la familia Pfam, del clan, de la secuencia
UniProt, estructura de PDB.
En este caso, se escribir el nmero de acceso de UniProt para la protena de
susceptibilidad al cncer de mama; la cual ya se ha revisado en numerosas ocasiones
anteriores.
6
-
Para poder entender toda la informacin arrojada es necesario explicar algunas
caractersticas.
Architecture: Es la combinacin de dominios presentes en una protena.
Sequence: Se refiere a la secuencia de aminocidos que contiene esta protena.
Interactions: Indica las interacciones que pueden tener los dominios de esta
protena con otros dominios.
Varios de estos enlaces, son los mismos a los que se tienen en el men izquierdo. Solo
que se muestran de forma grfica en la parte superior derecha. La seccin de Summary y
Features, se explicaran a continuacin.
Summary se encuentra divida en dos secciones. La primera es un resumen de la entrada
de donde se obtuvo la protena, en este caso de UniProt. Aqu se observa informacin
como descripcin de la protena, organismo fuente y longitud de la protena.
La seccin de Pfam domains contiene una tabla con las caractersticas ms relevantes,
de la estructura proteica, as como el formato Graphics, que muestra de forma
representativa los dominios, motivos, etc.
Graphics es una de las partes ms importantes de Pfam. Ya que en esta herramienta se
muestra de una forma visual la estructura de una protena o una secuencia, indicando los
dominios, motivos, etc.
En la estructura de la protena del gen BRCA1 se pueden apreciar varios dominios. Cabe
mencionar que en Pfam aparecen dos dominios relevantes que en Prosite no se haban
indicado.
La secuencia base, sin dominios ni otras caractersticas se muestra con una barra gris.
Esta barra es proporcional a la longitud de la secuencia.
-
En Pfam-A, se pueden encontrar cuatro tipos de secuencias: familia, dominio, repeat y
motivo.
Cada uno tiene diferente simbologa; para el caso de la protena BRCA1:
Zinc finger, C3CH4 type (RING finger) Es un motivo en
la secuencia proteica, que para distinguirse de las familias
y dominios, es representado por un rectngulo con las
orillas rectas. Al no tener sus bordes en zig-zag indica que
se encuentra su match de forma completa.
BRCT_assoc: Dominio rico en serina, asociado
con BRCT Se reconoce que es un dominio
debido a sus bordes curveados, de igual forma se
puede observar que es un match parcial ya que
no incluye el final de la secuencia. Es por eso que
se observa en una lnea zig-zag.
EIN3: Insensibilidad al etileno 3 El match
de este dominio se encuentra completo. Si
se da click al dominio, se redirige a la pgina
de familia del mismo.
BRCT: BRCA 1 C dominio terminal BRCT El
match de este dominio no incluye la primera
posicin del HMM, por ello el extremo N terminal
se muestra con un borde en zigzag. El dominio
se encuentra repetido, como se observa en la
imagen.
Las regiones Pfam-B son clusters generados
automticamente para suplementar las
regiones Pfam-A. Se representan con
rectngulos pequeos con tres lneas de
colores. Motivos pequeos como pptidos de
seal, regiones de baja complejidad, hlices
superenrrolladas y regiones
transmembranales se representan en Pfam.
Los colores de cada uno son naranjas, cian,
verde limn y rojo, respectivamente.
-
En la tabla se puede observar de forma resumida las caractersticas de los dominios,
familias y motivos de la protena.
-
Features incluye caractersticas de la secuencia. En ellas se muestra una representacin
grfica de la secuencia con los dominios y debajo de la imagen de Pfam se encuentran
otras lneas. Estas lneas reflejan caractersticas en la secuencia que se encontraron en
otras bases de datos como UniProt, InterPro, Superfamily, entre otros. Cuando la
secuencia es muy larga se puede desplazar con las barras para observarla
detalladamente de forma completa. Si se coloca el cursor sobre una de las lneas y en
alguno de los fragmentos, se puede obtener informacin de esa parte de la secuencia.
La pestaa de Sequence muestra la secuencia proteica obtenida con el nmero de
acceso de UniProt.
-
En Interactions se muestran las interacciones de los dominios o familias, sin embargo, no
muestra ninguna interaccin para BRCA1.
En Structures se muestra una tabla que contiene la asignacin entre los dominios Pfam,
UniProt y la estructura tridimensional correspondiente. (BRCA1). Para aquellas
secuencias que tienen una estructura en The Bank Data Protein, se utiliza la asignacin
entre UniProt, PDB y Pfam para coordinar los sistemas del grupo MSD, que permita
mapear dominios Pfam en UniProt con estructuras tridimensionales.
Se observa el nmero de
acceso a PDB; se
observa que para esta
protena, se tienen varias
estructuras definidas,
pero solo para su dos
dominios ms
importantes: BRCT y
zf_C3CH4
-
Al dar click en la secuencia sealada se despliega la informacin sobre esta estructura en
particular.
En la pestaa Summary se muestra informacin experimental de la protena, as como
una imagen del modelo tridimensional de esta, y los links pertinentes a diferentes bases
de datos.
En la seccin de TreeFam se puede observar la filogentica de los genes; incluye genes
ortlogos y parolgos. As como los dominios de las protenas.
Se puede dar click en uno de los dominios, para poder estudiar especficamente a su
familia.
En este caso se da click sobre el dominio BRCT.
-
En la seccin de Summary se tienen 3 pestaas:
La primera es una entrada de Wikipedia, la segunda es una entrada realizada por Pfam y
la tercera es un link a la base de datos InterPro.
En Domain organization se observan las organizaciones nicas de dominios o
arquitectura en la que un dominio se encuentra. En este apartado se observa informacin
como: Nmero de secuencias que la presentan, descripcin textual de la arquitectura, link
a la pgina de Pfam donde se muestra la informacin sobre la secuencia que la grfica
describe, descripcin de UniProt de la secuencia proteica, el nmero de residuos de la
secuencia y la grfica Pfam.
-
En la seccin de Clan muestra el clan al que la familia pertenece. As como las otras
familias que pertenecen a ste.
En la seccin de Alignment se almacena una gama de diferentes alineamientos de
secuencias para las familias. Si se da click en las palomas se puede visualizar el
alineamiento almacenado deseado y disponible.
-
La seccin HMM logo permite visualizar los perfiles HMM, de una forma similar a la
secuencia logo en Prosite. El tamao de la letra indicar la frecuencia con la que un
aminocido determinado se encuentra en una posicin y el mismo perfil muestra los
aminocidos ms conservados.
-
En la seccin de Trees se muestra el rbol filogentico para la alineacin de la simiente
de esta familia.
-
La seccin de Curation and family details muestra la informacin detallada acerca de la
familia Pfam.
La seccin de Species distribution proporciona una representacin grfica sencilla de la
distribucin de la familia a travs de especies.
-
En la pestaa de Interactions se muestra que la familia de la protena BRCT tiene dos
interacciones.
Y por ltimo en la seccin de Estructures muestra las estructuras disponibles para esta
familia en PDB.
-
Por ltimo, se puede acceder a la pgina de informacin del clan del dominio estudiado,
ya sea por medio de la navegacin entre otras pginas de informacin o directamente con
el nmero de acceso del clan.
La seccin de Clan contiene las mismas pestaas que cuando se revis, dominio y
familia. En este caso la pestaa nueva es Relationships
Relationships muestra la relacin entre miembros del clan. Los apareamientos de familias
menos cercanas, con E-values entre 10-3 y 10-1 se muestran con una lnea punteada. Si
uno pasa el cursor encima de algn cuadro, puede observar qu miembro est en ese
punto.