genes

Upload: robertochoa3363

Post on 14-Jan-2016

22 views

Category:

Documents


0 download

DESCRIPTION

Descripción

TRANSCRIPT

  • EL GENOMA HUMANO

    El genoma humano es el material gentico caracterstico de la espe-cie humana (fig. 1)1. Bsicamente, el 99,9% de este material puedehallarse representado en el ADN (cido desoxirribonucleico) conte-nido en una sola clula humana. As, el genoma est constituido por23 pares de molculas de ADN. Cada molcula de ADN tiene unalongitud que oscila entre 50 y 250 millones de bases, y la suma de to-dos ellos es de 6.000 millones de bases en estado diploide o de 3.000millones en estado haploide (fig. 1). Tambin la informacin genti-ca que presentan las mitocondrias forma parte del genoma humano.El ADN mitocondrial humano consta de un solo filamento circularconstituido por 16.569 pares de bases (pb). En general, en cada c-lula hay varios cientos de mitocondrias, por lo que hay varios cientosde copias de ADN mitocondrial en cada clula.

    Para poder valorar lo que la cifra de 3 109 pb supone, es tilestablecer comparaciones. Si tuvisemos que escribir esta secuen-cia, llenaramos 200 guas de telfono de Barcelona (1.000 pginascada tomo). En cuanto a sus dimensiones lineales, si estirsemostodos los cromosomas de una sola clula y los dispusisemos uno acontinuacin del otro, la longitud sera de 2 m (el cromosoma mspequeo, el 21, medira 3 cm, y el ms grande, el 1, medira 16 cm).Pero el material gentico caracterstico de la especie humana no esslo este ADN presente en una sola clula, sino que hay que consi-derar, adems, la variacin gnica presente en los distintos indivi-duos. Aproximadamente una de cada 270 bases vara entre cada 2personas, por lo que para conocer la verdadera magnitud del geno-ma humano, a los 3.000 millones de bases hay que sumarle toda lavariacin gnica presente en la especie humana (fig. 1).

    Genoma humano y estructura bsica de los genesJ. Oriolaa y R. Olivab

    aServicio de Hormonologa. Centro de Diagnstico Biomdico. Hospital Clnic. Barcelona. bServicio de Gentica. Centro de Diagnstico Biomdico. Hospital Clnic. Institut dInvestigacions Biomdiques August Pi i Sunyer (IDIBAPS). Barcelona.

    CONTENIDO DE INFORMACIN Y NMERO DE GENES DEL GENOMA HUMANO

    La informacin gentica de la especie humana viene determinadapor la secuencia de las cuatro bases (adenina [A] guanina [G], cito-sina [C], y timina [T]) (fig. 1). La secuencia de estas bases de cadauno de nosotros (el genotipo) es lo que determina junto con el am-biente (dieta, exposicin fsica, aspectos sociales, etc.) lo que somos(el fenotipo). La molcula de ADN est formada por dos hebrasque se aparean perfectamente entre s gracias a que las bases soncomplementarias dos a dos (la A con la T, y la G con la C) (fig. 1).Cada vez que una clula humana se divide (proceso denominadomitosis), debe copiar toda esta informacin y a continuacin repar-tirla, en partes iguales, a cada clula hija. Este gigantesco trabajo sepuede incluso realizar en 1-2 h y no deben generarse errores decopia. De esta forma, se transmite exactamente la misma informa-cin gentica a cada una de las clulas hijas.

    Pero la informacin contenida en el genoma humano no se dis-tribuye de forma uniforme a lo largo de la secuencia, sino que seconcentra sobre todo en determinadas secuencias denominadasgenes (fig. 2). Los genes representan las unidades funcionales delgenoma y normalmente la informacin contenida en ellos sirve pa-ra dar lugar a protenas (figs. 2 y 3).

    Se supone que existen alrededor de 30.000-50.000 genes repartidosentre todos los cromosomas. Muchos de ellos ya son conocidos en de-talle, as como sus posiciones en el genoma, mientras que del resto sedispone de representaciones en las bases de datos. El primer cromo-soma humano en secuenciarse fue el cromosoma 22 y en l se halla-ron 545 genes y 134 seudogenes2. Estos ltimos son genes que contie-

    T E M A M O N O G R F I C OGENTICA BSICA (I)

    Composicin del genoma humano. El genoma humano es el material gentico caracterstico de la especie humana. Suele quedar representado co-mo la secuencia de las bases del ADN de los 22 cromosomas autosmicos ms los cromosomas sexuales X e Y presentes en una sola clula (cen-tro de la imagen). A su nivel ms elemental el genoma est compuesto por 4 bases distintas (A, G, C y T; derecha). A su nivel superior el genomadebe considerarse como la secuencia prototipo presente en una clula ms la variacin existente entre todos los individuos presentes en la hu-manidad (izquierda)1.

    Figura 1

    HumanidadPersonas: 5 x 109El genoma difiereen una de cada270 basesentre cada2 personas

    IndividuoClulas: 1013El genoma escasi idnticoentre las clulasde un individuo

    ClulaCromosomas: 23 paresPares de bases: 6 x 109(en estado diploide)+ genoma mitocondrial(16.569 pb)50.000-100.000 genes

    CromosomaMolculas deADN: 2Tamao:entre 5 x 107 pby 2,5 x 108 pb

    GenUnidad hereditariay funcional (conexcepciones)Tamao: entre 400y 2 x 106 pb

    ADNcido desoxirribonucleicoCompuesto por 4 tiposde bases distintas: adenina (A),guanina (G), citosina (C) ytimina (T). que se apareanentre s (A:T y G:C)En la secuencia de las basesse halla la informacingentica

  • nen aberraciones en su secuencia y que, por ello, no son expresadospor la maquinaria celular. Si partimos de que hay unos 40.000 genesfuncionales en total y que la mayora de genes tienen una longitud en-tre 3.000 y 10.000 pb, haciendo un simple clculo obtendremos queentre todos los genes se necesitan entre 120 y 400 millones de pb. Sisabemos que el genoma humano tiene alrededor de 3.000 millones, elresultado es que hay mucho ADN (alrededor del 87%) entre gen ygen que, aparentemente, no contiene informacin. Entre este ADNque aparentemente no contiene informacin, y a la luz de los resulta-

    dos obtenidos con la secuenciacin del geno-ma humano, se conoce hoy la existencia demultitud de seudogenes (por cada 4-5 genesfuncionales habra uno no funcional).

    No obstante, a medida que avanza el co-nocimiento sobre este ADN que separa alos genes, se van descubriendo posiblesfunciones. Por ejemplo, la secuencia del ex-tremo 5 de los genes (la secuencia anterioral inicio de la transcripcin) contiene infor-macin para la unin de factores de trans-cripcin especficos de cada gen. De hecho,estas regiones llamadas promotoras pue-den considerarse tambin como parte delos genes y pueden estar formadas por msde 3.000 pb. Dentro de cada gen, hay se-cuencias no codificantes (intrones), que for-man alrededor del 80-90% del gen (fig. 2).

    Adicionalmente, este ADN que separa alos genes, o el ADN presente en los intro-nes, podra tener la funcin de incrementarla frecuencia de recombinacin meiticaaumentando la generacin de combinacio-nes allicas en la especie humana.

    Otro tipo de secuencias no codificantes sonlas repetitivas. Estas secuencias se pueden dividir entre las repetidas entndem y las secuencias dispersas1. Las secuencias repetidas en tn-dem son caractersticas de la regin central de los cromosomas (centr-meros) y garantizan la correcta distribucin de los cromosomas en lasclulas hijas durante la divisin celular. En estas regiones hay muy po-cos genes. Tambin hay repeticiones en tndem en las regiones finalesde cada cromosoma (telmeros), los cuales ayudan a mantener la esta-bilidad y la individualidad de cada cromosoma durante la replicacin.Cada telmero est formado por 250-1.500 secuencias TTAGGG re-petidas3. No todos los tipos celulares presentan el mismo nmero derepeticiones, pngase como ejemplo a los cromosomas de los esperma-tozoides que son los que poseen los telmeros ms largos. Esta secuen-cia telomrica la poseen todos los vertebrados estudiados hasta ahora.Otras regiones repetidas en tndem corresponden a genes implicadosen la fabricacin de los ribosomas. stos se hallan repetidos cientos deveces en los brazos cortos de los cromosomas 13, 14, 15, 21 y 22.

    Entre las secuencias dispersas ms abundantes se hallan las se-cuencias Alu I (regiones que contienen la secuencia AGCT que esreconocida por la enzima de restriccin Alu I). Estas secuenciasaparecen repetidas cerca de un milln de veces en el genoma, conuna longitud cada una de 300-500 pb. Por s solas, estas regiones re-presentan alrededor del 6-8% del genoma humano1. Hay teorasque intentan explicar la presencia de estas regiones Alu I, pero nin-guna de ellas ha sido hasta ahora aceptada de forma general. Otrotipo de secuencias dispersas son las denominadas microsatlites.Estas secuencias se hallan ms o menos distribuidas uniformemen-te dentro del genoma y son hipervariables o polimrficas. En estosmomentos no se les conoce funcin alguna, aunque s son de granayuda en diagnstico e investigacin (p. ej., estudios de ligamiento,paternidades, prdida de heterozigosidad, etc. (vase captulosHerramientas bsicas de anlisis gentico de este monogrfico).

    ESTRUCTURA BSICA DE LOS GENES. INTRONES Y EXONES

    La unidad bsica de informacin gentica es el gen (fig. 2). Un gense puede definir como una regin (fsica) del ADN cuya secuencia

    Estructura de un gen eucariota y principales procesos de expresin gnica. Se representaun gen con 3 exones y 2 intrones. Su transcripcin da lugar al ARN trnscrito primario quees procesado para preparar su extremo 3 y eliminar los intrones (splicing). Finalmente, losARN mensajeros son traducidos por el ribosoma para dar lugar a la protena correspondien-te (vase la fig. 3 para el detalle molecular de la clave de la traduccin proteica a travs delcdigo gentico). La regulacin de estos procesos de expresin gnica se trata en el segundocaptulo de este monogrfico.

    Figura 2

    ADN genmico

    Regin promotora Exn 1 Intrn 1 Exn 2 Intrn 2 Exn 3

    ARN trnscritoprimario

    ARN mensajero5 UTR

    Protena NH2 COOH

    Regincodificante

    3 UTRPoly-A

    Intrones

    3

    3

    5

    5

    AUG UGA

    Transcripcin

    Procesamientodel ARN (y poliadenilacin)

    Traduccin

    Transmisin de la informacin del ADN al ARNmensajero (ARNm)y su decodificacin a travs del cdigo gentico. La transcrip-cin de la cadena antisentido del ADN da lugar a un ARNm (consentido). La transmisin de la informacin del ADN al ARN seproduce por complementariedad de las bases correspondientes(T-A, A-U, C-G, G-C). La clave del cdigo gentico consiste en quea cada aminocido le corresponde uno o varios triplete de basescaractersticos (vase tabla I). La sntesis proteica tiene lugaren el ribosoma en donde se van incorporando los distintosARNt-aminocido aparendose perfectamente al siguiente tri-plete libre en el ARNm. En el ribosoma tiene lugar el enlace co-valente (enlace peptdico) entre los distintos aminocidos paradar lugar a la protena correspondiente.

    Figura 3

    ADN

    ARNm

    ARNm

    ARNE

    Metionin

    aAlanin

    a ArgininaTirosina

    Ribosoma

    3

    5

    3

    35

    5

    5

    3

    Sntesis de protena

    Genoma humano y estructura bsica de los genesJ. Oriola y R. Oliva

    T E M A M O N O G R F I C OGENTICA BSICA (I)

  • Cdigo gentico

    UUU Fenilalanina (Phe, F) UCU Serina (Ser, S) UAU Tirosina (Tyr, Y) UGU Cistena (Cys, C)UUC UCC UAC UGC UUA Leucina (Leu, L) UCA UAA Stop UGA StopUUG UCG UAG Stop UGG Triptfano (Trp, W)CUU Leucina (Leu, L) CCU Prolina (Pro, P) CAU Histidina (His, H) CGU Arginina (Arg, R)CUC CCC CAC CGC CUA CCA CAA Glutamina (Gln, Q) CGA CUG CCG CAG CGG AUU Isoleucina (Ile, I) ACU Treonina (Thr, T) AAU Asparagina (Asn, N) AGU Serina (Ser, S)AUC ACC AAC AGC AUA ACA AAA Lisina (Lys, K) AGA Arginina (Arg, R)AUG Metionina (Met, M) ACG AAG AGG GUU Valina (Val, V) GCU Alanina (Ala, A) GAU Asprtico (Asp, D) GGU Glicina (Gly, G)GUC GCC GAC GGC GUA GCA GAA Glutmico (Glu, E) GGA GUG GCG GAG GGG

    Se indica el aminocido codificado por cada triplete. Entre parntesis se indican tambin las dos posibles abreviaciones empleadas para cada aminocido. El cdigo gentico pre-sentado corresponde al del genoma nuclear. El cdigo gentico para el genoma mitocondrial, para bacterias y para algunos organismos inferiores difiere en determinados codonesrespecto al cdigo presentado aqu.

    TABLA I

    de bases contiene informacin para dar lugar a una unidad trans-cripcional con sus diversas secuencias reguladoras asociadas. El ta-mao de los genes oscila entre los 500 pb del gen de la protamina4(uno de los ms pequeos) y los 3 millones de pb del gen de la dis-trofina5 (uno de los ms grandes), aunque por trmino medio po-seen alrededor de 3.000-10.000 pb6,7. Otras caractersticas impor-tantes de los genes es que poseen polaridad 5-3, esto es, el gen selee en sentido 5-3 y no al revs (figs. 2 y 3). Tambin cabe sealarque en la regin anterior al inicio del primer exn existe la reginpromotora (fig. 2). A esta regin del ADN se unen factores detranscripcin, ya sean especficos o generales (vase captulo 2 deeste monogrfico, especfico para los aspectos de regulacin de laexpresin gnica).

    Los primeros genes que se estudiaron fueron los bacterianos.En ellos, cuando se sintetiza el ARN mensajero (ARNm) se obser-va el mismo orden de nucletidos que posee el ADN, teniendo encuenta que en el ARN la timina (T) es sustituida por el uracilo (U)(fig. 3). Cuando se empezaron a estudiar los genes en eucariotas,se consider que tendran estructuras parecidas. Pronto se com-prob que no era as. Los genes que se hallan en organismos euca-riotas poseen intrones (fig. 2). Los intrones son los segmentos deADN que no estn presentes en el ARNm y, por tanto, no se tra-ducen en aminocidos. Los intrones constituyen el 85-95% de lasecuencia nucleotdica de un gen, es decir, slo una pequea partede la secuencia de un gen pasa a ARNm. En la mayora de casos,se desconoce la funcin de los intrones. Tan slo sus extremos (al-rededor de 4 o 5 pb) participan de una forma muy importante enla maduracin del ARNm. En algunos genes, no obstante, se hanhallado regiones reguladoras que se hallan dentro de los intrones.

    Como casos puntuales que ayudan a entender la gran diversidadestructural de los genes, cabe mencionar al gen que codifica parala enzima 21-hidroxilasa (CYP21), y al gen de la tenascina-XB, am-bos superpuestos en sus extremos 3 terminales6. Uno se transcribede izquierda a derecha y el otro de derecha a izquierda. Otroejemplo curioso es el caso del gen NF-1, el cual posee 3 genes pe-queos en su zona intrnica.

    TRANSMISIN DE LA INFORMACIN GENTICADEL ADN A LAS PROTENAS

    El primer paso en la transmisin de la informacin gentica pre-sente en el ADN a las protenas es la copia de esta informacin auna molcula intermediaria denominada ARNm (figs. 2 y 3)8. Lainformacin contenida en la secuencia de bases del ADN se trans-mite fielmente al ARNm gracias al apareamiento de las bases delADN con las bases de ARN (la T se aparea con la A del ARN, la A

    se aparea con el uracilo [U] del ARN, la G se aparea con la C, y laC se aparea con la G) (fig. 3). La sntesis del ARNm corre a cargode la ARN polimerasa, utilizando como molde la secuencia de ba-ses presente en el ADN (figs. 2 y 3). Al ARN recin sintetizado sele denomina trnscrito primario (fig. 2). Este trnscrito primarioexperimenta un proceso de maduracin consistente en la elimina-cin de los intrones y el procesado del extremo 3 (fig. 2) dando lu-gar al ARNm maduro8.

    La informacin gentica presente en el ARNm se transmite alas protenas gracias a la existencia de un proceso de traduccin dela informacin (fig. 3). El cdigo de traduccin de esta informa-cin se denomina cdigo gentico, y esencialmente consiste enque a cada 3 bases concretas de la secuencia del ARN mensajerole corresponde un aminocido (tabla I). Las protenas se iniciansiempre con el aminocido metionina codificado por el tripleteAUG (tabla I y fig. 3). La sntesis proteica corre a cargo del riboso-ma (fig. 3). Las molculas clave en la traduccin de la informacingentica son los ARN de transferencia, ya que poseen la propiedadde aparearse especficamente a los distintos tripletes existentes enel ARN. Antes de que se produzca esta unin, cada ARN de trans-ferencia se ha acoplado al aminocido correspondiente al triplete(fig. 3). La sntesis proteica consiste precisamente en la unin co-valente entre los distintos aminocidos que se van apareando alARNm (fig. 3). La sntesis proteica termina siempre que el riboso-ma se encuentra con uno de los codones de terminacin (TGA,TAG, TAA; tabla I). As pues, la informacin gentica presente enel ADN se transmite, a travs del ARNm, a las protenas en formade la secuencia de aminocidos. Las protenas, a su vez, desempe-arn la mayora de las funciones celulares (figs. 2 y 3).

    Bibliografa1. Oliva R. Genoma humano. Barcelona: Masson S.A., 1996.2. Dunham I, Shimizu N, Roe BA, Chissoe S, Hunt AR, Collins JE et al. The

    DNA sequence of human chromosome 22. Nature 1999; 402: 489-495. 3. Moyzis RK, Buckingham JM, Scott Cram L, Dani M, Deaver LL, Jones MD et

    al. Highly conserved repetitive DNA sequence (TTAGGG)n, present at telome-res of human chromosomes. Proc Natl Acad Sci USA 1988; 85: 6622-6626.

    4. Oliva R, Dixon GH. Vertebrate protamine genes and the histone to protaminereplacement reaction. Prog Nucl Acids Res Mol Biol 1991; 40: 25-94.

    5. Tennyson CN, Klamut HS, Worton RG. The human dystrophin gene requires16 hours to be transcribed and is cotranscriptionally spliced. Nat Genet 1995; 9:184-190.

    6. Oriola J. Diagnstico molecular de los dficit de 21-hidroxilasa y su correlacincon el fenotipo. Endocrinologa 46: 168-172.

    7. Vidal-Taboada JM, Sanz S, Egeo A, Scartezzini P, Oliva R. Identification andcharacterization of a new gene from human chromosome 21 between markersD21S343 and D21S268 encoding a leucine rich protein. Biochem and BiophysRes Comm 1998; 250: 547-554.

    8. Watson JD, Hopkins NH, Roberts JW, Steitz JA, Weiner AM. Molecular bio-logy of the gene. Menlo Park: Benjamin/Cummings, 1987.

    Genoma humano y estructura bsica de los genesJ. Oriola y R. Oliva

    T E M A M O N O G R F I C OGENTICA BSICA (I)