naturaleza molecular del gen y el genoma

NATURALEZA MOLECULAR DEL GEN Y EL GENOMA

EL CONCEPTO DE GEN

El genoma es el conjunto de genes de una especie. Pero ¿qué es un gen? En principio es una unidad informativa discreta, responsable de una característica transmisible, El color de ojos, la textura de la semilla, la longitud del tallo. Este es el concepto mendeliano del gen, acuñado en el siglo XIX, cuando aún se desconocía su verdadera naturaleza química. Esta definición del gen sigue siendo útil en determinado contexto, con la salvedad de que hoy identificamos a dicha unidad de información con un fragmento de ADN localizado en determinado lugar de un cromosoma. Una segunda concepción del gen surgió cuando los genetistas demostraron de forma concluyente que los genes especifican la estructura de las proteínas individuales. A principios de los años 1950 se llegó a conocer la secuencia de aminoácidos de la proteína insulina y se descubrió que cada proteína consiste en una secuencia de aminoácidos típica, de la cual, se supuso, dependerían sus propiedades. Al mismo tiempo se correlacionaron mutaciones (alteraciones en la secuencia de nucleótidos del ADN) con alteraciones de la secuencia de aminoácidos en las proteínas. Resultó evidente que la secuencia del ADN especifica, mediante algún código, la secuencia proteica. Un gen es, entonces, una secuencia de ADN con la información necesaria para la síntesis de una proteína particular.

Dado que el ADN es una molécula relativamente inerte, su información se expresa indirectamente, a través de otras moléculas. El ADN dirige la síntesis de proteínas y éstas determinan las características físicas y químicas de la célula.

Como ya adelantáramos, las instrucciones genéticas contenidas en el ADN se expresan en dos pasos. El primero de ellos, la transcripción, consiste en la síntesis de ARN a partir del ADN. El ARN contiene toda la información de la secuencia de bases del ADN de la que ha sido copiado. El segundo paso de la expresión genética es la traducción, momento en el cual el ARN ejecuta las instrucciones recibidas cristalizándolas en la síntesis de una proteína específica.

Existen diversos tipos de ARN: el ARNm (mensajero), el ARNr (ribosómico), el ARNt (de transferencia) y los ARN pequeños. De todos ellos, tan sólo el ARNm es portador de información acerca de la secuencia aminoacídica de una proteína; sin embargo todos ellos son transcriptos de ADN. Por lo tanto, resulta necesario revisar la segunda definición del gen.

Hoy se acepta que un gen es una secuencia de ADN transcripta que genera un producto con función celular específica.

Cabe aclarar, no obstante, que esta definición no es completamente satisfactoria, en la medida en que existen regiones reguladoras de los genes, que no se transcriben, y otras regiones (llamadas intrones) que se transcriben pero se eliminan sin cumplir ninguna función aparente.

LA ORGANIZACIÓN DEL GENOMA

Con la excepción de ciertos virus, que contienen un genoma de ARN, el resto de los genomas utiliza el ADN como depositario de la información genética.

Sin embargo, debemos señalar algunas diferencias significativas en cuanto a la organización del genoma en procariontes y eucariontes.

· En primer lugar, el ADN procarionte se presenta como una única molécula circular, en tanto el ADN eucarionte es de estructura lineal. Además las células eucariotas poseen usualmente más de una molécula de ADN en sus núcleos. Cada molécula corresponde a un cromosoma, cuyo número es constante para todas las células de una misma especie (con excepción de las gametas).

· El ADN eucarionte, por otro lado, se halla asociado íntimamente a diferentes proteínas, entre las cuales las histonas juegan el papel más importante en lo que respecta al empaquetamiento del ADN. Esta asociación a histonas no se verifica en el ADN procarionte, por lo cual se lo ha denominado “ADN desnudo”.

En las células eucariotas los cromosomas están confinados en el compartimiento nuclear, donde tiene lugar la

transcripción, mientras que la traducción se localiza en el citoplasma; por lo tanto, ambos procesos se encuentran separados espacial y temporalmente. Esto permite que los transcriptos de ARN experimenten en el núcleo un proceso de maduración previo a la traducción. En las células procariotas, donde no existe la envoltura nuclear, el ADN está en contacto directo con el citosol, y los procesos de transcripción y traducción no se hallan separados en espacio ni en tiempo. Los ARNs no son sometidos a modificaciones postranscripcionales.

· Los eucariontes tienen genomas mucho más grandes que los procariontes. Aunque el valor C (cantidad haploide de ADN de una especie) es muy variable entre los mismos eucariontes (ver tabla 1), es siempre notablemente mayor que el de los procariontes. No necesariamente un mayor valor C refleja una mayor complejidad genética (véase en tabla 11.1 valores de Salamandra y Homo sapiens).

· En los procariontes se da una máxima economía de información: en casi todos los casos cada cromosoma contiene una sola copia de cualquier gen particular, y, con excepción de las secuencias reguladoras y señaladoras, prácticamente se expresa todo el ADN. En cambio, en toda célula eucariota parecería haber un gran exceso de ADN, o por lo menos de ADN cuyas funciones se desconocen por completo. Por ejemplo, la estimación del ADN “innecesario” en los seres humanos llega a ser tan elevada como el 95% del genoma.

EL CÓDIGO GENÉTICO

Hemos visto que los genes son segmentos de ADN situados en los cromosomas, que se comportan como unidades de transcripción. Hemos señalado también que muchos de los ARN transcriptos son productos celulares finales con función propia (al margen de las modificaciones postranscripcionales que requieran para completar su maduración), es decir que,

en alguna medida, la transcripción es un paso terminal de la expresión de ciertos genes. Sin embargo, sabemos que muchos otros genes contienen la información necesaria para especificar la secuencia de aminoácidos de las tantas proteínas que una célula es capaz de sintetizar. En estos casos, la transcripción es tan sólo el primer paso de la expresión genética. Los ARN obtenidos, ARN mensajeros, son, como su nombre lo indica, meros transportadores de información que aún debe ser decodificada, información que debe traducirse en la síntesis de una proteína. La traducción es el segundo paso de la expresión genética.

Fig. 11.1 - Flujo de información genética

Muchas de las características del código genético fueron anticipadas en forma teórica a partir del descubrimiento del ARNm. Pero en el año 1961, Nirenberg y Matthaei desarrollaron una técnica que abrió el camino para que en los siguientes cuatro años el código genético fuera enteramente descifrado.

Podemos pensar al código genético como un idioma. Los idiomas utilizan una cierta cantidad de letras, éstas se combinan para formar palabras, y cada palabra tiene un significado, designa a un objeto particular. En el código genético están presentes todos estos elementos: las letras son las 4 bases que forman las cadenas de ARN (A, U, C, G); las palabras son siempre agrupaciones de 3 letras o tripletes de bases, llamadas codones en la molécula del ARNm, y los objetos designados por dichas palabras son cada uno de los 20 aminoácidos que componen las proteínas.

La tabla del código que se halla a continuación es válida para los seres vivos más diversos: el hombre, las bacterias, las levaduras, las plantas. El código genético es universal, lo cual da prueba de que todos los organismos comparten un mismo origen. Una de las contadas excepciones a la universalidad del código es el ADN mitocondrial, en el cual algunos codones son leídos de manera diferente.

TABLA 11.2 - Código genético SEGUNDA LETRA

U C A G

PRIMERA

LETRA

U UUU

fenilalanina

UUC

fenilalanina

UUA leucina

UUG leucina

UCU

serina

UCC serina

UCA

serina

UCG serina

UAU

tirosina

UAC

tirosina

UAA stop

UAG stop

UGU

cisteína

UGC

cisteína

UGA stop

UGG

triptófano

U

C

A

G

TERCERA

LETRA

C CUU leucina CCU

prolina

CAU

histidina

CGU

arginina

U

CUC leucina

CUA leucina

CUG leucina

CCC

prolina

CCA

prolina

CCG

prolina

CAC

histidina

CAA

glutamina

CAG

glutamina

CGC

arginina

CGA

arginina

CGG

arginina

C

A

G

A AUU

isoleucina

AUC

isoleucina

AUA

isoleucina

AUG

metionina

ACU

treonina

ACC

treonina

ACA

treonina

ACG

treonina

AAU

asparagina

AAC

asparagina

AAA lisina

AAG lisina

AGU serina

AGC serina

AGA

arginina

AGG

arginina

U

C

A

G

G GUU valina

GUC valina

GUA valina

GUG valina

GCU

alanina

GCC

alanina

GCA

alanina

GCG

alanina

GAU

aspartato

GAC

aspartato

GAA

glutamato

GAG

glutamato

GGU glicina

GGC glicina

GGA glicina

GGG glicina

U

C

A

G

Características del Código Genético

El código genético consta de 64 codones o tripletes de bases.61 codones codifican aminoácidos. 3 codones funcionan como señales de terminación. El código no es ambiguo, pues cada codón especifica a un solo aminoácido. El código es degenerado, ya que un aminoácido puede estar codificado por diferentes codones. Es universal, debido a que sus mensajes son interpretados de la misma forma por todos los organismos.

Utiliza un marco de lectura establecido al inicio de la traducción y no lo modifica. No se produce solapamiento de codones.

EL PROCESO DE LA TRANSCRIPCIÓN

La transcripción consiste en la síntesis de ARN a partir de un molde de ADN.

A continuación realizaremos una descripción general del proceso de transcripción tomando en cuenta los aspectos comunes a la síntesis de los distintos tipos de ARN.

La transcripción, tanto en células procariotas como eucariotas, involucra la participación de una enzima ARN polimerasa ADN dependiente. Ésta sintetiza una cadena de ARN cuyos inicio, terminación y secuencia de bases vienen determinados por el propio gen.

El primer paso de la transcripción es la unión de la enzima ARN polimerasa a una región del gen llamada promotor. El promotor es una secuencia específica de bases con alta afinidad por la enzima, por lo que proporciona a la misma su sitio de unión al ADN. Es asimismo una señal que indica cuál cadena se ha de transcribir. La transcripción es asimétrica, pues usualmente sólo se transcribe una de las dos cadenas que forman cada gen. La cadena que actúa como plantilla es la cadena molde, negativa o no codificante; la hebra no transcripta, complementaria de la anterior, se denomina antimolde, positiva o codificante. La ARN polimerasa se desplaza sobre la cadena molde, recorriéndola en dirección 3’ => 5’ o “río abajo” y transcribiéndola a partir del nucleótido que el promotor señala como punto de inicio de la transcripción. Este nucleótido se nombra +1 y los siguientes, río abajo, siguen la numeración correlativa (+2, +3, etc.). Partiendo desde el

punto de inicio en la dirección contraria, es decir “río o corriente arriba”, los nucleótidos se numeran –1, -2, etc.

La ARN polimerasa sólo puede desplazarse y transcribir si previamente la doble hélice sufre un desenrollamiento y fusión (separación de las cadenas complementarias por ruptura de los puentes de hidrógeno entre las bases). La misma enzima cataliza ambos procesos, generando hacia el extremo 3´ una burbuja de transcripción, un tramo de aproximadamente 12 nucleótidos de longitud, en el cual las cadenas permanecen desapareadas. La burbuja de transcripción aparenta avanzar río abajo junto con la enzima, pues a medida que progresa la fusión por delante de ella, la doble hélice se recompone por detrás.

La formación de la burbuja causa una supertorsión o superenrollamiento de la doble hélice en los sectores ubicados hacia el extremo 5’ del molde. Este fenómeno es corregido por la acción de una enzima topoisomerasa I.

Fig. 11.3 - Burbuja de transcripción

Cuando el molde ya ha sido desapareado en la burbuja de transcripción y expone sus bases, éstas son reconocidas por la ARN polimerasa. A medida que la enzima “lee” la plantilla, coloca junto a cada base de la misma el ribonucleótido trifosfato portador de la base complementaria. A los desoxirribonucleótidos de A, T, C y G se le aparean, respectivamente, los ribonucleótidos de U (recordemos que el ARN no contiene T), A, G y C mediante puentes de hidrógeno. Una vez ubicados los dos primeros ribonucleótidos, la enzima cataliza la formación del puente fosfodiéster entre ambos, iniciándose la cadena de ARN.

Fig. 11.4 - Dirección de la transcripción

El enlace fosfodiéster se produce entre el hidroxilo en posición 3’ del primer nucleótido y el grupo fosfato interno, en posición 5’, del segundo. Un grupo pirofosfato de este último es liberado como producto y escindido rápidamente en dos fosfatos por la acción de una pirofosfatasa. Dicha ruptura es tan exergónica que la reacción inversa se torna prácticamente imposible. Así, desde el punto de vista termodinámico, se favorece la síntesis de la nueva cadena. Por lo tanto, son los mismos sustratos los que, por estar trifosfatados, aportan la energía necesaria para su polimerización.

Fig. 11.5 - Incorporación de ribonucleótidos en el extremo 3' de ARN

Este procedimiento se repite tantas veces como nucleótidos contenga el molde, de tal manera que el ARN va creciendo en forma antiparalela a aquél, es decir, desde su extremo 5’ (el que quedó libre en el primer nucleótido) hasta su extremo 3’ (que quedará libre en el último nucleótido añadido). La dirección de la síntesis del ARN es 5´ => 3´.

Siempre los nucleótidos recién incorporados al ARN forman una hélice corta ARN-ADN con su plantilla. Esta hélice híbrida es transitoria, pues conforme el polímero se alarga por su extremo 3’, el extremo 5’ se separa del molde, el cual vuelve a emparejarse con su hebra de ADN complementaria.

La transcripción concluye cuando la ARN polimerasa alcanza una señal (una secuencia específica de bases del ADN) que actúa como señal de terminación.

El producto obtenido, un ARN transcripto primario, resulta una copia complementaria y antiparalela de una región del gen comprendida entre el punto de inicio y la señal de terminación.

Fig. 11.6- ARN en distintos estadios de transcripción sobreel mismo gen

El transcripto primario repite la dirección y la secuencia (excepto porque lleva U en vez de T) de la hebra no copiada o antimolde, lo que justifica que a esta última se apliquen las denominaciones de hebra positiva o codificante. Es la cadena convencionalmente elegida para representar un gen.

Cabe aclarar que al describir la transcripción en forma general, hemos omitido la mención de regiones reguladoras de los genes, bajo cuyo control se encuentran los acontecimientos analizados. Este aspecto del tema será desarrollado más adelante en el mismo capítulo.

Los requisitos de la transcripción:

• Una molécula de ADN molde, con región promotora, que indica el inicio de la transcripción, con secuencia de

terminación, que marca el fin del proceso, y un segmento que será expresado.

• Una enzima ARN polimerasa que:

-reconoce las secuencias señalizadoras,

-abre la hélice,

-lee el molde (de 3´a 5´),

-reconoce y ubica los sustratos complementarios,

-polimeriza los sustratos(de 5´a 3´).

• Cofactores enzimáticos de la ARN polimerasa: Mg++ o Mn++.

• Sustratos: UTP, ATP, GTP Y CTP.

• Una fuente de energía: los mismos sustratos.

• Una pirofosfatasa.

• Una topoisomerasa I.

A partir de distintos genes se transcriben diferentes clases de ARN: ARN mensajero(ARNm),ARN

de transferencia(ARNt),ARN ribosómico(ARNr),ARN pequeños nucleares y citoplasmáticos

(ARNpn/ARNpc respectivamente).

Si bien el proceso transcripcional es básicamente similar en procariotas y eucariotas, existen diferencias que detallaremos a continuación:

EUCARIOTAS PROCARIOTAS

1- La transcripción es llevada a cabo por tres tipos

de enzima ARN polimerasa, cada una

especializada en la síntesis de los distintos tipos de

ARN:

La ARN polimerasa I transcribe genes del ADN

nucleolar que codifican para los ARNr 45S

La ARN polimerasa II transcribe genes del ADN

no nucleolar que codifican para todos los ARNm y

para la mayoría de los ARNpn.

La ARN polimerasa III transcribe genes del ADN

no nucleolar que codifican para los ARNt, los

ARNr 5S,los ARNpc y para el resto de los ARNpn.

1- La transcripción es llevada a cabo por un solo

tipo de ARN polimerasa que sintetiza las diversas

clases de ARN.

La ARN pol. bacteriana es un complejo proteico

oligomérico constituido por cinco subunidades.

Excepto la subunidad sigma (s), el resto conforma

un núcleo enzimático. Todo el complejo constituye una holoenzima capacitada para leer las secuencias

promotoras.

2- Las ARN polimerasas eucariotas no se unen al

ADN molde en su sitio promotor si no están

presentes proteínas denominadas factores basales

de transcripción. Estos son específicos de cada

polimerasa y se encuentran en todos los tipos

celulares. Las células eucariotas también cuentan

con factores de transcripción específicos los cuales

relacionan a los factores basales con las regiones

reguladoras de un gen. Los factores específicos

controlan la tasa de transcripción de los genes.

Cada tejido presenta una combinación particular

de los mismos.

2- Si bien la ARN polimerasa bacteriana no

requiere de factores de transcripción, se considera a

la subunidad s como un factor de inicio de la

transcripción, ya que el núcleo enzimático

despojado de la subunidad s no puede por sí mismo

leer adecuadamente las secuencias promotoras y

efectuar la transcripción.

3- Cada ARN polimerasa reconoce una secuencia

particular de nucleótidos o señal para la

transcripción ,que es diferente para cada enzima.

Por ejemplo la ARN polimerasa II, que trasncribe

los genes que codifican para ARNm, reconoce

varias secuencias de nucleótidos en el promotor,

entre las cuales se encuentran las secuencias

llamadas caja TATA o caja Hogness-Goldberg,

caja CAAT y GC. Éstas secuencias se encuentran

"río arriba" respecto del punto de inicio de la

transcripción. El reconocimiento de dichas

secuencias por parte de la ARN polimerasa II y los

factores basales de transcripción son prerequisitos

para iniciar la copia del gen.

Cabe destacar que las secuencias consenso que

reconocen las distintas ARN polimerasas y sus

correspondientes factores basales difieren en

composición y ubicación dentro del gen, esto

significa que no siempre se localizan delante del

promotor.

CAAT--GGGCCGGG--GGGCCGGG-TATA--

inico

3- La ARN polimerasa bacteriana también

reconoce secuencias consenso indispensables

para la unión de la holoenzima y la señalización

del punto de inicio. Una de las secuencias más

conocidas es la caja TATAAT o caja Pribnow y

TTGACA, ubicadas siempre río arriba del

punto de inicio de la transcripción.

-35 -10 +1

5' -----TTGACA----TATAAT----inicio--3'

Promotor procariota

Promotor eucariota

Resumiendo, las principales diferencias en la transcripción en células procariotas y eucariotas: · Existe una sola ARN polimerasa procariota y tres ARN polimerasas eucariotas. · La ARN polimerasa procariota no requiere factores de transcripción. Las eucariotas requieren la presencia de factores de transcripción basales y su actividad es regulada por factores de transcripción específicos. · Las secuencias señalizadoras son diferentes

naturaleza molecular del gen y el genoma

Documents