naturaleza molecular del gen y el genoma
DESCRIPTION
Investigacion Molecular del GenTRANSCRIPT
NATURALEZA MOLECULAR DEL GEN Y EL GENOMA
EL CONCEPTO DE GEN
El genoma es el conjunto de genes de una especie. Pero ¿qué es un gen? En principio es una unidad informativa discreta, responsable de una característica transmisible, El color de ojos, la textura de la semilla, la longitud del tallo. Este es el concepto mendeliano del gen, acuñado en el siglo XIX, cuando aún se desconocía su verdadera naturaleza química. Esta definición del gen sigue siendo útil en determinado contexto, con la salvedad de que hoy identificamos a dicha unidad de información con un fragmento de ADN localizado en determinado lugar de un cromosoma. Una segunda concepción del gen surgió cuando los genetistas demostraron de forma concluyente que los genes especifican la estructura de las proteínas individuales. A principios de los años 1950 se llegó a conocer la secuencia de aminoácidos de la proteína insulina y se descubrió que cada proteína consiste en una secuencia de aminoácidos típica, de la cual, se supuso, dependerían sus propiedades. Al mismo tiempo se correlacionaron mutaciones (alteraciones en la secuencia de nucleótidos del ADN) con alteraciones de la secuencia de aminoácidos en las proteínas. Resultó evidente que la secuencia del ADN especifica, mediante algún código, la secuencia proteica. Un gen es, entonces, una secuencia de ADN con la información necesaria para la síntesis de una proteína particular.
Dado que el ADN es una molécula relativamente inerte, su información se expresa indirectamente, a través de otras moléculas. El ADN dirige la síntesis de proteínas y éstas determinan las características físicas y químicas de la célula.
Como ya adelantáramos, las instrucciones genéticas contenidas en el ADN se expresan en dos pasos. El primero de ellos, la transcripción, consiste en la síntesis de ARN a partir del ADN. El ARN contiene toda la información de la secuencia de bases del ADN de la que ha sido copiado. El segundo paso de la expresión genética es la traducción, momento en el cual el ARN ejecuta las instrucciones recibidas cristalizándolas en la síntesis de una proteína específica.
Existen diversos tipos de ARN: el ARNm (mensajero), el ARNr (ribosómico), el ARNt (de transferencia) y los ARN pequeños. De todos ellos, tan sólo el ARNm es portador de información acerca de la secuencia aminoacídica de una proteína; sin embargo todos ellos son transcriptos de ADN. Por lo tanto, resulta necesario revisar la segunda definición del gen.
Hoy se acepta que un gen es una secuencia de ADN transcripta que genera un producto con función celular específica.
Cabe aclarar, no obstante, que esta definición no es completamente satisfactoria, en la medida en que existen regiones reguladoras de los genes, que no se transcriben, y otras regiones (llamadas intrones) que se transcriben pero se eliminan sin cumplir ninguna función aparente.
LA ORGANIZACIÓN DEL GENOMA
Con la excepción de ciertos virus, que contienen un genoma de ARN, el resto de los genomas utiliza el ADN como depositario de la información genética.
Sin embargo, debemos señalar algunas diferencias significativas en cuanto a la organización del genoma en procariontes y eucariontes.
· En primer lugar, el ADN procarionte se presenta como una única molécula circular, en tanto el ADN eucarionte es de estructura lineal. Además las células eucariotas poseen usualmente más de una molécula de ADN en sus núcleos. Cada molécula corresponde a un cromosoma, cuyo número es constante para todas las células de una misma especie (con excepción de las gametas).
· El ADN eucarionte, por otro lado, se halla asociado íntimamente a diferentes proteínas, entre las cuales las histonas juegan el papel más importante en lo que respecta al empaquetamiento del ADN. Esta asociación a histonas no se verifica en el ADN procarionte, por lo cual se lo ha denominado “ADN desnudo”.
En las células eucariotas los cromosomas están confinados en el compartimiento nuclear, donde tiene lugar la
transcripción, mientras que la traducción se localiza en el citoplasma; por lo tanto, ambos procesos se encuentran separados espacial y temporalmente. Esto permite que los transcriptos de ARN experimenten en el núcleo un proceso de maduración previo a la traducción. En las células procariotas, donde no existe la envoltura nuclear, el ADN está en contacto directo con el citosol, y los procesos de transcripción y traducción no se hallan separados en espacio ni en tiempo. Los ARNs no son sometidos a modificaciones postranscripcionales.
· Los eucariontes tienen genomas mucho más grandes que los procariontes. Aunque el valor C (cantidad haploide de ADN de una especie) es muy variable entre los mismos eucariontes (ver tabla 1), es siempre notablemente mayor que el de los procariontes. No necesariamente un mayor valor C refleja una mayor complejidad genética (véase en tabla 11.1 valores de Salamandra y Homo sapiens).
· En los procariontes se da una máxima economía de información: en casi todos los casos cada cromosoma contiene una sola copia de cualquier gen particular, y, con excepción de las secuencias reguladoras y señaladoras, prácticamente se expresa todo el ADN. En cambio, en toda célula eucariota parecería haber un gran exceso de ADN, o por lo menos de ADN cuyas funciones se desconocen por completo. Por ejemplo, la estimación del ADN “innecesario” en los seres humanos llega a ser tan elevada como el 95% del genoma.
EL CÓDIGO GENÉTICO
Hemos visto que los genes son segmentos de ADN situados en los cromosomas, que se comportan como unidades de transcripción. Hemos señalado también que muchos de los ARN transcriptos son productos celulares finales con función propia (al margen de las modificaciones postranscripcionales que requieran para completar su maduración), es decir que,
en alguna medida, la transcripción es un paso terminal de la expresión de ciertos genes. Sin embargo, sabemos que muchos otros genes contienen la información necesaria para especificar la secuencia de aminoácidos de las tantas proteínas que una célula es capaz de sintetizar. En estos casos, la transcripción es tan sólo el primer paso de la expresión genética. Los ARN obtenidos, ARN mensajeros, son, como su nombre lo indica, meros transportadores de información que aún debe ser decodificada, información que debe traducirse en la síntesis de una proteína. La traducción es el segundo paso de la expresión genética.
Fig. 11.1 - Flujo de información genética
Muchas de las características del código genético fueron anticipadas en forma teórica a partir del descubrimiento del ARNm. Pero en el año 1961, Nirenberg y Matthaei desarrollaron una técnica que abrió el camino para que en los siguientes cuatro años el código genético fuera enteramente descifrado.
Podemos pensar al código genético como un idioma. Los idiomas utilizan una cierta cantidad de letras, éstas se combinan para formar palabras, y cada palabra tiene un significado, designa a un objeto particular. En el código genético están presentes todos estos elementos: las letras son las 4 bases que forman las cadenas de ARN (A, U, C, G); las palabras son siempre agrupaciones de 3 letras o tripletes de bases, llamadas codones en la molécula del ARNm, y los objetos designados por dichas palabras son cada uno de los 20 aminoácidos que componen las proteínas.
La tabla del código que se halla a continuación es válida para los seres vivos más diversos: el hombre, las bacterias, las levaduras, las plantas. El código genético es universal, lo cual da prueba de que todos los organismos comparten un mismo origen. Una de las contadas excepciones a la universalidad del código es el ADN mitocondrial, en el cual algunos codones son leídos de manera diferente.
TABLA 11.2 - Código genético SEGUNDA LETRA
U C A G
PRIMERA
LETRA
U UUU
fenilalanina
UUC
fenilalanina
UUA leucina
UUG leucina
UCU
serina
UCC serina
UCA
serina
UCG serina
UAU
tirosina
UAC
tirosina
UAA stop
UAG stop
UGU
cisteína
UGC
cisteína
UGA stop
UGG
triptófano
U
C
A
G
TERCERA
LETRA
C CUU leucina CCU
prolina
CAU
histidina
CGU
arginina
U
CUC leucina
CUA leucina
CUG leucina
CCC
prolina
CCA
prolina
CCG
prolina
CAC
histidina
CAA
glutamina
CAG
glutamina
CGC
arginina
CGA
arginina
CGG
arginina
C
A
G
A AUU
isoleucina
AUC
isoleucina
AUA
isoleucina
AUG
metionina
ACU
treonina
ACC
treonina
ACA
treonina
ACG
treonina
AAU
asparagina
AAC
asparagina
AAA lisina
AAG lisina
AGU serina
AGC serina
AGA
arginina
AGG
arginina
U
C
A
G
G GUU valina
GUC valina
GUA valina
GUG valina
GCU
alanina
GCC
alanina
GCA
alanina
GCG
alanina
GAU
aspartato
GAC
aspartato
GAA
glutamato
GAG
glutamato
GGU glicina
GGC glicina
GGA glicina
GGG glicina
U
C
A
G
Características del Código Genético
El código genético consta de 64 codones o tripletes de bases.61 codones codifican aminoácidos. 3 codones funcionan como señales de terminación. El código no es ambiguo, pues cada codón especifica a un solo aminoácido. El código es degenerado, ya que un aminoácido puede estar codificado por diferentes codones. Es universal, debido a que sus mensajes son interpretados de la misma forma por todos los organismos.
Utiliza un marco de lectura establecido al inicio de la traducción y no lo modifica. No se produce solapamiento de codones.
EL PROCESO DE LA TRANSCRIPCIÓN
La transcripción consiste en la síntesis de ARN a partir de un molde de ADN.
A continuación realizaremos una descripción general del proceso de transcripción tomando en cuenta los aspectos comunes a la síntesis de los distintos tipos de ARN.
La transcripción, tanto en células procariotas como eucariotas, involucra la participación de una enzima ARN polimerasa ADN dependiente. Ésta sintetiza una cadena de ARN cuyos inicio, terminación y secuencia de bases vienen determinados por el propio gen.
El primer paso de la transcripción es la unión de la enzima ARN polimerasa a una región del gen llamada promotor. El promotor es una secuencia específica de bases con alta afinidad por la enzima, por lo que proporciona a la misma su sitio de unión al ADN. Es asimismo una señal que indica cuál cadena se ha de transcribir. La transcripción es asimétrica, pues usualmente sólo se transcribe una de las dos cadenas que forman cada gen. La cadena que actúa como plantilla es la cadena molde, negativa o no codificante; la hebra no transcripta, complementaria de la anterior, se denomina antimolde, positiva o codificante. La ARN polimerasa se desplaza sobre la cadena molde, recorriéndola en dirección 3’ => 5’ o “río abajo” y transcribiéndola a partir del nucleótido que el promotor señala como punto de inicio de la transcripción. Este nucleótido se nombra +1 y los siguientes, río abajo, siguen la numeración correlativa (+2, +3, etc.). Partiendo desde el
punto de inicio en la dirección contraria, es decir “río o corriente arriba”, los nucleótidos se numeran –1, -2, etc.
La ARN polimerasa sólo puede desplazarse y transcribir si previamente la doble hélice sufre un desenrollamiento y fusión (separación de las cadenas complementarias por ruptura de los puentes de hidrógeno entre las bases). La misma enzima cataliza ambos procesos, generando hacia el extremo 3´ una burbuja de transcripción, un tramo de aproximadamente 12 nucleótidos de longitud, en el cual las cadenas permanecen desapareadas. La burbuja de transcripción aparenta avanzar río abajo junto con la enzima, pues a medida que progresa la fusión por delante de ella, la doble hélice se recompone por detrás.
La formación de la burbuja causa una supertorsión o superenrollamiento de la doble hélice en los sectores ubicados hacia el extremo 5’ del molde. Este fenómeno es corregido por la acción de una enzima topoisomerasa I.
Fig. 11.3 - Burbuja de transcripción
Cuando el molde ya ha sido desapareado en la burbuja de transcripción y expone sus bases, éstas son reconocidas por la ARN polimerasa. A medida que la enzima “lee” la plantilla, coloca junto a cada base de la misma el ribonucleótido trifosfato portador de la base complementaria. A los desoxirribonucleótidos de A, T, C y G se le aparean, respectivamente, los ribonucleótidos de U (recordemos que el ARN no contiene T), A, G y C mediante puentes de hidrógeno. Una vez ubicados los dos primeros ribonucleótidos, la enzima cataliza la formación del puente fosfodiéster entre ambos, iniciándose la cadena de ARN.
Fig. 11.4 - Dirección de la transcripción
El enlace fosfodiéster se produce entre el hidroxilo en posición 3’ del primer nucleótido y el grupo fosfato interno, en posición 5’, del segundo. Un grupo pirofosfato de este último es liberado como producto y escindido rápidamente en dos fosfatos por la acción de una pirofosfatasa. Dicha ruptura es tan exergónica que la reacción inversa se torna prácticamente imposible. Así, desde el punto de vista termodinámico, se favorece la síntesis de la nueva cadena. Por lo tanto, son los mismos sustratos los que, por estar trifosfatados, aportan la energía necesaria para su polimerización.
Fig. 11.5 - Incorporación de ribonucleótidos en el extremo 3' de ARN
Este procedimiento se repite tantas veces como nucleótidos contenga el molde, de tal manera que el ARN va creciendo en forma antiparalela a aquél, es decir, desde su extremo 5’ (el que quedó libre en el primer nucleótido) hasta su extremo 3’ (que quedará libre en el último nucleótido añadido). La dirección de la síntesis del ARN es 5´ => 3´.
Siempre los nucleótidos recién incorporados al ARN forman una hélice corta ARN-ADN con su plantilla. Esta hélice híbrida es transitoria, pues conforme el polímero se alarga por su extremo 3’, el extremo 5’ se separa del molde, el cual vuelve a emparejarse con su hebra de ADN complementaria.
La transcripción concluye cuando la ARN polimerasa alcanza una señal (una secuencia específica de bases del ADN) que actúa como señal de terminación.
El producto obtenido, un ARN transcripto primario, resulta una copia complementaria y antiparalela de una región del gen comprendida entre el punto de inicio y la señal de terminación.
Fig. 11.6- ARN en distintos estadios de transcripción sobreel mismo gen
El transcripto primario repite la dirección y la secuencia (excepto porque lleva U en vez de T) de la hebra no copiada o antimolde, lo que justifica que a esta última se apliquen las denominaciones de hebra positiva o codificante. Es la cadena convencionalmente elegida para representar un gen.
Cabe aclarar que al describir la transcripción en forma general, hemos omitido la mención de regiones reguladoras de los genes, bajo cuyo control se encuentran los acontecimientos analizados. Este aspecto del tema será desarrollado más adelante en el mismo capítulo.
Los requisitos de la transcripción:
• Una molécula de ADN molde, con región promotora, que indica el inicio de la transcripción, con secuencia de
terminación, que marca el fin del proceso, y un segmento que será expresado.
• Una enzima ARN polimerasa que:
-reconoce las secuencias señalizadoras,
-abre la hélice,
-lee el molde (de 3´a 5´),
-reconoce y ubica los sustratos complementarios,
-polimeriza los sustratos(de 5´a 3´).
• Cofactores enzimáticos de la ARN polimerasa: Mg++ o Mn++.
• Sustratos: UTP, ATP, GTP Y CTP.
• Una fuente de energía: los mismos sustratos.
• Una pirofosfatasa.
• Una topoisomerasa I.
A partir de distintos genes se transcriben diferentes clases de ARN: ARN mensajero(ARNm),ARN
de transferencia(ARNt),ARN ribosómico(ARNr),ARN pequeños nucleares y citoplasmáticos
(ARNpn/ARNpc respectivamente).
Si bien el proceso transcripcional es básicamente similar en procariotas y eucariotas, existen diferencias que detallaremos a continuación:
EUCARIOTAS PROCARIOTAS
1- La transcripción es llevada a cabo por tres tipos
de enzima ARN polimerasa, cada una
especializada en la síntesis de los distintos tipos de
ARN:
La ARN polimerasa I transcribe genes del ADN
nucleolar que codifican para los ARNr 45S
La ARN polimerasa II transcribe genes del ADN
no nucleolar que codifican para todos los ARNm y
para la mayoría de los ARNpn.
La ARN polimerasa III transcribe genes del ADN
no nucleolar que codifican para los ARNt, los
ARNr 5S,los ARNpc y para el resto de los ARNpn.
1- La transcripción es llevada a cabo por un solo
tipo de ARN polimerasa que sintetiza las diversas
clases de ARN.
La ARN pol. bacteriana es un complejo proteico
oligomérico constituido por cinco subunidades.
Excepto la subunidad sigma (s), el resto conforma
un núcleo enzimático. Todo el complejo constituye una holoenzima capacitada para leer las secuencias
promotoras.
2- Las ARN polimerasas eucariotas no se unen al
ADN molde en su sitio promotor si no están
presentes proteínas denominadas factores basales
de transcripción. Estos son específicos de cada
polimerasa y se encuentran en todos los tipos
celulares. Las células eucariotas también cuentan
con factores de transcripción específicos los cuales
relacionan a los factores basales con las regiones
reguladoras de un gen. Los factores específicos
controlan la tasa de transcripción de los genes.
Cada tejido presenta una combinación particular
de los mismos.
2- Si bien la ARN polimerasa bacteriana no
requiere de factores de transcripción, se considera a
la subunidad s como un factor de inicio de la
transcripción, ya que el núcleo enzimático
despojado de la subunidad s no puede por sí mismo
leer adecuadamente las secuencias promotoras y
efectuar la transcripción.
3- Cada ARN polimerasa reconoce una secuencia
particular de nucleótidos o señal para la
transcripción ,que es diferente para cada enzima.
Por ejemplo la ARN polimerasa II, que trasncribe
los genes que codifican para ARNm, reconoce
varias secuencias de nucleótidos en el promotor,
entre las cuales se encuentran las secuencias
llamadas caja TATA o caja Hogness-Goldberg,
caja CAAT y GC. Éstas secuencias se encuentran
"río arriba" respecto del punto de inicio de la
transcripción. El reconocimiento de dichas
secuencias por parte de la ARN polimerasa II y los
factores basales de transcripción son prerequisitos
para iniciar la copia del gen.
Cabe destacar que las secuencias consenso que
reconocen las distintas ARN polimerasas y sus
correspondientes factores basales difieren en
composición y ubicación dentro del gen, esto
significa que no siempre se localizan delante del
promotor.
CAAT--GGGCCGGG--GGGCCGGG-TATA--
inico
3- La ARN polimerasa bacteriana también
reconoce secuencias consenso indispensables
para la unión de la holoenzima y la señalización
del punto de inicio. Una de las secuencias más
conocidas es la caja TATAAT o caja Pribnow y
TTGACA, ubicadas siempre río arriba del
punto de inicio de la transcripción.
-35 -10 +1
5' -----TTGACA----TATAAT----inicio--3'
Promotor procariota
Promotor eucariota
Resumiendo, las principales diferencias en la transcripción en células procariotas y eucariotas: · Existe una sola ARN polimerasa procariota y tres ARN polimerasas eucariotas. · La ARN polimerasa procariota no requiere factores de transcripción. Las eucariotas requieren la presencia de factores de transcripción basales y su actividad es regulada por factores de transcripción específicos. · Las secuencias señalizadoras son diferentes