universidad de chile facultad de ciencias fisicas y ...a pesar de lo anterior, las aplicaciones...
TRANSCRIPT
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS DEPARTAMENTO DE INGENIERIA QUIMICA Y BIOTECNOLOGIA
BASES ESTRUCTURALES DE LA PSICROFILICIDAD: PREDICCION E INGENIERIA DE UNA ENDOGLUCANASA
TESIS PARA OPTAR AL GRADO DE DOCTOR EN CIENCIAS DE LA INGENIERIA MENCION QUIMICA
JUAN MATIAS SAAVEDRA SALINAS
SANTIAGO DE CHILE AGOSTO 2011
ii
UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS DEPARTAMENTO DE INGENIERIA QUIMICA Y BIOTECNOLOGIA
BASES ESTRUCTURALES DE LA PSICROFILICIDAD: PREDICCION E INGENIERIA DE UNA ENDOGLUCANASA
TESIS PARA OPTAR AL GRADO DE DOCTOR EN CIENCIAS DE LA INGENIERIA MENCION QUIMICA
JUAN MATIAS SAAVEDRA SALINAS
PROFESOR GUIA: JUAN ASENJO DE LEUZE
PROFESOR GUIA 2: BARBARA ANDREWS FARROW
MIEMBROS DE LA COMISION:
MARIA ELENA LIENQUEO CONTRERAS GONZALO NAVARRO BADINO
OCTAVIO MONASTERIO OPAZO
SANTIAGO DE CHILE AGOSTO 2011
iii
A mis Padres,
“Petit à petit l’oiseau fait son nid”
iv
Resumen
Gran variedad de procesos industriales basados en reacciones catalizadas
químicamente han sido reemplazados durante las últimas décadas por procesos
biotecnológicos que involucran enzimas. En particular, el uso de enzimas criofílicas, cuya
actividad se mantiene alta a bajas temperaturas, supone considerables ahorros de
energía y recursos. Diversos factores y variables han sido asociados a la adaptación de
enzimas a bajas temperaturas. Entre estos, la flexibilidad aparece como uno de los más
aceptados. En efecto, la movilidad de las proteínas, especialmente en la vecindad del sitio
activo, es esencial para la catálisis, y a bajas temperaturas, ésta se ve comprometida.
Con el fin de detectar aspectos estructurales vinculados al proceso de adaptación
mencionado en celulasas pertenecientes a la familia 5 de las glicósido-hidrolasas, se
realizó una serie de estudios comparativos entre estructuras homólogas mesofílicas y
psicrofílicas. El análisis se centró en parámetros asociados con la dinámica del edificio
molecular, como las interacciones electrostáticas (puentes de hidrógeno y puentes
salinos), la compactación estructural y las fluctuaciones atómicas, calculadas mediante
análisis de modos normales. La celulasa Cel5A de Bacillus agaradhaerens se usó como
modelo experimental y sus propiedades catalíticas fueron evaluadas. La catálisis en
Cel5A es favorecida por un factor entrópico, que contraresta el efecto negativo de su alta
energía de activación (Ea), mientras que en las otras celulasas homólogas estudiadas,
Cel5 de Erwinia chrysanthemi (mesofílica) y Cel5G de Pseudoalteromonas haloplanktis
(psicrofílica), la actividad es impulsada entálpicamente. Estos resultados fueron
interpretados en términos estructurales. Se identificó 5 residuos potencialmente
vinculados con el patrón de actividad catalítica exhibido por Cel5A, tres de éstos situados
en la vecindad del sitio activo y los otros dos en un sitio de unión a calcio. Mediante
mutagénesis sitio-dirigida se modificó algunas de las posiciones seleccionadas y se
caracterizó la actividad de las mutantes. Tres variantes resultaron ser significativamente
más activas que Cel5A a bajas temperaturas (N138L, I99A e I99A/A134Y) evidenciando
paralelamente una disminución de la Ea (y la entalpía de activación). Los resultados
obtenidos sugieren que el concepto de psicrofilicidad como criterio de clasificación de
enzimas es aún precario y sujeto a relatividad.
v
Indice de Contenidos
1. INTRODUCCIÓN ........................................................................................................................................... 1
1.1. INDUSTRIA QUÍMICA V/S INDUSTRIA BIOTECNOLÓGICA ............................................................................ 1 1.2. INDUSTRIA DE LAS ENZIMAS....................................................................................................................... 1 1.3. ENZIMAS ADAPTADAS A CONDICIONES EXTREMAS ................................................................................... 2 1.4. ENZIMAS ADAPTADAS A BAJAS TEMPERATURAS ....................................................................................... 4
1.4.1. El comienzo ......................................................................................................................................... 4 1.4.2. Aplicaciones biotecnológicas ............................................................................................................ 5
1.5. CATÁLISIS ENZIMÁTICA.............................................................................................................................. 7 1.5.1. Las enzimas son estructuras dinámicas ............................................................................................ 8 1.5.2. Flexibilidad ......................................................................................................................................... 9 1.5.3. Flexibilidad y actividad....................................................................................................................11 1.5.4. Flexibilidad y estabilidad.................................................................................................................12 1.5.5. Catálisis enzimática a bajas temperaturas .....................................................................................14 1.5.6. Adaptación al frío: compromisos y controversias..........................................................................16
1.6. ESTUDIO DE LA DINÁMICA DE PROTEÍNAS ...............................................................................................23 1.6.1. Métodos experimentales...................................................................................................................23 1.6.2. Métodos computacionales................................................................................................................25
1.7. HIPÓTESIS DE TRABAJO.............................................................................................................................27 1.8. MODELO DE ESTUDIO: CELULASAS PERTENECIENTES A LA FAMILIA GH5-2 .........................................27
2. OBJETIVOS ...................................................................................................................................................29
2.1. OBJETIVO GENERAL ..................................................................................................................................29 2.2. OBJETIVOS ESPECÍFICOS ...........................................................................................................................29
3. MATERIALES Y MÉTODOS ....................................................................................................................30
3.1. MATERIALES .............................................................................................................................................30 3.1.1. Cepas bacterianas ............................................................................................................................30 3.1.2. Reactivos ...........................................................................................................................................30 3.1.3. Vectores de clonamiento y expresión ..............................................................................................30 3.1.4. Medios de cultivo líquidos ...............................................................................................................32 3.1.5. Medios de cultivo sólidos.................................................................................................................32 3.1.6. Antibióticos .......................................................................................................................................33 3.1.7. Soluciones Stock ...............................................................................................................................33 3.1.8. Recursos informáticos ......................................................................................................................33
vi
3.2. MÉTODOS ..................................................................................................................................................34 3.2.1. Teoría del análisis de modos normales...........................................................................................34 3.2.2. Fluctuaciones atómicas, matriz Hessiana y modos normales .......................................................38 3.2.3. Energía potencial y funciones de campo de fuerza ........................................................................41 3.2.4. Cálculo de compactación.................................................................................................................44 3.2.5. Análisis de modos normales ............................................................................................................45 3.2.6. Interacciones electrostáticas ...........................................................................................................46 3.2.7. Algoritmos de comparación .............................................................................................................47 3.2.8. Cultivo de microorganismos ............................................................................................................60 3.2.9. Extracción de DNA plasmidial ........................................................................................................60 3.2.10. Mutaciones sitio-dirigidas .............................................................................................................61 3.2.11. Amplificación del DNA por PCR...................................................................................................61 3.2.12. Electroforesis de DNA....................................................................................................................64 3.2.13. Purificación de DNA a partir de geles de agarosa ......................................................................64 3.2.14. Digestión del DNA..........................................................................................................................64 3.2.15. Reacciones de ligación...................................................................................................................64 3.2.16. Preparación de células electrocompetentes .................................................................................65 3.2.17. Transformación de células electrocompetentes ...........................................................................65 3.2.18. PCR de colonias .............................................................................................................................66 3.2.19. Clonamiento del dominio catalítico de la celulasa Cel5A en el plásmido de expresión
pET22(+) .........................................................................................................................................................66 3.2.20. Producción recombinante de las celulasas ..................................................................................67 3.2.21. Electroforesis de proteínas (SDS-PAGE) .....................................................................................68 3.2.22. Determinación de la concentración de proteínas ........................................................................68 3.2.23. Ensayos de actividad enzimática...................................................................................................69 3.2.24. Determinación de los parámetros cinéticos de las enzimas recombinantes ..............................70 3.2.25. Determinación de los parámetros termodinámicos de activación ..............................................70 3.2.26. Modelamiento estructural del dominio catalítico de CelA8........................................................71
4. RESULTADOS...............................................................................................................................................72
4.1. PARÁMETROS VINCULADOS CON LA ACTIVIDAD DE CEL5A A DISTINTAS TEMPERATURAS ..................75 4.2. ALGORITMOS DE COMPARACIÓN..............................................................................................................77 4.3. ESTUDIO COMPARATIVO E IDENTIFICACIÓN DE RESIDUOS CANDIDATOS PARA MUTAGÉNESIS .............77
4.3.1. Interacciones electrostáticas ...........................................................................................................78 4.4. COMPACTACIÓN ESTRUCTURAL ...............................................................................................................80 4.5. ANÁLISIS DE MODOS NORMALES ..............................................................................................................83 4.6. SITIO DE UNIÓN A CALCIO: POSIBLE ADAPTACIÓN DE CEL5G A BAJAS TEMPERATURAS.......................85 4.7. MUTACIONES SITIO-DIRIGIDAS.................................................................................................................88
vii
5. DISCUSIÓN....................................................................................................................................................94
6. CONCLUSIONES .......................................................................................................................................102
7. BIBLIOGRAFÍA .........................................................................................................................................104
ANEXO I BASES TERMODINÁMICAS DE LA CATÁLISIS ..................................................................118
ANEXO II TEST DE STUDENT ......................................................................................................................140
ANEXO III ECUACIONES PARA CÁLCULO DE PARÁMETROS TERMODINÁMICOS..............143
ANEXO IV CÓDIGOS PYTHON.....................................................................................................................145
ANEXO V ALINEAMIENTO DE LAS CELULASAS MESOFÍLICAS Y PSICROFÍLICAS.............
146
1
1. Introducción
1.1. Industria química v/s industria biotecnológica
La industria química tradicional ha contribuido en gran medida a nuestra actual
calidad de vida, sin embargo, se encuentra bajo crecientes presiones que apuntan a
cambiar los procesos existentes por alternativas más amigables con el medio ambiente y
sustentables (Poliakoff et al., 2002; Gavrilescu y Chisti, 2005). Las desventajas asociadas
a la industria química incluyen su dependencia en energía y recursos no renovables, la
existencia de procesos cuyos desechos y subproductos constituyen potenciales peligros
para el medio ambiente, productos finales que no son fácilmente reciclados o
biodegradados al terminar su vida útil, entre otros aspectos (Gavrilescu y Chisti, 2005).
Entre las principales nuevas tecnologías surgidas desde los años 1970, la
biotecnología ha despertado un particular interés mundial. Esta nueva disciplina ha
demostrado ser capaz de generar riqueza y bienestar, influenciando todos los sectores
relevantes de la economía (Gavrilescu y Chisti, 2005).
El desarrollo de la biotecnología ha permitido desvincular el crecimiento
económico con los impactos ambientales adversos, mediante un cambio radical en los
procesos productivos. La aparición de nuevas técnicas y prácticas ha posibilitado la
explotación de nuevos recursos renovables, al tiempo que ha permitido el surgimiento de
nuevos procesos, productos y servicios menos contaminantes y persistentes.
Siguiendo esta tendencia, gran variedad de procesos industriales basados en
reacciones catalizadas químicamente han sido reemplazados durante las últimas décadas
por procesos biotecnológicos que involucran células vivas o enzimas (Stottmeister et al.,
2005). Como consecuencia de aquello, se han posicionado en forma robusta en el
mercado nuevas industrias basadas en el desarrollo de biocatalizadores.
1.2. Industria de las enzimas
Uno de los ámbitos en que el desarrollo de la biotecnología moderna ha tenido
mayor impacto es la aplicación de enzimas industriales. Más de 500 productos que cubren
diversas aplicaciones en industrias tan diversas como los detergentes y la producción de
2
cerveza, suponen el uso de enzimas producidas a gran escala mediante fermentaciones
(Cherry y Fidantsef, 2003). El mercado mundial de enzimas industriales, estimado en 1,5
billones de dólares en el año 2000 (McCoy, 2000) se compone de tres segmentos
principales. las enzimas técnicas, aplicadas en las industrias de detergentes, cuero, textil,
papel y cuidado personal, entre otras, acaparan la mayor parte del mercado con el 65%
de las ventas. Las enzimas utilizadas en industrias de alimentos como lácteos, cerveza,
vino, jugos, grasas, aceites y pan, constituyen el segundo segmento en importancia con
un 25%. Finalmente, las enzimas incorporadas en alimentos para animales contribuyen
con el 10% del mercado (Cherry y Fidantsef, 2003).
Las enzimas ofrecen importantes ventajas en comparación con los
catalizadores químicos. En efecto, estas macromoléculas representan recursos
renovables, son biodegradables y tienden a presentar una notable selectividad
estereoquímica (Rozzell, 1999). Es así como los fosfatos en detergentes han sido
reemplazados progresivamente por proteasas y celulasas, los agentes químicos
emulsificadores en la industria del pan por lipasas y el hidróxido de sodio en la industria
textil por amilasas y pectinasas (Cherry y Fidantsef, 2003).
A pesar de lo anterior, las aplicaciones enzimáticas compiten fuertemente con
los procesos químicos tradicionales, que en muchos casos son extremadamente baratos.
El advenimiento de los avances derivados de la biotecnología moderna, como la
fermentación a gran escala y la tecnología del ADN recombinante, no sólo han convertido
las enzimas en una alternativa económicamente viable, sino que han permitido el
desarrollo de biocatalizadores mejor adaptados a las condiciones específicas requeridas
en los diversos procesos productivos, frecuentemente extremas (Cherry y Fidantsef,
2003).
1.3. Enzimas adaptadas a condiciones extremas
A pesar de que en la actualidad se ha identificado más de 3000 enzimas
diferentes, y muchas de ellas han encontrado aplicaciones biotecnológicas, aún no es
posible cubrir satisfactoriamente todas las demandas industriales (Van den Burg, 2003).
En efecto, muchas de las enzimas conocidas no son capaces de funcionar
satisfactoriamente en las difíciles condiciones impuestas por algunos procesos (Demirjian
et al., 2001).
3
Las enzimas provenientes de microorganismos adaptados a condiciones
extremas (frío, calor, radiación, salinidad, pH, presión, etc.) presentan diversas
propiedades únicas que favorecen su aplicabilidad biotecnológica (Rothschild y Mancinelli,
2001; Demirjian et al., 2001; Schiraldi y De Rosa, 2002; Van den Burg, 2003; Gomes y
Steiner, 2004).
Las enzimas resistentes a altas temperaturas (> 60°C), presentes en
organismos termófilos e hipertermófilos, son frecuentemente requeridas para procesos
que involucran la degradación de polímeros como quitina, celulosa o almidón. Bajo estas
condiciones, la solubilidad y accesibilidad de los sustratos se optimiza (Van den Burg,
2003).
Las enzimas adaptadas a altas concentraciones salinas (2-5 M NaCl),
provenientes de organismos halófilos tienen el potencial para catalizar reacciones en
sistemas con solventes orgánicos (Marhuenda-Egea y Bonete, 2002).
Diversos organismos capaces de sobrevivir bajo condiciones extremas de pH,
alcalófilos (pH > 9) y acidófilos (pH < 2-3), han sido usados para aislar enzimas
(frecuentemente extracelulares) adaptadas a esas particulares condiciones (Van den
Burg, 2003).
La presión parece no ejercer una fuerza selectiva sobre la función de enzimas
(Gros y Jainicke, 1994). Esta aseveración se basa en que presiones superiores a 400
MPa son necesarias para inducir la denaturación de proteínas de cadena simple y los
microorganismos que viven en las profundidades marinas están expuestos a presiones
que no superan los 120 MPa. Sin embargo, existen ejemplos de estabilización de
proteínas mediante alzas de presión (Hei y Clark, 1994). Enzimas resistentes a altas
presiones pueden ser útiles, especialmente en la industria de alimentos, donde se
encuentra esta condición en numerosos procesos (Van den Burg, 2003).
Existen otros ejemplos de microorganismos y enzimas adaptados a
condiciones extremas. Los metalófilos son capaces de crecer en presencia de altas
concentraciones de metales, los radiófilos resisten alta radiación, y la lista puede
continuar (Van den Burg, 2003).
Un aspecto particularmente sensible en las distintas economías del planeta es
el consumo energético. El uso eficiente de la energía no sólo disminuye los costos
asociados a diversas actividades industriales y sociales, sino que además refuerza el
concepto de desarrollo sustentable. En este contexto, un grupo particular de enzimas
extremófilas adaptadas a bajas temperaturas, ha suscitado creciente interés. Estas
4
enzimas provienen de organismos psicrófilos, que han sido capaces de colonizar
exitosamente nichos ambientales extremos cuya temperatura permanece baja (< 5°C)
durante todo el año. Estos ambientes constituyen más del 75 % de la superficie del
planeta e incluyen regiones polares o montañosas, océanos, cuevas además de las
regiones frías en forma estacional (Van den Burg, 2003; Hoyoux et al., 2004). Las
enzimas psicrofílicas presentan alta actividad en frío y baja estabilidad térmica, cualidades
que fundamentan su interés biotecnológico. En efecto, permiten ahorrar energía al
catalizar reacciones sin necesidad de calentar el medio, minimizar la ocurrencia de
reacciones químicas indeseadas que pueden ocurrir a altas temperaturas y optimizar los
recursos disponibles al disminuir la cantidad de biocatalizador indicado en comparación
con el uso de enzimas mesofílicas en frío. Además, son fácilmente inactivadas a
temperaturas moderadamente altas, lo que favorece su aplicación en procesos
industriales que requieren la eliminación selectiva de actividades enzimáticas sin afectar
el contenido de medios complejos o productos inestables (Cavicchioli et al., 2002;
Margesin et al., 2002).
El interés evolutivo y biotecnológico de las enzimas psicrofílicas ha
incentivado su estudio, con el fin de comprender en detalle los mecanismos moleculares
responsables de su exitosa adaptación.
1.4. Enzimas adaptadas a bajas temperaturas
1.4.1. El comienzo
La vida a bajas temperaturas ya había sido identificada por Hooker en 1840
mediante la detección de algas asociadas a hielo marino (Hoyoux et al., 2004). En 1887,
Forster fue el primero en reportar el crecimiento de microorganismos a 0 °C (Hoyoux et
al., 2004). El término “psicrofílico” fue introducido por Schmidt-Nielsen para describir los
organismos adaptados al frío.
Un psicrófilo se define como un organismo, procariótico o eucariótico, capaz de
vivir permanentemente a temperaturas cercanas al punto de congelamiento del agua y en
equilibrio térmico con el ambiente (Hoyoux et al., 2004).
La primera enzima psicrofílica proveniente de microorganismos de la antártica en
ser caracterizada fue una fosfatasa alcalina (Kobori et al., 1984; Marx et al., 2007), dando
5
paso a una gran cantidad de estudios relacionados con este tipo de enzimas extremófilas
y un creciente interés por sus implicancias evolutivas y aplicaciones biotecnológicas.
1.4.2. Aplicaciones biotecnológicas
Como consecuencia de sus propiedades únicas de eficiencia catalítica y
estabilidad, las enzimas adaptadas a bajas temperaturas encuentran múltiples y muy
variadas aplicaciones comerciales. A continuación se describe algunos ejemplos.
1.4.2.1. Detergentes
Los detergentes constituyen la aplicación principal de las enzimas industriales.
El mercado de proteasas, lipasas, amilasas y celulasas, enzimas usadas comúnmente
como aditivos en detergentes, representa cerca del 40% de las ventas totales (Marx et al.,
2007). Las enzimas adaptadas al frío tienen gran potencial en el desarrollo de detergentes
eficientes a temperatura ambiente.
1.4.2.2. Alimentos
Las β-galactosidasas criofílicas representan alternativas interesantes para la
remoción de lactosa en la leche con el fin de incrementar la digestibilidad y el dulzor.
Pueden ser usadas durante el transporte y almacenamiento (Marx et al., 2006).
Se ha utilizado xilanasas activas a bajas temperaturas en la fabricación de pan
para asegurar un volumen atractivo y aumentar la calidad de la miga (Collins et al., 2006).
Nuestro laboratorio también está tramitando una patente internacional para una xilanasa
psicrofílica bacteriana de origen antártico (WO/2010/089302).
Existen antecedentes de uso de pectinasas en los procesos de clarificación de
jugos; lipasas en el desarrollo de sabores gracias a su alta especificidad de sustrato; y
proteasas para incrementar la digestibilidad de alimento animal y ablandar carnes (Marx
et al., 2006).
6
Estas enzimas pueden ser usadas adicionalmente en la producción de
compuestos químicos de alto valor agregado, tales como péptidos, ácidos grasos,
polisacáridos, etc. (Marx et al., 2006).
1.4.2.3. Textil
Las celulasas psicrofílicas son usadas en el tratamiento de telas de algodón
para restaurar la suavidad y reducir la formación de pelusas, originadas a partir de fibrillas
prominentes. Este procedimiento se denomina “biopulido”. Producto de su inestabilidad
intrínseca, las celulasas psicrofílicas pierden su actividad en forma progresiva. Esto
minimiza la perdida de resistencia mecánica en los tejidos, inconveniente tradicional
asociado al biopulido (Gerday et al., 2000; Marx et al., 2006).
1.4.2.4. Biología molecular y producción de proteínas
Mediante el uso de una fosfatasa alcalina y una polinucleotido quinasa es
posible efectuar marcaje radioactivo de ácidos nucleicos. Por su naturaleza psicrofílica, la
fosfatasa alcalina puede ser inactivada a temperaturas moderadamente altas antes de
incorporar la quinasa, lo que incrementa el rendimiento de la operación (Marx et al.,
2006).
Otra aplicación prometedora es el uso de ligasas psicrofílicas para unir
fragmentos de ADN. Estas reacciones se ejecutan a bajas temperaturas para optimizar su
rendimiento (Georlette et al., 2003a; Marx et al., 2006).
También se están realizando estudios para desarrollar sistemas de expresión
de proteínas a bajas temperaturas usando hospederos psicrofílicos. Esto tiene el potencial
de reducir drásticamente la formación de cuerpos de inclusión, y consecuentemente
aumentar la producción de proteínas solubles correctamente plegadas, producto del
debilitamiento de las interacciones hidrofóbicas en ambientes fríos (Duilio et al., 2004).
7
1.4.2.5. Biocombustibles
Algunas glicósido-hidrolasas psicrofílicas tienen el potencial para ser utilizadas
en la producción renovable de etanol a bajo costo energético (Hildebrandt et al., 2009).
Ciertas lipasas son capaces de efectuar la reacción de transesterificación de
triglicéridos en presencia de alcohol para generar Biodiesel (ésteres de ácidos grasos)
(Fukuda et al., 2001). El uso de una lipasa psicrofílica permitiría rebajar la temperatura de
reacción generando un importante ahorro de energía (Luo et al., 2006).
Las extraordinarias características de las enzimas psicrofílicas suscitan gran
interés desde el punto de vista evolutivo e industrial. Para poder explorar los distintos
aspectos de la adaptación molecular de estos biocatalizadores a bajas temperaturas es
necesario primero comprender nociones básicas de termodinámica y catálisis, tanto
química como enzimática. Estos conceptos constituyen los fundamentos del mecanismo
enzimático.
1.5. Catálisis enzimática
Las reacciones químicas son aceleradas mediante la acción de catalizadores.
Enlaces químicos relevantes en biología, como el enlace fosfodiester presente en la
molécula de ADN son hidrolizados en forma espontánea a temperatura ambiente en
lapsos de tiempo que superan los 130.000 años (vida media) (Radzicka y Wolfenden,
1995). Sin embargo, en todas las células vivas, el ADN es hidrolizado en el contexto de
diversos procesos esenciales que suceden a escalas de tiempo acordes con la cinética de
desarrollo de cada célula. La vida es posible porque las reacciones bioquímicas ocurren a
velocidades razonables producto de la acción de biocatalizadores. Las enzimas
constituyen catalizadores muy efectivos, pudiendo llegar a acelerar reacciones en un
factor de 1017 (Radzicka y Wolfenden, 1995; Wolfenden et al., 1998).
Es importante subrayar que los catalizadores, tanto biológicos como químicos,
son incapaces de modificar el equilibrio natural y los parámetros termodinámicos
subyacentes de las reacciones. La diferencia de energía libre de Gibbs entre los
reactantes y productos será la misma, sin importar la presencia o ausencia de catalizador
(Dill y Bromberg, 2003).
8
¿Como funcionan las enzimas? La búsqueda de respuestas para esta
pregunta fundamental ha sido el foco de numerosos esfuerzos por más de un siglo. La
evolución del conocimiento en esta área descansa en ciertos hitos reconocibles.
El químico estadounidense Linus Pauling propuso en 1946 que los
catalizadores químicos y las enzimas funcionan por medio de la estabilización del estado
de transición de las reacciones (Pauling, 1946).
Algunos años más tarde, se determinó por primera vez la estructura
tridimensional de una enzima, la lisozima del huevo de gallina, con una resolución de 2 Å,
mediante cristalografía de rayos X (Blake et al., 1965). Este acontecimiento marcó el inicio
de los estudios estructurales a nivel atómico.
En 1971, Page y Jencks propusieron una nueva explicación para la catálisis
enzimática basada en la termodinámica. Según sus postulados, la pérdida de entropía
durante la unión del sustrato a la enzima produce la energía libre suficiente para catalizar
la reacción química (Page y Jencks, 1971). Para que esto ocurra, el sustrato debe unirse
de manera muy específica y ser orientado con gran precisión.
Estos conceptos son ampliamente reconocidos, y han representado la base
para la aparición de propuestas más recientes como la pre-organización del sitio activo
(Bruice y Benkovic, 2000) y la reducción de energía libre de reorganización (Warshel,
1998). La enzima plegada proveería un ambiente predefinido en el cual los elementos
relevantes se encuentran pre-orientados para estabilizar el estado de transición (Benkovic
y Hammes-Schiffer, 2003).
La visión actual de la catálisis enzimática considera todos los aportes recién
descritos (Garcia-Viloca, et al., 2004) e incorpora un nuevo aspecto que ha cobrado gran
relevancia y que será tratado en las próximas secciones: la dinámica.
1.5.1. Las enzimas son estructuras dinámicas
Los modelos tridimensionales de la estructura de las proteínas, obtenidos por
medio de cristalografía de rayos X y resonancia magnética nuclear, han permitido avanzar
en el entendimiento de los complejos plegamientos de las cadenas polipeptídicas, los
mecanismos catalíticos y las interacciones con moléculas relevantes (sustratos y
cofactores). Sin embargo, estas imágenes también generan la falsa impresión de que las
enzimas en solución se comportan como estructuras estáticas esperando rígidas la
9
llegada de un sustrato con el cual interactuar. Esto ha sido ampliamente descartado a
través del uso de diversas técnicas experimentales, tales como intercambio hidrógeno-
deuterio en agua pesada, apagamiento dinámico de fluorescencia, espectroscopia de
Mössbauer y de absorción de fotones y dispersión de neutrones, entre otras (Zavodszky
et al., 1998; Zaccai, 2000; Fields, 2001; Siddiqui y Cavicchioli, 2006).
Una enzima activa en solución puede ser representada en forma más precisa
por una distribución estadística de microestados con conformaciones espaciales
ligeramente distintas, determinadas por diferencias locales en el plegamiento (Bai et al.,
1995; Wooll et al., 2000; Mulder et al., 2001). Estos microestados presentan afinidades
diferentes por los potenciales sustratos (Ma et al., 1999). De hecho, al momento de unirse
un sustrato, el equilibrio de la población de microestados puede desplazarse hacia
aquellas conformaciones más favorables para la catálisis (Kumar et al., 2000; Hoyoux et
al., 2004; Hanson et al., 2007). La distribución de conformaciones ocupadas por la
población de moléculas es considerada como el “estado nativo” de la enzima y puede ser
influenciada por las condiciones del ambiente (temperatura, pH, fuerza iónica, presencia
de cofactores, etc.) (Kumar et al., 2000).
1.5.2. Flexibilidad
Gran cantidad de información acerca de la cinética y termodinámica de las
reacciones catalizadas por enzimas se ha obtenido mediante el estudio de la conversión
de sustratos a productos. Sin embargo, el conocimiento sobre la cinética y aspectos
energéticos de los procesos dinámicos conformacionales en las proteínas es aún precario
(Eisenmesser et al, 2005).
Una cadena polipeptídica es intrínsicamente flexible porque muchos de los
enlaces covalentes que participan en su esqueleto y cadenas laterales tienen cierta
libertad rotacional (Daniel et al, 2003).
La flexibilidad en proteínas implica dos fenómenos distinguibles entre sí. El
primero consiste en movimientos moleculares de gran escala, en los que porciones de la
estructura se desplazan como cuerpos rígidos. Este tipo de movimiento se relaciona
frecuentemente con la unión de sustratos o eventos alostéricos, por lo que pueden ser
detectados mediante comparación de estructuras resueltas con y sin sustratos o
cofactores (Kumar et al., 2001). De hecho, este tipo de comparaciones masificadas ha
10
llevado a la creación de una base de datos de movimientos macromoleculares (Gerstein y
Krebs, 1998). El segundo tipo de flexibilidad involucra movimientos a pequeña escala,
reflejados en un conjunto de isómeros conformacionales que constituyen el estado nativo
de la proteína en la base de su superficie de energía potencial (Kumar et al., 2001). Es así
como las proteínas globulares exhiben un amplio rango de movimientos internos. Estos
movimientos cubren amplitudes entre 0,01 Å y 10 Å, y escalas de tiempo entre 10-15 s y
más de 1 s. Las fluctuaciones pueden ser de carácter local o involucrar grandes porciones
de la estructura (Daniel et al, 2003) (Figura 1).
El solvente ejerce una importante influencia sobre la flexibilidad de una proteína. A
temperaturas fisiológicas, las proteínas deshidratadas son más rígidas que las hidratadas
y se acepta comúnmente que carecen de actividad. Aunque, algunos trabajos han
demostrado la existencia de actividad enzimática en muestras deshidratadas (10% de la
superficie molecular cubierta por agua) (Daniel et al, 2003) y en cristales de proteínas
usados para cristalografía de rayos X (Varrot et al., 2000). El aumento de la flexibilidad en
medio acuoso puede en parte deberse al debilitamiento de las interacciones
RANGO DE FUNCIÓN ENZIMÁTICA
Catalasa Anhidrasa carbónica
Ciclofilina A Acetilcolinesterasa
Dihidrofolato reductasa
Quimotripsina RuBisCO
RANGO DE EVENTOS DINÁMICOS EN PROTEÍNAS Movimientos de “breathing”
Rotaciones de cadenas laterales en superficie
Vibraciones elásticas
!
kBT h Vibraciones de
enlaces
Figura 1. Escala temporal de eventos dinámicos estructurales y ligados a la conversión de sustratos. Extraído de Agarwal, 2006. Se expone el factor universal de frecuencia (
!
kBT h )
usado en la teoría del estado de transición (ver capítulo 1.5.5 y anexo I).
11
electrostáticas en la superficie de la molécula, debido a la alta constante dieléctrica del
ambiente (Daniel et al, 2003). Además, la red fluctuante de puentes de hidrógeno entre la
superficie de la estructura y el agua puede inducir cambios transcientes en el nivel de
energía de determinadas conformaciones espaciales, ampliando el universo de posibles
estados (Böde et al., 2007). En tanto, la presencia de actividad enzimática en condiciones
de baja hidratación y ausencia aparente de fluctuaciones, puede deberse al
mantenimiento de flexibilidad local en el sitio activo, que no es percibida con precisión por
las técnicas experimentales actuales (Daniel et al, 2003).
Investigaciones detalladas han logrado discriminar entre movimientos
dependientes de las contribuciones del solvente y otros independientes (Fenimore et al.,
2002).
1.5.3. Flexibilidad y actividad
La necesidad de flexibilidad para sostener la actividad catalítica enzimática es
una noción que encuentra amplia aceptación en la actualidad aunque su influencia directa
no se ha logrado entender tal como se entiende el rol de la estructura (Daniel et al, 2003;
Eisenmesser et al., 2005).
La habilidad de cubrir un amplio espacio conformacional es esencial para la
funcionalidad de las enzimas (Zavodszky et al., 1998; Zaccai, 2000). Estas
macromoléculas deben ser capaces de adaptar su geometría para facilitar y permitir la
unión de sustratos y cofactores, poner en contacto las especies químicas reactivas en el
complejo enzima-sustrato, crear un ambiente con las características fisicoquímicas
apropiadas para la catálisis en el sitio activo o liberar los productos resultantes de la
reacción catalizada (Fields et al., 2001). El modelo de “calce inducido”, sostenido por
Koshland en 1958 (Koshland, 1958) para describir la interacción entre una enzima y su
sustrato, complemento del tradicional modelo “llave-cerradura” propuesto en 1890 por
Fischer, supone la ocurrencia de cambios conformacionales que optimizan la orientación
de los grupos químicos catalíticos en el complejo enzima-sustrato (Daniel et al, 2003).
La existencia de fluctuaciones específicamente seleccionadas durante la
evolución para incrementar la tasa de catálisis constituye un tema de debate (Daniel et al,
2003), aunque se ha relacionado movimientos específicos con la ocurrencia del ciclo
catalítico (Miller y Benkovic, 1998; Bruice y Benkovic, 2000; Radkiewicz y Brooks, 2000).
12
Los movimientos que determinan directamente el funcionamiento enzimático
corresponden al desplazamiento de estructuras secundarias o cambios conformacionales
en las proteínas. Estos movimientos son generalmente amplios, concertados y ocurren en
escalas de tiempo situadas en el rango
!
µs"ms. Las fluctuaciones térmicas de los átomos
individuales, en el rango de los
!
ps, actúan como el lubricante que hace posible los
cambios conformacionales importantes para la función enzimática (Zaccai, 2000) (Figura
1).
A temperaturas bajas (cercanas a 0°C), las enzimas usualmente pierden un alto
porcentaje de su actividad biológica. Se comportan como materiales rígidos: sus átomos
están anclados fuertemente en el contexto de la estructura, atrapados en un único estado
conformacional. Los movimientos térmicos en estas condiciones consisten en vibraciones
armónicas alrededor de posiciones de equilibrio (Zaccai, 2000). A temperaturas
suficientemente altas, los átomos son capaces de superar las barreras energéticas que
separan un estado conformacional de otro, y la estructura puede explorar un mayor
número de distribuciones espaciales. En este caso, los desplazamientos atómicos se
vuelven inarmónicos. Los átomos ya no vibran al rededor de posiciones fijas, sino que
pueden alcanzar diversos nuevos estados de equilibrio, que corresponden a distintas
conformaciones (Zaccai, 2000).
Trabajos experimentales recientes realizados en la enzima prolil cis-trans
isomerasa ciclofilina A (CypA), participante en el proceso de virulencia del VIH, sostienen
que los movimientos característicos detectados durante la catálisis, con frecuencias
correspondientes a la tasa de reacción (del orden de milisegundos), ocurren también en la
enzima libre de sustrato (Eisenmesser et al, 2005). Se concluye que la dinámica
necesaria para la catálisis es una propiedad intrínseca de la proteína.
1.5.4. Flexibilidad y estabilidad
En condiciones ambientales adecuadas, usualmente las proteínas se pliegan
espontáneamente alcanzando su estructura nativa. El modelo más aceptado para explicar
este comportamiento es el “cono de plegamiento” (“folding Funnel”) (Bryngelson et al.,
1995). Este modelo sostiene que la superficie de energía potencial de una proteína tiene
la forma de un cono, de paredes relativamente lisas, correspondiendo el estado plegado
(conformación más probable y de menor energía) al fondo del cono. Sin importar su
13
distribución espacial inicial, una proteína desplegada seguirá el gradiente de energía
hasta alcanzar un estado nativo (Rose et al., 2006) (Figura 2).
La energía de estabilización neta de las proteínas es usualmente muy baja
(Zaccai, 2000). Corresponde a la energía de unos pocos puentes de hidrógeno (Jaenicke,
2000). Datos experimentales sugieren que bastaría con interrumpir algunas de las
interacciones débiles en una estructura para inducir su denaturación (Zaccai, 2000). Se
asume que esta aparente inestabilidad estructural es una condición necesaria para la
flexibilidad y actividad enzimática (Zavodszky et al., 1998).
La mantención de un balance adecuado entre estabilidad molecular y
flexibilidad estructural es un aspecto clave para la función de las proteínas. La estabilidad
es necesaria para evitar la denaturación de la proteína y asegurar la geometría molecular
que permite la interacción con el sustrato, mientras que un nivel apropiado de flexibilidad
es indispensable para la unión eficiente de sustratos, la catálisis y la liberación de los
productos resultantes (Hoyoux et al., 2004; Henzler-Wildman et al., 2007).
Diversos estudios han establecido relaciones entre dinámica, estabilidad y
función en enzimas (Zaccai, 2000). De hecho, ciertos datos experimentales sugieren que
Figura 2. Modelo del “cono de plegamiento” (“folding Funnel”). Extraído de Rose et al., 2006. La línea roja representa un camino de plegamiento posible desde el estado desplegado hasta el estado nativo único (N).
14
la actividad catalítica es incompatible con altos niveles de estabilidad, siendo usualmente
inhibida en regimenes armónicos de vibraciones moleculares (Zavodszky et al., 1998;
Cordone et al., 1999; Zaccai, 2000).
La estabilidad global de una proteína no necesariamente responde a la
flexibilidad de su sitio activo. La dinámica en regiones específicas cercanas al sitio activo
puede diferir notablemente respecto del panorama global (Daniel et al, 2003).
Según el criterio Lindemann, a temperaturas fisiológicas, el interior de las
proteínas en su estado nativo se comporta como un sólido, bien estructurado, mientras
que la superficie tiene características dinámicas propias de los líquidos. La solidez del
interior de la estructura asegura la estabilidad del estado nativo y disminuye enormemente
la probabilidad de ocurrencia de conformaciones inactivas parcialmente denaturadas en
condiciones adecuadas. En tanto, la fluidez de la superficie hace posible la actividad
enzimática (Zhou et al., 1999).
La necesidad de las enzimas por mantener un cierto umbral de flexibilidad que
asegure su funcionalidad puede determinar los niveles de estabilidad permitidos en los
diversos nichos térmicos (Fields, 2000).
1.5.5. Catálisis enzimática a bajas temperaturas
Las temperaturas bajas disminuyen fuertemente la velocidad de las
reacciones químicas. La dependencia entre la velocidad de reacción (a través de la
constante catalítica) y la temperatura puede ser descrita por la ecuación de Arrhenius (ver
anexo I, ecuación 70) (Arrhenius, 1889) y la teoría del estado de transición (ver anexo I,
ecuación 80) (Evans y Polanyi, 1935; Eyring, 1935; Laidler y King, 1983).
donde A es un factor pre-exponencial,
!
Ea es la energía de activación de la reacción,
!
" es
el coeficiente de transmisión dinámica (se asume 1 generalmente para soluciones no
!
kCAT
= A"e#Ea RT
!
kCAT
="kT
he#$G
#RT
(1)
(2)
15
viscosas) (Garcia-Viloca et al., 2004), R es la constante de los gases ideales (8,314 JK-
1mol-1), T es la temperatura absoluta en grados Kelvin,
!
h es la constante de Planck,
!
k es
la constante de Boltzmann y
!
"G# es la energía libre de activación. Cabe señalar que la
constante de Boltzmann (
!
k ) es equivalente a la constante de los gases ideales (
!
R),
siendo la primera expresada en unidades de energía por partícula y la segunda en
unidades de energía por mol.
!
"G# representa la diferencia de energía libre entre el
complejo enzima-sustrato y el complejo enzima-sustrato activado (en el estado de
transición). El componente
!
kBT h es un factor de frecuencia equivalente a 6 ps-1 a una
temperatura de 300°K, para la conversión del estado de transición a productos, válido
tanto en solución como en fase gaseosa (Garcia-Viloca et al., 2004).
A partir de estas ecuaciones se puede deducir que cualquier disminución en la
temperatura producirá una disminución exponencial en la tasa de reacción. En la mayoría
de los sistemas biológicos, una caída de 10°C baja la velocidad de reacción en un factor
de 2 a 3. Esto corresponde al Q10 de la reacción (razón de las tasas de reacción medidas
a intervalos de 10°C) (Hoyoux et al., 2004).
Un aspecto adicional a tener en consideración es el coeficiente de transmisión
dinámica
!
" . Este coeficiente está gobernado por 3 factores: traspasos de la barrera
energética en sentido inverso al de la reacción, es decir del estado activado al complejo
enzima-sustrato basal, con influencia negativa en la tasa de reacción; el efecto túnel, que
corresponde a la formación de productos sin la necesidad de cruzar la barrera energética
de activación, con influencia positiva en la tasa de reacción; y desviaciones del sistema
con respecto al equilibrio asumido, con influencia positiva o negativa en la tasa de
reacción (Garcia-Viloca et al., 2004). En relación a la adaptación a bajas temperaturas, la
viscosidad del medio constituye la principal influencia sobre el coeficiente
!
" . En efecto, la
viscosidad del medio aumenta progresivamente al descender la temperatura, y se ha
demostrado experimentalmente que esto afecta negativamente la actividad enzimática
(Marx et al., 2007). Se conoce diversos métodos para calcular el coeficiente
!
" , tanto
experimentalmente como en forma teórica (Watney et al., 2003; Siddiqui y Cavicchioli,
2006).
Las enzimas psicrofílicas contrarrestan los impedimentos físicos asociados al
frío por medio de diversas estrategias, pudiendo alcanzar actividades a bajas
temperaturas hasta 10 veces mayores que las exhibidas por sus homólogas mesofílicas o
termofílicas (Hoyoux et al., 2004; Siddiqui y Cavicchioli, 2006).
16
1.5.6. Adaptación al frío: compromisos y controversias
Las enzimas psicrofílicas se caracterizan por una alta eficiencia catalítica en
frío. Generalmente, esta capacidad responde a una baja energía de activación (ver
ecuación de Arrhenius (ecuación 70 anexo I)), originada posiblemente por un incremento
en la flexibilidad local o global y una consecuente disminución de la estabilidad estructural
(D’Amico et al., 2002). Se observa con frecuencia que la temperatura a la cual estas
enzimas alcanzan su mayor actividad en condiciones experimentales definidas, es más
baja que la de sus homólogas mesofílicas (D’Amico et al., 2002; Marx et al., 2007). La
Figura 3 muestra la tendencia general observada con respecto a los efectos relativos de la
temperatura sobre la actividad de enzimas psicrofílicas y mesofílicas.
A continuación exploraremos en detalle el estado del arte que explica la lógica
de las adaptaciones térmicas mencionadas, y los mecanismos moleculares que las
determinan, marcados por compromisos y controversias.
Temperatura
Figura 3. Dependencia térmica de la constante catalítica de una enzima psicrofílica y su homóloga mesofílica. Extraído de D’Amico et al., 2002. Los puntos negros corresponden a una α-amilasa psicrofílica de Pseudoalteromonas haloplanktis; los puntos blancos representan un homólogo termoestable de Bacillus amyloliquefaciens.
17
1.5.6.1. Estabilidad
Se ha demostrado experimentalmente, mediante técnicas espectroscópicas y
calorimétricas que las enzimas psicrofílicas son menos estables que sus homólogas
mesofílicas y termofílicas (Marx et al., 2007). Las temperaturas de denaturación de
enzimas homólogas ortólogas y los rangos de temperatura de sus nichos ecológicos de
origen tienden a ser directamente proporcionales (McFall-Ngai y Horwitz, 1990; Maes et
al., 1999).
Se ha podido calcular los parámetros termodinámicos de estabilización para
algunas enzimas psicrofílicas (Feller et al., 1999; D’Amico et al., 2003; Georlette et al.,
2003b; Xu et al., 2003). La energía libre de estabilización (
!
"GEST
), que corresponde a la
energía necesaria para destruir la estructura molecular nativa a una temperatura dada,
entrega valiosa información acerca de la estabilidad conformacional de una enzima.
!
"GEST
para cualquier temperatura se obtiene a partir de parámetros experimentales de
denaturación mediante la ecuación de Gibbs-Helmholtz (Siddiqui y Cavicchioli, 2006):
donde
!
Tm
es la(s) temperatura(s) de denaturación,
!
"Hm
es el cambio de entalpía
a la
!
Tm
, y
!
"CP
es la capacidad calorífica del sistema a presión constante. La Figura 4
muestra la energía libre de estabilización de α-amilasas homólogas adaptadas a distintas
temperaturas (psicrofílica, mesofílica y termofílica). Se puede observar que la energía de
estabilización máxima de las tres α-amilasas se alcanza a temperatura ambiente, patrón
común a una gran variedad de proteínas (Kumar et al., 2002, Feller et al., 2007). Esto es
presumiblemente debido a la optimización del efecto hidrofóbico (crucial en el plegamiento
y mantención de la estructura proteica) a esta temperatura (Baldwin, 1986; Kumar et al.,
2002). De este tipo de estudios se concluye también que las enzimas psicrofílicas son
más sensibles, tanto a la denaturación por calor, como a la denaturación por frío
(intersección de las curvas con el eje x, donde
!
"GEST
= 0). La denaturación por frío es un
concepto poco intuitivo, que consiste en la pérdida de estructura terciaria producto de la
hidratación de interacciones iónicas, polares y apolares a temperaturas suficientemente
bajas (López et al., 2007).
Las energías de estabilización máxima de ciertas enzimas psicrofílicas se
encuentran en rangos muy cercanos al limite de denaturación (14-15 kJ/mol), lo que
reafirma la noción de inestabilidad en estas macromoléculas (Marx et al., 2007).
!
"G(T ) = "Hm(1# T T
m)+ "C
P(T # T
m)# T"C
Pln(T T
m) (3)
18
1.5.6.2. Flexibilidad
El incremento de la flexibilidad estructural de las enzimas psicrofílicas aparece en
la actualidad como una de las potenciales adaptaciones a bajas temperaturas para la cual
existe mayor consenso (Lonhienne at al., 2000; D’Amico et al., 2003; Violot et al., 2005;
Marx et al., 2007; Papaleo et al., 2007). La importancia de la flexibilidad estructural para la
actividad enzimática ya fue discutida en el capítulo 1.5.3. La Figura 5 muestra un modelo
de cono de plegamiento, desarrollado a partir de una recopilación de información
bioquímica y biofísica relevante, que ilustra diferencias importantes entre las enzimas
psicrofílicas y sus homólogas termofílicas (D’Amico et al., 2003). La flexibilidad estructural
se traduce en el modelo como una distribución más amplia de isómeros conformacionales
en equilibrio, con débiles barreras energéticas entre uno y otro (D’Amico et al., 2003). Al
interactuar con un sustrato, las enzimas psicrofílicas son capaces de desplazar el
equilibrio hacia las conformaciones más activas a un menor costo energético, lo que les
permite mantener altas actividades a bajas temperaturas (D’Amico et al., 2003) (ver
capítulo 1.5.1). Sin embargo, el amplio universo de conformaciones accesibles también
puede influir negativamente sobre la Km al aumentar el tiempo ocupado en
Temperatura (°C)
Figura 4. Energía de estabilización de 3 α-amilasas adaptadas a distintas temperaturas. Extraído de D’Amico et al., 2003. AHA, psicrofílica de Pseudoalteromonas haloplanktis; PPA, mesofílica de cerdo; BAA, termofílica de Bacillus amyloliquefaciens.
19
conformaciones sub-óptimas para la interacción con los sustratos (Siddiqui y Cavicchioli,
2006).
En el caso de las enzimas termofílicas, las altas temperaturas ambientales
posibilitan, mediante un valor positivo de la entropía de estabilización, un descenso en
!
"GEST
. Esto asegura la mantención de un nivel de flexibilidad apropiado para la catálisis.
La flexibilidad de las enzimas psicrofílicas, por el contrario, está asociada a un valor
negativo en la entalpía de estabilización a bajas temperaturas (Marx et al., 2007; Feller,
2007). Este valor obedece al gran número de interacciones (puentes de hidrógeno)
favorables entre las moléculas de agua que se producen al denaturarse la estructura
nativa y exponerse los residuos hidrofóbicos a temperaturas suficientemente bajas (Dill y
Bromberg, 2003). En estas condiciones, la fuerza que mantiene la estructura
tridimensional en su estado nativo es de naturaleza entrópica (producto del ordenamiento
de las moléculas de agua en la vecindad de los residuos hidrofóbicos en la proteína
desplegada) (Marx et al., 2007; Feller, 2007).
Coordenadas conformacionales
Psicrofílicas Termofílicas
Figura 5. Modelo de cono de plegamiento propuesto para enzimas psicrofílicas y termofílicas. Extraído de D’Amico et al., 2003. En estos esquemas, la energía potencial (E) se representa en función de la diversidad conformacional.
20
Una observación interesante es que la inactivación térmica de las enzimas
adaptadas a bajas temperaturas frecuentemente precede la denaturación de la estructura
completa (Collins et al., 2003; D’Amico et al., 2003; Georlette et al., 2003b). Esto no
sucede con sus homólogas mesofílicas o termofílicas, en cuyo caso la temperatura de
máxima actividad coincide con la etapa de transición hacia la denaturación, por lo que, en
estas enzimas, la pérdida de actividad es consecuencia directa de la denaturación general
(Collins et al., 2003; D’Amico et al., 2003; Georlette et al., 2003b). Estos resultados
incorporan el concepto de “flexibilidad local” que describe la alta actividad en frío como
resultado de una disminución de la estabilidad en regiones específicas de la estructura,
particularmente en la vecindad del sitio activo (Hoyoux et al., 2004; Marx et al., 2007). Sin
embargo, a través del estudio de enzimas silvestres y mutantes, también se ha asociado
un incremento global de la flexibilidad con el carácter de criofilicidad (Siddiqui y
Cavicchioli, 2006).
1.5.6.3. Relación entre flexibilidad, estabilidad, actividad y adaptación al frío
A pesar de lo descrito en los capítulos precedentes, el entendimiento de la
relación entre flexibilidad, actividad y adaptación al frío aún es precario. Existe
controversia acerca de la relación entre la flexibilidad y la alta actividad a bajas
temperaturas (Hoyoux et al., 2004; Marx et al., 2007). Mientras algunos estudios
experimentales comparativos entre enzimas psicrofílicas, mesofílicas y termofílicas han
tenido éxito estableciendo esta relación (Fields, 2001; Zecchinon et al., 2001; D’Amico et
al., 2003; Georlette et al., 2003b; Bae y Phillips, 2004; Siddiqui y Cavicchioli, 2006), otros
han sido incapaces de confirmarla (Svingor et al., 2001; Zecchinon et al., 2001).
Los datos experimentales disponibles sugieren la existencia de un
compromiso entre estabilidad y actividad en el contexto de la adaptación enzimática a
bajas temperaturas (Siddiqui y Cavicchioli, 2006). Para numerosas enzimas silvestres y
mutantes, un incremento en la actividad coincide con una disminución de la estabilidad,
dándose la situación inversa también (Zecchinon et al., 2001; Hoyoux et al., 2004;
Siddiqui y Cavicchioli, 2006). La gran cantidad de ejemplos de este tipo en la literatura
indican que se trata de un principio general. Sin embargo, existen algunos casos en los
que este compromiso es desafiado. Se ha obtenido por medio de evolución dirigida y
modificaciones químicas, mutantes que presentan simultáneamente alta estabilidad y
21
actividad a bajas temperaturas (Giver et al., 1998; Miyazaki et al., 2000; Zhang et al.,
2003; Siddiqui y Cavicchioli, 2005). Con respecto a esto, se ha propuesto que la baja
estabilidad de las enzimas psicrofílicas responde a la ausencia de presión selectiva por
estructuras estables en sus ambientes naturales, y no se encuentra necesariamente
ligada al proceso de adaptación de la actividad catalítica (Wintrode y Arnold, 2000).
Por otro lado, en enzimas psicrofílicas que contienen múltiples dominios
catalíticos y no catalíticos, se ha observado que el dominio catalítico tiende a ser
termolábil, mientras que los otros dominios pueden ser altamente estables (Bentahir et al.,
2000; Lonhienne et al., 2001). Considerando estas observaciones, resulta poco probable
que la ausencia de presión selectiva afecte cada dominio de manera desigual (Hoyoux et
al., 2004).
Un estudio comparativo en el que se construyeron quimeras compuestas de
dominios provenientes de 3 adenilato kinasas homólogas adaptadas a distintas
temperaturas, reveló que los parámetros de actividad y estabilidad podían ser
determinados en forma separada por dominios diferentes. Mientras un dominio es
responsable de la termoestabilidad de la enzima, otro es el que determina el incremento
de actividad a bajas temperaturas (Bae y Phillips, 2006).
En definitiva, a pesar de las múltiples alternativas factibles, la mayor
flexibilidad y baja estabilidad, global o local, de las enzimas psicrofílicas podría constituir
la estrategia de adaptación al frío más simple en ausencia de presión selectiva por
estructuras estables, pero en presencia de una fuerte presión por biocatalizadores más
activos (Hoyoux et al., 2004).
1.5.6.4. Adaptaciones moleculares al frío: tendencias generales
Se ha observado que las enzimas psicrofílicas tienden a presentar menor
hidrofobicidad interna. Esto se traduce en un aumento del número y volumen de
cavidades, generándose estructuras menos compactas y más flexibles (Leiros et al.,
2003; Bae y Phillips, 2004; Garsoux et al., 2004). Por el contrario, la superficie de estas
enzimas contiene usualmente mayor cantidad de residuos hidrofóbicos (Smalas et al.,
1994; Aghajari et al., 1998; Russell et al., 1998; de Backer et al., 2002; Van Petegem et
al., 2003; Bae y Phillips, 2004). La exposición de residuos apolares es un fenómeno que
22
contribuye entrópicamente a la desestabilización de la estructura, incrementando su
flexibilidad a bajas temperaturas (Feller, 2003; Saunders et al., 2003).
Algunas enzimas psicrofílicas exhiben una mayor cantidad de cargas,
especialmente negativas, en su superficie (Feller et al., 1997; Russell et al., 1998; Leiros
et al., 2000; de Backer et al., 2002; Garsoux et al., 2004; Arnorsdottir et al., 2005). Esto
incrementa las interacciones con el solvente, favoreciendo la flexibilidad a bajas
temperaturas (ver capítulo 1.5.2) (Feller et al., 1999).
El análisis de estructuras 3D, frecuentemente revela que los sitios activos y de
unión a sustrato en las enzimas psicrofílicas son más amplios y accesibles, en relación a
los de enzimas mesofílicas o termofílicas (Aittaleb et al., 1997; Russell et al., 1998;
Aghajari et al., 2003). Esto se logra por medio de distintas adaptaciones específicas, que
suponen cambios conformaciones o ausencia de “loops” al borde del sitio activo; o
reemplazo de cadenas laterales voluminosas por otras más pequeñas en ubicaciones
claves (Feller, 2003; Hoyoux et al., 2004). La amplitud del bolsillo de unión podría permitir
la acomodación de los sustratos a costos energéticos bajos y facilitar la liberación de los
productos (Feller, 2003; Hoyoux et al., 2004).
Sin embargo, la situación opuesta también ha sido documentada. En una
xilanasa psicrofílica, la accesibilidad del sitio de unión a sustrato es sustancialmente
menor en comparación con su homólogo termofílico, debido al plegamiento particular de
un “loop” vecino (Van Petegem et al., 2003).
Otras adaptaciones generales involucran un aumento en el número de
aminoácidos pequeños como glicina, disminución de prolinas (lo que provee mayor
flexibilidad de “loops”), disminución de argininas (capaces de formar múltiples
interacciones iónicas y puentes de hidrógeno), alteraciones desfavorables que debilitan la
interacción carga-dipolo en los extremos de hélices α y una menor cantidad de
interacciones electrostáticas y aromáticas (Feller, 2003).
Cada enzima adopta estrategias de adaptación al frío que le son propias
combinando uno o más de los factores mencionados, además de posibles aspectos aún
desconocidos. En consecuencia existe una gran diversidad de mecanismos efectivos para
alcanzar las capacidades observadas, en su mayoría vinculados con la dinámica de las
estructuras.
23
1.6. Estudio de la dinámica de proteínas
El entendimiento de los aspectos dinámicos relacionados con la actividad, la
estabilidad y la adaptación térmica de enzimas ha avanzado gracias al desarrollo de
herramientas de estudio adecuadas, tanto experimentales como de simulación in silico.
Estas herramientas, cada vez más sofisticadas, permiten a los investigadores presenciar
eventos microscópicos que ocurren a escalas temporales que van generalmente desde
picosegundos hasta varios segundos (Figura 1).
1.6.1. Métodos experimentales
La flexibilidad en proteínas puede ser determinada mediante una variedad de
técnicas como: cristalografía de rayos X (factores B o de Debye-Waller), intercambio
hidrógeno-deuterio en agua pesada, apagamiento dinámico de fluorescencia,
espectroscopia de Mössbauer y de absorción de fotones, dispersión de neutrones y
resonancia magnética nuclear (Zavodszky et al., 1998; Zaccai, 2000; Siddiqui y
Cavicchioli, 2006). Estas metodologías, sin embargo, presentan limitaciones. Sus
resultados son esencialmente cualitativos, la tecnología de rayos X se circunscribe a
cristales solamente y la espectroscopía Mössbauer se restringe generalmente a muestras
sólidas. Adicionalmente, varias de estas metodologías sólo describen el movimiento
general de la estructura, sin distinguir aspectos locales (Daniel et al., 2003).
Los experimentos de NMR permiten estudiar la dinámica de proteínas en solución. Arrojan
un conjunto de confórmeros, de acuerdo a ciertas restricciones geométricas, que
describen parte del universo de microestados posibles en la estructura nativa (Kumar et
al., 2001). La relevancia de los resultados depende en gran medida del espacio
conformacional efectivamente cubierto y de la calidad o resolución de los confórmeros. No
obstante, existen antecedentes experimentales que validan esta técnica como un medio
razonable para el estudio de la estructura y dinámica de proteínas (MacArthur y Thornton,
1993). Para poder establecer correlaciones entre las mediciones experimentales de
dinámica y la actividad en enzimas, es necesario que éstas se encuentren activas bajo las
condiciones particulares de cada metodología. Los ensayos de relajación de NMR
cumplen con este requisito al utilizar sistemas en solución (Eisenmesser et al, 2005).
24
La dispersión de neutrones permite evaluar cuantitativamente el movimiento
global y local de macromoléculas en una gran variedad de estados físicos (polvo,
solución, membranas), no necesariamente cristales. Mediante esta metodología es
posible estudiar, además de estructuras proteicas aisladas, células enteras, obteniéndose
valores promedio que incluyen todas las proteínas en el ambiente celular. La dispersión
de neutrones es una herramienta poderosa y versátil de gran potencial en el estudio de la
dinámica de sistemas biológicos complejos (Réat et al., 1998; Zaccai, 2000).
La espectroscopía de Mössbauer detecta el movimiento de una sonda de
hierro en la estructura (Daniel et al., 2003). Las técnicas de intercambio hidrógeno-
deuterio miden la accesibilidad de los aminoácidos al solvente, que es proporcional a la
tasa de recambio entre los átomos de hidrógeno en la proteína y el deuterio del solvente
(Siddiqui y Cavicchioli, 2006). En la técnica de apagamiento dinámico de fluorescencia
una molécula denominada “apagador” (por ejemplo acrilamida) se infiltra hacia el interior
de la proteína producto de los movimientos de la estructura, donde provoca un
decaimiento en la fluorescencia de triptófanos. La flexibilidad es entonces proporcional a
la permeabilidad de la proteína con respecto al agente apagador (Siddiqui y Cavicchioli,
2006).
Un parámetro altamente recurrido para evaluar la flexibilidad relativa de
residuos y átomos en una proteína es el factor B (o factor de Debye-Waller) obtenido a
partir de los mapas de densidad electrónica en cristalografía de rayos X. Este parámetro
es proporcional al promedio del cuadrado de las fluctuaciones para cada átomo (ecuación
(4)) sin embargo otros factores como el desorden en los cristales también influyen en su
valor (Bahar et al., 1997; Parthasarathy y Murthy, 2000).
Las amplitudes, pero no las frecuencias de las fluctuaciones térmicas pueden
ser estimadas a partir del factor B (Zaccai, 2000).
Cada técnica experimental es capaz de capturar movimientos a distintas
escalas de tiempo específicas. La cristalografía de rayos X promedia horas, la
espectroscopía Mössbauer detecta movimientos del orden de 10-7 s, la dispersión de
neutrones muestrea escalas temporales en el rango 10-12 - 10-8 s y nuevos métodos
basados en resonancia magnética nuclear son capaces de caracterizar los movimientos
!
Bk
=8" 2
3< #R
k.#R
k> (4)
25
directamente relacionados con el ciclo catalítico en el rango 10-6 – 10-3 s (Eisenmesser et
al., 2005).
1.6.2. Métodos computacionales
Las simulaciones computacionales han alcanzado un nivel de desarrollo que
permite generar modelos realistas de la dinámica de macromoléculas complejas como las
proteínas y su entorno (solvente) (Dodson y Verma, 2006). Los datos generados a través
de estas herramientas concuerdan cualitativamente con las mediciones experimentales
(Dodson y Verma, 2006).
La primera visión detallada de los movimientos atómicos en una proteína
surgió en 1977 mediante simulaciones de dinámica molecular en el inhibidor de tripsina
pancreática (McCammon et al., 1977; Karplus y Kuriyan, 2005). Desde estos trabajos
pioneros de Martin Karplus y colegas, el incremento acelerado de la capacidad de cálculo
en los computadores y el desarrollo de parámetros que definen de manera más exacta las
propiedades fisicoquímicas de los sistemas (campos de fuerza) han posibilitado hoy la
realización rutinaria de simulaciones detalladas (Dodson y Verma, 2006). Sin embargo, la
mayoría de los protocolos y sistemas para efectuar dinámica molecular permiten explorar
escalas de tiempo relativamente pequeñas, del orden de los nanosegundos (Agarwal et
al., 2006), aunque se ha reportado simulaciones mas largas (Duan y Kollman, 1998). Para
obtener un muestreo conformacional significativo del estado nativo de una proteína es
necesario efectuar múltiples dinámicas moleculares de larga duración (Kazmirski et al.,
1999). El resultado de estas dinámicas moleculares de larga duración se superpone de
manera significativa con los conjuntos de estructuras obtenidos experimentalmente a
través de NMR (Abseher et al., 1998).
Las fluctuaciones atómicas armónicas pueden ser aproximadas
satisfactoriamente a través de técnicas físico-matemáticas como el análisis de modos
normales (NMA, sus siglas en inglés) (Rader, 2006).
Este método ha sido usado frecuentemente en el campo de las ciencias
físicas para describir movimientos en la vecindad de un estado de equilibrio (Hinsen 1998;
Hayward 2001). Por su simplicidad, permite analizar sistemas macromoleculares
complejos, a escalas de tiempo amplias, que no pueden ser simuladas mediante dinámica
molecular producto del alto costo computacional asociado (Becker y Watanabe, 2001;
26
Hayward, 2001). El NMA se basa en una aproximación armónica de la energía potencial
de un sistema en un mínimo local para determinar las fluctuaciones atómicas y las
frecuencias vibratorias de cada modo de movimiento. Estos parámetros corresponden a
los valores y vectores propios de la matriz hesiana de la función de energía potencial
(Hinsen, 1998; Hayward, 2001). A pesar de los supuestos y gruesas simplificaciones que
conlleva su aplicación, el NMA es reconocido como una herramienta coherente, de
comprobada utilidad en la exploración de la dinámica de proteínas (Hayward, 2001;
Rader, 2006).
Como resultado de la popularidad del NMA, diversos estudios han sido
dedicados a la introducción de nuevos modelos más simples y menos costosos desde el
punto de vista computacional, basados en mecánica de redes de polímeros. El modelo de
red Gaussiana (GNM, sus siglas en inglés) es probablemente el más simple. Consiste en
una red elástica (Elastic Network Model) con potencial armónico único y uniforme. El GNM
fue originalmente propuesto por Bahar y colaboradores (Bahar et al., 1997), basándose en
los trabajos de Tirion (Tirion, 1996) y Flory (Flory 1976), como un método minimalista para
explorar el rol y contribución de restricciones puramente topológicas, determinadas por la
estructura 3-D, en la dinámica colectiva de las proteínas. Sin embargo, estos métodos
minimalistas son incapaces de distinguir cambios específicos que no generan
modificaciones notables en la topología general de las estructuras, como las mutaciones
puntuales.
Una ventaja sustancial que presentan los métodos teóricos para estimar
parámetros dinámicos es que sus resultados son directamente comparables. Esto
frecuentemente no sucede con los datos experimentales. Por ejemplo, cuando existe
disponibilidad de estructuras resueltas mediante difracción de rayos X, los factores B
constituyen un índice útil para detectar regiones de la proteina particularmente flexibles o
rígidas. Sin embargo, si se requiere comparar los factores B de dos o más proteínas el
escenario se complica ya que frecuentemente las condiciones experimentales
(temperatura de cristalización, temperatura de los patrones de difracción, posición de las
moléculas en los cristales, interacciones establecidas dentro de los cristales, etc.), son
desiguales, y por consecuencia los datos generados no son directamente comparables
(Marx et al., 2007).
27
1.7. Hipótesis de trabajo
Es posible identificar residuos claves en la celulasa Cel5A de Bacillus
agaradherans que definen su comportamiento catalítico a diversas temperaturas mediante
análisis comparativos in silico de factores vinculados con la flexibilidad de su estructura y
evaluación experimental de mutantes sitio-dirigidas.
1.8. Modelo de estudio: celulasas pertenecientes a la familia GH5-2
Para validar experimentalmente la hipótesis planteada, se propone usar
celulasas como modelo de estudio. Las celulasas son enzimas capaces de hidrolizar los
enlaces β-1,4-glicosídicos de la celulosa, el polímero más abundante en la biomasa
vegetal y ampliamente distribuido en productos comerciales como prendas textiles, papel
y materias primas para la industria de alimentos (Davies et al., 1998; Violot et al., 2005).
El gran potencial de aplicación de estas enzimas justifica el interés que existe por
entender los aspectos estructurales y mecanísticos de su funcionamiento.
La mayoría de las celulasas exhibe una organización modular, con un dominio
catalítico unido a uno o más dominios sin actividad hidrolítica (Davies et al., 1998;
Henrissat y Davies, 2000). Estos dominios adicionales son responsables de la unión de la
enzima a sustratos poliméricos insolubles, como la celulosa cristalina.
Debido a aspectos relacionados con la disponibilidad de información
estructural adecuada para el análisis in silico, se utilizó únicamente los dominios
catalíticos de las celulasas seleccionadas. Todas las estructuras estudiadas en este
trabajo son homólogas, pertenecientes a la familia 5, sub-familia 2, clan A de las glicósido-
hidrolasas (GH5-2), caracterizadas por un plegamiento tipo barril (α/β)8. Estas enzimas
presentan un mecanismo de catálisis de doble desplazamiento, con retención de la
configuración anomérica (Barras et al., 1992). El centro catalítico está conformado por dos
ácidos glutámicos, un dador de protones (ácido/base) y un nucleófilo (Wang et al., 1993).
Como modelo experimental se utilizó la celulasa mesofílica Cel5A (GH5-2)
proveniente de Bacillus agaradhaerens AC 13 (ATCC 700163), una bacteria alcalofílica
estricta (Nielsen et al., 1995; Davies et al., 1998). Tanto la bacteria de origen, como la
celulasa Cel5A, se encuentran protegidas por patentes internacionales pertenecientes a
28
las empresas danesas Novo Nordisk A/S y Novozymes A/S, respectivamente
(WO9401532, 1994; US6280984, 2001).
29
2. Objetivos
2.1. Objetivo general
Identificar aspectos determinantes de la dinámica estructural en celulasas
pertenecientes a la familia 5-2 de las glicósido-hidrolasas, vinculados con la adaptación de
su actividad catalítica a diversas temperaturas, mediante el uso de herramientas biofísicas
y bioinformáticas.
2.2. Objetivos específicos
1. Diseñar y codificar algoritmos computacionales para efectuar comparaciones de
aspectos estructurales estáticos (interacciones electrostáticas, compactación) y
dinámicos (modos normales) entre proteínas homólogas.
2. Identificar residuos potencialmente involucrados en la adaptación de la actividad
catalítica de celulasas (GH5-2) a diversas temperaturas mediante la aplicación de
los algoritmos computacionales generados en estudio de homólogos estructurales
psicrofílicos y mesofílicos.
3. Validar los resultados obtenidos in silico a través de la construcción y
caracterización bioquímica de mutantes sitio-dirigidas.
30
3. Materiales y Métodos
3.1. Materiales
3.1.1. Cepas bacterianas
• E. coli cepa DH5α: F-, endA1, hsdR17, supE44, thi-1, recA1, gyrA96, relA1,
deoR, Δ(lacZYA-argF), U169 (lacZΔM15).
• E. coli BL21(DE3): F- ompT hsdSB (rB-mB
+) gal dcm (DE3).
• Bacillus agaradherans AC 13 (ATCC 700163; DSM 8721)
3.1.2. Reactivos
Los reactivos utilizados durante el trabajo de tesis y el laboratorio proveedor
se detallan en la Tabla 1.
3.1.3. Vectores de clonamiento y expresión
El plásmido comercial pGEM-T Easy se utilizó como vector de clonamiento de
productos de PCR. Este plásmido se distribuye en forma linearizada y posee una timina
no apareada en el extremo 3’ de cada una de sus hebras. Esto permite la ligación directa
de segmentos de DNA amplificados mediante Taq DNA polimerasa, que poseen extremos
3’ con una adenina no apareada.
Para la producción de proteínas recombinantes en E. coli se utilizó el vector
de expresión comercial pET22b(+) (Novagen). Este vector cuenta con el sistema promotor
del bacteriófago T7, que reconoce la T7 RNA polimerasa, una enzima muy activa y
específica que al ser inducida involucra gran parte de los recursos celulares en la síntesis
de la proteína blanco. La proteína generada contiene un hexapéptido de histidinas en el
extremo C-terminal, lo que facilita su purificación mediante sistemas de afinidad. El
31
plásmido además posee el gen bla (beta-lactamasa), marcador de resistencia a ampicilina
o carbenicilina y la secuencia lider pelB (extremo N-terminal) que dirige la proteína
recombinante al espacio periplásmico.
Laboratorio Reactivos
PROMEGA (WI-USA) Taq DNA polimerasa, pGem-t easy
INVITROGEN (CA-USA) T4 dna ligasa, elongasa, estándar de tamaño molecular 100 kb, dNTPs, cepa E. coli DH5α
SIGMA (MO-USA) X-gal, IPTG
FERMENTAS Estándar de tamaño molecular preteñido de proteínas
DIFCO (DT- USA) Triptona, extracto de levadura, agar
NEW ENGLAND BIOLABS (MA-USA)
Enzimas de restricción NdeI, XhoI
NOVAGEN, MADISON (WI-USA) pET22b(+), E. coli BL21(DE3)
QIAGEN Los sistemas de purificación de productos de PCR, de dna plasmidial y de extracción de DNA desde geles de agarosa, resina Ni-NTA superflow
WINKLER Tris, glicina, SDS, glicerol
J. T. BACKER Cloruro de sodio y ácido bórico.
FERMELO Agarosa
MERK El resto de las sales, ácidos, bases, bromuro de etidio y solventes de grado analítico o de biología molecular
Tabla 1. Reactivos.
32
3.1.4. Medios de cultivo líquidos
3.1.4.1. Medio Luria-Bertani
El medio LB contiene por cada 100 ml de solución: 1 g de triptona, 0,5 g de
extracto de levadura y 0,5 g de cloruro de sodio. Se prepara en agua Milli-Q, se esteriliza
por autoclave y se almacena a temperatura ambiente. Opcionalmente se puede ajustar su
pH a 7.
3.1.4.2. Medio SOB
El medio SOB contiene por cada litro de solución: 20 g de triptona, 5 g de
extracto de levadura, 0,5 g de cloruro de sodio, 10 ml de una solución de cloruro de
potasio 250 mM y 5 ml de una solución de cloruro de magnesio 2 M. Se prepara en agua
Milli-Q. Antes de agregar el cloruro de magnesio, se ajusta el pH del medio a 7 y se
esteriliza por autoclave. La solución de cloruro de magnesio se esteriliza por separado
mediante filtración.
3.1.4.3. Medio Molitor
El medio Molitor contiene por 100 ml de solución: 2 g de triptona, 0,5 g de
extracto de levadura y 0,36 mL de glicerol. Se prepara en agua Milli-Q, se esteriliza por
autoclave y se almacena a temperatura ambiente. Opcionalmente se puede ajustar su pH
a 7 (Salazar et al., 2001).
3.1.5. Medios de cultivo sólidos
Para la preparación de placas con medio sólido se agregó a los medios
líquidos agar al 1,5% P/V.
33
3.1.6. Antibióticos
Los medios líquidos y sólidos fueron suplementados, cuando fue requerido,
con carbenicilina o ampicilina a una concentración final de 100 µg/ml. Estos antibióticos se
esterilizaron por filtración (ver punto 3.1.7).
3.1.7. Soluciones Stock
• IPTG: Solución 0,1 M en agua Milli-Q. Se esteriliza por filtración usando un filtro
con tamaño de poro de 0,2 µm (Sartorius, Hannover-Alemania). Se almacena a
4°C.
• X-Gal: Solución 50 mg/ml en N,N’- dimetil-formamida. Se almacena a -20 °C en un
tubo tapado con papel metálico (alusa) para impedir el paso de la luz.
• Ampicilina y carbenicilina: Solución 100 mg/ml en agua Milli-Q. Se esteriliza por
filtración usando un filtro con tamaño de poro de 0,2 µm. Se almacena a -20 °C.
3.1.8. Recursos informáticos
Los experimentos computacionales fueron realizados en un equipo laptop
Macintosh PowerBook G4, con procesador PowerPC G4 de 1,5 GHz y memoria RAM de
1,25 GB.
Todas las funciones desarrolladas en este trabajo fueron codificadas mediante
el lenguaje de alto nivel “Python”, utilizando herramientas del módulo PDB de Biopython
(www.biopython.org), un proyecto de libre acceso con librerías Python aplicables a
estudios bioinformáticos de biología molecular y estructural (Hamelryck y Manderick,
2003). Los códigos comentados se encuentran en el anexo 4.
34
3.2. Métodos
3.2.1. Teoría del análisis de modos normales
La teoría del análisis de modos normales se basa en la resolución de las
ecuaciones de movimiento de Newton, con la hipótesis de que la función de energía
potencial del sistema en estudio tiene forma cuadrática. Esto ocurre cuando se está en un
mínimo local de energía.
En efecto, la función de energía potencial
!
V r( ) de una molécula constituida
por N átomos puede ser expandida para pequeños desplazamientos atómicos como una
serie de Taylor:
Las sumatorias se efectúan sobre un total de 3N elementos ya que la posición
de cada átomo del sistema se define a través de 3 coordenadas espaciales (x, y, z). El
índice 0, representa el estado inicial y se refiere al sistema en un mínimo local de energía
potencial. Por lo tanto, el término
!
"V "ri( )0
= 0. Adicionalmente, se puede definir la
energía del sistema relativa al estado inicial, lo que se traduce en
!
V r0( ) = 0 . Finalmente,
para desplazamientos los suficientemente pequeños, los elementos de la serie de orden
mayor que dos pueden ignorarse.
Con los supuestos mencionados, la función de energía potencial del sistema
queda de forma cuadrática:
Donde
!
ki, j = " 2V "ri"rj( )0 representa la constante de fuerza relativa a los
elementos i y j.
!
V r( ) = V r0( ) +
"V
"ri
#
$ %
&
' ( 0
ri ) ri0( ) +
1
2
" 2V
"ri"rj
#
$ %
&
' ( 0
ri ) ri0( )
i, j=1
3N
*i=1
3N
* rj ) rj0( ) + ...
!
V r( ) =1
2ki, j ri " ri
0( )i, j
3N
# rj " rj0( )
(5)
(6)
35
En la ecuación (6) la función de energía potencial coincide con la ley de Hooke
que describe el potencial de sistemas tipo resorte:
Donde
!
x corresponde al desplazamiento con respecto a la posición de
equilibrio (
!
x = r " r0) y F es la fuerza aplicada sobre el sistema y
!
k es la constante de
fuerza.
Combinando la ley de Hooke con la expresión de la fuerza según las leyes de
Newton, se tiene:
Resolviendo esta expresión para obtener su extensión en función del tiempo
queda:
Donde
!
" es la frecuencia y A la amplitud de vibración. La segunda derivada
de esta expresión con respecto al tiempo es:
Combinando las ecuaciones (8) y (10) queda:
La ecuación (11) constituye la base para el cálculo de los modos normales de
un sistema.
!
V =1
2kx
2
!
k =d2V
dx2
(7) !
F = "dV
dx= "kx
!
F = ma
!
md2x
dt2
= "kx
!
x t( ) = Asen 2"#t( )
!
d2x
dt2
= "4# 2$ 2x
(8)
(9)
(10)
!
"4# 2$ 2mx = "kx (11)
36
En el caso particular de una molécula, se debe evaluar el movimiento de cada
átomo en las tres coordenadas espaciales (x, y, z).
Para una molécula conformada por N átomos, existen 3N x 3N posibles
segundas derivadas de la energía potencial y, por consecuencia, el mismo número de
constantes de fuerza (ver ecuación (7)). Estas constantes de fuerza se refieren al
movimiento de un átomo individual sujeto a la influencia de todos los demás átomos
presentes en su contexto espacial. Por ejemplo,
es la constante de fuerza aplicada al átomo 1 en la dirección
!
x al desplazarse el átomo 1
en la dirección
!
x . De igual forma,
es la constante de fuerza aplicada al átomo 1 en la dirección
!
x al desplazarse el átomo 2
en la dirección
!
y .
Al describir el comportamiento de cada átomo del sistema en cada
coordenada espacial mediante la ecuación (11), se genera el siguiente conjunto de 3N
ecuaciones:
El segundo termino en cada ecuación, que contiene las constantes de fuerza,
corresponde al negativo de la derivada parcial de la energía potencial total del sistema
con respecto al desplazamiento atómico asociado (ver ecuaciones (6) y (7)). La fuerza
total ejercida sobre el átomo i equivale a la suma de las fuerzas ejercidas por todos los
demás átomos sobre i.
!
" 2V
"x1
2= k
xx
11
!
" 2V
"x1"y
2
= kxy12
!
"4# 2$ 2m1x1= "kxx
11x1" kxy
11y1" kxz
11z1" kxx
12x2" kxy
12y2" ..." kxz
1NzN
"4# 2$ 2m1y1= "kyx
11x1" kyy
11y1" kyz
11z1" kyx
12x2" kyy
12y2" ..." kyz
1NzN
M
"4# 2$ 2m2x2
= "kxx21x1" kxy
21y1" kxz
21z1" kxx
22x2" kxy
22y2" ..." kxz
2NzN
M
"4# 2$ 2mNzN = "kzxN1x1" kzy
N1y1" kzx
N1z1" kzx
N 2x2" kzy
N 2y2" ..." kzz
NNzN
(12)
(13)
(14)
37
Existen diversos métodos numéricos para resolver sistemas de ecuaciones
lineales como el recién descrito. Sin embargo, el problema puede simplificarse
incorporando coordenadas ponderadas por masa. Los desplazamientos quedan de la
siguiente forma:
y las constantes de fuerza:
Con coordenadas ponderadas por masa, las ecuaciones del conjunto (14)
quedan de la forma:
El sistema de ecuaciones (14), expresado en coordenadas ponderadas por
masa (17) puede ser expresado con más claridad en forma matricial:
donde
!
K es una matriz simétrica de tamaño 3N x 3N, que contiene las segundas
derivadas de la energía potencial, o constantes de fuerza, ponderadas por masa
!
˜ k ,
denominada Hessiana,
!
U es un vector de tamaño 3N que contiene los desplazamientos
!
˜ x de cada átomo, y
!
" es una matriz diagonal de tamaño 3N x 3N con las frecuencias
cuadradas
!
" 2, correspondientes a cada vector
!
U . La resolución de esta ecuación
constituye un problema de valores y vectores propios que genera 3N soluciones,
conformadas por un vector propio
!
U y un valor propio
!
" cada una.
El conjunto de vectores
!
U y valores
!
" equivale a los modos normales y
frecuencias normales de la molécula analizada, respectivamente.
En la mayoría de los casos, los modos normales se calculan mediante
diagonalización de la matriz Hessiana
!
K . El proceso de diagonalización permite extraer
los vectores y valores propios de una matriz.
!
˜ x 2
= m2x
2
!
˜ x 1
= m1x
1 (15)
!
˜ k xx
12=
kxx
12
m1
m2
(16)
!
"4# 2$ 2˜ x 1
= " ˜ k xx
11˜ x 1" ˜ k xy
11˜ y 1" ˜ k xz
11˜ z 1" ˜ k xx
12˜ x
2" ˜ k xy
12˜ y
2" ..." ˜ k xz
1N˜ z N (17)
!
K.U = "4# 2$.U (18)
38
Los modos normales se definen como un conjunto de vectores ortogonales de
desplazamientos atómicos, asociados a una determinada frecuencia de vibración, que
constituyen la base del comportamiento dinámico harmónico de una molécula. En
consecuencia, cualquier movimiento harmónico de la molécula en cuestión puede ser
descrito mediante una combinación lineal de sus modos normales.
3.2.2. Fluctuaciones atómicas, matriz Hessiana y modos normales
El movimiento harmónico de los átomos se expresa usualmente como el
promedio del cuadrado de sus fluctuaciones. Si no se consideran los cuadrados de los
desplazamientos, este promedio tiende a cero al anularse los movimientos en direcciones
opuestas.
Las fluctuaciones atómicas cuadradas promedio se pueden obtener a partir de
la información contenida en la matriz Hessiana, aplicando algunos conceptos de mecánica
estadística.
Según la ley de distribución de Boltzmann (capítulo 3, anexo 1), la
probabilidad
!
p(xi) de que una partícula o átomo
!
i en un sistema con volumen y
temperatura constantes se encuentre a una distancia
!
x con respecto a su posición de
equilibrio es:
donde
!
V (xi) es la energía potencial del sistema en función de la posición de la partícula
en cuestión,
!
kB
es la constante de Boltzmann y
!
T es la temperatura absoluta.
El valor del desplazamiento cuadrado promedio de esta partícula corresponde
al ancho de la distribución de probabilidad
!
p(xi) :
!
p(xi) =e"V (xi ) kBT
e"V (xi ) kBT dx
"#
+#
$(19)
!
< xi2
>= xi2p(xi)dxi
"#
#
$ (20)
39
Si consideramos como sistema de estudio la molécula descrita en el capítulo
anterior, con N átomos capaces de interactuar entre sí, las ecuaciones (19) y (20) deben
adoptar una forma matricial. Reemplazando
!
V (x) con la expresión (6) queda:
donde
!
X es un vector columna que contiene los desplazamientos de todos los átomos,
!
XT es la transpuesta de
!
X , y
!
K es la matriz Hessiana del sistema. La matriz Hessiana
contiene todas las segundas derivadas de la energía potencial, es decir las constantes de
fuerza que se establecen en el contexto de las interacciones entre átomos (ecuaciones
(12) y (13)).
Resolviendo la integral en el denominador de la ecuación (21), se obtiene la función de
distribución de probabilidad:
porque
!
e"ax 2
dx = # a
"$
+$
% .
Reemplazando la ecuación (23) en la ecuación (22) queda:
Resolviendo la integral de la ecuación (24), se obtiene la siguiente expresión
para la fluctuación cuadrada promedio:
!
p(X) =K
2"kBT
#
$ %
&
' (
1 2
e)X .K .X T
2kBT
!
< X .XT
>= X .XTp(X)dX =
K
2"kBT
#
$ %
&
' (
1 2
X .XTe)X .K .X T
2kBT dX)*
+*
+)*
+*
+
(23)
(24)
!
p(X ) =e"X .K .X T
2kBT
e"X .K .X T
2kBTdX"#
#
$(21)
!
< X.XT
>= X.XTp(X )dX
"#
#
$ (22)
40
porque
!
x2e"ax 2
dx = 1 4a( ) # a
0
$
% y
!
= 20
"
#$"
"
# .
Las fluctuaciones cuadradas promedio de cada átomo corresponden a los
elementos diagonales de la matriz de autocorrelación
!
< X .XT
>, obtenida a partir de la
inversa de la matriz Hessiana, según la siguiente expresión:
La inversa de la matriz Hessiana se puede calcular a partir de los vectores y
valores propios de la matriz Hessiana original según el método de descomposición
siguiente:
siendo
!
U la matriz con los vectores propios y
!
" la matriz diagonal con los valores propios
de
!
K .
En conformidad con las ecuaciones (26) y (27), las fluctuaciones cuadradas
promedio para cada átomo
!
i pueden obtenerse a partir de los modos normales y sus
frecuencias de acuerdo a:
donde
!
r u
ni
2 es el cuadrado de la norma del modo normal
!
n para el átomo
!
i , y
!
"n
2 es el
cuadrado de la frecuencia angular del modo normal
!
n . Es importante destacar que las
coordenadas de los modos normales expresados en la ecuación (28) no están
ponderadas por masa. En el caso de usarse modos normales ponderados por masa es
necesario dividir la expresión anterior por el producto de la raíz cuadrada de las masas
atómicas correspondientes.
!
< X .XT
>= kBT.K
"1(25)
!
< xi.xi
>= kBT .K
ii
"1
!
K"1
= U.#"1.UT
(26)
(27)
!
< xi.x
i>= k
BT.K
ii
"1= k
BT. #
n
"1.U
ni.U
ni
T
n
$ = kBT.
r u
ni
2
%n
2
n
$ (28)
41
El grado de correlación en el movimiento entre pares de átomos se puede
calcular a partir de los elementos situados fuera de la diagonal de la matriz Hessiana,
mediante la siguiente relación:
Donde:
El valor de
!
Cij se sitúa entre -1 y 1. Correlaciones negativas representan
movimientos antiparalelos y correlaciones positivas representan movimientos paralelos. A
mayor valor absoluto de
!
Cij , mayor correlación entre los átomos i y j.
Combinando las ecuaciones (4) y (28) resulta la siguiente expresión para
calcular el factor B en las estructuras resueltas por difracción de rayos X (ver capítulo
1.6.1):
3.2.3. Energía potencial y funciones de campo de fuerza
La obtención de una función capaz de describir la energía potencial total del
sistema estudiado constituye la primera etapa del análisis de modos normales. Esta
función es esencial para satisfacer el principal supuesto del método: contar con una
conformación particular del sistema que se encuentre en la vecindad de un mínimo local o
global de energía potencial. Además, constituye un prerrequisito para el cálculo de la
matriz Hessiana, a partir de la cual se obtienen los modos normales mediante
diagonalización.
!
Bi
=8" 2
3x
i.x
i=8" 2
kBT
3
r u
ni
2
vn
2
n
# (31)
!
Cij ="xi ."xj
"xi ."xi1/ 2
"xj ."xj1/ 2 (29)
!
< xi .x j >= kBT.
r u i .
r u j
" n
2
n
# (30)
42
En el caso de pequeños sistemas químicos, se ha utilizado con éxito
aproximaciones de mecánica cuántica para calcular funciones de energía potencial
(MacKerrel, 2001). Sin embargo, no se han desarrollado aún aproximaciones de este tipo
para explorar grandes sistemas macromoleculares, como es el caso de las proteínas
(MacKerrel, 2001). Por otra parte, la naturaleza dinámica de los sistemas
macromoleculares supone la realización de cálculos para un gran número de
conformaciones distintas. En consecuencia, se requiere de funciones de energía
relativamente simples, que permitan la realización de un gran número de cálculos en
sistemas de gran tamaño y en tiempos aceptables, recurriendo a la capacidad de
procesamiento computacional disponible.
Las funciones de energía empíricas cumplen con los requerimientos para ser
aplicadas en sistemas bioquímicos y biofísicos (MacKerrel, 2001). A través de ecuaciones
relativamente simples, que describen las interacciones físicas más relevantes, permiten
calcular la energía potencial total como función de la estructura tridimensional del sistema
en cuestión (MacKerrel, 2001).
Las ecuaciones (32), (33) y (34) representan una función de energía potencial
empírica, en la que se separan los términos relacionados con los enlaces covalentes y
aquellos relacionados con las interacciones no-covalentes.
En la ecuación (33), el primer componente da cuenta del cambio de energía
en función del largo de los enlaces covalentes, el segundo componente evalúa el efecto
del cambio en los ángulos de enlace y el tercer componente constituye el aporte de las
variaciones en los ángulos diedros. En la ecuación (34) se consideran los efectos de las
!
V(R)total = V(R)covalente +V(R)no covalente (32)
!
V(R)covalente = KBb " b0( )
2+ K# # "# 0( )
2+ K$ 1+ cos n$ " %( )[ ]
ángulos dihedros
&ángulos
&enlaces
& (33)
!
V(R)no covalente = " ij
Rmin, ij
rij
#
$ %
&
' (
12
)Rmin, ij
rij
#
$ %
&
' (
6*
+
, ,
-
.
/ / +qiqj
"Drij
#
$
% %
&
'
( (
pares de átomos no enlazados
0 (34)
43
interacciones no covalentes entre pares de átomos como las fuerzas de dispersión o Van
der Waals y las fuerzas atractivas o repulsivas entre cargas.
Las variables extraídas de la estructura del sistema son el largo de los enlaces
covalentes (
!
b), los ángulos de valencia (
!
" ), los ángulos diedros o de torsión (
!
" ) y la
distancia entre átomos
!
i, j (
!
rij ). Los demás términos en las ecuaciones corresponden a
parámetros específicos para cada tipo de átomo e interacción. Los parámetros con
subíndice 0 representan los respectivos estados en el equilibrio.
Las variaciones en el largo de los enlaces covalentes y en los ángulos de
valencia son tratadas mediante simples potenciales harmónicos (componentes 1 y 2 en
ecuación (33)), en los que
!
Kb y
!
K" representan las respectivas constantes de fuerza.
Como los enlaces y los ángulos se mantienen cerca de sus posiciones de equilibrio a
temperatura ambiente, estos potenciales harmónicos reproducen en forma precisa la
superficie de energía potencial. Las variaciones en los ángulos de torsión generan
cambios energéticos de naturaleza oscilatoria (la rotación de un enlace puede inducir
cambios periódicos entre conformaciones con distinta energía), por lo que son modelados
eficazmente a través de funciones sinusoidales (tercer componente en ecuación (33)).
Estas funciones sinusoidales se componen de una constante de fuerza,
!
K" , que
determina la barrera energética para la rotación, un índice de periodicidad,
!
n , que indica
el número de ciclos por cada rotación completa (en 360°) y una fase
!
" . Cada ángulo de
torsión puede ser descrito por una sumatoria de varias funciones sinusoidales con
diferentes parámetros, lo que permite aumentar el número de conformaciones modeladas
y en consecuencia reproducir de manera más exacta los resultados experimentales
(MacKerrel, 2001). Para modelar las fuerzas de dispersión se utilizan potenciales del tipo
Lennard-Jones (LJ) (primer componente en ecuación (34)). Estas funciones se rigen por
dos parámetros: la profundidad de la depresión energética,
!
"ij , que señala la magnitud de
las fuerzas de dispersión de London (atractivas) entre los dos átomos considerados
!
i, j , y
la distancia interatómica
!
Rmin
, correspondiente al valor mínimo de potencial. La función de
potencial que describe el comportamiento de las interacciones electrostáticas se deriva de
la ley de Coulomb (segundo componente en ecuación (34)) y considera parámetros de
carga
!
q para cada átomo y la constante dieléctrica
!
"D
del medio (usualmente igual a 1,
correspondiente al vacío) (MacKerrel, 2001).
Los valores de los parámetros descritos se ajustan en función de una gran
variedad de datos experimentales sobre sistemas similares al estudiado.
44
Las funciones de energía potencial empíricas, como la descrita en las
ecuaciones (32)-(34), satisfacen el compromiso entre simplicidad y exactitud, necesario
para su aplicación en sistemas biológicos complejos.
3.2.4. Cálculo de compactación
Para cuantificar la compactación de una proteína es necesario establecer
relaciones físicas que vinculen los distintos elementos de la estructura. Generalmente se
establece un umbral de distancia entre átomos sobre el cual se basan criterios de
conectividad. Este umbral varía usualmente entre 4,0 Å y 8,5 Å dependiendo del método
(Böde et al., 2007; Gunasekaran y Nussinov, 2007) y se define en función de distintas
consideraciones teóricas, tales como la distribución radial de átomos en las estructuras
(Bahar y Jernigan, 1997; Halle, 2002), los radios de Van der Waals (Pattabiraman et al.,
1995), el límite de influencia de las fuerzas atractivas de London-Van der Waals (Greene y
Higman, 2003; del Sol et al., 2006); o empíricas (Plaxco et al., 1998; Robinson-Rechavi et
al., 2006). Diversos métodos que responden a los criterios recién mencionados, como el
OS (occluded surface) (Pattabiraman et al., 1995) y el volumen de Voronoi (Richards,
1974), han probado ser efectivos para estudiar la compactación de proteínas (Fleming y
Richards, 2000). Sin embargo, en este trabajo se optó por el concepto de densidad de
contacto (Halle, 2002; Gunasekaran y Nussinov, 2007). Definimos la densidad de contacto
de un residuo como el número de átomos que hacen contacto con éste. Un átomo está en
contacto con un residuo si se encuentra a una distancia menor que un umbral
!
d = 4 Å con
respecto a cualquiera de los átomos que conforman ese residuo. Esto permite extraer
información detallada acerca del entorno inmediato de cada residuo.
3.2.4.1. Cálculo de la densidad de contacto
La función “residue_contacts_calculator” de la clase “Protein” en el módulo
“structural_analysis.py” calcula la densidad de contacto de un residuo en una proteína
dada, de acuerdo a lo descrito en el párrafo anterior. Sólo los átomos pertenecientes a
residuos separados por más de 3 posiciones en la cadena polipeptídica son considerados
en los cálculos con el fin de evitar información trivial (Robinson-Rechavi et al., 2006).
45
La función “residue_compactation_score_dico_calculator” de la clase “Protein”
en el módulo “structural_analysis.py” aplica la función “residue_contacts_calculator” para
calcular la densidad de contacto de la totalidad de los residuos de una proteína.
La función “protein_compactation_score_dico_generator” del módulo
“cliente_esterico.py” genera como resultado un diccionario que contiene la densidad de
contacto por residuo para todas las proteínas estudiadas.
3.2.5. Análisis de modos normales
Todos los cálculos se efectuaron mediante las herramientas disponibles en la
librería de programas de libre acceso para aplicaciones de simulación molecular, MMTK
(Molecular Modelling Tool Kit, http://dirac.cnrs-orleans.fr/MMTK) (Hinsen, 2000).
La energía potencial de las estructuras estudiadas, disponibles en archivos
formato pdb (protein data bank), se obtuvo mediante la aplicación de funciones de campo
de fuerza contenidas en el paquete AMBER94, disponible en MMTK.
Previo al análisis de modos normales, las estructuras fueron sometidas a una
minimización de energía potencial, utilizando el método de gradiente conjugado. El
proceso se extendió hasta alcanzar un valor de gradiente igual a 0,01 kJoules/nm,
instante en el que se consideró que las estructuras se encontraban en la vecindad de un
mínimo local.
Para disminuir el tiempo de cálculo, se utilizó una metodología particular que
crea un sub-espacio en el cual sólo los movimientos en que los residuos se desplazan
como unidades rígidas son considerados (Hinsen et al., 2000, Tama et al., 2000).
Mediante este procedimiento se descartan todas las vibraciones atómicas internas de
cada residuo, altamente localizadas, que no aportan en la descripción del comportamiento
dinámico general (Hinsen et al., 2000). Por constituir cuerpos rígidos, el análisis de las
fluctuaciones de cada residuo se limita a la evaluación de sus respectivos carbonos alfa.
Los códigos relacionados con los análisis de modos normales se encuentran
en el módulo “cliente_comparacion_NMA.py” (anexo 4).
46
3.2.6. Interacciones electrostáticas
En este trabajo se estudian dos tipos de interacciones electrostáticas
presentes en las estructuras proteicas. Los puentes de hidrógeno y los puentes salinos (o
interacciones iónicas).
Los criterios utilizados para calcular ambos tipos de interacciones a partir de
las coordenadas estructurales son esencialmente geométricos:
Puentes de hidrógeno (McDonald y Thornton, 1994; Torshin el al., 2002)
• Se considera los grupos amino y carboxilo del esqueleto peptídico en todos los
residuos, y todos los grupos dadores y aceptores de puentes de hidrógeno en las
cadenas laterales (ver código en módulo “structural_analysis.py”, clase “Protein”,
anexo 4).
• Distancia entre átomo aceptor e hidrógeno de átomo dador menor que 2,5 Å.
• Ángulo entre átomo dador, hidrógeno y átomo aceptor mayor que 90º.
Puentes salinos (Kumar y Nussinov, 1999)
• Sólo se consideran residuos con cargas opuestas (ver código en módulo
“structural_analysis.py”, clase “Protein”, anexo 4).
• Distancia entre los centroides de los grupos cargados (en las cadenas laterales)
de cada residuo menor que 4 Å.
• Al menos un par de átomos de oxígeno carboxílico y nitrógeno de la cadena lateral
de cada residuo se encuentra a una distancia menor que 4 Å.
Para poder efectuar los cálculos relacionados con la identificación de puentes de
hidrógeno, es necesario conocer las coordenadas de los átomos de hidrógeno
involucrados en tales interacciones. Sin embargo, en la mayoría de las estructuras
proteicas resueltas por cristalografía de rayos X, la posición de los átomos de hidrógeno,
de bajo poder de difracción de rayos X, no puede ser determinada satisfactoriamente (Shu
et al., 2000). En consecuencia, estas coordenadas deben ser calculadas.
La posición de los átomos de hidrógeno se determinó mediante criterios
geométricos estándar usando la librería de programas Python para aplicaciones de
simulación molecular, MMTK (Hinsen, 2000). Las coordenadas de los átomos de
hidrógeno que pueden rotar, y por consecuencia explorar varias conformaciones, se
47
obtuvieron mediante minimización de la energía potencial de las estructuras (capítulo
3.2.5).
Los códigos relacionados con el cálculo de interacciones electrostáticas se
encuentran en los módulos “cliente_puentes_hidrogeno.py”, “cliente_puentes_salinos.py”
y “structural_analysis.py”.
Durante el cálculo de puentes de hidrógeno, se recopila información detallada
sobre cada interacción, como la distancia entre átomos dadores y aceptores, ángulos
dador-hidrógeno-aceptor, la identidad de los átomos dadores y aceptores y la identidad de
los residuos involucrados.
3.2.7. Algoritmos de comparación
Las comparaciones se basan en alineamientos múltiples asistidos por estructura,
formato ClustalW (Higgins y Sharp, 1988) (ver alineamiento de celulasas en anexo 5),
obtenidos a través del programa de libre acceso 3DCoffee (Poirot et al., 2004), desde los
cuales se extrae información acerca de la identidad y posición de los residuos
equivalentes (comparables). Las proteínas estudiadas se clasifican en dos grupos en
función de características diferenciales. Esta información se complementa con los
cálculos de interacciones electrostáticas, de compactación y de modos normales en cada
estructura para generar los respectivos análisis comparativos. Las diferencias detectadas
en los promedios de cada grupo de comparación son validadas estadísticamente
mediante test de Student para varianzas desiguales con un nivel de confianza de 0,05
(ver anexo 2). Para aplicar el test de Student se asume que la distribución de las variables
es normal.
Los códigos de las funciones que extraen información desde los archivos de
alineamientos múltiples junto con el detalle de su funcionamiento se encuentran en la
clase “Alignment” del módulo “structural_analysis.py”, disponible en el anexo 4.
3.2.7.1. Compactación y factores B calculados
Los algoritmos usados para efectuar tanto comparaciones de compactación
como de factores B (o fluctuaciones atómicas) calculados mediante análisis de modos
48
normales son idénticos. Las funciones homólogas “compactation_score_comparator”
(módulo “cliente_esterico.py”) y “protein_groups_Bfactor_comparator” (módulo
“cliente_comparacion_NMA.py”) llevan a cabo las comparaciones de compactación y
factores B calculados, respectivamente, usando la información extraída de los
alineamientos múltiples para identificar los residuos comparables. Estas funciones
además calculan los parámetros requeridos para el análisis estadístico mediante test de
Student (anexo 2). Sólo aquellos datos que presentan diferencias estadísticamente
significativas son considerados en el resultado.
Las funciones “create_compactation_difference_results_file” y
“create_fluctuations_difference_results_file” generan archivos de texto con los resultados
de las comparaciones de compactación y fluctuaciones atómicas, respectivamente. Estos
archivos de texto son interpretados por la función “PymolPython.py” que expone
gráficamente los resultados a través del programa de visualización PyMOL (DeLano,
2002).
3.2.7.2. Interacciones electrostáticas
3.2.7.2.1. Formato de interacciones
Interacciones:
Las interacciones se expresan mediante tuplas (forma de representar un punto
en el espacio, en este caso dos coordenadas) con dos cifras correspondientes a la
posición en el alineamiento múltiple que ocupa cada uno de los residuos involucrados (por
ejemplo: (20,135) representa una interacción entre los residuos que ocupan la posición 20
y 135 en el alineamiento múltiple).
Listas de interacciones:
Las listas de interacciones contienen “sublistas de tuplas” (una sublista se
entiende por una lista contenida o anidada en otra lista). Si hay varias tuplas en una
sublista determinada, se trata de “interacciones equivalentes” (por ejemplo:
[(20,135),(21,136)] es una sublista que contiene dos interacciones equivalentes). El
criterio para considerar dos interacciones como “equivalentes” se describe más adelante.
49
Comparaciones:
Si se detecta dos sublistas de tuplas “idénticas” o “equivalentes” (ver criterios
de comparación) en una comparación el resultado contendrá todas las tuplas no
redundantes de ambas sublistas. Por ejemplo, las sublistas [(15,124),(16,124)] y
[(16,124),(17,125)] generan la sublista resultado [(15,124),(16,124),(17,125)].
3.2.7.2.2. Criterios de comparación
Interacciones equivalentes:
Dos interacciones equivalentes conectan zonas de la estructura que no
difieren en más de x residuos en la cadena lineal, siendo x un determinado valor umbral.
Por ejemplo las interacciones (15,150) y (18,147) se consideran equivalentes si x = 4, ya
que las zonas conectadas difieren de sólo 3 residuos cada una.
Grupos de interacciones equivalentes
Para que un grupo de interacciones equivalentes sea equivalente a otro grupo
de interacciones equivalentes, todas las interacciones individuales que componen ambos
grupos deben ser equivalentes entre sí. Si al menos una de las tuplas no es considerada
equivalente a las demás, los dos grupos son distintos.
Interacciones idénticas
Como definición general, se considera que dos grupos de interacciones son
idénticos cuando contienen exactamente las mismas interacciones o cuando una de las
listas está contenida por completo en la otra.
Ejemplo 1: [(A,B),(C,D),(E,F)] y [(A,B),(C,D)]
Ejemplo 2: [(A,B),(C,D),(E,F)] y [(A,B)]
Ejemplo 3: [(A,B)] y [(A,B)]
Parametro de equivalencia entre interacciones
Para cuantificar la equivalencia entre dos interacciones (o tuplas), se calculan
4 diferencias:
1) la diferencia entre el primer elemento de la tupla 1 y el primer elemento de la tupla 2.
Esta magnitud se denomina “diferencia paralela 1” (DP1).
50
2) la diferencia entre el segundo elemento de la tupla 1 y el segundo elemento de la tupla
2. Esta magnitud se denomina “diferencia paralela 2” (DP2).
3) la diferencia entre el primer elemento de la tupla 1 y el segundo elemento de la tupla 2.
Esta magnitud se denomina “diferencia antiparalela 1” (DA1).
4) la diferencia entre el segundo elemento de la tupla 1 y el primer elemento de la tupla 2.
Esta magnitud se denomina “diferencia antiparalela 2” (DA2).
Considerando las siguientes dos sublistas de tuplas: [(A1,A2)] y [(B1,B2)]:
DP1 = abs(A1 – B1)
DP2 = abs(A2 – B2)
DA1 = abs(A1 – B2)
DA2 = abs(A2 – B1)
Se considera el valor absoluto de cada diferencia para que no se generen
valores negativos.
Estas cuatro diferencias permiten cubrir todas las configuraciones en las que se
puede encontrar un par de tuplas.
Sólo se validan las diferencias menores a un determinado valor umbral (ver
“interacciones equivalentes” en capítulo 3.2.7.2.2).
Un valor parcial del parámetro de equivalencia se obtiene al sumar las dos
diferencias paralelas o antiparalelas entre sí, con la condición de que hayan sido
validadas.
DP1 + DP2 = parámetro parcial paralelo (PPP)
DA1 + DA2 = parámetro parcial antiparalelo (PPA)
Finalmente el parámetro de equivalencia entre las tuplas comparadas es el
mínimo entre los parámetros parciales.
A continuación se ilustra el método a través de tres ejemplos, considerando un
valor umbral de 4.
Ejemplo 1:
Tupla1 = [(10,15)]
51
Tupla2 = [(12,14)]
DP1 = abs(10 – 12) = 2 < 4
DP2 = abs(15 – 14) = 1 < 4
DA1 = abs(10 – 14) = 4 < 4
DA2 = abs(15 – 12) = 3 < 4
En este caso, todas las diferencias cumplen el criterio de equivalencia, por lo
que son validadas.
PPP = DP1 + DP2 = 2 + 1 = 3
PPA = DA1 + DA2 = 4 + 3 = 7
Parámetro de equivalencia = min {PPP;PPA} = min {3;7} = 3
Ejemplo 2:
Tupla1 = [(10,120)]
Tupla2 = [(12,117)]
DP1 = abs(10 – 12) = 2 < 4
DP2 = abs(120 – 117) = 3 < 4
DA1 = abs(10 – 117) = 107 > 4
DA2 = abs(120 – 12) = 108 > 4
En este caso, sólo las diferencias paralelas son válidas.
PPP = DP1 + DP2 = 5 = parámetro de equivalencia
Ejemplo 3:
Tupla1 = [(120,10)]
Tupla2 = [(12,117)]
DP1 = abs(120 – 12) = 108 > 4
DP2 = abs(10 – 117) = 107 > 4
DA1 = abs(120 – 117) = 3 < 4
DA2 = abs(10 – 12) = 2 < 4
52
En este caso, sólo las diferencias paralelas son válidas.
PPA = DA1 + DA2 = 3 + 2 = 5 = parámetro de equivalencia
Parámetro de equivalencia entre grupos de interacciones equivalentes
El parámetro de equivalencia correspondiente a la comparación de dos grupos
de interacciones equivalentes es el mínimo entre los parámetros de equivalencia de cada
par de interacciones comparadas, sin considerar las interacciones idénticas, cuyo
parámetro de equivalencia es cero.
Porcentaje de ocurrencia total de sublistas de tuplas en la comparación intergrupal
Para poder comparar el porcentaje de ocurrencia en ambos grupos de las
sublistas generadas en la comparación intergrupal, es necesario establecer un parámetro
que describa la situación general. El porcentaje de ocurrencia total de una sublista
determinada corresponde a la suma de sus porcentajes de ocurrencia en cada grupo . De
esta manera, una sublista que se encuentra en el 100% de los elementos en ambos
grupos, exhibirá un porcentaje de ocurrencia total de 200%.
3.2.7.2.3. Pseudocódigos de comparación
Comparación de dos listas de interacciones:
• Para cada sublista1 en lista1:
• Se compara esa sublista con todas las sublistas de la lista2 a fin de detectar
interacciones idénticas o equivalentes.
• Las interacciones equivalentes detectadas se dividen en dos categorías:
• semi-idéntica: parte de las tuplas comparadas son idénticas y otras son
equivalentes,
• no-idéntica: todas las tuplas comparadas son equivalentes, no hay tuplas
idénticas.
Esta clasificación permite priorizar la selección de sublistas que contienen al
menos una tupla idéntica. Si no se clasificaran las sublistas “equivalentes” algunas
sublistas del tipo “semi-equivalente” podrían ser eliminadas por sublistas del tipo
“no-equivalente” con parámetro de equivalencia menor. Para entender este
53
escenario es necesario conocer todas las etapas del algoritmo (ver ejemplo 2 en
capítulo 3.2.7.2.5).
• El “loop” sigue corriendo aunque se detecte una sublista de tuplas “idéntica” a la
sublista evaluada, ya que puede haber más de una sublista en la lista 2 que
contenga esta sublista y sea considerada como “idéntica” (ver ejemplo 1 en
capítulo 3.2.7.2.5).
• Las sublistas de tuplas “idénticas” se almacenan directamente en la llave “idéntica”
del diccionario “tuples_in_both_lists” que tiene además llaves “semi-idéntica” y “no-
idéntica”.
• Todas las sublistas “equivalentes” a la sublista1 que son detectadas en la lista2,
junto con su parámetro de equivalencia, se almacenan en listas provisorias
diferenciadas en función de su clasificación (“semi-idéntica”, “no-idéntica”).
• La función “selected_similar_tuples_final_format_generator()” extrae de las listas
provisorias aquellas sublistas que presentan el menor parámetro de equivalencia,
es decir, las que presentan mayor identidad en la comparación. De una misma lista
provisoria pueden ser seleccionadas varias sublistas que presenten el mismo
parámetro de equivalencia (mínimo).
• Las sublistas seleccionadas son incorporadas a las llaves “semi-idéntica” y “no-
idéntica” del diccionario “tuples_in_both_lists”.
• El “loop” anterior completa el diccionario “tuples_in_both_lists” incorporando aquellas
sublistas de tuplas que resultan seleccionadas en el proceso de comparación entre
cada sublista de la lista1 y cada sublista de la lista2.
• Todas las sublistas contenidas en la llave “idéntica” del diccionario
“tuples_in_both_lists” son incorporadas al resultado final como interacciones presentes
en las dos listas comparadas.
• La función “common_tuples_list_filler” analiza las sublistas contenidas en las llaves
“semi-idéntica” y “no-idéntica” del diccionario “tuples_in_both_lists”.
• Se compara todas las sublistas que tengan en común el elemento proveniente de
la lista2 con el fin de elegir aquella que presente el menor parámetro de
equivalencia. Una sublista determinada de la lista2 puede tener varias sublistas
“idénticas” (ver ejemplo 1 en capítulo 3.2.7.2.5) o “equivalentes” en la lista1, por lo
que es necesario seleccionar la pareja más parecida. Es posible que de este
54
proceso resulten seleccionadas más de una sublista con el mismo parámetro de
equivalencia.
• Se incorpora al resultado final las sublistas seleccionadas mediante la función
“_get_format_result_tuple_sublist()” que impone una condición:
• Ninguna tupla perteneciente a la sublista evaluada puede estar contenida en
una sublista previamente clasificada como “idéntica” (esto prioriza la inclusión
de sublistas “idénticas” al resultado final por sobre las “equivalentes”).
Obtención del perfil de interacciones en cada grupo evaluado:
A cada proteína analizada se le asigna una letra del alfabeto. Se definen dos
grupos de comparación, supongamos grupo 1: (A,B,C) y grupo 2: (D,E,F). Para cada
grupo se establecen todas las combinaciones posibles de comparación entre sus
miembros. Para el grupo 1, éstas serían tres: (AB), (AC), (BC) y (ABC).
Las sublistas de tuplas asignadas a una combinación en particular corresponden a
aquellas conservadas entre las combinaciones que cumplen los siguientes dos criterios:
1) Contener una letra (o proteína) menos que la combinación evaluada.
2) Estar completamente contenida en la combinación evaluada.
Este procedimiento es equivalente a seleccionar las sublistas de tuplas
conservadas entre una combinación que cumple con los dos criterios recién mencionados
y la proteína (o letra) restante para completar la combinación evaluada.
Para asignar sublistas de tuplas de manera exclusiva a cada combinación, las
sublistas que se repiten en combinaciones más grandes son eliminadas de las más
pequeñas. Por ejemplo, las sublistas contenidas tanto en la combinación (AB) como en la
combinación (ABC), son eliminadas de la primera.
Comparación de interacciones entre dos grupos:
En la comparación intergrupal la función “_get_format_result_tuple_sublist” no
impone condiciones para la incorporación de nuevas sublistas de tuplas al resultado. Por
lo tanto, una sublista que contiene una tupla en común con otra sublista proveniente de la
categoría “idéntica”, puede formar parte de las tuplas conservadas en los dos grupos
55
analizados. Esta medida evita la pérdida de información en algunos casos particulares
(ver ejemplo 3 en capítulo 3.2.7.2.5), sin embargo, genera algunos inconvenientes
adicionales. El ejemplo 4 en el capítulo 3.2.7.2.5 ilustra un escenario en el cual el
resultado final de sublistas conservadas presenta sublistas contenidas en otras más
grandes (redundantes), y sublistas que comparten las tuplas provenientes de uno u otro
grupo. Éstas últimas no son detectadas ni tratadas en los pasos anteriores del algoritmo
de comparación ya que las tuplas compartidas no provienen de la misma lista. La
condición que afecta estas listas se denominará en adelante “solapamiento cruzado”.
Para refinar el resultado final de la comparación intergrupal se incorpora al
algoritmo tres etapas de selección adicionales. Estas etapas se describen a continuación
mediante un pseudocódigo:
• Para cada “sublista1” en lista de resultados:
• Se compara esa sublista con todas las otras “sublistas2” que conforman la lista de
resultados a fin de detectar aquellas sublistas que comparten al menos una tupla
con la sublista evaluada.
• Todas las “sublistas2” que comparten al menos una tupla con la “sublista1”
evaluada son almacenadas en una lista provisoria denominada “prov_list1” (este
nombre se aplica sólo en el presente pseudocódigo y no aparece en el código
real).
• La “sublista1” evaluada es incorporada al resultado final procesado sólo si cumple
con los siguientes tres requisitos, por orden de prioridad:
1) Su porcentaje de ocurrencia total (ver definición en capítulo 3.2.7.2.2)
debe corresponder al máximo entre las “sublistas2” almacenadas en
“prov_list1”. Si alguna de las “sublistas2” de “prov_list1” presenta un
mayor porcentaje de ocurrencia total, la evaluación de la “sublista1” se
detiene, ésta no es incorporada al resultado final y el “loop” pasa a la
próxima “sublista1”, sin que se ejecuten las siguientes etapas de
selección. Esto se realiza mediante el comando “continue”. En el caso
de haber varias “sublistas2” en “prov_list1” que presentan el porcentaje
de ocurrencia total máximo junto con la “sublista1”, éstas son
almacenadas en una nueva lista provisoria denominada “prov_list2”.
2) El tamaño de la “sublista1”, es decir el número de tuplas que la
componen, debe corresponder al mínimo entre las “sublistas2” de
“prov_list2”. Si existe alguna “sublista2” en “prov_list2” de menor tamaño
56
que la “sublista1”, la evaluación se detiene, la “sublista1” no es
incorporada al resultado final y el “loop” continúa sin que se ejecute la
siguiente etapa de selección. En el caso de haber varias “sublistas2” en
“prov_list2” compuestas por el número de tuplas mínimo al igual que la
“sublista1”, éstas son almacenadas en una última lista provisoria
denominada “prov_list3”.
3) El parámetro de equivalencia (ver definición en capítulo 3.2.7.2.2) de la
“sublista1” debe corresponder al mínimo entre las “sublistas2” de
“prov_list3”. Si alguna de las “sublistas2” de “prov_list3” presenta un
parámetro de equivalencia menor al de la “sublista1”, la evaluación se
detiene, la “sublista1” no es incorporada al resultado final y el “loop”
continúa. Por el contrario, si se cumple esta última condición, la
“sublista1” es incorporada al resultado final y el proceso se repite para la
próxima “sublista1” de la lista original de resultados.
3.2.7.2.4. Resultados
A partir de la lista de interacciones conservadas en ambos grupos y los
resultados de las comparaciones efectuadas por separado en cada grupo se establecen 6
categorías de resultados:
• Interacciones presentes sólo en grupo 1
• Interacciones presentes sólo en grupo 2
• Interacciones más abundantes en grupo 1
• Interacciones más abundantes en grupo 2
• Interacciones totalmente conservadas en ambos grupos
• Interacciones presentes en igual proporción
La función “inter_group_comparator”, además de efectuar la comparación
intergrupal final, clasifica los resultados en 3 categorías iniciales:
• Interacciones presentes sólo en grupo 1
• Interacciones presentes sólo en grupo 2
• Interacciones presentes en ambos grupos
57
Las “interacciones presentes en ambos grupos” son usadas por la función
“groups_comparison_tuple_list_sorter” para construir las restantes cuatro categorías de
clasificación.
El resultado final es entregado a través de un archivo pdf construido por la
función “pdb_results_generator” utilizando la librería Python de acceso libre, ReportLab
(www.reportlab.org/). Este archivo expone los porcentajes de ocurrencia de cada
interacción en los grupos de comparación y la identidad de los residuos involucrados por
proteína para las 6 categorías señaladas (anexo 4).
Mediante el módulo “cliente_detalle_puente_hidrogeno.py” se genera un
archivo pdf con información más detallada acerca de una interacción en particular
(distancias, ángulos, etc.) (anexo 4).
3.2.7.2.5. Casos particulares
Ejemplo 1: Varias sublistas idénticas en una comparación
En una lista de tuplas conservadas resultante de una comparación, puede
haber dos o más sublistas que contengan una misma tupla. Esto ocurre cuando una tupla
perteneciente a una de las listas comparadas es equivalente a dos o más tuplas en la otra
lista.
Supongamos que:
• En la lista 1 existe la sublista: [(15,125)].
• En la lista 2 existen las sublistas [(10,120)] y [(20,130)].
Como resultado de la comparación de ambas listas, surgirán dos sublistas de
tuplas equivalentes con el mismo valor de parámetro de equivalencia considerando un
valor umbral de 5 (ver “Interacciones equivalentes en capítulo 3.2.7.2.2):
[(10,120),(15,125)] y [(20,130),(15,125)]. Ambas sublistas contienen la tupla (15,125).
Si el resultado anterior es sometido a una nueva comparación con una lista que
contiene la sublista [(15,125)], se detectará dos sublistas que cumplen con los requisitos
para ser clasificadas como “idénticas”.
Ejemplo 2: Clasificación de sublistas equivalentes
Consideremos las dos listas de interacciones siguientes:
58
• Lista 1: [ ..... [(11,121),(13,123)] ...... [(14,124)] ..... ]
• Lista 2: [ ..... [(13,123),(15,125)] ...... ]
El resultado del proceso de comparación sería:
• Sublista A en categoría de tuplas “semi-idénticas”: [(11,121),(13,123),(15,125)].
• Sublista B en categoría de tuplas “no-idénticas”: [(14,124),(13,123),(15,125)].
A y B comparten la misma sublista proveniente de la lista 2 ([(13,123),(15,125)]),
por lo que si no estuvieran clasificadas en dos categorías independientes, sus parámetros
de equivalencia serían comparados por la función “common_tuples_list_filler” con el
objetivo de seleccionar el menor. En este escenario, se seleccionaría sólo la sublista B
con parámetro de equivalencia igual a 1, y la sublista A, con parámetro de equivalencia
igual a 2, quedaría fuera del resultado a pesar de compartir una tupla con una sublista de
la lista 2.
La clasificación y tratamiento independiente de sublistas “semi-idénticas” y “no-
idénticas” permite evitar esta pérdida de información.
Ejemplo 3: Incorporación de nuevas sublistas de tuplas al resultado de la comparación
intergrupal
Consideremos 4 proteínas A, B, C y D; y dos grupos de comparación, grupo 1: (AB) y
grupo 2: (CD); con las interacciones siguientes:
• A: [(116,113)]
• B: [(115,112)]
• C: [(115,112)] y [(116,113)]
• D: [(115,111)]
El resultado del proceso de comparación para cada grupo sería:
• Grupo 1: [(116,113),(115,112)]
• Grupo 2: [(115,112),(115,111)] y [(116,113)]
La potencial sublista [(116,113),(115,111)] en el grupo 2 se descarta del resultado
ya que es comparada directamente con la sublista [(115,112),(115,111)], que pertenece a
la misma clasificación (ver ejemplo 2) y presenta un parámetro de equivalencia menor.
Por esta razón queda seleccionada en el resultado la sublista [(116,113)], presente sólo
en la proteína C.
Si la comparación final intergrupal se realizara bajo las mismas condiciones que
las comparaciones en el seno de cada grupo, surgiría la sublista [(116,113),(115,112)]
59
(producto de la comparación entre la sublista [(116,113),(115,112)] del grupo 1 y la
sublista [(116,113)] del grupo 2) clasificada como “idéntica” . Esto impediría la
incorporación de la potencial sublista [(116,113),(115,112),(115,111)] al resultado final
(ver condición impuesta por la función “_get_format_result_tuple_sublist()” en el capítulo
3.2.7.2.3).
El escenario recién descrito genera errores en la asignación de porcentajes de
ocurrencia a las interacciones en cada grupo. En efecto, la sublista [(115,112),(115,111)]
resultante de la comparación en el grupo 2, al no estar representada en la comparación
intergrupal, a través de la sublista [(116,113),(115,112),(115,111)], aparecería clasificada
en la categoría “Interacciones presentes sólo en grupo 2” (ver capítulo 3.2.7.2.4). Sin
embargo, esta sublista contiene la tupla (115,112) existente en la proteína B del grupo 1.
Para evitar inconvenientes como el recién descrito, la función
“_get_format_result_tuple_sublist” no impone condiciones para la incorporación de nuevas
sublistas de tuplas al resultado en la comparación intergrupal.
Ejemplo 4: Comparación intergrupal sin imponer condición establecida en función
“_get_format_result_tuple_sublist”.
Consideremos 4 proteínas A, B, C y D; y dos grupos de comparación, grupo 1: (AB) y
grupo 2: (CD); con las interacciones siguientes:
• A: [(294,276)], [(294,277)] y [(279,292)]
• B: [(294,276)], [(294,277)] y [(279,292)]
• C: [(294,276)], [(294,277)] y [(279,292)]
• D: [(294,276)], [(294,277)] y [(279,292)]
El resultado del proceso de comparación para cada grupo sería:
• Grupo 1: [(294,276)], [(294,277)] y [(279,292)]
• Grupo 2: [(294,276)], [(294,277)] y [(279,292)]
El resultado de la comparación intergrupal, que no impone la condición establecida en la
función “_get_format_result_tuple_sublist” sería:
• Sublista A: [(294,276)] presente en el 100% de las proteínas
• Sublista B: [(294,277)] presente en el 100% de las proteínas
• Sublista C: [(279,292)] presente en el 100% de las proteínas
• Sublista D: [(294,276),(294,277)] presente en el 100% de las proteínas
• Sublista E: [(294,277),(279,292)] presente en el 100% de las proteínas
60
Las sublistas A, B y C están contenidas en las sublistas D y E, lo que genera
redundancia.
Las sublistas D y E comparten una tupla que proviene del grupo 2 en el caso de D
y del grupo 1 en el caso de E. Esta condición se denomina “solapamiento cruzado”.
3.2.8. Cultivo de microorganismos
3.2.8.1. Mantención de microorganismos
Para ser almacenadas por períodos cortos, las cepas de E. coli se crecieron
O.N. a 37 °C en placas con medio sólido LB suplementado con ampicilina o carbenicilina
cuando era requerido. Estos cultivos se mantuvieron a 4°C y se renovaron cada 30 días.
Para almacenamientos por períodos mayores a 30 días, las cepas se crecieron O.N. en
medio líquido LB suplementado con antibióticos cuando era requerido. Los cultivos se
criopreservaron a -80°C en el mismo medio, suplementado con glicerol al 25% v/v.
3.2.8.2. Crecimiento de cepas en cultivos líquidos
Las cepas de E. coli se inocularon en los medios correspondientes y se
incubaron a 37ºC en un agitador orbital (MaxQ 4000, Barnstead, Lab-Line, Iowa, USA)
hasta alcanzar la D.O. deseada.
3.2.9. Extracción de DNA plasmidial
El DNA plasmidial se extrajo a partir de un cultivo en 4 mL de medio LB
incubado por 16 h a 37ºC y 200 rpm. Para esto se utilizó el kit QIAprep Spin Miniprep
(QIAGEN). Este kit está basado en el método de lisis alcalina (Birnboim y Doly, 1979), y
en la unión específica del ADN a sílica en presencia de una elevada concentración salina.
El protocolo consta de tres etapas principales: lisis celular con SDS y NaOH, adsorción
del ADN a una columna de sílica y lavado/elución del ADN. La extracción se realizó según
las instrucciones del fabricante.
61
3.2.10. Mutaciones sitio-dirigidas
Para realizar mutaciones sitio-dirigidas se utilizó un procedimiento basado en
el método del kit QuikChange (Stratagene). Este método permite mutar secuencias de
DNA en una gran variedad de plásmidos sin requerir sitios de restricción específicos o
múltiples etapas de clonamiento.
Mediante una reacción de PCR utilizando 2 partidores complementarios entre
sí que contienen la mutación, se amplifica directamente el DNA plasmidial
sobreenrrollado. Para esto se empleó la enzima KOD Hot Start DNA polimerasa
(Novagen). Al término de los ciclos de amplificación se obtiene una población de
plásmidos mutantes con cortes en el extremo 5’ de cada primer. La mezcla de reacción se
somete a una digestión con Dpn I, una endonucleasa de restricción que reconoce sólo
DNA metilado o hemi-metilado. Durante esta etapa se degrada en forma selectiva el
plásmido original usado como templado, que al provenir de una cepa de E. coli dcm+
(BL21 (DE3)), se encuentra metilado. Los plásmidos cortados que contienen los genes
mutantes se transforman en una cepa de E. coli receptora, donde son reparados. Para
comprobar el éxito del procedimiento, se extrae el DNA plasmidial de colonias
seleccionadas y se constata la presencia de la mutación mediante secuenciación.
3.2.11. Amplificación del DNA por PCR
En este trabajo se utilizó la reacción en cadena de la polimerasa (PCR) para
amplificar y clonar la secuencia del módulo catalítico de las celulasas estudiadas, evaluar
la presencia de inserto en colonias aisladas resultantes de los procesos de clonación y
generar mutantes sitio-dirigidas mediante el método descrito en el punto anterior.
3.2.11.1. Partidores
Los partidores utilizados en este trabajo se resumen en la tabla 2. Las Tm se
calcularon mediante la siguiente relación, recomendada en el manual del kit QuikChange
(Stratagene):
62
donde
!
%GC es el porcentaje de guaninas y citosinas en la secuencia,
!
N es el
largo del partidor en número de nucleótidos y
!
%PBNA es el porcentaje de bases no
apareadas. Es recomendable que las Tm de los partidores mutagénicos sean iguales o
superiores a 78 °C.
Todos los oligonucleótidos se mandaron a sintetizar a Fermelo y Macrogen
(Corea).
NOMBRE SECUENCIA (5’→ 3’) Ta (°C)
CEL5A-MC-NDEI-FW CATATGGTTGTAGAAGAACATGGGCAATTAAG 55
CEL5A-MC-XHOI-RV CTCGAGTGGCGGAATAGATGCTGATTCTC 55
Y134-CEL5A-FW CCGAATGTGATATACGAAATTTACAATGAACCGAATGGTAGTGATG 59
Y134-CEL5A-RV CATCACTACCATTCGGTTCATTGTAAATTTCGTATATCACATTCGG 59
F134-CEL5A-FW CCGAATGTGATATACGAAATTTTCAATGAACCGAATGGTAGTGATG 59
F134-CEL5A-RV CATCACTACCATTCGGTTCATTGAAAATTTCGTATATCACATTCGG 59
I99A-CEL5A-FW GTGATCATTGATTGGCATGCCCTTTCAGACAATGACCC 59
I99A-CEL5A-RV GGGTCATTGTCTGAAAGGGCATGCCAATCAATGATCAC 59
N138L-CEL5A-FW AATGAACCGCTTGGTAGTGATGTTACGTGGGGC 59
N138L-CEL5A-RV GCCCCACGTAACATCACTACCAAGCGGTTCATT 59
Tabla 2. Partidores. En los partidores Cel5A-MC-NdeI-Fw y Cel5A-MC-XhoI-Rv, los nucleótidos destacados con letra gruesa corresponden a las secuencias de reconocimiento de las enzimas de restricción NdeI y XhoI, respectivamente. En los partidores mutagénicos, los codones destacados con letra gruesa corresponden a los residuos modificados. Ta: temperatura de “annealing” usada en los programas de PCR.
!
Tm
= 81,5 + 0,41 %GC( ) " 675 N "% PBNA (35)
63
3.2.11.2. Mezclas de reacción
Las mezclas de reacción utilizadas para los ensayos de PCR con Taq DNA
polimerasa y KOD Hot Start DNA polimerasa se detallan en la Tabla 3.
TAQ DNA POLIMERASA KOD HOT START DNA POLIMERASA
COMPONENTE CANTIDAD COMPONENTE CANTIDAD
Buffer 5x 10 µl Buffer 10x 2 µl
MgCl2 (25 mM) 4 µl MgSo4 (25 mM) 0,8 µl
dNTP (10 mM) 1 µl dNTP (10 mM) 0,4 µl
Partidor 1 (10 mM) 2 µl Partidor 1 (10 mM) 0,8 µl
Partidor 2 (10 mM) 2 µl Partidor 2 (10 mM) 0,8 µl
DNA templado 2 µl DNA templado 2 µl
Taq DNA polimerasa 1 µl KOD Hot Start DNA polimerasa 0,5 µl
H2O 28 µl H2O 12,7 µl
TOTAL 50 µL TOTAL 20 µL
3.2.11.3. Programas
El programa de PCR utilizado para generar mutaciones sitio-dirigidas con la
enzima KOD Hot Start DNA polimerasa consistió en una etapa de activación de la
polimerasa (2 min a 95°C), 30 ciclos de amplificación (45 s a 95°C, 45 s a la Ta elegida
(ver Tabla 2) y 9 min a 70°C) y un ciclo de extensión final (10 min a 70°C).
Para todos los PCR realizados con la enzima Taq DNA polimerasa se utilizó el
mismo programa pero con una temperatura y tiempo de extensión de 72°C y 1 min 30 s,
respectivamente. Los programas se llevaron a cabo en un termociclador Eppendorf
Mastercycler gradient.
Tabla 3. Mezclas de reacción para Taq DNA polimerasa y KOD Hot Start DNA polimerasa.
64
3.2.12. Electroforesis de DNA
Las muestras se mezclaron en proporción 5:1 con buffer de carga 6X (glicerol
30% p/v y azul de bromofenol 0,25% p/v) y se cargaron en geles de agarosa al 0,8%
preparados con buffer TAE (Tris 40 mM, acetato 20 mM y EDTA 1 mM) y bromuro de
etidio 0,2 µg/mL. Las electroforesis se realizaron en una cámara horizontal Horizon-58
(Gibco-BRL Life Technologies, Inc., MA-USA) con un voltaje constante de 100 V generado
por una fuente de poder modelo 500 de BRL Life Technologies, Inc., MD-USA. Se empleó
TAE como buffer de corrida. Las bandas de DNA se visualizaron mediante un
transiluminador UV.
3.2.13. Purificación de DNA a partir de geles de agarosa
La extracción y purificación de DNA desde geles de agarosa se realizó
mediante el kit QIAEX II Gel Extraction (Qiagen), según las instrucciones del fabricante.
3.2.14. Digestión del DNA
Para digerir el DNA plasmidial se usó las endonucleasas de restricción
indicadas en los procedimientos, según protocolos estándares (Ausubel et al., 1992).
3.2.15. Reacciones de ligación
Las ligaciones en el vector de clonamiento pGEM-T Easy (Promega) se
realizaron de acuerdo a las instrucciones del fabricante usando los reactivos
suplementados en el kit.
Las ligaciones en el vector de expresión pET22b(+) se efectuaron mediante el
sistema T4 DNA ligasa (Invitrogen) de acuerdo a las instrucciones del fabricante.
Las mezclas de reacción, con un volumen final de 10 µl, se incubaron O.N. a
16 °C.
Se usó 1 µl de la mezcla de reacción para transformar las cepas de E. coli.
65
3.2.16. Preparación de células electrocompetentes
Se inoculó 10 mL de medio SOB con una colonia de la cepa requerida y se
creció el cultivo a 37ºC con agitación durante 16 h. Se midió la densidad óptica (D.O) del
cultivo a una longitud de onda de 620 nm, utilizando como blanco medio estéril, y se
inoculó 1 L de medio estéril fresco con el volumen adecuado para establecer una D.O620
inicial de 0,05. Se incubó el cultivo a 37ºC con agitación hasta alcanzar un valor de D.O620
entre 0,6 y 0,8 (2-4 h). El cultivo se enfrió en hielo durante 10 min y se centrifugó a 5.000
x gv
y 4ºC durante 10 min (centrífuga Sorvall® RC-28S y rotor GS-3 Sorvall®, DuPont,
CT, USA). El precipitado se lavó 4 veces con glicerol 10% v/v estéril preparado en agua
Milli-Q. Luego del último lavado, el precipitado se resuspendió en el residuo de glicerol, y
se alicuotó en volúmenes precisos para su utilización (entre 25 y 100 µL). Las células
electrocompetentes se almacenaron a -80ºC.
3.2.17. Transformación de células electrocompetentes
Se agregó 1 µL de mezcla de ligación sobre 20 µL de células
electrocompetentes. La electroporación se realizó en un equipo Cell-Porator®
Electroporation System (Gibco-BRL Life Technologies, Inc., MD-USA) bajo las siguientes
condiciones: 420 V, 330 µF, baja impedancia, tasa de carga rápida y tiempo máximo de
2,5 mseg. Las células transformadas se mezclaron con 1 mL de medio LB precalentado a
37ºC y se incubaron con agitación (200 rpm) a la misma temperatura, durante 1 h. Se
plaqueó entre 20 y 100 µL del precultivo en placas selectivas de medio LB suplementado
con carbenicilina (100 µg/mL). El volumen restante de precultivo se centrifugó a 13.000
rpm (centrífuga Eppendorf 5403 de Eppendorf AG, Hamburgo, Alemania) durante 1 min y
se descartó 850 µL de sobrenadante. El precipitado se resuspendió en el medio
remanente y se plaqueó 50 µL de la suspensión en las placas de medio selectivo ya
descritas. Este procedimiento permite cubrir un rango de concentraciones celulares
amplio, lo que aumenta las probabilidades de obtener un número aceptable de colonias
aisladas.
66
3.2.18. PCR de colonias
Este procedimiento permite evaluar en forma rápida y eficiente la presencia de
determinados genes en colonias de células aisladas. Las colonias se transfirieron
paralelamente, mediante una punta amarilla estéril, a una placa con medio LB agar
suplementado con carbenicilina para ser almacenadas, y a un tubo Eppendorf con 100 µL
de agua Milli-Q estéril. La suspensión resultante en el tubo Eppendorf se incubó a 100ºC
durante 10 min para inducir la lisis celular y se centrifugó a 13.000 x gv
por 1 min. El
sobrenadante se usó como DNA templado en una reacción de PCR con Taq DNA
polimerasa y los partidores adecuados para amplificar el gen requerido (Tabla 3). El
resultado de la amplificación se analizó mediante electroforesis en gel de agarosa.
3.2.19. Clonamiento del dominio catalítico de la celulasa Cel5A en el plásmido de
expresión pET22(+)
La secuencia de ADN codificante para la celulasa Cel5A se clonó en el
plásmido de expresión pET22b(+) sin el péptido señal pelB en el extremo amino terminal.
La secuencia de DNA codificante para el módulo catalítico de la celulasa
mesofílica Cel5A (Cel5A-MC) se amplificó desde el DNA total de Bacillus agaradherans
AC 13 (ATCC 700163) mediante PCR de colonias usando KOD Hot Start DNA
polimerasa. En este procedimiento se utilizó la pareja de partidores Cel5A-MC-NdeI-
Fw/Cel5A-MC-XhoI-Rv, que incorpora sitios de corte para las endonucleasas NdeI y XhoI
en los extremos 5’ y 3’ de la secuencia amplificada, respectivamente. Los sitios de corte
mencionados permiten incorporar la secuencia de Cel5A-MC en el vector de expresión
pET22b(+) sin la secuencia del péptido señal pelB en el extremo 5’ y justo antes de la cola
de poli-histidina.
El resultado de la amplificación se ligó al vector de clonación pGEM-T Easy y
se incorporó a células de E. coli DH5α electrocompetentes mediante electroporación. La
presencia de inserto en las colonias resultantes se determinó por PCR de colonias. Se
seleccionó colonias con inserto y se les extrajo el DNA plasmidial. Este DNA se digirió con
las enzimas de restricción correspondientes (NdeI y XhoI), los fragmentos producidos se
separaron mediante electroforesis en gel de agarosa, se purificaron y se ligaron en
pET22b(+) previamente digerido y purificado de manera homóloga. La mezcla de ligación
67
se transformó en células de E. coli BL21(DE3). Se seleccionó 3 colonias con inserto por
PCR de colonias, se extrajo su DNA plasmidial y se comprobó la presencia del gen
deseado mediante secuenciación.
Las células de E. coli BL21(DE3) son lisógenos del fago λDE3, y por lo tanto
cuentan con una copia cromosomal del gen de la RNA polimerasa del fago T7, bajo el
control del promotor lacUV5 (inducido por IPTG). Producto de esto, representan un
huésped adecuado para la expresión de proteínas recombinantes mediante el sistema
pET22(+).
3.2.20. Producción recombinante de las celulasas
3.2.20.1. Inducción de la síntesis de proteínas recombinantes
Se inoculó una colonia de células BL21(DE3) recombinantes, que contienen el
vector pET22b(+) con el gen de interés, en 8 ml de medio Molitor suplementado con
carbenicilina. El cultivo se creció a 37°C O.N con agitación de 200 rpm. Se inició un nuevo
cultivo en 400 ml del mismo medio fresco inoculando la totalidad del pre-cultivo O.N, y se
creció en las mismas condiciones. Al alcanzar una O.D600 de 1,45 (aproximadamente 6 h),
el cultivo se separó en dos fracciones idénticas de 200 ml. Una fracción se usó como
control sin inducir y la otra se indujo agregando IPTG a una concentración final de 0,5
mM. Las fracciones se incubaron O.N a 18°C bajo las mismas condiciones de agitación.
3.2.20.2. Purificación de las proteínas recombinantes
Las células se recolectaron mediante centrifugación a 5.000 x gv
por 10 min
(centrífuga Sorvall® RC-28S y rotor GS-3 Sorvall®, DuPont, CT, USA). El sobrenadante, o
fracción extracelular, se descartó. El sedimentado, que contiene las fracciones
intracelulares solubles e insolubles se resuspendió en 10 ml de buffer de unión (NaCl 300
mM, NaH2PO4 50 mM, Imidazol 4 mM, pH 8), se sonicó (Sonicador Microson, Equilab) en
baño de hielo con 5 pulsos de 30 s aplicando potencia máxima, y se centrifugó a 10.000 x
gv
durante 30 min. El sobrenadante, que corresponde a la fracción intracelular soluble, se
guardó a 4°C para ser usado en los pasos posteriores de purificación.
68
Las celulasas recombinantes se purificaron por afinidad mediante una resina
de níquel (Ni-NTA superflow, QIAGEN), siguiendo la instrucciones del proveedor. Esta
resina interactúa con la cola de poli-histidina incorporada por el sistema de expresión
pET22b(+). Se agregó 0,5 ml de resina al sobrenadante obtenido en la etapa anterior y se
incubó la mezcla en baño de hielo durante 2 h con agitador magnético suave.
Posteriormente la resina se empacó en una columna, se lavó con 4 ml de buffer de unión
y se eluyó con 2,5 ml de buffer de elución (NaCl 300 mM, NaH2PO4 50 mM, Imidazol 250
mM, pH 8). La pureza de las proteínas recombinantes fue evaluada mediante
electroforesis (SDS-PAGE).
3.2.21. Electroforesis de proteínas (SDS-PAGE)
Las separaciones electroforéticas en condiciones desnaturantes se realizaron
en una cámara vertical MiniProtean II (Bio-Rad Laboratories Inc., CA-USA). Las muestras
se mezclaron en proporción 4:1 con buffer de carga 5X (Tris/HCl 60 mM, glicerol 25% v/v,
SDS 2% p/v, 2-mercaptoetanol 14,4 mM y azul de bromofenol 0,1% p/v pH 6,8), se
desnaturaron mediante incubación a 100°C durante 5 min y posteriormente se cargaron
en geles de acrilamida/bis-acrilamida preparados de acuerdo a los procedimientos
estándares (Bollag et al., 1996). Las electroforesis se realizaron bajo voltaje constante de
200 V (fuentes de poder Power Pac 1000 de Bio-Rad Laboratories Inc., CA-USA o Power
Supply EPS 3500XL de Pharmacia Biotech AB, Uppsala, Suecia). Como buffer de corrida
se utilizó Tris-glicina-SDS (Tris 25 mM, glicina 192 mM y SDS 0,1% p/v) (Bollag et al.,
1996).
Para visualizar las proteínas, cada gel se tiñó durante 30 min en una solución
de tinción Coomasie (45% metanol, 10% ácido acético, 45% agua destilada y 1 g de azul
de Coomasie), y se destiñó en una solución de destinción (45% metanol, 10% ácido
acético, 45% agua destilada) hasta la aparición de bandas bien definidas (30-60 min).
3.2.22. Determinación de la concentración de proteínas
La concentración de proteína se determinó mediante un ensayo de Bradford
(Bradford, 1976) modificado, para lo cual se mezcló: 1,2 mL de agua destilada, 0,5 mL de
69
Coomassie 1 g/L preparado en HCl 2,2% v/v y 50 µL de muestra o proteína estándar de
calibración. Se midió la absorbancia de la mezcla a 465 (abs465) y 595 nm (abs595) y se
calculó la razón abs595/ abs465. El valor control obtenido en ausencia de proteína se restó a
todos los resultados. Las cuantificaciones se realizaron en base a una curva de
calibración con BSA (seroalbúmina de bovino) en un rango de concentraciones entre 0,06
y 1 mg/mL.
A pesar de los pasos de purificación, las proteínas recombinantes se
obtuvieron mezcladas con bajas concentraciones de otras proteínas contaminantes. Por lo
tanto, para determinar su concentración a partir de la información generada por los
ensayos de Bradford fue necesario establecer su porcentaje en relación al total. Para esto
se utilizó el programa Gel-Pro Analyzer versión 4 (Media Cybernetics, L.P. 1996-2000),
que permite obtener una imagen digitalizada de los geles de poliacrilamida o agarosa y
calcular el porcentaje representado por cada banda. En todos los casos el nivel de pureza
de las proteínas recombinantes superó el 50% (entre 50% y 60%).
3.2.23. Ensayos de actividad enzimática
Para medir la actividad de las celulasas recombinantes, se usó el sustrato
sintético p-nitrofenil-β-D-celobiósido (pNFC), cuya hidrólisis genera p-nitrofenol (pNF), un
compuesto amarillo de fácil detección por medio de espectrofotometría.
Se mezcló 45 µl de pNFC 20 mM preparado en buffer Hepes 50 mM (pH 7,5)
con 5 µl de celulasa purificada. Se incubó la mezcla de reacción a una temperatura
determinada, en el rango entre 10°C y 40°C, usando un termociclador Eppendorf
Mastercycler gradient como incubador, hasta la aparición de color amarillo. La enzima se
inactivó agregando 100 µl de Na2CO3 1M. Se traspasó una alícuota de 100 µl a
microplacas desechables de 96 pocillos (Falcon 3912) para determinar su absorbancia a
405 nm en un lector de placas (Anthos 2010). La variación de absorbancia durante el
período de incubación en todos los ensayos mostró un comportamiento lineal.
La concentración de pNF generado se calculó a partir de los valores de
absorbancia, en base a una curva de calibración construida con distintas concentraciones
del mismo compuesto. A todos los valores experimentales obtenidos se les restó el valor
del blanco, consistente en la mezcla de reacción sin enzima y sometida a los mismos
tratamientos que las muestras.
70
La actividad enzimática se expresó en µmoles de pNF liberados por litro de
reacción y por minuto (
!
µmoles min.L ). La actividad específica corresponde a la actividad
por mg de enzima.
3.2.24. Determinación de los parámetros cinéticos de las enzimas recombinantes
Los parámetros cinéticos
!
VMAX
y
!
Km
se calcularon mediante una regresión no
lineal de las curvas de saturación (velocidad de reacción v/s concentración de sustrato)
usando la ecuación cinética de Michaelis-Menten.
La
!
kCAT
se calculó en base a las ecuaciones siguientes:
donde
!
VMAX
es la velocidad máxima de conversión de sustrato y
!
E[ ]saturada
es
la concentración de enzima en condiciones saturantes.
3.2.25. Determinación de los parámetros termodinámicos de activación
La energía de activación
!
Ea de las reacciones enzimáticas se calculó a partir
de la pendiente de gráficos de Arrhenius.
Aplicando logaritmo a la ecuación de Arrhenius (ecuación 70 anexo I) se
obtiene:
!
VMAX
= kCAT. E[ ]
saturada (36)
!
kCAT
=VMAX
E[ ]saturada
(37)
!
log kCAT ="Ea
RT+ logA (38)
71
En un gráfico de Arrhenius, que expone la dependencia del logaritmo de la
constante catalítica en función de la inversa de la temperatura, la pendiente corresponde
a
!
"EaR .
Los parámetros termodinámicos de activación se calcularon usando las
siguientes ecuaciones (Lonhienne et al., 2000):
3.2.26. Modelamiento estructural del dominio catalítico de CelA8
La estructura 3D del dominio catalítico de la celulasa psicrofílica CelA8 se
determinó mediante modelación por homología, a través del programa de acceso libre
MODELLER versión 8v2 (Sali y Blundell, 1993), usando como templado la secuencia y
estructura de la celulasa psicrofílica de Pseudoalteromonas haloplanktis, Cel5G (Violot et
al., 2005). Las secuencias que codifican para los módulos catalíticos de las celulasas
Cel5G y CelA8 presentan un alto porcentaje de identidad (88%). Esto permitió obtener un
alineamiento de buena calidad usando el programa ClustalW (Higgins y Sharp, 1988), que
no requirió modificaciones posteriores. Para ser usado por el programa MODELLER, el
alineamiento de secuencias debe ser presentado en formato pir.
El módulo “CelA8.py” contiene el código en lenguaje Python utilizado para
generar 50 modelos candidatos. La calidad de los modelos se evaluó mediante el
programa de libre acceso VERIFY3D (Bowie et al., 1991; Lüthy et al., 1992). Este
programa evalúa el ambiente estructural de cada aminoácido y establece un parámetro de
calidad usando como referencia información extraída desde estructuras correctamente
plegadas. Se eligió el modelo candidato de mejor calidad.
!
"G# = RT ln k
BT h( ) # ln kCAT[ ]
!
"H#
= Ea# RT
!
"S# = "H
## "G
#( ) T
(39)
(40)
(41)
72
4. Resultados
Se realizó un análisis estructural comparativo del dominio catalítico de 5
celulasas adaptadas a distintos rangos de temperaturas: una celulasa termofílica, Cel5B,
de Thermobifida fusca (código PDB: 2CKS), 2 celulasas mesofílicas, Cel5 (ex CelZ) de
Erwinia chrysanthemi (código PDB: 1EGZ) (Chapon et al., 2001) y Cel5A de Bacillus
agaradherans (código PDB: 1QHZ) (Davies et al., 1998; Varrot et al., 2000), y 2 celulasas
psicrofílicas, Cel5G de Pseudoalteromonas haloplanktis (código PDB: 1TVN) (Violot et al.,
2005) y CelA8, aislada en nuestro laboratorio desde una cepa de Pseudoalteromonas de
origen marino antártico.
Debido a la carencia de información estructural experimental sobre la celulasa
psicrofílica CelA8, fue necesario confeccionar un modelo por homología de la
conformación tridimensional de su dominio catalítico (ver capítulo 3.2.26).
Todas las estructuras estudiadas son homólogas. Pertenecen a la familia 5
(sub-familia 2) de las glicósido-hidrolasas y comparten el mismo plegamiento (ver capítulo
1.8). Las diferencias estructurales son sutiles y se concentran principalmente a nivel de
los “loops” (Figura 6). Esto posibilita la realización de análisis comparativos. La Tabla 4 y
la Tabla 5 exponen los datos de similitud de secuencia y estructural, respectivamente,
entre cada una de las enzimas.
Cel5A (M) Cel5B (T) Cel5G (P) CelA8 (P)
Cel5 (M) 47 % 36 % 64 % 66 %
Cel5A (M) - 38 % 42 % 40 %
Cel5B (T) - - 33 % 34 %
Cel5G (P) - - - 88 %
Tabla 4. Porcentaje de identidad de secuencia entre las celulasas Cel5, Cel5A, Cel5B, Cel5G y CelA8. Se especifica la naturaleza psicrofílica (P), mesofílica (M) o termofílica (T) de cada enzima.
73
Cel5A (M) Cel5B (T) Cel5G (P) CelA8 (P)
Cel5 (M) 0,89 (90%) 1,09 (88%) 0,58 (98%) 0,60 (98%)
Cel5A (M) - 1,04 (92%) 0,89 (90%) 0,88 (90%)
Cel5B (T) - - 1,11 (86%) 1,13 (87%)
Cel5G (P) - - - 0,15 (100%)
Tabla 5. Valor de la raíz de la desviación cuadrada promedio (root mean square deviation, rmsd) en angstrom (Å) de la superposición estructural de las celulasas Cel5, Cel5A, Cel5B, Cel5G y CelA8. Los valores entre paréntesis corresponden al porcentaje de átomos equivalentes considerados para el cálculo, en base a la secuencia más larga. La superposición se efectuó a través del programa Swiss PDB Viewer (Guex y Peitsch, 1997; Guex et al., 1999). Se especifica la naturaleza psicrofílica (P), mesofílica (M) o termofílica (T) de cada enzima.
Figura 6. Superposición estructural de las celulasas Cel5 (café), Cel5A (azul), Cel5B (rosado), Cel5G (violeta) y CelA8 (naranja). La figura se confeccionó mediante el programa PyMOL (DeLano, 2002).
74
La celulasa Cel5A, usada en este trabajo como modelo experimental, presenta
actividad en un rango amplio de pH (Figura 7). El pH óptimo de esta enzima, bajo las
condiciones experimentales impuestas, se sitúa entre 6 y 7. Sin embargo, con el fin de
poder establecer equivalencias, los ensayos de actividad se realizaron tal como los
describieron previamente Garsoux et al. al caracterizar las celulasas Cel5 y Cel5G
(Garsoux et al., 2004).
Cel5A ha sido ampliamente caracterizada desde el punto de vista estructural,
representando un modelo para el estudio de la relación estructura-función en glicósido-
hidrolasas de la familia 5 (Davies et al., 1998; Varrot et al., 2000; Varrot y Davies, 2003).
En contraste, los parámetros vinculados con su actividad catalítica a distintas
temperaturas no son conocidos.
Figura 7. Efecto del pH en la actividad de Cel5A. Los buffers usados para los distintos rangos de pH fueron: citrato 50 mM (pH 4-5), fosfato 50 mM (pH 6-8), glicina/NaOH 50 mM (pH 9-10).
75
4.1. Parámetros vinculados con la actividad de Cel5A a distintas temperaturas
Se comparó el comportamiento catalítico de Cel5A con el de Cel5 y Cel5G en
función de la temperatura utilizando datos cinéticos de Cel5 y Cel5G extraídos de la
literatura (Garsoux et al., 2004; Sonan et al., 2007). La celulasa Cel5A presenta una
actividad notablemente superior a la de Cel5 en todo el rango de temperaturas estudiado.
La diferencia se acentúa a medida que aumenta la temperatura. A 40°C la actividad de
Cel5A es 50 veces más alta que la de Cel5. Con respecto a su homóloga psicrofílica
Cel5G, la situación es similar, aunque las diferencias son menores. Particularmente,
alrededor de los 10°C las actividades de ambas enzimas tienden a igualarse y
eventualmente, siguiendo la tendencia observada, Cel5G podría superar a Cel5A a
temperaturas aún más bajas. Esto concuerda con la naturaleza psicrofílica de Cel5G
(Figura 8). Las actividades catalíticas de Cel5 y Cel5G son menos sensibles a los cambios
de temperatura en relación a Cel5A.
La Ea influye fuertemente sobre la relación entre la velocidad de una reacción
y la temperatura (Ver ecuación de Arrhenius, capítulo 1.5.5 y sección 7 en anexo I).
Según la ecuación de Arrhenius, un descenso en el valor de la Ea provocaría un aumento
de la constante catalítica de la reacción. Sin embargo, esto no se cumple en el caso de
Cel5, que a pesar de presentar una Ea menor que Cel5A, también es menos activa. La
respuesta a lo anterior se encuentra en la Tabla 6. De acuerdo a la teoría del estado de
transición, la mayor contribución a la constante catalítica (kcat) proviene de la energía libre
de activación (
!
"G# ) y la temperatura, por encontrarse estos términos en el factor
exponencial (Benkovic y Hammes-Schiffer, 2003). La clásica ecuación de Gibbs-
Helmholtz (ecuación 16 anexo I),
!
"G° = "H°#T"S°, define la relación entre la energía
libre, la entalpía y la entropía. Considerando lo anterior, se observa que Cel5A compensa
el efecto negativo de altas Ea y
!
"H# sobre su actividad, aumentando
!
"S# (Tabla 6).
Aunque todas las celulasas consideradas en este estudio comparten el mismo mecanismo
de catálisis, Cel5A parece seguir una estrategia distinta. La catálisis efectuada por Cel5A
aparece favorecida entrópicamente, mientras que la catálisis efectuada por Cel5 y Cel5G
es dominada mayoritariamente por factores entálpicos.
En esta tesis se supone que la adaptación de la actividad de las enzimas a
distintas temperaturas está ligada principalmente a cambios en la flexibilidad de su
estructura. Con el fin de detectar aspectos estructurales vinculados al proceso de
76
adaptación mencionado, se realizó una serie de estudios comparativos considerando
diferencias estructurales asociadas con la dinámica molecular. Los parámetros
investigados fueron las interacciones electrostáticas (puentes de hidrógeno y puentes
salinos), la compactación estructural y las fluctuaciones atómicas, calculadas mediante
análisis de modos normales. Estos parámetros se determinaron y compararon usando
algoritmos originales.
Figura 8. Efecto de la temperatura sobre la actividad catalítica de Cel5 (naranja), Cel5G (celeste) y Cel5A (azul) con pNFC. Los datos para Cel5 y Cel5G fueron extraídos de la literatura (Garsoux et al., 2004; Sonan et al., 2007).
Tabla 6. Parámetros termodinámicos de activación para la hidrólisis enzimática de pNFC a 30°C. Los datos para Cel5 y Cel5G fueron extraídos de la literatura (Garsoux et al., 2004; Sonan et al., 2007).
Celulasa Ea (kJ/mol) (kJ/mol) (kJ/mol) (J/mol °K)
Cel5A 103,2 71,1 100,8 101,3
Cel5 68,1 79,5 65,6 -46,0
Cel5G 48,5 73,8 46,0 -91,9!
"G#
!
"H#
!
"S#
77
4.2. Algoritmos de comparación
Se desarrolló algoritmos que permiten comparar parámetros entre residuos
equivalentes pertenecientes a proteínas homólogas clasificadas en dos grupos según
características de interés. Estos algoritmos identifican los residuos equivalentes a partir de
información extraída desde alineamientos estructurales múltiples (en formato ClustalW).
El algoritmo diseñado para comparar puentes de hidrógeno, además de
detectar interacciones que involucran residuos en posiciones idénticas, es capaz de
reconocer interacciones equivalentes, cuya posición varía levemente entre una estructura
y otra. Esto permite lidiar con la ocurrencia de cambios posicionales irrelevantes.
4.3. Estudio comparativo e identificación de residuos candidatos para
mutagénesis
La celulasa Cel5A, sorpresivamente exhibe características que la diferencian
claramente con respecto a las celulasas Cel5 y Cel5G. Estas propiedades motivaron un
análisis más profundo. Para poder identificar posiciones claves en la estructura de Cel5A,
relacionadas con sus características catalíticas distintivas, se investigó los aspectos
estructurales que la diferencian de sus homólogas Cel5, Cel5G y CelA8. De igual manera,
aprovechando la misma plataforma analítica, se estudió los aspectos distintivos de Cel5G
y CelA8 potencialmente responsables de su adaptación a bajas temperaturas. Los
resultados fueron usados para definir mutaciones sitio-dirigidas.
La información disponible acerca de las capacidades cinéticas de la celulasa
termofílica Cel5B es escasa, razón por la cuál no conviene utilizarla como referencia. A
CelA8, la celulasa identificada y clonada en nuestro laboratorio, se le asignó las mismas
propiedades catalíticas que Cel5G, por su alto nivel de identidad en la estructura primaria
(Tabla 4).
Para facilitar el análisis de las comparaciones, los residuos de todas las
enzimas se numeraron de acuerdo a las posiciones equivalentes en Cel5A. Esta
numeración se basa en el alineamiento múltiple y no coincide necesariamente con los
correspondientes archivos PDB.
78
4.3.1. Interacciones electrostáticas
A modo de análisis global, se cuantificó las interacciones electrostáticas
existentes en la estructura de cada celulasa estudiada. El número total de puentes de
hidrógeno no varía significativamente entre las celulasas mesofílicas y psicrofílicas. La
celulasa termofílica Cel5B tiene más puentes de hidrógeno por residuo, con respecto a las
demás estructuras (Tabla 7). Esto podría constituir un factor de adaptación a altas
temperaturas. Se observa además que las estructuras mesofilicas presentan una mayor
cantidad de puentes salinos en comparación con las estructuras adaptadas a bajas
temperaturas. Sin embargo, esta tendencia no se mantiene en el caso de la estructura
termofílica, que contiene igual número de puentes salinos que su homóloga psicrofílica
Cel5G.
Al inspeccionar los resultados de la Tabla 7, no es posible detectar un patrón
evidente que relacione el número de interacciones en cada estructura con la temperatura
del nicho ecológico al que pertenecen.
La Figura 9 muestra los resultados del análisis comparativo en el contexto de
la estructura primaria de Cel5A. Para mayor claridad, aparecen únicamente aquellas
interacciones ausentes en Cel5A, pero conservadas en Cel5, Cel5G y CelA8, aunque el
caso contrario también fue considerado. Cinco interacciones llaman la atención por su
cercanía con los residuos Glu136 (ácido/base catalítico) y Asn135 (que interactúa con el
sustrato), y por encontrarse en una zona altamente conservada de la secuencia. Dos de
Cel5B Cel5 Cel5A Cel5G CelA8
Número de residuos 305 291 300 293 293
Puentes de hidrógeno / residuos 0,95 0,89 0,89 0,89 0,89
Puentes de hidrogeno totales 290 260 269 260 261
peptídico - peptídico 192 188 184 185 195
peptídico - lateral 63 40 53 48 47
lateral - lateral 35 32 32 27 19
Puentes salinos 11 13 16 11 8
Tabla 7. Puentes de hidrógeno y puentes salinos en celulasas adaptadas a distintas temperaturas.
79
estas interacciones involucran directamente el residuo catalítico ácido/base, y las otras
tres se sitúan a un residuo de distancia. Para tener una visión más amplia de esta zona,
se graficó las interacciones presentes en Cel5 y Cel5A de manera homóloga a lo
propuesto por Bikadi y colaboradores (Bikadi et al., 2007) (Figura 10).
Según estos gráficos, el número de interacciones en la vecindad del residuo
catalítico ácido/base no cambia mayormente entre las celulasas (3 en Cel5, Cel5G y
CelA8, 4 en Cel5A). Las interacciones aparentemente perdidas en Cel5A, expuestas en la
Figura 9, son en definitiva reemplazadas por otras potencialmente equivalentes,
generándose un patrón distinto en esa zona. Al inspeccionar las estructuras 3D
Figura 9. Secuencia aminoacídica del dominio catalítico de Cel5A con resultados de los estudios comparativos. Los residuos con menor densidad de contacto en Cel5A aparecen destacados en negro. Los asteriscos señalan aquellos residuos conservados en el alineamiento múltiple de las secuencias de Cel5, Cel5G, CelA8 y Cel5A. Los números dispuestos arriba de los residuos representan interacciones electrostáticas (puentes salinos y puentes de hidrógeno) conservadas en Cel5, Cel5G y CelA8 pero ausentes en Cel5A. Cada número identifica el índice del otro residuo participante en la interacción. Los residuos seleccionados son equivalentes a los que conforman las respectivas interaccciones en Cel5, Cel5G y CelA8. Los dos residuos catalíticos se destacan con cuadrados negros. Todos los residuos cuyos carbonos alfa se sitúan a menos de 10 Å de los residuos catalíticos se encuentran subrayados. Los residuos que interactúan con el sustrato, según Varrot y Davies (Varrot y Davies, 2003) se destacan con cuadros grises. Los índices de los residuos corresponden al alineamiento múltiple.
80
experimentales disponibles para Cel5, Cel5G y Cel5A (códigos PDB: 1EGZ, 1TVN y
1QHZ, respectivamente), se confirmó lo anterior y se detectó diferencias adicionales
(Figura 11). El residuo catalítico ácido/base establece dos puentes de hidrógeno a través
de su esqueleto peptídico en todas las celulasas. Sin embargo, los aminoácidos
involucrados varían de una estructura a otra. En Cel5, Cel5G y CelA8, la serina 99 y la
histidina 100 actúan como receptor y dador, respectivamente. En cambio, la asparagina
138 y la isoleucina 99 cumplen esta función en Cel5A. La tirosina 134 forma un tercer
puente de hidrógeno con el ácido glutámico 103 en Cel5 y Cel5G. Esta interacción se
pierde en Cel5A ya que la posición 134 es ocupada por una alanina, cuya cadena lateral
no puede establecer puentes de hidrógeno. Sin embargo, Cel5A contiene puentes de
hidrógeno adicionales que pueden cubrir esta pérdida. La asparagina 138, además de
interactuar con el residuo catalítico, está ligada a la leucina 100 (un puente de hidrógeno)
y la asparagina 103 (dos puentes de hidrógeno, detectados como uno sólo por los
algoritmos al tratarse del mismo residuo). El “loop” en el que se encuentra la asparagina
103 en Cel5A es más largo y adopta una conformación espacial que favorece el contacto
con la posición 138. La isoleucina 99 forma un puente de hidrógeno con la asparagina
135, no detectado por los algoritmos porque la distancia que separa el hidrógeno
(Asn135) del oxígeno (Ile99) es levemente mayor (2,59 Å) al umbral arbitrario definido
(capítulo 3.2.6). Como resultado, Cel5A presenta 6 puentes de hidrógeno, contra 3 de
Cel5 y Cel5G, en una zona que contiene 3 residuos directamente involucrados con la
actividad enzimática, el ácido glutámico 136 (acido/base), la asparagina 135 y la histidina
98 (ambos ligandos del sustrato) (Varrot y Davies, 2003). El largo y el ángulo de los
puentes de hidrógeno equivalentes son similares en todas las celulasas.
4.4. Compactación estructural
Para evaluar la compactación local a nivel de cada residuo en las estructuras
estudiadas, se utilizó un concepto descrito previamente: la densidad de contacto (Halle,
2002; Gunasekaran y Nussinov, 2007) (capítulo 3.2.4).
La Figura 9 destaca sólo los residuos que presentan menor densidad de
contacto en Cel5A, aunque el caso inverso también se evaluó.
81
Indi
ces
de re
sidu
os
Indices de residuos
Indi
ces
de re
sidu
os
A
B Indices de residuos
Figura 10. Gráficos de interacciones electrostáticas. A, Cel5; B, Cel5A. Para facilitar el análisis, se muestra sólo la zona de interés. Cada punto representa una interacción. Las interacciones que solamente están presentes en la estructura evaluada se destacan en negro. Las interacciones relevantes en la vecindad del residuo catalítico ácido/base se señalan con círculos rojos y aquellas que involucran directamente éste residuo se identifican con flechas. Los índices corresponden al alineamiento múltiple de Cel5, Cel5G y Cel5A, no a los archivos PDB. Cel5G tiene las mismas características que Cel5 en la zona tratada.
82
Se observa diferencias en varias zonas de interés (altamente conservadas o cercanas a
residuos clave para la catálisis), incluyendo las secuencias adyacentes a ambos residuos
catalíticos. Entre éstas destaca la posición 173, que corresponde a una glicina en Cel5A y
a una prolina en el resto de las celulasas. La glicina y la prolina otorgan características
mecánicas muy distintas a las cadenas peptídicas que las contienen. La glicina no posee
cadena lateral, por lo que permite configuraciones del esqueleto peptídico muy variadas.
La prolina en cambio, restringe enormemente la libertad de movimiento y rigidiza la
cadena peptídica (MacArthur et al., 1991; Sriprapundh et al., 2000; Tian et al., 2010). Sin
embargo, nuestra atención fue puesta nuevamente en el residuo ácido/base catalítico y la
alanina 134 colindante, cuyas densidades de contacto son menores en Cel5A, debido
probablemente al reordenamiento estructural local evidenciado en la sección anterior.
Figura 11. Estructura de Cel5 (A) y Cel5A (B) en la vecindad del residuo catalítico ácido/base. El residuo catalítico ácido/base aparece en azul. Los residuos que interactúan con el sustrato se destacan en celeste (Varrot y Davies, 2003). Los átomos de oxígeno y nitrógeno se exponen en azul oscuro y rojo, respectivamente. Las interacciones se representan con líneas punteadas. Los índices de aminoácidos corresponden a las posiciones equivalentes en Cel5A según el alineamiento múltiple realizado (Figura 9), a excepción del residuo Glu103 de Cel5 que no se encuentra en Cel5A. En caso de no coincidir, los índices publicados en los archivos pdb 1EGZ y 1QHZ de cel5 y Cel5A, respectivamente, se indican entre paréntesis. Cel5G y CelA8 presentan las mismas características que Cel5 en esta zona.
A B
His98(101)
Ile99(102)
Leu100(103)
Asn103(106)
Glu136(139)
Asn138(141)
Asn135(138)
Glu136(133)
Asn135(132)
Pro137(134)
His98
Ser99
Ala134(137)
Tyr134 (131)
His100
Glu103
83
4.5. Análisis de modos normales
Se aplicó análisis de modos normales (NMA, por sus siglas en inglés) para
estimar en forma teórica la magnitud de las fluctuaciones atómicas cuadradas promedio
para cada residuo en las dos celulasas mesofílicas Cel5 y Cel5A, y las dos celulasas
psicrofílicas Cel5G y CelA8 (capítulo 3.2.1).
Las figuras 12, 13 y 14 muestran una comparación entre los factores B
calculados mediante NMA (capítulo 3.2.2) y los factores B experimentales (capítulo 1.6.1)
extraídos directamente de los archivos PDB, de Cel5, Cel5A y Cel5G, respectivamente.
La comparación no se efectuó con los datos de CelA8 ya que no existe información
experimental acerca de los factores B para esta enzima. Se puede observar que los
factores B calculados se ajustan razonablemente al patrón experimental. La coincidencia
es especialmente buena en el caso de Cel5G (rmsd=2,55). Esto concuerda con otros
resultados publicados (Miller y Agard, 1999). Sin embargo, el nivel de correspondencia
entre los datos calculados y los datos experimentales, según nuestro criterio, no es
satisfactorio en el contexto de un análisis cuantitativo detallado. De hecho, se ha
comprobado que el método de NMA es más efectivo para predecir la dirección,
correlación (ver más adelante) y grado de colectividad de los movimientos (Skjaerven et
al., 2009), que para estimar su amplitud (Alexandrov et al., 2005). Producto de lo anterior,
se resolvió caracterizar las propiedades dinámicas generales de cada celulasa mediante
el análisis de las correlaciones (capítulo 3.2.2) en los movimientos de los distintos
componentes estructurales (átomos, residuos, elementos de estructura secundaria, etc.),
sin basarse en la amplitud de las fluctuaciones cuadradas promedio como único
parámetro de estudio.
El patrón general de correlaciones es similar en todas las celulasas (Figura 15
a y b). No fue posible establecer diferencias que pudieran vincularse con las propiedades
catalíticas de alguna enzima en particular. Algunas de las características conservadas
involucran al bolsillo de unión, y por lo tanto podrían estar relacionadas con procesos
importantes para el funcionamiento de la enzima. Los índices de correlación entre pares
de residuos situados en un mismo lado del bolsillo tienden a ser más altos, lo que sugiere
un desplazamiento coordinado. Esto podría responder a la necesidad de mantener la
posición relativa de estos residuos con el fin de optimizar la interacción con el sustrato
(Figura 15 c).
84
Figura 13. Factores B experimentales y calculados para cada resíduo de Cel5A. Los datos calculados fueron escalados para minimizar la raiz de la desviación cuadrada promedio (rmsd = 6,11).
Figura 12. Factores B experimentales y calculados para cada resíduo de Cel5. Los datos calculados fueron escalados para minimizar la raiz de la desviación cuadrada promedio (rmsd = 8,6).
85
4.6. Sitio de unión a calcio: posible adaptación de Cel5G a bajas temperaturas
Utilizando la misma plataforma analítica anterior, se evaluó las
particularidades estructurales de la celulasa psicrofílica Cel5G, potencialmente ligadas
con su comportamiento dinámico. Se detectaron diferencias importantes en la zona
equivalente al sitio de unión a calcio de Cel5 y Cel5A conformado por los “loops” que
conectan la hélice α 3 con la hoja β 4 y la hélice α 4 con la hoja β 5 (Varrot et al., 2000;
Chapon et al., 2001). Las cadenas laterales de los residuos equivalentes a la asparagina
165 y la asparagina 166, que participan en la coordinación del ion calcio, presentan una
configuración distinta en Cel5G, afectando dramáticamente la topología de esa zona
(Figura 16 A). Lo mismo ocurre con la arginina 160 que interactúa con el ácido aspártico
163 (también parte del sitio de unión a calcio) y la asparagina 166 en las estructuras
mesofílicas mediante 3 puentes de hidrógeno.
Figura 14. Factores B experimentales y calculados para cada resíduo de Cel5G. Los datos calculados fueron escalados para minimizar la raiz de la desviación cuadrada promedio (rmsd = 2,55).
86
Res
iduo
s
Residuos
Res
iduo
s
Asn135
His98
Tyr63 His32
Tyr199
Ala231
Glu266
Residuos
A B
C
Figura 15. Análisis de correlaciones. A y B, matrices de correlaciones de Cel5 y Cel5A, respectivamente. Las barras laterales indican el código de color usado para expresar el valor de los índices de correlación. Los círculos destacan pares de residuos situados en la vecindad del bolsillo de unión. Los gráficos se hicieron mediante Matplotlib (Hunter, 2007). C, modelo 3D de la estructura de Cel5A. Los residuos catalíticos se muestran en azul y los residuos que conforman el bolsillo de unión, en celeste. Los índices corresponden al alineamiento múltiple realizado. La figura se generó usando PyMol (DeLano, 2002).
87
A
B
Gly124
Asp163 Asn165
Asn166
Asp163 Arg160
Asn166
Figura 16. Superposición estructural del sitio de unión a calcio de Cel5 (café), Cel5A (rosado) y Cel5G (azul). A, Sitio de unión a calcio (Chapon et al., 2001). B, Red de puentes de hidrógeno entre la arginina 160 y el sitio de unión a calcio. Cuando es requerido, los átomos de oxígeno y nitrógeno se exponen en celeste y amarillo, respectivamente. Los residuos rotulados corresponden a Cel5A y los índices representan las posiciones en el alineamiento múltiple realizado. La superposición se efectuó a través del programa Swiss PDB Viewer (Guex y Peitsch, 1997; Guex et al., 1999). La figura se generó mediante PyMol (DeLano, 2002).
88
Producto del cambio conformacional de su cadena lateral, esta arginina no interactúa con
el ácido aspártico 163 en Cel5G, pero establece un nuevo puente de hidrógeno con el
oxígeno carboxílico de la cadena lateral desplazada de la asparagina 166.
El efecto estabilizador de la interacción de cationes bivalentes con sitios
específicos de las estructuras proteicas ha sido ampliamente documentado (Arnold y
Zhang, 1994; Feller et al., 1999; Miyazaki et al., 2000; Stoner et al., 2005). El
debilitamiento o pérdida de este tipo de interacción en Cel5G producto de las
modificaciones topológicas descritas podría constituir un mecanismo de adaptación a
bajas temperaturas induciendo mayor flexibilidad estructural.
4.7. Mutaciones sitio-dirigidas
Los antecedentes expuestos hasta aquí permitieron identificar residuos
potencialmente relacionados con el proceso de adaptación a diversas temperaturas de
enzimas modelo pertenecientes a la familia 5, sub-familia dos, clan A de las glicosil
hidrolasas.
Las posiciones 134 y 138 aparecen como candidatas atractivas para
mutagénesis. Ambas están relacionadas con variaciones estructurales significativas en la
vecindad del sitio activo. La alanina 134 de Cel5A corresponde a una tirosina en Cel5,
Cel5G y CelA8. La presencia de una tirosina en esa posición aumenta la compactación
estructural y permite la formación de un puente de hidrógeno inexistente en Cel5A. La
asparagina 138 de Cel5A parece jugar un rol clave en la configuración espacial de su
entorno. Participa en 4 puentes de hidrógeno con residuos vecinos, incluyendo el ácido
glutámico 136 (ácido/base catalítico). Esa posición es ocupada por una leucina incapaz de
formar puentes de hidrógeno mediante su cadena lateral en Cel5, Cel5G y CelA8.
La posición 173 en Cel5A está ocupada por una glicina, residuo mucho más
pequeño y que permite mayor libertad conformacional que la prolina presente en las
demás celulasas estudiadas. Esta modificación ocurre en una zona altamente
conservada, ubicada a menos de 10 Å del residuo ácido-base catalítico, por lo que
adquiere interés.
La celulasa psicrofílica Cel5G presenta un sitio de unión a calcio con una
topología alterada, producto de una reorganización de las cadenas laterales de los
89
residuos en posición 165 y 166. Esta alteración podría estar relacionada con su carácter
psicrofílico.
El objetivo de esta sección es validar experimentalmente las predicciones
teóricas resultantes del análisis in silico mediante la construcción y evaluación de
mutantes sitio-dirigidas usando como modelo la celulasa Cel5A de Bacillus agaradherans.
En este contexto, se optó por mutar las posiciones 134 y 138, relegando las
demás posibilidades a trabajos futuros.
La alanina 134 de Cel5A se reemplazó por tirosina, generándose la mutante
A134Y. Esta mutación fue elegida con el objeto de reproducir las características de Cel5,
Cel5G y CelA8 en esa posición. Las propiedades catalíticas y termodinámicas de la
mutante A134Y son muy similares a las de Cel5 desde un punto de vista cualitativo
(capítulo 4.1). El intercambio de alanina por tirosina provoca una disminución
concomitante de la constante catalítica y de la Ea (Figura 16; Figura 17 y Tabla 8). Al igual
que en el caso de Cel5, lo anterior responde a una entropía de activación desfavorable
que se impone por sobre la influencia positiva de la baja Ea (y
!
"H# ). Se observa que la
actividad de esta variante es menos sensible a los cambios de temperatura. A 30°C la
enzima nativa es 2 veces más activa que la mutante, mientras que a 10°C la diferencia es
sutil (Tabla 8). La tirosina en posición 134 también provoca un aumento de la Km en más
de 20 veces. Para poder discriminar entre los efectos relacionados con el volumen de la
cadena lateral y aquellos ligados a la formación de un puente de hidrógeno con residuos
cercanos, tal como ocurre en las celulasas Cel5 y Cel5G entre la tirosina 134 y la
asparagina 103, se construyó una mutante de Cel5A con una fenilalanina en posición 134
(A134F). Las estructuras de la fenilalanina y la tirosina son muy parecidas. La única
diferencia entre ambas es un grupo hidroxilo situado en el anillo aromático de la tirosina
que disminuye su hidrofobicidad y le otorga la capacidad de establecer puentes de
hidrogeno. La mutante A134F no presentó cambios significativos con respecto a la enzima
silvestre en sus parámetros catalíticos y termodinámicos. Este hecho sugiere que la
capacidad de formar puentes de hidrógeno de la tirosina es un factor relevante en el
comportamiento catalítico de la mutante A134Y. Una inspección detallada de las
respectivas estructuras 3D (Figura 11) demuestra que la cadena lateral de la tirosina 134
en el contexto espacial de Cel5A no puede adoptar la conformación observada en las
otras celulasas debido a impedimentos estéricos producidos por la cadena lateral de la
isoleucina 99 (serina en Cel5, Cel5G y CelA8). Esta conformación supone el
establecimiento de un puente de hidrógeno con el residuo asparagina 103.
90
Tabl
a 8.
Par
ámet
ros
cata
lític
os y
term
odin
ámic
os p
ara
la h
idró
lisis
de
pNPC
por
Cel
5A y
las
enzi
mas
mut
ante
s a
10°C
y 3
0°C
.
Celu
lasa
10°C
30°C
10°C
30°C
10°C
30°C
10°C
30°C
10°C
30°C
Ea (
kJ/
mol)
Cel5
A0,3
04,5
0,6
30,6
172,1
70,5
100,9
100,7
101,8
99,8
103,3
A134Y
0,2
82,2
13,1
22,8
72,2
72,3
70,1
69,9
-7,4
-7,7
72,5
N138L
0,7
16,6
1,5
3,7
70,0
69,5
82,3
82,1
43,3
41,5
84,7
I99A
0,5
16,2
1,6
1,9
70,8
69,7
88,9
88,7
63,8
62,7
91,2
I99A/A
134Y
0,6
56,3
4,3
5,3
70,3
69,6
77,7
77,5
26,2
25,9
80,0
A134F
0,2
84,5
0,4
7N
.D.
72,3
70,5
97,7
97,5
89,7
03
89,1
100,0
(
kJ/
mol)
(J/m
ol °K)
(
kJ/
mol)
Kcat
(seg-1
)Km
(m
M)
!
"G#
!
"H#
!
"S#
91
Figura 17. Actividad relativa de Cel5A y sus variantes mutadas a distintas temperaturas, con el sustrato pNFC. Las actividades relativas corresponden a los valores de kcat normalizados con respecto a Cel5A, para cada temperatura.
Figura 16. Efecto de la temperatura sobre la actividad catalítica de Cel5A y sus variantes mutadas, con el sustrato pNFC. El recuadro interno muestra los respectivos gráficos de Arrhenius para calcular la energía de activación.
92
Teniendo en consideración lo anterior, aparece razonable relacionar los efectos de la
mutación A134Y sobre la actividad, la Ea y la Km de Cel5A con la ocurrencia de un
cambio conformacional local, inducido para mantener el puente de hidrógeno entre la
tirosina 134 y la asparagina 103 a pesar de los impedimentos estéricos impuestos por la
isoleucina 99. Este reordenamiento podría afectar la distribución espacial de los residuos
Glu136, Asn135 y/o His98 involucrados en la catálisis y la unión al sustrato (Figura 11).
Para explorar esta posibilidad con más detalle se decidió reemplazar la
isoleucina 99 por una alanina en la mutante A134Y, generándose la mutante doble
I99A/A134Y. La alanina es el aminoácido con la cadena lateral más pequeña (un grupo
metilo) y por lo tanto debiera presentar menos interferencia estérica con la tirosina en
posición 134. Paralelamente se construyó la mutante simple I99A para individualizar los
efectos del reemplazo de la isoleucina por alanina en posición 99. La mutante doble
A134Y/I99A no presenta indicios de los efectos negativos causados por la tirosina en
A134Y. Su comportamiento catalítico es comparable al de I99A, con una actividad
superior a bajas temperaturas (Figura 16; Figura 17 y Tabla 8). Esto indica que las
consecuencias de la mutación A134Y en Cel5A tienen relación con el tamaño de la
cadena lateral en posición 99, lo que robustece la hipótesis planteada anteriormente. Las
mutantes I99A e I99A/A134Y resultaron ser más activas que la enzima nativa,
particularmente a bajas temperaturas (Figura 17). La mutante I99A y la mutante doble son
casi 2 y 3,5 veces más activas que Cel5A a 5°C, respectivamente. El efecto de la
mutación A134Y en el contexto de la mutante doble sigue siendo difícil de interpretar en
términos de relación estructura función. La asparagina 103 establece un puente de
hidrógeno con la asparagina 138 en Cel5A a través de su oxígeno peptídico (Figura 11).
La eventual formación del puente de hidrógeno entre la tirosina 134 y la asparagina 103
involucraría el mismo átomo de oxígeno y podría ejercer algún tipo de influencia sobre la
primera interacción. Una interpretación razonable de los efectos producidos por la tirosina
134 requiere contar con información estructural experimental detallada de las mutantes.
En la mutante I99A, la disminución del volumen ocupado por la alanina podría significar
un aumento en la flexibilidad del sitio activo, lo que respaldaría su alta actividad a bajas
temperaturas.
La asparagina 138 de Cel5A se reemplazó por una leucina, tal como ocurre en
Cel5, Cel5G y CelA8. La mutante resultante, N138L, es más activa que la enzima nativa
en un amplio rango de temperaturas, particularmente en frío (Figura 16 y Figura 17). A
5°C, N138L es casi 3 veces más activa que Cel5A. Este incremento en la actividad
93
catalítica es favorecido entálpicamente (disminución de Ea y
!
"H# ). Lo mismo ocurre con
las mutantes I99A e I99A/A134Y (Tabla 8). En Cel5A, los residuos asparagina 138 e
isoleucina 99 conforman puentes de hidrógeno con el residuo ácido-base catalítico. Por lo
tanto, modificaciones en ambas posiciones tienen el potencial de alterar interacciones
entálpicas centrales en el sitio activo de la enzima.
Todas las mutantes generadas, a excepción de A134Y y A134F, pueden ser
consideradas versiones psicrofílicas de Cel5A, ya que presentan valores más bajos de
Ea, son más activas en frío y a temperaturas lo suficientemente altas su actividad es
menor (Figura 17). Sin embargo, los valores de Ea, parámetro ampliamente utilizado para
clasificar enzimas adaptadas a diversos nichos térmicos, siguen siendo altos en
comparación con sus homólogas Cel5 y Cel5G.
94
5. Discusión
La endoglucanasa Cel5A de Bacillus agaradhaerens ha sido ampliamente
caracterizada desde el punto de vista estructural. De hecho, fue la primera estructura de
una glicósido-hidrolasa perteneciente a la familia 5 resuelta experimentalmente mediante
cristalografía de rayos X (Davies et al, 1998) y usada como modelo para el estudio de la
relación estructura-función en estas enzimas (Varrot et al, 2000; Varrot y Davies, 2003).
Sin embargo, poco se conoce acerca de sus propiedades cinéticas (Hirasawa et al.,
2006).
En este trabajo se evaluó el desempeño catalítico de Cel5A, por medio de la
obtención e interpretación de parámetros cinéticos y termodinámicos de activación.
Los parámetros termodinámicos de activación (
!
"G# ,
!
"H# y
!
"S# ) son usados
frecuentemente en el estudio de la relación estructura-función de las enzimas, y han
probado ser muy útiles en la caracterización de factores estructurales vinculados a la
adaptación a diversas temperaturas (Lonhienne et al., 2000; Garsoux et al., 2004; Violot et
al., 2005). Sin embargo, su significado físico debe ser interpretado con cautela, porque
derivan de un modelo simplificado de las reacciones químicas, que considera diversas
aproximaciones y suposiciones arbitrarias: la teoría del estado de transición (Lonhienne et
al., 2000; Pineda y Schwartz, 2006). Entre otras consideraciones, la teoría del estado de
transición supone la existencia de un estado activado, en equilibrio con el complejo
enzima sustrato, a través del cual los reactantes fluyen en su conversión a productos.
Además, el coeficiente de transmisión
!
" que incorpora variados fenómenos cuánticos
relevantes, como el efecto “túnel” y los traspasos múltiples de la barrera energética
(Garcia-Viloca et al., 2004), es usualmente ignorado (Lonhienne et al., 2000). Las
complicaciones ligadas a las limitaciones de este modelo se atenuaron mediante la
interpretación de las variaciones entre los parámetros calculados para distintas enzimas,
sin considerar los valores absolutos (Lonhienne et al., 2000).
Los resultados obtenidos permitieron identificar aspectos distintivos de Cel5A
que validan su uso como modelo para avanzar en el entendimiento de la relación entre la
catálisis enzimática y la temperatura.
A pesar de provenir de una bacteria alcalófila, Cel5A presenta mayor actividad
en el rango neutro de pH (máxima actividad entre pH 6 y 7) con el sustrato sintético
pNPC. Otra enzima de Bacillus agaradhaerans, una xilanasa perteneciente a la familia
95
GH11, muestra un patrón similar (Poon et al., 2003). Sin embargo, ambas enzimas
retienen un porcentaje significativo de su actividad a pH alcalino (30% a pH 9 en el caso
de Cel5A) lo que les permite funcionar en esas condiciones.
La expresión de kCAT derivada de la teoría del estado de transición (capítulo
1.5.5) puede ser escrita con el término exponencial detallado de la siguiente manera:
donde
!
"H# es la entalpía de activación y
!
"S# es la entropía de activación. La Ea en la
ecuación de Arrhenius es equivalente a
!
"H# en la teoría del estado de transición. Ambos
parámetros representan la diferencia de energía en términos de calor entre el estado de
transición y el complejo basal enzima-sustrato (anexo I) (Lonhienne et al., 2000). Una Ea
o
!
"H# baja supone una menor dependencia de la constante catalítica (kCAT) con respecto
a la temperatura. Estas consideraciones tienen implicancias de alta relevancia en el
contexto de la adaptación de enzimas al frío (Marx et al., 2007). De hecho, se ha
sugerido, en base a numerosos estudios, que la superioridad catalítica de las enzimas
psicrofílicas, particularmente a bajas temperaturas, responde principalmente a una
reducción de su Ea o
!
"H# (Lonhienne et al., 2000; Tsigos et al., 2001; Siddiqui y
Cavicchioli, 2006).
Cel5A, sin embargo, parece contradecir esta hipótesis siendo más activa que
sus homólogas Cel5 y Cel5G en un amplio rango de temperaturas, a pesar de tener una
Ea más alta. Una explicación para este comportamiento se obtuvo mediante la
determinación de los parámetros termodinámicos de activación. Observando la expresión
para kCAT derivada de la teoría del estado de transición se puede notar que tanto una
reducción de
!
"H# como un incremento de
!
"S# producen un aumento de la tasa de
reacción, y vice versa. Cel5A es capaz de contrarrestar el efecto negativo causado por el
alto valor de Ea y
!
"H# a través de una
!
"S# alta. En Cel5 se aprecia la situación inversa.
El valor negativo de
!
"S# tiende a disminuir la kCAT a pesar de la contribución de una
!
"H#
más baja. Los resultados sugieren la existencia de una relación antagonista entre
!
"H# y
!
"S# , que acota las variaciones de kCAT y define el comportamiento catalítico. De hecho,
en las enzimas psicrofílicas, una reducción de
!
"H# siempre se ve acompañada por una
reducción concomitante de
!
"S# (Collins et al., 2003; Siddiqui y Cavicchioli, 2006; Marx et
al., 2007). Sin una compensación entrópica-entálpica la actividad de las enzimas
!
kCAT
=kBT
he" #H
#RT"#S
#R( )
(42)
96
adaptadas al frío podría superar ampliamente la de sus contrapartes mesofílicas, en sus
respectivas temperaturas ambientales.
La comparación de los parámetros termodinámicos permite el establecimiento
de un contexto racional que facilita la interpretación de las observaciones experimentales.
Sin embargo, para entender los acontecimientos físicos subyacentes se debe interpretar
la información termodinámica en términos estructurales.
La magnitud de
!
"H# es directamente proporcional a la cantidad y fuerza de
las interacciones inducidas entálpicamente que deben ser modificadas o destruidas para
alcanzar el estado de transición (Gerday et al., 1997; Hoyoux et al., 2004). A partir de
esto, es posible generar una explicación para el efecto compensatorio entre
!
"H# y
!
"S#
utilizando argumentos estructurales.
!
"S# representa la diferencia de entropía entre el
estado de transición y el complejo enzima-sustrato. Una disminución del número o de la
fuerza de las interacciones inducidas entálpicamente tiene el potencial de reducir
!
"S#
(junto con
!
"H# ) aumentando la flexibilidad (universo de posibles configuraciones
espaciales) de elementos estructurales claves vinculados con la catálisis y por
consecuencia la entropía del complejo enzima sustrato (D’Amico et al., 2002). Un
incremento de estas interacciones tendría el efecto opuesto. De acuerdo a lo anterior, el
mayor número de puentes de hidrógeno cerca del residuo ácido/base catalítico en Cel5A
podría ser la causa de sus altos valores de Ea (
!
"H# ) y
!
"S# en comparación con Cel5 y
Cel5G. Sin embargo, el mecanismo físico a través del cual Cel5A logra alcanzar
actividades ampliamente superiores a las de Cel5 sigue siendo un dilema. Más aún,
según los valores de
!
"S# , Cel5A posee un sitio activo más rígido que Cel5, lo que,
aplicando la noción de la flexibilidad como un aspecto clave en la catálisis (Zaccai, 2000;
Daniel et al., 2003; Eisenmesser et al., 2005; Agarwal, 2006), aparece como una
contradicción.
Para entender lo anterior es necesario considerar que el término general
“flexibilidad” designa dos conceptos distinguibles entre sí, la flexibilidad estática y la
flexibilidad dinámica (Siddiqui y Cavicchioli, 2006). La flexibilidad estática corresponde al
universo de posibles conformaciones que puede adoptar la estructura. La flexibilidad
dinámica considera la velocidad de interconversión entre las distintas conformaciones
(escala temporal de los movimientos). Se ha demostrado experimentalmente la existencia
de movimientos asociados con la catálisis que ocurren a escalas de tiempo del orden de
los microsegundos-milisegundos (Agarwal et al., 2004; Wolf-Watz et al., 2004;
97
Eisenmesser et al., 2005; Agarwal, 2006). Este rango temporal concuerda con la tasa de
conversión de sustrato a producto en diversas enzimas (Boehr et al., 2006). Las
fluctuaciones térmicas de átomos individuales, que ocurren a una escala de tiempo mucho
más rápida, del orden de los picosegundos-nanosegundos (Boehr et al., 2006), también
han sido vinculadas con el proceso catalítico. Por medio de simulaciones teóricas
computacionales se ha identificado y caracterizado, en las enzimas alcohol
deshidrogenasa (Caratzoulas et al., 2002) y lactato deshidrogenasa (Basner y Schwartz,
2004), vibraciones en el rango de los picosegundos que promueven la reacción catalítica
influyendo sobre la barrera energética. Sin embargo, poco se entiende acerca de la
relación entre las fluctuaciones locales de alta frecuencia y los movimientos colectivos
más amplios y lentos en el rango temporal de la reacción catalítica, fuera del hecho de
que pueden estar fuertemente correlacionadas (Henzler-Wildman et al., 2007). Pineda y
Schwartz propusieron recientemente, en base a simulaciones teóricas, que sólo una
pequeña fracción del universo de posibles conformaciones estructurales ofrece un entorno
apropiado para la catálisis (Pineda y Schwartz, 2006). En consecuencia, la brecha
temporal entre las vibraciones atómicas de alta frecuencia y la tasa de reacción
enzimática probablemente responde a la necesidad de una búsqueda estocástica para
encontrar las escasas configuraciones requeridas.
En base a las consideraciones expuestas, es posible establecer una relación
lógica entre la actividad catalítica, los parámetros termodinámicos y la información
estructural de Cel5A. El mayor número de puentes de hidrógeno en la vecindad del
residuo catalítico ácido/base podría afectar la flexibilidad estática local, restringiendo el
universo de posibles conformaciones y favoreciendo la ocurrencia de aquellas
compatibles con la catálisis. La exploración de conformaciones con potencial catalítico en
el plegamiento nativo es un concepto que ha sido validado experimentalmente con la
enzima ciclofilina A (Eisenmesser et al., 2005). La actividad catalítica de Cel5 y Cel5G es
favorecida entálpicamente. Una menor cantidad de interacciones entálpicas que deben
ser modificadas para alcanzar el estado de transición implica una disminución de la
barrera energética de la reacción. La actividad de Cel5A, por otro lado, es impulsada por
una alta entropía de activación, generada probablemente por un complejo enzima-sustrato
más ordenado.
El análisis comparativo computacional realizado en este trabajo permitió
identificar varias posiciones en la secuencia de Cel5A potencialmente vinculadas con la
modulación de su actividad catalítica a diversas temperaturas, algunas de las cuales
98
fueron seleccionadas para efectuar un estudio de mutagénesis sitio-dirigida. De esta
manera se construyó las mutantes A134Y y N138L. Adicionalmente se generó las
mutantes A134F, I99A e I99A/A134Y como complemento de la mutación simple A134Y.
La posibilidad teórica de impedimentos estéricos e interferencias entre interacciones, con
la potencialidad de generar distorsiones mayores en la topología del esqueleto peptídico,
impidieron la identificación de factores específicos relacionados con el comportamiento
catalítico de A134Y e I99A/A134Y. El reemplazo de la alanina 134 por una fenilalanina,
permitió asociar el grupo hidroxilo de la tirosina (que le confiere capacidad para formar
puentes de hidrógeno) con los efectos negativos causados por la mutación A134Y.
Todas las mutantes evidenciaron un aumento de la Km y una disminución de
la Ea comparado con Cel5A. Estudios de mutagénesis en una lactato deshidrogenasa han
demostrado que la energía de activación puede ser modificada sin influenciar la Km
cuando las mutaciones se sitúan lejos del sitio activo (Fields y Houseman, 2004). Sin
embargo, la Km usualmente varía en forma inversa a la energía de activación cuando las
mutaciones ocurren en la vecindad del sitio activo (Fields y Houseman, 2004), lo que
concuerda con nuestro resultado. También se ha establecido que la Km tiende a
aumentar en conjunto con la kCAT (Tindbaek et al., 2004), fenómeno frecuentemente
asociado al incremento en la flexibilidad del sitio de unión requerida para sostener una
actividad más alta. Los parámetros cinéticos de las mutantes N138L, I99A e I99A/A134Y,
corroboran esta aseveración, aunque cabe señalar que existen excepciones en las que el
aumento de kCAT coincide con una baja en la Km (Taguchi et al., 2000).
En este estudio no se utilizó el parámetro kCAT/Km, referido generalmente
como eficiencia catalítica ya que no es apto para comparar la actividad de distintas
enzimas sobre un mismo sustrato (Eisenthal et al., 2007). Esto se puede constatar
observando las curvas de saturación usadas para calcular la Km de Cel5A y sus
derivadas (Figura 18). La mutante doble I99A/A134Y es más activa que Cel5A e I99A a
concentraciones de sustrato por encima de 10 mM. En cambio, a concentraciones
suficientemente bajas, la situación se invierte. Utilizando los datos de la Tabla 8, se tiene
que la eficiencia catalítica de Cel5A a 10°C es mayor que la de I99A/A134Y, sin embargo
su actividad es menor en un amplio rango de concentraciones de sustrato. Lo anterior
sugiere que la constante catalítica como parámetro de comparación entre enzimas
también debe ser aplicado con cautela ya que refleja la actividad de una enzima en
condiciones saturantes y a una temperatura dada. El escenario puede cambiar
radicalmente si es que se modifican las condiciones mencionadas. Teniendo en cuenta lo
99
anterior, se puede afirmar que las mutantes N138L, I99A e I99A/A134Y presentan mayor
actividad catalítica que Cel5A a bajas temperaturas y en un amplio rango de
concentraciones del sustrato sintético pNPC, como consecuencia de una Ea más baja y
valores de Km que presentan variaciones menores. En la celulasa Cel5A de La histidina
138 de Thermotoga maritima, equivalente a la asparagina 138 de nuestra celulasa modelo
homónima, se intercambió por una tirosina, produciéndose una leve disminución en la
actividad
Nuestros resultados demuestran que la sustitución de un solo aminoácido
puede cambiar dramáticamente las propiedades de la celulasa Cel5A. Existen muchos
ejemplos en la literatura que atribuyen importantes adaptaciones catalíticas a
modificaciones estructurales muy sutiles (Taguchi et al., 2000; Wintrode et al., 2000;
Tsigos et al., 2001; D’Amico et al., 2002; Fields y Houseman, 2004; Henzler-Wildman et
al., 2007). Desgraciadamente, los efectos observados no se pueden extrapolar
directamente a otras enzimas homólogas ya que las consecuencias de una mutación
Figura 18. Curvas de saturación de Cel5A y enzimas mutantes con pNPC a 10°C.
100
dependen del complejo contexto estructural en el que está inmersa. Es así como la
leucina en posición 100 de Cel5A no es tolerada en el contexto homólogo de Cel5 (Bortoli-
German et al., 1995) y una mutación relevante para la adaptación de la subtilisina BPN a
bajas temperaturas se encuentra también en una estructura homóloga termofílica con
propiedades opuestas (Taguchi et al., 2000).
Es importante resaltar el hecho de que todas las mutaciones seleccionadas en
este estudio se localizan en las cercanías de residuos importantes para la actividad y la
unión del sustrato. En la naturaleza, las adaptaciones estructurales frecuentemente se
encuentran fuera del sitio activo, que permanece altamente conservado (Feller, 2003;
Zeng et al., 2006). Cambios en posiciones periféricas pueden modular los parámetros de
actividad modificando las propiedades dinámicas y conformacionales del centro reactivo
(Feller, 2003). Sin embargo, son más difíciles de detectar.
Hasta ahora, ningún aspecto estructural específico en el dominio catalítico de
Cel5G ha podido ser vinculado con sus propiedades psicrofílicas. Análisis comparativos
anteriores han descrito tendencias generales relacionadas con la adaptación de este
dominio a bajas temperaturas, pero no existe información acerca de mecanismos
particulares (Violot et al., 2005). Usando nuestra plataforma analítica detectamos
anomalías en la configuración espacial del sitio de unión a calcio de Cel5G situado en los
“loops” que conectan la hélice α 3 con la hoja β 4 y la hélice α 4 con la hoja β 5. La unión
de metales bivalentes, como el calcio, es un factor estabilizante en las estructuras
proteicas (Arnold y Zhang, 1994; Feller et al., 1999; Miyazaki et al., 2000; Stoner et al.,
2005). Una menor afinidad por calcio supone una estructura más flexible. De hecho, esta
condición es considerada como una posible adaptación estructural al frío en las enzimas
psicrofílicas (Feller et al., 1994; Villeret et al., 1997; Wintrode et al., 2000). Un residuo
vecino al sitio de unión a calcio, la arginina 160 (numeración correspondiente a Cel5A,
según secuencia aminoacídica), también se encuentra desplazado en Cel5G. Se ha
reportado que esta arginina juega un papel clave en la estabilización de la estructura,
posiblemente a través de interacciones electrostáticas (Bortoli-German et al., 1995). Es
probable que los cambios topológicos observados en, y alrededor del sitio de unión a
calcio de Cel5G afecten su funcionalidad, provocando un efecto desestabilizador, que
podría relacionarse con la adaptación de esta enzima al frío. En base a lo anterior y con el
propósito de validar nuestras predicciones teóricas, proponemos a los residuos
asparagina 165 y asparagina 166 de Cel5A, equivalentes a los ligandos de calcio
101
potencialmente disfuncionales en Cel5G, como blancos para mutagénesis sitio-dirigida en
estudios futuros.
El concepto de psicrofilicidad para designar organismos que viven a bajas
temperaturas es relativamente ambiguo y se encuentra, desde hace más de un siglo, en
constante evolución (Feller y Gerday, 1997). La clasificación de enzimas como
psicrofílicas o adaptadas a bajas temperaturas es una tarea igualmente compleja (Gerday
et al., 1997). Se acepta generalmente que las enzimas psicrofílicas son más activas a
bajas temperaturas y más termolábiles que sus contrapartes mesofílicas (Feller y Gerday,
2003, Papaleo et al., 2006; Siddiqui y Cavicchioli, 2006). Sin embargo, nuestros
resultados confirman la existencia de muchos parámetros independientes susceptibles de
ser usados como criterios de evaluación y cuyas combinaciones pueden dar origen a un
amplio espectro de comportamientos intermedios. En este contexto, la clasificación se
puede tornar relativa y dependiente de propiedades específicas de interés. Cel5A, sólo
por el hecho de ser más activa que Cel5 alrededor de 15°C, podría ser considerada más
psicrofílica.
102
6. Conclusiones
En base a los objetivos planteados, se despenden las siguientes conclusiones
del trabajo realizado:
• El carácter aproximado del análisis de modos normales dificulta su aplicación en el
estudio detallado de los mecanismos moleculares que gobiernan la catálisis
enzimática.
• La alta actividad catalítica de Cel5A con respecto a sus homólogas estructurales
podría ser impulsada por la desestabilización entrópica del complejo enzima-
sustrato.
• La actividad catalítica de las enzimas estudiadas se ve favorecida por factores
aparentemente antagonistas: el beneficio entrópico posiblemente asociado a la
rigidez de componentes específicos del sitio activo, en Cel5A, y el beneficio
entálpico ligado a la disminución de interacciones electrostáticas, que sugiere un
aumento de la flexibilidad local, observado en las mutantes.
• Cambios muy sutiles en la estructura de Cel5A pueden influenciar fuertemente su
comportamiento catalítico. El acceso a información estructural experimental de alta
resolución constituye una condición indispensable para el estudio y entendimiento
de la catálisis enzimática en éste y otros modelos.
• La inclusión de conceptos ligados a la dinámica estructural, tales como la
búsqueda estocástica de conformaciones favorables y las vibraciones promotoras,
en el estudio de la catálisis enzimática, podría complementar los parámetros
termodinámicos clásicos y permitir la elaboración de modelos más realistas y
descriptivos.
• La definición de psicrofilicidad como criterio para clasificar enzimas es aún
precaria y sujeta a relatividad. El limitado entendimiento de los fenómenos
fisicoquímicos subyacentes impide el establecimiento de reglas claras y
103
consensuadas. El razonamiento depende más bien del contexto temático, los
objetivos y los antecedentes considerados.
• Todas las mutantes generadas, a excepción de A134Y y A134F, pueden ser
consideradas versiones psicrofílicas de Cel5A.
104
7. Bibliografía
Abseher, R., Horstink, L., Hilbers, C. W. & Nilges, M. 1998. Essential spaces defined by NMR structure ensembles and molecular dynamics simulation show significant overlap. Proteins 31: 370-382. Agarwal, P. K. 2006. Enzymes: An integrated view of structure, dynamics and function. Microb. Cell Fact. 5: 2. Agarwal, P. K., Geist, A. & Gorin, A. 2004. Protein dynamics and enzymatic catalysis: Investigating the peptidyl-prolyl cis-trans isomerization activity of cyclophilin A. Biochemistry 43: 10605-10618. Aghajari, N., Feller, G., Gerday, C. & Haser, R. 1998. Crystal structures of the psychrophilic ∝-amylase from Alteromonas haloplanctis in its native form and complexed with an inhibitor. Prot. Sci. 7: 564-572. Aghajari, N., Van Petegem, F., Villeret, V., Chessa, J. P., Gerday, C., Haser, R. & Van Beeumen, J. 2003. Crystal structures of a psychrophilic metalloprotease reveal new insights into catalysis by cold-adapted proteases. Proteins 50: 636-647. Aittaleb, M., Hubner, R., Lamotte-Brasseur, J. & Gerday, C. 1997. Cold adaptation parameters derived from cDNA sequencing and molecular modelling of elastase from antarctic fish Notothenia neglecta. Prot. Eng. 10: 475-477. Alexandrov, V., Lehnert, U., Echols, N., Milburn, D., Engelman, D. & Gerstein, M. 2005. Normal modes for predicting protein motions: a comprehensive database assessment and associated web tool. Prot. Sci. 14: 633-643. Arnold, F. H. & Zhang, J. H. 1994. Metal-mediated protein stabilization. Trends Biotechnol. 12: 189-192. Arnorsdottir, J., Kristjansson, M. M. & Ficner, R. 2005. Crystal structure of a subtilisin-like serine proteinase from a psychrotrophic Vibrio species reveals structural aspects of cold adaptation. FEBS. J. 272: 832-845. Arrhenius, S. 1889. On the reaction velocity of the inversion of cane sugar by acids. Z. Phys. Chem. 4: 226-248. Ausubel, F., Brent, R., Kingstone, R., Moore, D., Seidman, J., Smith, J. & Struhl, K. (ed.) 1992. Short protocols in molecular Biology. Green Publidhing Associates and John Wiley & Sons. Bae, E. & Phillips, G. N. Jr. 2004. Structures and analysis of highly homologous psychrophilic, mesophilic and thermophilic adenylate kinases. J. Biol. Chem. 279: 28202-28208.
105
Bahar, I., Atilgan, A. R. & Erman, B. 1997. Direct evaluation of thermal fluctuations in proteins using a single-parameter harmonic potential. Fold. Des. 2: 173-181. Bahar, I. & Jernigan, R. L. 1997. Inter-residue potentials in globular proteins and the dominance of highly specific hydrophilic interactions at close separation. J. Mol. Biol. 266: 195-214. Bai, Y. W., Sosnick, T.R., Mayne, L. & Englander, S. W. 1995. Protein-folding intermediates: native-state hydrogen-exchange. Science 269: 192-197. Baldwin, R. 1986. Temperature dependence of the hydrofobic interaction in protein folding. PNAS 83: 8069-8072. Barras, F., Bortoli-German, I., Bauzan, M., Rouvier, J., Gey, C., Heyraud, A. & Henrissat, B. 1992. Stereochemistry of the hydrolisis reaction catalyzed by endoglucanase Z from Erwinia chrysanthemi. FEBS Lett. 300: 145-148. Basner, J. E. & Schwartz, S. D. 2004. Donor-acceptor distance and protein promoting vibration coupling to hydride transfer: A possible mechanism for kinetic control in isozymes of human lactate dehydrogenase. J. Phys. Chem. B 108: 444-451. Becker, O. & Watanabe, M. 2001. Dynamic Methods, en Computational Biochemistry and Biophysics, Becker O., MacKerell Jr, A., Roux, B. & Watanabe, M. eds. (New York, Marcel Dekker, Inc.), 39-67.
Benkovic, S.J. & Hammes-Schiffer, S. 2003. A perspective on enzyme catalysis. Science 301: 1196-1202. Bentahir, M., Feller, G., Aittaleb, M., Lamotte-Brasseur, J., Himri, T., Chessa, J.-P. & Gerday, C. 2000. Structural, kinetic, and calorimetric characterization of the cold-active phosphoglycerate kinase from the antarctic Pseudomonas sp. TACII18. J. Biol. Chem. 275: 11147-11153. Bikadi, Z., Demko, L. & Hazai, E. 2007. Functional and structural characterization of a protein based on analysis of its hydrogen bonding network by hydrogen bonding plot. Arch. Biochem. Biophys. 461: 225-234. Birnboim, H. C. & Doly, J. 1979. A rapid alkaline extraction procedure for screening recombinant plasmid DNA. Nucl. Acids Res. 7: 1513-1523. Blake, C. C., Koenig, D. F., Mair, G. A., North, A. C., Phillips, D. C. & Sarma, V. R. 1965. Structure of hen egg-white lysozyme. A three-dimensional Fourier synthesis at 2 Angstrom resolution. Nature 206: 757-761. Böde, C., Kovács, I., Szalay, M., Palotai, R., Korcsmáros, T. & Csermely, P. 2007. Network analysis of protein dynamics. FEBS Letters 581: 2776-2782. Boehr, D. D., Dyson, J. & Wright, P. E. 2006. An NMR perspective on enzyme dynamics. Chem. Rev. 106: 3055-3079.
106
Bollag, D. M., Rozycki, M. D., Edelstein, S. J. (ed.) 1996. Protein methods. Wiley-Liss, Inc., New York. Bortoli-German, I., Haiech, J., Chippaux, M. & Barras, F. 1995. Informational suppression to investigate structural functional and evolutionary aspects of the Erwinia chrysanthemi cellulase EGZ. J. Mol. Biol. 246: 82-94. Bradford, M. M. 1976. A rapid and sensitive method for the quantitation of microgram quantities of protein utilizing the principle of protein-dye binding. Anal. Biochem. 72: 248-254. Bruice, T. C. & Benkovic, S. J. 2000. Chemical basis for enzyme catalysis. Biochemistry 39: 6267-6274. Bryngelson, J. D., Onuchic, J. N., Socci, N. D. & Wolynes, P.G. 1995. Funnels, pathways, and the energy landscape of protein folding: a synthesis. Proteins 21: 167-195.
Cannon, W.R., Singleton, S.F. & Benkovic, S.J. 1996. A perspective on biological catalysis. Nat. Struct. Biol. 3: 821-833. Caratzoulas, S., Mincer, J. S. & Schwartz, S. D. 2002. Identification of a protein-promoting vibration in the reaction catalyzed by horse liver alcohol dehydrogenase. J. Am. Chem. Soc. 124: 3270-3276.
Cavicchioli, R., Siddiqui, K.S., Andrews, D. & Sowers, K.R. 2002. Low-temperature extremophiles and their applications. Curr. Opin. Biotechnol. 13: 253-261. Chapon, V., Czjzek, M., Hassouni, M., Py, B., Juy, M. Barras, F. 2001. Type II protein secretion in Gram-negative pathogenic bacteria: the study of the structure/secretion relationships of the cellulase Cel5 (formerly EGZ) from Erwinia chrysanthemi. J. Mol. Biol. 310: 1055-1066. Cherry, J.R. & Fidantsef, A.L. 2003. Directed evolution of industrial enzymes: an update. Curr. Opin. Biotech. 14: 438-443. Collins, T., Meuwis, M. A., Gerday, C. & Feller, G. 2003. Activity, stability and flexibility in glycosidases adapted to extreme thermal environments. J. Mol. Biol. 328: 419-428. Collins, T. H., Dutron, A., Georis, J., Genot, B., Dauvrin, T., Arnaut, P., Gerday, C. & Feller, G. 2006. Use of glycoside hydrolase family 8 xylanases in baking. J. Cereal Sci. 43: 79-84. Collins, T., Meuwis, M-A., Gerday, C. & Feller, G. 2003. Activity, stability and flexibility in glycosidases adapted to extreme thermal environments. J. Mol. Biol. 328: 419-428. Cordone, L., Ferrand, M., Vitrano, E. & Zaccai, G. 1999. Harmonic behavior of trehalose-coated carbon-monoxy-myoglobin at high temperature. Biophys. J. 76: 1043-1047.
107
D’Amico, S., Claverie, P., Collins, T., Georlette, D., Gratia, E., Hoyoux, A., Meuwis, M.-A., Feller, G. & Gerday, C. 2002. Molecular basis of cold adaptation. Philos. Trans. R. Soc. London Ser. B 357: 917-925. D’Amico, S., Gerday, C. & Feller, G. 2002. Structural determinants of cold adaptation and stability in a psychrophilic α-amylase. Biologia, Bratislava 57: 213-219. D’Amico, S., Marx, J.-C., Gerday, C. & Feller, G. 2003. Activity-stability relationships in extremophilic enzymes. J. Biol. Chem. 278: 7891-7896. Daniel, R. M., Dunn, R. V., Finney, J. L. & Smith, J. C. 2003. The role of dynamics in enzyme activity. Annu. Rev. Biophys. Biomol. Struct. 32: 69-92. Davies, G., Dauter, M., Brzozowski, M., Bjørnvad, M. E., Andersen, K. V. & Schülein, M. 1998. Structure of the Bacillus agaradherans family 5 enduglucanase at 1.6 Å and its cellobiose complex at 2.0 Å resolution. Biochemistry 37: 1926-1932. De Backer, M., McSweeney, S., Rasmussen, H. B., Riise, B., Lindley, P. & Hough, E. 2002. The 1,9 Å crystal structure of heat-labile shrimp alkaline phosphatase. J. Mol. Biol. 318: 1265-1274. DeLano, W. L. 2002. The PyMOL Molecular Graphics System. DeLano Scientific, San Carlos, CA, USA. del Sol, A., Fujihashi, H., Amoros, D. & Nussinov, R. 2006. Residues crucial for maintaining short paths in network communication mediate signaling in proteins. Mol. Sys. Biol. 2: 2006.0019. Demirjian, D.C., Moris-Varas, F. & Cassidy, C.S. 2001. Enzymes from extremophiles. Curr. Opin. Chem. Biol. 5: 144-151. Dill, K. & Bromberg, S. 2003. Molecular driving forces: statistical thermodynamics in chemistry and biology. Garland Science, New York. Dodson, G. & Verma, C. S. 2006. Protein flexibility: its role in structure and mechanism revealed by molecular simulations. Cell. Mol. Life Sci. 63: 207-219. Duan, Y. & Kollman, P. A. 1998. Pathways to a protein folding intermediate observed in a 1-microsecond simulation in aqueous solution. Science 282: 740-744. Duilio, A., Tutino, M.-L. & Marino, G. 2004. Recombinant protein production in Antarctic Gram-negative bacteria. Meth. Mol. Biol. 267: 225-237. Eisenmesser, E., Millet, O., Labeikovsky, W., Korzhnev, D., Wolf-Watz, M., Bosco, D., Skalicky, J., Kay, L. & Kern, D. 2005. Intrinsic dynamics of an enzyme underlies catalysis. Nature 438: 117-121. Eisenthal, R., Danson, M. J. & Hough, D. W. 2007. Catalytic efficiency and kCAT/Km: a useful comparator? Trends Biotechnol. 25: 247-249.
108
Evans, M. G. & Polanyi, M. 1935. Some applications of the transition state method to the calculation of reaction velocities, especially in solution. Trans. Faraday Soc. 31: 875-894. Eyring, H. 1935. The activated complex in chemical reactions. J. Chem. Phys. 3: 107-115. Feller, G., Payan, F., Theys, F., Qian, M., Haser, R. & Gerday, C. 1994. Stability and structural analysis of a α-amylase from antarctic psychrophile Alteromonas haloplanctis A23. Eur. J. Biochem. 222: 441-447. Feller, G. & Gerday, C. 1997. Psychrophilic enzymes: molecular basis of cold adaptation. Cell. Mol. Life Sci. 53: 830-841. Feller, G., Zekhnini, Z., Lamotte-Brasseur, J. & Gerday, C. 1997. Enzymes from cold-adapted microorganisms-the class C β-lactamase from the antarctic psychrophile Psychrobacter Immobilis A5. Eur. J. Biochem. 244: 186-191. Feller, G., D’Amico, D. & Gerday, C. 1999. Thermodynamic stability of a cold-active α-amylase from the antarctic bacterium Alteromonas haloplanctis. Biochemistry 38: 4613-4619. Feller, G. 2003. Molecular adaptations to cold in psychrophilic enzymes. Cell. Mol. Life Sci. 60: 648-662. Feller, G. & Gerday, C. 2003. Psychrophilic enzymes: hot topics in cold adaptation. Nat. Rev., Microbiol. 1: 200-208. Feller, G. 2007. Life at low temperatures: is desorder the driving force? Extremophiles 11: 211-216. Fenimore, P. W., Frauenfelder, H., McMahon, B. H. & Parak, F. G. 2002. Slaving: solvent fluctuations dominate protein dynamics and functions. Proc. Natl. Acad. Sci. USA 99: 16047-16051. Fersht, A. 1985. The basic equations of enzyme kinetics, In Enzyme structure and mechanism. W.H. Freeman and Company, New York, 98-120. Fields, P. 2001. Review: Protein function at thermal extremes: balancing stability and flexibility. Comp. Biochem. Physiol. 129: 417-431. Fields, P. A. & Houseman, D. E. 2004. Decreases in activation energy and substrate affinity in cold-adapted A4-lactate dehydrogenase: Evidence from the antarctic notothenioid fish Chaenocephalus aceratus. Mol. Biol. Evol. 21: 2246-2255. Fleming, P. & Richards, F. 2000. Protein packing: dependence on protein size, secondary structure and amino acid composition. J. Mol. Biol. 299: 487-498. Flory, P. J. 1976. Statistical Thermodynamics of Random Networks. Proc. R. Soc. Lond. A. 351: 351-380. Fukuda, H., Kondo, A. & Noda, H. 2001. Biodiesel fuel production by transesterification of oils. J. Biosci. Bioeng. 92: 405-416.
109
Garcia-Viloca, M., Gao, J., Karplus, M. & Truhlar, D. G. 2004. How enzymes work: analysis by modern rate theory and computer simulations. Science 303: 186-195. Garsoux, G., Lamotte, J., Gerday, C. & Feller, G. 2004. Kinetic and structural optimization to catalysis at low temperatures in a psychrophilic cellulase from the antarctic bacterium Pseudomonas haloplanktis. Biochem. J. 384: 247-253. Gavrilescu, M. & Chisti, Y. 2005. Biotechnology – a sustainable alternative for chemical industry. Biotech. Adv. 23: 471-499. Georlette, D., Blaise, V., Dohmen, C., Bouillenne, F., Damien, B., Depiereux, E., Gerday, C., Uversky, V. N. & Feller, G. 2003a. Cofactor binding modulates the conformational stabilities and unfolding patterns of NAD(+)-dependent DNA ligases from Escherichia coli and Thermus scotoductus. J. Biol. Chem. 278: 49945-49953. Georlette, D., Damien, B., Blaise, V., Depiereux, E., Uversky, V., Gerday, C. & Feller, G. 2003b. Structural and functional adaptations to extreme temperatures in psychrophilic, mesophilic, and thermophilic DNA ligases. J. Biol. Chem. 278: 37015-37023. Gerday, C., Aittaleb, M., Arpigny, J. L., Baise, E., Chessa, J. P., Garsoux, G., Petrescu, I. & Feller, G. 1997. Psychrophilic enzymes: a thermodynamic challenge. Biochim. Biophys. Acta 1342: 119-131. Gerday, C., Aittaleb, M., Bentahir, M., Chessa, J. P., Claverie, P., Collins, T., D’Amico, S., Dumont, J., Garsoux, G., Georlette, D., Hoyoux, A., Lonhienne, T., Meuwis, M.-A. & Feller, G. 2000. Cold-adapted enzymes: from fundamentals to biotechnology. Trends Biotechnol. 18: 103-107. Gerstein, M. & Krebs, W. 1998. A database of macromolecular motions. Nucl. Acids Res. 26: 4280-4290. Giver, L., Gershenson, A., Freskgard, P. O. & Arnold, F. H. 1998. Directed evolution of a thermostable esterase. Proc. Natl. Acad. Sci. USA 95: 12809-12813. Gomes, J. & Steiner, W. 2004. The biocatalytic potential of extremophiles and extremozymes. Food Technol. Biotechnol. 42: 223-235. Greene, L. H. & Higman, V. A. 2003. Uncovering network systems within protein structures. J. Mol. Biol. 334: 781-791. Gromiha, M. M. & Selvaraj, S. 2004. Inter-residue interactions in protein folding and stability. Prog. Biophys. Mol. Biol. 86: 235-277. Gros, M. & Jainicke, R. 1994. Protein under pressure. Eur. J. Biochem. 221: 617-630. Guex, N., Diemand, A. & Peitsch, M. C. 1999. Protein modelling for all. Trends Biochem. Sci. 24: 364-367. Guex, N. & Peitsch, M. C. 1997. SWISS-MODEL and the Swiss-PdbViewer: an environment for comparative protein modeling. Electrophoresis 18: 2714-2723.
110
Gugolya, Z., Dosztanyi, Z. & Simon, I. 1997. Interresidue interactions in protein classes. Proteins 27: 360-366. Gunasekaran, K. & Nussinov, R. 2007. How different are structurally flexible and regid binding sites? Sequence and structural features discriminating proteins that do and do not undergo conformational change upon ligand binding. J. Mol. Biol. 365: 257-273. Halle, B. 2002. Flexibility and packing in proteins. Proc. Natl. Acad. Sci. USA 99: 1274-1279. Hamelryck, T. & Manderick, B. 2003. PDB file parser and structure class implemented in Python. Bioinformatics 19: 2308-2310. Hanson, J., Duderstadt, K., Watkins, L., Bhattacharyya, S., Brokaw, J., Chu, J.-W. & Yang, H. PNAS 104: 18055-18060. Hayward S. 2001. Normal Mode Analysis of Biological Molecules en Computational Biochemistry and Biophysics, Becker O., A. MacKerell Jr, B. Roux y M. Watanabe eds., Marcel Dekker, Inc. Hei, D.J. & Clark, D.S. 1994. Pressure stabilization of proteins from extreme thermophiles. Appl. Environ. Microbiol. 60: 932-999. Henrissat, B. & Davies, G. 2000. Glycoside hydrolases and glycosyltransferases. Families, modules and implications for genomics. Plant Physiol. 124: 1515-1519. Henzler-Wildman, K., Lei, M., Thai, V., Kerns, S. J., Karplus, M. & Kern, D. 2007. A hierarchy of timescales in protein dynamics is linked to enzyme catalysis. Nature 450: 913-918. Higgins, D. G. & Sharp, P. M. 1988. CLUSTAL: a package for performing multiple sequence alignment on a microcomputer. Gene 73: 237-244 (http://www.ebi.ac.uk/clustalw). Hildebrandt, P., Wanarska, M. & Kur, J. 2009. A new cold-adapted β-D-galactosidase from the antarctic Arthrobacter sp. 32c – gene cloning, overexpression, purification and properties. BMC Microbiol. 9: 151-161. Hinsen K. 1998. Analysis of Domain Motions by Approximate Normal Mode Calculations. Proteins 33: 417-429. Hinsen, K. 2000. The molecular modelling tool kit: a new approach to molecular simulations. J. Comp. Chem. 21: 79-85. Hinsen, K & Kneller, G. R. 2000. Projection methods for the analysis of complex motions in macromolecules. Mol. Sim. 23: 275-292. Hirasawa, K., Uchimura, K., Kashiwa, M., Grant, W. D., Ito, S., Kobayashi, T. & Horikoshi, K. 2006. Salt-activated endoglucanase of a strain of alkaliphilic Bacillus agaradhaerens. Ant. van Leeuwenhoek 89: 211-219.
111
Hoyoux, A., Jennes, I., Dubois, P., Genicot, S., Dubail, F., François, J. M., Baise, E. & Gerday, C. 2001. Cold-adapted β-galactosidase from the antarctic psychrophile Pseudoalteromonas haloplanktis. Appl. Environ. Microbiol. 67: 1529-1535. Hoyoux, A., Blaise, V., Collins, T., D’Amico, S., Gratia, E., Huston, A.L., Marx, J.C., Sonan, G., Zeng, Yinxin, Feller, G. & Gerday C. 2004. Extreme catalysts from low-temperature environments. J. Biosci. Bioeng. 98: 317-330. Hunter, J. D. 2007. Matplotlib: a 2D graphics environment. Comp. Sci. E ng. 9: 90-95. Jaenicke, R. 2000. Stability and stabilization of globular proteins in solution. J. Biotechnol. 79: 193-203. Karplus, M. & Kuriyan, J. Molecular dynamics and protein function. Proc. Natl. Acad. Sci. USA 102: 6679-6685. Kazmirski, S. L., Li, A. & Daggett, V. Analysis methods for comparison of multiple molecular dynamics trajectories: applications to protein unfolding pathways and denatured ensembles. J. Mol. Biol. 290: 283-304. Koshland, D. E. 1958. Aplication of a theory of enzyme specificity to protein synthesis. Proc. Natl. Acad. Sci. USA 44: 98-105. Kumar, S. & Nussinov, R. 1999. Salt bridge stability in monomeric proteins. J. Mol. Biol. 293: 1241-1255. Kumar, S., Ma, B., Tsai, C.-J., Sinha, N. & Nussinov, R. 2000. Folding and binding cascades: Dynamic landscapes and population shifts. Prot. Sci. 9: 10-19. Kumar, S., Wolfson, H & Nussinov, R. 2001. Protein flexibility and electrostatic interactions. IBM J. Res & Dev. 45: 499-512. Kumar, S., Tsai, C.-J. & Nussinov, R. 2002. Maximal stabilities of reversible two-state proteins. Biochemistry 41: 5359-5374. Laidler, K. J. & King, M. C. 1983. The development of Transition-State-Theory. J. Phys. Chem. 87: 2657-2664. Leiros, H. K., Willassen, N. P. & Smalas, A. O. 2000. Structural comparison of psychrophilic and mesophilic trypsins. Elucidating the molecular basis of cold-adaptation. Eur. J. Biochem. 267: 1039-1049. Leiros, I., Moe, E., Lanes, O., Smalas, O. & Willassen, P. 2003. The structure of uracil-DNA glycosylase from atlantic cod (Gadus morhua) reveals cold-adaptation features. Acta Crystallogr. D Biol. Crystallogr. 59: 1357-1365. Lonhienne, T., Gerday, C. & Feller, G. 2000. Psychrophilic enzymes: revisiting the thermodynamic parameters of activation may explain local flexibility. Biochim. Biophys. Acta 1543: 1-10.
112
Lonhienne, T., Zoidakis, J., Vorgias, C. E., Feller, G., Gerday, C. & Bouriotis, V. 2001. Modular structure, local flexibility and cold-activity of a novel chitobiase from a psychrophilic antarctic bacterium. J. Mol. Biol. 310: 291-297. Lopez, C. F., Darst, R. K. & Rossky, P. J. 2007. Mechanistic elements of protein cold denaturation. J. Phys. Chem. B 112: 5961-5967. Luo, Y., Zheng, Y., Jiang, Z., Ma, Y. & Wei, D. 2006. A novel psychrophilic lipase from Pseudomonas fluorescens with unique property in chiral resolution and biodiesel production via transesterification. Appl. Microbiol. Biotechnol. 73: 349-355. Ma, B., Kumar, S., Tsai, C.-J. & Nussinov, R. 1999. Folding funnels and binding mechanisms. Protein Eng. 12: 713-720. MacArthur, M. W. & Thornton, J. M. 1991. Influence of proline residues on protein conformation. J. Mol. Biol. 218: 397-412. MacArthur, M. W. & Thornton, J. M. 1993. Conformational analysis of protein structures derived from NMR data. Proteins 17: 232-251. MacKerell, A. D. 2001. Atomistic models and force fields, en Computational Biochemistry and Biophysics, Becker O., MacKerell Jr, A., Roux, B. & Watanabe, M. eds. (New York, Marcel Dekker, Inc.), 7-38. McDonald, I. K. & Thornton, J. M. 1994. Satisfying hydrogen bonding potential in proteins. J. Mol. Biol. 238: 777-793. Maes, D., Zeelen, J. P., Thanki, N., Beaucamp, N., Alvarez, M., Thi, M. H. D., Backmann, J., Martial, J. A., Wyns, L., Jaenicke, R. & Wierenga, R. K. 1999. The crystal structure of triosephosphate isomerase (TIM) from Thermotoga maritima: a comparative thermostability structural analysis of ten different TIM structures. Proteins Struct. Funct. Genet. 37: 441-453. Margesin, R., Feller, G., Gerday, C. & Russell, N. 2002. Cold-adapted microorganisms: adaptation strategies and biotechnological potential. In Bitton, G. (ed.), The encyclopedia of environmental microbiology. John Wiley & Sons, New York, 871-885. Marhuenda-Egea, F.C. & Bonete, M.J. 2002. Extreme halophilic enzymes in organic solvents. Curr. Opin. Biotechnol. 13: 385-389. Marx, J.-C., Collins, S., D’Amico, G., Feller, C. & Gerday, C. 2007. Cold-adapted enzymes from marine antarctic microorganisms. Mar. Biotech. 9: 293-304. McCoy, M. 2000. Novozymes emerges. Chem. Eng. News 19: 23-25. McFall-Ngai, M. J. & Horwitz, J. 1990. A comparative study of the thermal stability of the vertebrate eye lens: antarctic ice fish to the desert iguana. Exp. Eye Res. 50: 703-709. Miller, G. L. 1959. Use of dinitrosalicylic acid reagent for determination of reducing sugars. Anal. Chem. 31: 426-428.
113
Miller, G. P. & Benkovic, S. J. 1998. Stretching exercices-flexibility in dihydrofolate reductase catalysis. Chem. Biol. 5: 105-113. Miller, D. W. & Agard, D. A. 1999. Enzyme specificity under dynamic control: a normal mode analysis of α-lytic protease. J. Mol. Biol. 286: 267-278. Miyazaki, K., Wintrode, P. L., Grayling, R. A., Rubingh, D. N. & Arnold, F. H. 2000. Directed evolution study of temperature adaptation in a psychrophilic enzyme. J. Mol. Biol. 297: 1015-1026. Morrison, K. L. & Weiss, G. A. 2001. Combinatorial alanine-scanning. Curr. Opin. Chem. Biol. 5: 302-307. Mulder, F. A. A., Mittermaier, A., Hon, B., Kahlquist, F. W. & Kay, L. E. Studying excited states of proteins by NMR spectroscopy. Nature Struct. Biol. 8: 932-935. Nielsen, P., Fritze, D. & Priest, F. G. 1995. Phenetic diversity of alkaliphilic Bacillus strains: proposal for nine new species. Microbiology 141: 1745-1761. Page, M. I. & Jencks, W. P. 1971. Entropic contributions to rate accelerations in enzymic and intramolecular reactions and the chelate effect. Proc. Natl. Acad. Sci. USA 68: 1678-1683. Papaleo, E., Riccardi, L., Villa, C., Fantucci, P. & De Gioia, L. 2006. Flexibility and enzymatic cold-adaptation: A comparative molecular dynamics investigation of the elastase family. Biochim. Biophys. Acta 1764: 1397-1406. Papaleo, E., Olufsen, M., De Gioia, L. & Brandsdal, B. O. 2007. Optimization of electrostatics as a strategy for cold-adaptation: a case study of cold- and warm-active elastases. J. Mol. Graph. Mod. 26: 93-103. Parthasarathy, S. & Murthy M. R. N. 2000. Correlating dynamics to conformational properties: an analysis of atomic displacement parameters (B-values) in high-resolution protein structures. Science 78: 1123-1126. Pattabiraman, N., Ward, K. B. & Fleming, P. J. 1995. Occluded molecular surface: analysis of protein packing. J. Mol. Recognit. 8: 334-344. Pauling, L. 1946. Molecular architecture and biological reactions. Chem. Eng. News 24: 1375-1377. Pineda, J. R. E. T. & Schwartz, S. D. 2006. Protein dynamics and catalysis: the problems of transition state theory and the subtlety of dynamic control. Phil. Trans. R. Soc. B 361: 1433-1438. Plaxco, W. K., Simons, K. T. & Baker, D. 1998. Contact order, transition state placement and the refolding rates of single domain proteins. J. Mol. Biol. 277: 985-994.
114
Poirot, O., Suhre, K., Abergel, C., O’Toole, E. & Notredame, C. 2004. 3DCoffee@igs: a web server for combining sequences and structures into a multiple sequence alignment. Nucleic Acids Res. 32 (Web Server issue): 37-40. Poliakoff, M., Fitzpatrick, J.M., Farren, T.R., Paul, T & Anastas, P.T. 2002. Green chemistry: science and politics of change. Science 297: 807-810. Poon, D. K. Y., Webster, P., Withers, S. G. & McIntosh, L. P. 2003. Characterizing the pH-dependent stability and catalytic mechanism of the family 11 xylanase from the alkalophilic Bacillus agaradhaerens. Carbohydr. Res. 338: 415-421. Rader, A. J., Chennubhotla, Ch., Yang, L.-W., & Bahar, I. 2006. The Gaussian Network Model: Theory and Applications, in Normal Mode Analysis: Theory and Applications to Biological and Chemical Systems. Eds. Cui, Q. & Bahar, I., Chapman & Hall / CRC Mathematical and Computational Biology Series, CRC Press, Taylor & Francis Group, 41-64. Radkiewicz, J. & Brooks, C. L. 2000. Protein dynamics in enzymatic catalysis: exploration of dihydrofolate reductase. J. Am. Chem. Soc. 122: 225-231. Radzicka, A. & Wolfenden, R. 1995. A proficient enzyme. Science 267: 90-93. Réat, V., Patzelt, H., Ferrand, M., Pfister, C., Oesterhelt, D. & Zaccai, G. 1998. Dynamics of different functional parts of bacteriorhodopsin: H-2H labeling and neutron scattering. Proc. Natl. Acad. Sci. USA 95: 4970-4975. Richards, F. M. 1974. The interpretation of protein structures: total volume, group volume distributions and packing density. J. Mol. Biol. 82: 1-14. Robinson-Rechavi, M., Alibés, A. & Godzik, A. 2006. Contribution of electrostatic interactions, compactness and quaternary structure to protein thermostability: lessons from structural genomics of Thermotoga maritima. J. Mol. Biol. 356: 547-557. Rose, G., Fleming, P., Banavar, J. & Maritan, A. 2006. A backbone-based theory of protein folding. Proc. Natl. Acad. Sci. USA 103: 16623-16633. Rothschild, L. J., & Mancinelli, R.L. 2001. Life in extreme environments. Nature 409: 1092-1101. Rozzell, J.D. 1999. Commercial scale biocatalysis: myths and realities. Bioorg. Med. Chem. 7: 2253-2261. Russell, R. J., Gerike, U., Danson, M. J., Hough, D. W. & Taylor, G. L. 1998. Structural adaptations of the cold-active citrate synthase from an antarctic bacterium. Structure 6: 351-361. Ruxton, G. D. 2006. The unequal variance t-test is an underused alternative to Student’s t-test and the Mann-Whitney U test. Behav. Ecol. 17: 688-690.
115
Salazar, O., Molitor, J., Lienqueo, M. E. & Asenjo, J. A. 2001. Overproduction, purification and characterization of β-1,3-glucanase type II in Escherichia coli. Protein Expr. Purif. 23: 219-225. Sali, A. & Blundell, T. L. 1993. Comparative protein modelling by satisfaction of spatial restraints. J. Mol. Biol. 234: 779-815. Schiraldi, C. & De Rosa, M. 2002. The production of biocatalysts and biomolecules from extremophiles. Trends Biotechnol. 20: 515-521. Shu, F., Ramakrishnan, V. & Schoenborn, B. P. 2000. Enhanced visibility of hydrogen atoms by neutron crystallography on fully deuterated myoglobin. Proc. Natl. Acad. Sci. USA 97: 3872-3877. Siddiqui, K. S. & Cavicchioli, R. 2005. Improved thermal stability and activity in the cold-adapted lipase B from Candida antarctica following chemical modification with oxidized polysaccharides. Extremophiles 9: 471-476. Siddiqui, K. S. & Cavicchioli, R. 2006. Cold-adapted enzymes. Annu. Rev. Biochem. 75: 403-433. Smalas, A. O., Heimstad, E. S., Hordvik, A., Willassen, N. P. & Male, R. 1994. Cold adaptation of enzymes: structural comparison between salmon and bovine trypsins. Proteins 20: 149-166. Sonan, G. K., Receveur-Brechot, V., Duez, C., Aghajari, N., Czjzek, M., Haser, R. & Gerday, C. 2007. The linker region plays a key role in the adaptation to cold of the cellulase from an Antarctic bacterium. Biochem. J. 407: 293-302. Sriprapundh, D., Vieille, C. & Zeikus, J. G. 2000. Molecular determinants of xylose isomerase thermal stability and activity: analysis of thermozymes by site-directed mutagenesis. Protein Eng. 13: 259-265. Stoner, M. R., Dale, D. A., Gualfetti, P. J., Becker, T. & Randolph, T. W. 2005. Ca2+-surfactant interactions affect enzyme stability in detergent solutions. Biotech. Prog. 21: 1716-1723. Süel, G. M., Lockloss, S. W., Wall, M. A. & Ranganathan, R. 2003. Evolutionarily conserved networks of residues mediate allosteric communication in proteins. Nat. Struct. Biol. 10: 59-69. Svingor, A., Kardos, J., Hajdu, I., Nemeth, A. & Zavodszky, P. 2001. A better enzyme to cope with cold. Comparative flexibility studies on psychrotrophic, mesophilic, and thermophilic ipmdhs. J. Biol. Chem. 276: 28121-28125. Taguchi, S., Komada, S. & Momose, H. 2000. The complete amino acid substitutions at position 131 that are positively involved in cold adaptation of subtilisin BPN. Appl. Environ. Microbiol. 66: 1410-1415. Tama, F., Gadea, F., Marques, O. & Sanejouand, Y.-H. 2000. Building-block approach for determining low-frequency normal modes of macromolecules. Proteins 41: 1-7.
116
Tian, J., Wang, P., Gao, S., Chu, X., Wu, N. & Fan, Y. 2010. Enhanced thermostability of methyl parathion hydrolase from Ochrobactrum sp. M231 by rational engineering of a glycine to proline mutation. FEBS J. 277: 4901-4908. Tindbaek, N., Svendsen, A., Oestergaard, P. R. & Draborg, H. 2004. Engineering a substrate-specific cold-adapted subtilisin. Protein Eng. Des. Sel. 17: 149-156. Tirion, M.M. 1996. Large Amplitude Elastic Motions in Proteins from a Single –Parameter Atomic Analysis. Phys. Rev. Lett. 77: 1905-1908. Torshin, I. Y., Weber, I. T. & Harrison, R. W. 2002. Geometric criteria of hydrogen bonds in proteins and identification of “bifurcated” hydrogen bonds. Prot. Eng. 15: 359-363. Tsigos I., Mavromatis, K., Tzanodaskalaki, M., Pozidis, C., Kokkinidis, M. & Bouriotis, V. 2001. Engineering the properties of a cold active enzyme through rational redesign of the active site. Eur. J. Biochem. 268: 5074-5080. Urban, A., Neukirchen, S. & Jaeger, K.-E. 1997. A rapid and efficient method for site-directed mutagenesis using one-step overlap extension PCR. Nucl. Acids Res. 25: 2227-2228. Van den Burg, B. 2003. Extremophiles as a source for novel enzymes. Curr. Opin. Microbiol. 6: 213-218. Van Petegem, F., Collins, T, Meuwis, M.-A., Gerday, C., Feller, G. & Van Beeumen, J. 2003. The structure of a cold-adapted family 8 xylanase at 1.3 Å resolution, structural adaptations to cold and investigation of the active site. J. Biol. Chem. 278: 7531-7539. Varrot, A., Schülein, M. & Davies, G. J. 2000. Insights into ligand-induced conformational change in Cel5A from Bacillus agaradhaerens revealed by a catalytically active crystal form. J. Mol. Biol. 297: 819-828. Varrot, A. & Davies, G. J. 2003. Direct experimental observation of the hydrogen-bonding network of a glycosidase along its reaction coordinate revealed by atomic resolution analyses of endoglucanase Cel5A. Acta Cryst. D 59: 447-452. Villeret, V., Chessa, J.-P., Gerday, C. & Van Beeumen, J. 1997. Preliminary crystal structure determination of the alkaline protease from the antarctic psychrophile Pseudomonas aeruginosa. Prot. Sci. 6: 2462-2464. Violot, S., Aghajari, N., Czjzek, M., Feller, G., Sonan, G. K., Gouet, P., Gerday, C., Haser, R., Receveur-Bréchot, V. 2005. Structure of a full length psychrophilic cellulase from Pseudoalteromonas haloplanktis revealed by X-ray diffraction and small angle X-ray scattering. J. Mol. Biol. 348: 1211-1224. Wang, Q., Tull, D., Meinke, A., Gilkes, N., Warrens, A., Aebersold, R. & Withers, S. 1993. Glu280 is the nucleophile in the active site of Clostridium thermocellum CelC, a family A endo-β-1,4-glucanase. J. Biol. Chem. 268: 14096-14102. Ward, S., Curtis, C. & Hulme, E. 1999. Alanine-scanning mutagenesis of transmembrane
117
domain 6 of the M1 muscarinic acetylcholine receptor suggests that Tyr381 plays key roles in receptor function. Mol. Pharmacol. 56: 1031-1041. Warshel, A. 1998. Electrostatic origin of the catalytic power of enzymes and the role of preorganized active sites. J. Biol. Chem. 273: 27035-27038. Wintrode, P. L. & Arnold, F. H. 2000. Temperature adaptation of enzymes: lessons from laboratory evolution. Adv. Protein Chem. 55: 161-225. Wintrode, P. L., Miyazaki, K. & Arnold, F. H. 2000. Cold adaptation of a mesophilic subtilisin-like protease by laboratory evolution. J. Biol. Chem. 275: 31635-31640. Wolfenden, R.; Ridgway, C. & Young, G. 1998. Spontaneous hydrolysis of ionized phosphate monoesters and diesters and the proficiencies of phosphatases and phosphodiesterases as catalysts. J. Am. Chem. Soc. 120: 833-834. Wolf-Watz, M., Thai, V., Henzler-Wildman, K., Hadjipavlou, G., Eisenmesser, E. Z. & Kern, D. 2004. Linkage between dynamics and catalysis in a thermophilic-mesophilic enzyme pair. Nature Struct. Mol. Biol. 11: 945-949. Wooll, J. O., Wrabl, J. O. & Hilser, V. J. 2000. Ensemble modulation as an origin of denaturant-independent hydrogen exchange in proteins. J. Mol. Biol. 301: 247-256. Xu, Y., Feller, G., Gerday, C. & Glansdorff, N. 2003. Moritella cold-active dihydrofolate reductase: are there natural limits to optimization of catalytic efficiency at low temperature? J. Bact. 185: 5519-5526. Zaccai, G. 2000. How soft is a protein? A protein dynamics force constant measured by neutron scattering. Science 288: 1604-1607. Zavodszky, P., Kardos, J., Svingor, A. & Petsko, G. 1998. Adjustment of conformational flexibility is a key event in the thermal adaptation of proteins. Proc. Natl. Acad. Sci. USA 95: 7406-7411. Zecchinon, L., Claverie, P., Collins, T., D’Amico, S., Delille, D., Feller, G., Georlette, D., Gratia, E., Hoyoux, A., Meuwis, M. A., Sonan, G. & Gerday, C. 2001. Did psychrophilic enzymes really win the challenge? Extremophiles 5: 313-321. Zeng, R., Xiong, P. & Wen, J. 2006. Characterization and gene cloning of a cold-active cellulase from a deep-sea psychrtrophic bacterium Pseudoalteromonas sp. DY3. Extremophiles 10: 79-82. Zhang, N., Suen W.-C., Windsor, W., Xiao, L., Madison, V. & Zaks, A. 2003. Improving tolerance of Candida antarctica lipase B towards irreversible thermal inactivation through directed evolution. Prot. Eng. 16: 599-605. Zhou, Y., Vitkup, D. & Karplus, M. 1999. Native proteins are surface-molten solids: application of the Lindemann criterion for the solid versus liquid state. J. Mol. Biol. 285: 1371-1375.
118
ANEXO I
Bases termodinámicas de la catálisis
En esta sección se revisará los conceptos termodinámicos básicos que
permiten describir y estudiar el comportamiento enzimático.
1. Ecuaciones termodinámicas fundamentales
Los conceptos termodinámicos básicos de energía interna y entropía, marcan el
inicio del razonamiento que nos llevará finalmente a entender el fenómeno de catálisis
enzimática. La energía interna de un sistema es la suma de las energías de cada partícula
que lo compone. La entropía (S) es una magnitud que, según la famosa relación de
Ludwig Boltzmann,
!
S = k lnW , donde k es la constante de Boltzmann y W es la
multiplicidad de grados de libertad, da cuenta del nivel de “orden” o “desorden” de un
sistema (Dill y Bromberg, 2003). Ambas propiedades son extensivas, ya que dependen
del tamaño del sistema.
Se puede demostrar que un sistema termodinámico, para alcanzar el equilibrio,
siempre tiende a una máxima multiplicidad de estados, es decir, según la relación de
Boltzmann, a una máxima entropía (Dill y Bromberg, 2003).
Las ecuaciones fundamentales para los conceptos de entropía y energía libre se
basan en la noción de que la tendencia de un sistema hacia una máxima multiplicidad de
estados (entropía) puede explicar diversos comportamientos físicos macroscópicos.
Cuando el volumen puede variar, la tendencia hacia máxima entropía predice la
expansión de los gases, cuando el número de partículas puede cambiar, la tendencia
hacia máxima entropía predice el fenómeno de mezcla y cuando la energía puede variar,
la tendencia hacia máxima entropía predice el flujo de calor (Dill y Bromberg, 2003).
Así, la ecuación termodinámica fundamental para la entropía depende de 3
variables: U (energía interna), V (volumen) y N (número de partículas):
!
dS ="S
"U
#
$ %
&
' ( V ,N
dU +"S
"V
#
$ %
&
' ( U ,N
dV +"S
"N j
#
$ % %
&
' ( (
j=1
M
)U ,V ,Ni* j
dN j (1)
119
La ecuación fundamental para la energía interna depende de S (entropía), V
(volumen) y N (número de partículas):
!
Cada derivada parcial en la ecuación de energía se asocia a una propiedad física
intensiva:
Siendo T, p y
!
µ, la temperatura, presión y potencial químico de un sistema,
respectivamente. Estas magnitudes se comportan como fuerzas que gobiernan procesos
como transferencia de calor, trabajo y mezcla respectivamente (Dill y Bromberg, 2003).
Incorporando las definiciones recién mencionadas, las ecuaciones termodinámicas
fundamentales de la entropía y la energía interna quedan de la siguiente manera:
2. Energía libre y equilibrio
Un sistema combinado, conformado por un subsistema y su entorno, evoluciona
hacia su estado de equilibrio cuando la suma de las variaciones de entropía del
subsistema y el entorno es positiva. En el equilibrio las variaciones de entropía suman
cero, es decir se maximiza la entropía. Esto se basa en el hecho de que una máxima
multiplicidad de estados tiene la mayor probabilidad de ocurrencia.
Se tiene:
!
dU ="U
"S
#
$ %
&
' ( V ,N
dS +"U
"V
#
$ %
&
' ( S,N
dV +"U
"Nj
#
$ %
&
' (
j=1
M
)S,V ,Ni* j
dNj
!
"U
"Nj
#
$ %
&
' ( S,V ,Ni) j
= µ j
!
"#U
#V
$
% &
'
( ) S,N
= p
!
"U
"S
#
$ %
&
' ( V ,N
= T
!
dU = TdS" pdV + µ jdNj
j=1
M
#
!
dS =1
T
"
# $
%
& ' dU +
p
T
"
# $
%
& ' dV (
µ j
T
"
# $
%
& '
j=1
M
) dNj
(2)
(3)
(4)
(5)
120
donde Ssc es la entropía del sistema combinado, Ss es la entropía del subsistema y Sa es
la entropía del ambiente.
Suponiendo que el sistema combinado es aislado, es decir no intercambia energía
en sus fronteras, se puede establecer una relación que describe el equilibrio considerando
sólo parámetros del subsistema de interés, sin incorporar parámetros del ambiente. Esta
relación introduce un nuevo concepto: la energía libre.
Sistema combinado aislado:
La idea es eliminar los parámetros que describen el ambiente. Considerando la
ecuación (5), manteniendo V y N constantes se tiene:
Según (7),
!
dUa
= "dUs, por lo tanto
Sustituyendo la ecuación (9) en la ecuación (6):
De la ecuación (10) surge una expresión que describe la aproximación a un estado
de equilibrio en términos del subsistema estudiado únicamente. Esta relación define la
cantidad F, denominada Energía Libre de Helmholtz:
Derivando la ecuación (11) y considerando T constante, se obtiene la ecuación
(10). La energía libre de Helmhotz depende de 3 variables: T, V y N. Examinando las
!
dSsc
= dSs+ dS
a" 0 (6)
!
dUs+ dU
a= 0 (7)
!
dSa
=1
T
"
# $
%
& ' dUa
(8)
!
dSa
= "1
T
#
$ %
&
' ( dUs (9)
!
dSs"1
T
#
$ % &
' ( dUs
) 0
!
dUs" TdS
s# 0 (10)
!
F =U "TS (11)
121
ecuaciones (10) y (11) se establece que cuando se alcanza el equilibrio (ecuación (10)
igual a cero), la cantidad F se encuentra en un mínimo.
La energía libre de Helmholtz describe el estado de equilibrio a T, V y N
constantes. Siguiendo el mismo razonamiento, es posible encontrar una relación a S, p y
N constantes. Retomando la ecuación fundamental de la energía interna (4), y
considerando que a presión y numero de partículas constante
!
Va
= "Vs (ley de los gases
ideales), se tiene:
Reemplazando la ecuación (12) en la ecuación de conservación de la energía (7)
se obtiene:
De la ecuación (13) surge otra función fundamental, la entalpía (H):
A pesar de la validez de las 4 ecuaciones termodinámicas fundamentales recién
presentadas, éstas dependen de variables difíciles de imponer en condiciones de
laboratorio. La última ecuación termodinámica fundamental, que da origen a la Energía
Libre de Gibbs (G) depende de variables fácilmente controlables como T, p y N. Por esta
razón, G es considerada una de las ecuaciones fundamentales más importantes e útiles
para describir el estado de equilibrio de los sistemas termodinámicos.
Para deducir la ecuación fundamental de G, es necesario fijar las variables T, p
y N como constantes. En estas condiciones, el término entrópico de la ecuación (4) no se
cancela. Aplicando el mismo tipo de resolución que para el caso de la entalpía y la
Energía Libre de Helmholtz se obtiene:
!
dUa = pdVs (12)
!
dUs + pdVs = 0 (13)
!
H = U + pV (14)
!
dUs + pdVs " TdSs # 0 (15)
122
Finalmente combinando las ecuaciones (14) y (15), se obtiene la relación
fundamental para la Energía Libre de Gibbs:
Cuando un sistema termodinámico alcanza el equilibrio a T, p y N constantes,
la energía libre de Gibbs se encuentra en un mínimo y su diferencial es cero.
3. Ley de distribución de Boltzmann
Las propiedades termodinámicas de un sistema se pueden predecir mediante
funciones de distribución, como la de Boltzmann.
La ley de distribución de Boltzmann describe el equilibrio entre átomos y
moléculas. A continuación se presenta las etapas que permiten la deducción de la ley de
distribución de Boltzmann.
Ludwig Boltzmann relacionó el concepto de entropía con fundamentos
probabilísticos en la relación:
Donde S es la entropía, k es la constante de Boltzmann (1,380662*10-23 J/K) y
pj es la probabilidad de ocurrencia del estado j.
Al diferenciar con respecto a pj se obtiene:
Se plantea que la energía interna del sistema en estudio consiste en el
promedio de las energías discretas de cada partícula que lo compone:
!
G = H "TSs
(16)
!
S
k= " pj ln pj
j=1
t
# (17)
!
dS = "k 1+ ln pj( )dpjj=1
t
# (18)
!
U =< E >= pjEjj=1
t
" (19)
123
Donde pj es la probabilidad de ocurrencia de cada nivel energético discreto.
Derivando:
Tal como la energía interna U, los niveles de energía discretos de cada
partícula del sistema dependen de V y N. Sin embargo, a diferencia de U, no dependen de
S y T. Siguiendo un principio fundamental de la mecánica cuántica, sólo las
probabilidades de un estado, pj(T), y no los niveles de energía Ej, dependen de la
temperatura. Considerando esto, la energía promedio del sistema depende de la
temperatura.
Considerando V y N constantes, Ej no varía y por lo tanto su derivada es igual
a cero. Así, la ecuación (20) queda de la forma:
Se busca la función de probabilidad que satisfaga la condición de equilibrio
dada por la energía libre de Helmholtz,
!
dF = d < E > "TdS = 0 , sujeta a la restricción de
que la suma de las probabilidades de cada estado en el sistema sumen 1 (
!
p j =1j=1
t
" ).
Sustituyendo las ecuaciones (18) y (21) en y
expresando la restricción impuesta como un multiplicador de Lagrange (ya que la
restricción es una función constante), se tiene:
De acuerdo con el método del multiplicador de Lagrange, la función F alcanza
un extremo cuando el valor pj satisface la ecuación (22) para cada j. Por lo tanto se tiene t
ecuaciones de la forma:
!
dU = d < E >= Ejdpj + pjdEjj=1
t
" (20)
!
d < E >= Ejdpjj=1
t
" (21)
!
dF = d < E > "TdS = 0
!
E j + kT 1+ ln p j( ) +"[ ] = 0j=1
t
# (22)
124
Aplicando exponencial queda:
Finalmente para eliminar el factor desconocido α de la ecuación, se sustituye la
ecuación de restricción
!
p j =1j=1
t
" en la ecuación (24), y se utiliza este término como
denominador en la ecuación (24). El resultado es:
donde Q es la función de partición.
La función de partición Q da cuenta del número total de estados energéticos
efectivamente alcanzables por un sistema en función de la temperatura (esto se puede
apreciar al estudiar los límites de Q cuando T es cero o infinito).
4. Propiedades termodinámicas y ley de distribución
En esta sección utilizaremos la ley de distribución de Boltzmann para deducir
propiedades termodinámicas relevantes.
!
ln pj = "Ej
kT"#
kT"1 (23)
!
pj = e"Ej kTe
"# kT( )"1 (24)
!
pj =e"Ej kT
e"Ej kT
j=1
t
#=e"Ej kT
Q(25)
!
Q = e"Ej kT
j=1
t
# (26)
125
Energía interna:
Si sustituimos la ecuación (25) en la ecuación (19) para la energía interna se
tiene:
Donde β=1/kT. La suma de la parte derecha de la ecuación (27) se puede expresar como
derivada de la función de partición (ecuación (26)):
Reemplazando la ecuación (28) en la ecuación (27) se logra una relación mas simple:
Como β=1/kT:
Multiplicando el lado izquierdo de la ecuación (30) por
!
"1 kT2 y el lado derecho por
!
"# "T , se obtiene:
!
U = Q"1
Eje"#Ej
j=1
t
$ (27)
!
"Q
"#
$
% &
'
( ) =
"
"#e*#Ej
j=1
t
+ = * Eje*#Ej
j=1
t
+ (28)
!
U = "1
Q
#Q
#$
%
& '
(
) * = "
# lnQ
#$
%
& '
(
) *
!
"#
"T
$
% &
'
( ) = *
1
kT2
(29)
(30)
!
U
kT2
=" lnQ
"T
#
$ %
&
' ( (31)
!
U = kT2 " lnQ
"T
#
$ %
&
' ( (32)
126
Entropía y energía libre de Helmholtz:
Si sustituimos la ecuación (25) en la ecuación (17) para la entropía, se tiene:
Considerando la ecuación (27) para la energía interna, y reemplazándola en la
ecuación (33) resulta la relación para la entropía:
Por lo tanto, la dependencia de la energía libre de Helmholtz con la función de
partición de Boltzmann es:
Potencial químico:
El potencial químico es una función que depende del número de partículas del
sistema (N). Por esta razón, es conveniente expresar la función de distribución de
Boltzmann en términos de N.
La ley de distribución de Boltzmann se aplica a sistemas con diversos grados
de complejidad. Por ejemplo supongamos un sistema compuesto por N moléculas
poliméricas, que pueden adquirir diversos estados. Los posibles niveles discretos de
energía del sistema (Ej) corresponderán a la suma de los distintos niveles discretos de
energía presentados por cada molécula (
!
"i
A ,
!
i =1,2,...,a para la molécula A;
!
"m
B ,
!
m =1,2,....,b para la molécula B; etc.),
!
E j = "iA
+ "mB
+ ...+ "nN . Suponiendo que las
moléculas del sistema son independientes, existirá una función de distribución específica
para cada una de ellas. Para un sistema simplificado con dos moléculas:
!
S
k= "
1
Qe"Ej kT
#
$ %
&
' ( ln
1
Q
#
$ %
&
' ( "
Ej
kT
#
$ %
&
' (
j=1
t
) (33)
!
S = k lnQ +U
T(34)
!
F = U " TS = "kT lnQ (35)
127
La cantidad de estados discretos de energía que puede adoptar el sistema
completo corresponde al número de combinaciones de los estados discretos de energía
de las N partículas que lo componen. Es decir,
!
t = ab para el caso del sistema con 2
partículas A y B, siendo
!
t el número de estados energéticos del sistema completo,
!
a el
número de estados energéticos de la partícula A y
!
b el número de estados energéticos de
la partícula B. Generalizando lo anterior, se tiene que para
!
N partículas que pueden
presentar
!
n estados energéticos discretos cada una,
!
t = nN .
Recordando que la función de distribución da cuenta de la cantidad de estados
energéticos efectivamente alcanzables por el sistema en función de la temperatura, se
tiene, en forma análoga al cálculo de
!
t , para N partículas independientes con función de
distribución q:
La ecuación (36) es válida sólo si las partículas que conforman el sistema son
distinguibles entre sí. En un sistema en el que las partículas no son distinguibles entre sí,
como un gas ideal, muchas de las combinaciones de estados energéticos discretos entre
las partículas son idénticas o equivalentes. En efecto, en un sistema con dos partículas
independientes indistinguibles, si una ocupa el nivel energético 15 y la otra ocupa el nivel
energético 20, es imposible discernir el escenario inverso. Por esta razón, es necesario
corregir el número de estados por
!
N!. Con esta restricción, la ecuación (36) queda de la
forma:
La expresión para la energía libre de Helmholtz de un gas ideal se obtiene
sustituyendo la ecuación (37) en la ecuación (35):
!
qB = e"#m
B kT
m=1
b
$
!
qA = e"#i
AkT
j=1
t
$
!
Q = qN
(36)
!
Q =qN
N!(37)
!
F = "kT lnQ = "kT lnqN
N!= "kT ln
eq
N
#
$ %
&
' (
N
= " NkT lneq
N
#
$ %
&
' ( (38)
128
El factor
!
e proviene de una aproximación de Stirling para
!
N! (
!
x!" x e( )x ).
Combinando las ecuaciones termodinámicas fundamentales para la energía
interna (4) y la energía libre de Helmholtz (11), se puede derivar la siguiente definición
para el potencial químico (
!
µ):
!
µ = "F "N( )T ,V
. Aplicando esta relación en la ecuación (37)
surge una expresión para el potencial químico de un gas ideal en términos de su función
de partición:
Partiendo de la ecuación (39), el potencial químico puede ser expresado en
función de la presión. Factorizando el volumen en la función de partición se tiene:
Aplicando la relación (40) y la ley de los gases ideales,
!
pV = nkT (que puede
ser derivada a partir de las ecuaciones (39), (40) y la definición proveniente de las
ecuaciones termodinámicas fundamentales
!
p = " #F #V( )T ,N
), en la ecuación (39) queda:
La expresión
!
q0kT tiene unidades de presión y se define como
!
pint
0 (presión
parcial estándar). Luego:
Donde
!
µ0 = "kT ln pint
0 se define como el potencial químico estándar. Las magnitudes
!
pint
0
y
!
µ0 dependen de la naturaleza de la partícula o molécula y de la temperatura.
5. La ecuación de van’t Hoff
La ecuación de van’t Hoff describe la dependencia del equilibrio químico con
respecto a la temperatura.
!
µ = kT lnN
eq
"
# $
%
& ' + kT = (kT ln
q
N
"
# $
%
& ' (39)
!
q = q0V (40)
!
µ = "kT lnq0kT
p
#
$ %
&
' ( (41)
!
µ = "kT lnpint
0
p
#
$ %
&
' ( = µ0 + kT ln p (42)
129
La condición para que exista equilibrio químico a T y p constantes se puede
deducir a partir de la ecuación fundamental de la energía libre de Gibbs (combinación
entre ecuaciones (4), (14) y (16):
La ecuación (43) describe un sistema con 2 tipos de moléculas en equilibrio
(
!
A" B). La condición de equilibrio dicta que
!
dG = 0. Considerando T y p constantes,
queda:
Si todas las moléculas se encuentran en estado A o B, el número total de
moléculas
!
NTOTAL
es constante:
Con estas consideraciones, la ecuación (44) puede ser escrita en función de
!
dNA
únicamente:
Esta relación debe ser válida para cualquier variación
!
dNA
, por lo que la
condición para el equilibrio es:
Esta condición expresada en términos de la ecuación (42) queda:
La constante de equilibrio basada en la presión,
!
Kp , para un sistema
conformado por dos especies
!
A" B, se define como:
!
dG = "SdT +Vdp + µAdNA + µBdNB (43)
!
dG = µAdN
A+ µ
BdN
B= 0 (44)
!
NA
+ NB
= NTOTAL
" dNA
+ dNB
= 0" dNA
= #dNB
(45)
!
µA" µ
B( )dNA= 0 (46)
!
µA
= µB (47)
!
µA
0 + kT ln pA = µB
0 + kT ln pB (48)
130
Entonces, aplicando
!
Kp en la ecuación (48) se tiene:
El potencial químico tiene diversas definiciones equivalentes, dependiendo de
la ecuación termodinámica fundamental de la cual derive:
Siguiendo la definición de energía libre en la ecuación (16), se puede expresar
la energía libre de Gibbs molar parcial en términos de sus componentes molares parciales
entrópicos y entálpicos:
Donde
!
h j y
!
s j son la entalpía y entropía molar parcial, respectivamente.
Teniendo lo anterior en consideración, la dependencia de la ecuación (50) con
respecto a la temperatura esta dada por:
!
Kp =pB
pA
(49)
!
lnKp = lnpB
pA
"
# $
%
& ' =
( µB
0 ( µA
0( )kT
= ()µ 0
kT
(50)
!
µ j ="G
"Nj
#
$ %
&
' ( T, p,Ni) j
="U
"Nj
#
$ %
&
' ( V , S,Ni) j
="H
"Nj
#
$ %
&
' ( S, p,Ni) j
="F
"Nj
#
$ %
&
' ( T,V ,Ni) j
(51)
!
µ j ="G
"Nj
#
$ %
&
' ( T, p,Ni) j
="H
"Nj
#
$ %
&
' ( T, p,Ni) j
* T"S
"Nj
#
$ %
&
' ( T, p,Ni) j
= hj * Tsj (52)
!
" lnKp
"T
#
$ %
&
' ( = )
"
"T
*µ 0
kT
#
$ %
&
' ( = )
"
"T
*h0 ) T*s0
kT
#
$ %
&
' ( (53)
131
Suponiendo que
!
"h0
= hB
0# h
A
0 y
!
"s0
= sB
0# s
A
0 son independientes de la
temperatura, se obtiene la relación de van’t Hoff:
6. Relación entre la energía libre de Gibbs y el equilibrio químico
La ecuación (42) que define el potencial químico en función de la presión en
conjunto con la ecuación (51) permiten deducir una de las relaciones más útiles para la
energía libre de Gibbs: su dependencia con respecto al equilibrio químico.
Retomando la ecuación (51) se tiene:
El término de la derecha es válido ya que G es una función homogénea de
primer orden.
Supongamos un sistema en equilibrio conformado por 4 especies (A,B,C y D),
que reaccionan entre sí de la siguiente manera:
Según la ecuación (55), la energía libre de Gibbs para ese sistema en
equilibrio corresponde a:
Si perturbamos el estado de equilibrio redistribuyendo las especies, dejándolas
en estados A’, B’, C’ y D’, la nueva energía libre de Gibbs del sistema corresponderá a:
!
" lnKp
"T
#
$ %
&
' ( =
)h0
kT2
(54)
!
µ j ="G
"Nj
#
$ %
&
' ( T,P,Ni) j
* dG = µ jdNj *G = µ j Nj
j=1
M
+j=1
M
+ (55)
!
A+ 2B " 3C +D (56)
!
G = µAN
A+ µ
BN
B+ µ
CNC
+ µDN
D (57)
132
En combinación con la ecuación (42), se puede expresar el cambio de energía
libre de Gibbs al retornar el sistema a su estado de equilibrio de la siguiente forma:
Como el número de especies del sistema es constante, y teniendo en cuenta la
estequiometría de la reacción (ecuación (56)), las diferencias en la cantidad de cada
especie entre el estado perturbado y de equilibrio obedecen las siguientes relaciones:
Reordenando la ecuación (59) teniendo en cuenta la ecuación (60), queda:
Por definición, tal como queda demostrado en las ecuaciones (45), (46) y (47),
en el estado de equilibrio se tiene:
Por lo tanto, el primer término de la ecuación (61) se anula. Finalmente el
cambio de energía libre de Gibbs queda como sigue:
!
G '= µA 'N
A '+ µ
B 'N
B '+ µ
C 'N
C '+ µ
D 'N
D ' (58)
!
"G = µA
0 + kT ln pA '( )NA ' # µA
0 + kT ln pA( )NA + µB
0 + kT ln pB '( )NB ' # µB
0 + kT ln pB( )NB +
µC
0 + kT ln pC '( )NC ' # µC
0 + kT ln pC( )NC + µD
0 + kT ln pD '( )ND' # µD
0 + kT ln pD( )ND
(59)
!
ND '" N
D( ) = " NA '" N
A( ) = "2 NB '" N
B( ) = 3 NC '" N
C( ) (60)
!
"G = ND' # ND( ) #µA
0 # 2µB
0 + 3µC
0 + µD
0( ) + ND ' # ND( ) #kT lnpA '
pA
$
% &
'
( ) # 2kT ln
pB '
pB
$
% &
'
( ) + 3kT ln
pC '
pC
$
% &
'
( ) + kT ln
pD'
pD
$
% &
'
( )
*
+ ,
-
. / (61)
!
"µA" 2µ
B+ 3µ
C+ µ
D= 0 (62)
!
"G = ND' # ND( ) kT lnpA pB
2pC '3pD '
pA 'pB '2pC3pD
$
% &
'
( )
*
+ ,
-
. /
!
"G = ND' # ND( ) #kT lnpC3pD
pA pB2
$
% &
'
( ) + kT ln
pC '3pD '
pA 'pB '2
$
% &
'
( )
*
+ ,
-
. /
133
Donde
!
Keq es la constante de equilibrio de la reacción y
!
Q es un cuociente de reacción
en un estado fuera del equilibrio.
Las ecuación (63) es más conocida de la siguiente forma:
Donde
!
"G0 es el cambio de energía libre de Gibbs estándar por mol de producto (cambio
de energía entre el estado estándar (presión 1 atm, temperatura 25°C y todas las
concentraciones de las especies iguales a 1 molar) y el estado de equilibrio) y R es la
constante de Boltzmann en J/mol.
En efecto, si
!
Q =1 (condiciones estándar), entonces:
En las ecuaciones (63) y (64), las variables
!
Keq y
!
Q pueden ser expresadas en términos
de concentraciones o presiones indistintamente. Según la ley de los gases ideales, la
concentración de una especie en un medio puede expresarse asi:
Por lo tanto, si se expresa la ecuación (63) en función de concentraciones y
éstas se sustituyen empleando la ecuación (66) el resultado no debiera cambiar:
!
"G
ND ' # ND( )= #kT lnKeq + kT lnQ (63)
!
"G = "G0
+ RT lnQ (64)
!
C =n
V=
p
RT(66)
!
"G = #RT lnC0
+ RT lnC
!
= "RT lnp0
RT
#
$ %
&
' ( + RT ln
p
RT
#
$ %
&
' (
!
"G = "G0
= #RT lnKeq(65)
134
!
"G es expresado como cantidad molar. Esta equivalencia es posible gracias a
la presencia de los logaritmos en las relaciones.
7. Cinética de las reacciones químicas y ecuación de Arrhenius
En este capítulo entenderemos, a través de los conceptos termodinámicos
fundamentales que revisamos anteriormente, la fuerte dependencia entre la velocidad de
las reacciones químicas y la temperatura.
Consideremos la siguiente reacción binaria:
La tasa de generación de producto puede expresarse de la siguiente manera:
Donde
!
P[ ] ,
!
A[ ] y
!
B[ ] corresponden a las concentraciones de las especies A, B y P,
respectivamente, y
!
kR
representa la constante cinética de la reacción. Por definición
!
kR
es independiente de las concentraciones de A y B, sin embargo, depende fuertemente de
la temperatura.
Se ha observado que la dependencia de la constante cinética de una reacción
con respecto a la temperatura es mucho mayor de lo esperable, suponiendo un
incremento normal de los movimientos térmicos de las moléculas (energía térmica =
!
kT )
(Dill y Bromberg, 2003). En 1889, el físico y químico sueco Svante Arrhenius propuso una
explicación para este fenómeno, basándose en la ecuación de van’t Hoff (54) que
!
= "RT ln p0
+ RT lnRT + RT ln p " RT lnRT
!
= "RT ln p0
+ RT ln p
!
A + BkR" # " P (67)
!
d P[ ]dt
= kRA[ ] B[ ] (68)
135
describe la dependencia entre el equilibrio químico y la temperatura (Arrhenius, 1889).
Recordando la ecuación de van’t Hoff se tiene:
Arrhenius propuso que las constantes cinéticas también tenían la forma de la
ecuación de van’t Hoff:
Donde
!
Ea tiene unidades de energía y es calculado de tal manera que concuerde con los
datos experimentales.
!
Ea es denominada la “energía de activación” de la reacción.
De acuerdo con la teoría de Arrhenius, la cinética de las reacciones no
depende de la energía promedio de los reactantes, sino que de las altas energías de las
moléculas “activadas”. La Figura A1. 1 muestra esta idea en un diagrama. Existen dos
plataformas energéticas, correspondientes a los reactantes y los productos. Se puede
observar un máximo, llamado “estado de transición”, que representa la energía que deben
alcanzar las moléculas activadas para transformarse de reactantes a productos.
Según la ley de distribución de Boltzmann, un pequeño aumento de la
temperatura puede producir un gran aumento de la proporción de moléculas en un estado
energético alto, y vise versa. Esto concuerda con la teoría de Arrhenius.
Integrando la ecuación (69) y expresando su exponencial se obtiene la
relación entre la constante cinética de la reacción y la temperatura:
Donde A es una constante.
!
" lnKp
"T
#
$ %
&
' ( =
)h0
kT2
!
" lnkR
"T
#
$ %
&
' ( =
Ea
kT2
(69)
!
d lnkR
=Ea
k
dT
T2""
!
kR
= Ae"E
akT
(70)
136
La ecuación de Arrhenius explica la fuerte dependencia entre la velocidad de
una reacción química y la temperatura. Sin embargo existe un modelo que permite
explicar este fenómeno a una escala más detallista: la teoría del estado de transición.
8. Teoría del estado de transición
La teoría del estado de transición supone la existencia de un intermediario de
alta energía a lo largo de las coordenadas de reacción, tal como lo muestra la Figura A1.
1. Este intermediario es muy inestable y puede desplazarse hacia los productos o hacia
los reactantes con igual facilidad. Como consecuencia de su alta energía, existe en una
proporción muy baja.
La constante cinética derivada de la ecuación de Arrhenius también puede
calcularse a partir de la teoría del estado de transición. Para hacerlo retomaremos la
reacción descrita en la ecuación (67). La idea es separar la reacción en dos etapas, como
lo muestra la siguiente ecuación:
Δh0
Ea
Reactantes Productos
!
"
E
!
A + B K#
" # $ AB( )# k
#
$ # $ P (71)
Figura A1. 1. Diagrama de energía de activación.
!
" indica la coordenada de progreso de la reacción. Ea es la energía de activación, Δh0 es la entalpía molar parcial estándar.
137
La primera etapa es un equilibrio entre los reactantes y el estado de transición
(o estado activado)
!
AB( )# , con una constante de equilibrio
!
K# . La segunda etapa
consiste en un paso directo desde el estado de transición hasta el producto, con una
constante cinética
!
k# .
Un aspecto crítico de la teoría del estado de transición es la presunción de un
estado de equilibrio entre los reactantes y las especies activadas, plasmado en la
constante
!
K# ,
aunque no se trate de un verdadero equilibrio producto de la inestabilidad de estas últimas
a lo largo de las coordenadas de reacción.
La tasa de generación de producto, considerando las ecuaciones (71) y (72)
es:
Combinando la ecuación (67) con la ecuación (73) queda:
Al ser
!
K# una constante de equilibrio, puede se expresada en función de la
energía libre de Gibbs, la entalpía y la entropía, según la ecuación (65):
Donde
!
"G# es el cambio de energía libre de Gibbs estándar molar que describe el
equilibrio entre los reactantes y el estado activado.
Por otro lado, la frecuencia a la cual el estado activado se descompone en
producto(s), la constante cinética
!
k# , corresponde a la frecuencia de vibración del enlace
que se está rompiendo:
!
K# =
AB( )#[ ]
A[ ] B[ ](72)
!
d P[ ]dt
= k#AB( )
#[ ] = k#K#A[ ] B[ ] (73)
!
kR
= k#K# (74)
!
"G#
= #RT lnK#
(75)
!
K#
= e"#G
#RT
138
Aquí surge otra suposición fundamental de la teoría del estado estacionario: la
frecuencia de vibración
!
v del enlace en el estado de transición ubicado en las
coordenadas de reacción (factor universal de frecuencia), puede ser obtenida a partir de
la equivalencia entre las energías de un oscilador, calculadas mediante la teoría cuántica
(ecuación (77)) y la física clásica (ecuación (78)):
A 25°C la frecuencia
!
v es de 6,212 x 1012 s-1. Combinando las ecuaciones
(74), (75), (76) y (79) se obtiene una expresión detallada para la constante cinética
homóloga a la ecuación de Arrhenius:
Recordando que el cambio de energía libre de Gibbs puede ser expresado en
términos de entalpía y entropía (
!
"G = "H #T"S ), la ecuación (80) queda de la siguiente
forma:
Producto de que el estado de transición en una reacción, al ser extremadamente
inestable, no puede ser detectado, el equilibrio químico entre éste y los reactantes sólo es
!
E = hv (77)
!
E = kT (78)
!
v =kT
h
(79)
!
k#
= v (76)
!
kR
=kT
he"#G
#RT (80)
!
kR
=kT
he"S
#Re#"H
#RT
(81)
139
considerado en forma cualitativa. Esto justifica las suposiciones críticas a las cuales
recurre la teoría.
140
ANEXO II
Test de Student
El test t de Student permite evaluar si dos grupos de datos son
significativamente diferentes de acuerdo a sus promedios y su desviación estándar.
Mediante un procedimiento matemático estandarizado, se acepta o rechaza una hipótesis
nula, cuya propuesta consiste en que los dos grupos evaluados no difieren
significativamente.
Para poder aplicar este tipo de análisis estadístico se debe asumir que los datos
estudiados presentan una distribución normal. En el caso del test t estándar, se debe
asumir además igualdad de varianzas entre los dos grupos de datos. Esta condición es
violada en diversos contextos, lo que induce la ocurrencia de errores e inexactitudes en
los resultados (Ruxton, 2006).
Cuando las varianzas de los grupos de datos comparados presentan
diferencias notables, o cuando no se puede determinar con exactitud su condición de
igualdad, se recomienda usar una versión del test t específica para varianzas desiguales
(Ruxton, 2006).
Se aplicó el test t para varianzas desiguales con el objeto de identificar
diferencias estadísticamente significativas en los análisis estructurales comparativos
efectuados in silico.
El procedimiento se inicia calculando el parámetro t de la siguiente manera:
Donde
!
µ es el promedio,
!
s2 es la varianza, y
!
n es el tamaño de los grupos
de datos comparados.
La varianza corresponde al cuadrado de la desviación estándar y se calcula
de la siguiente forma:
!
t =µ1" µ
2
s1
2
n1
+s2
2
n2
141
Siendo
!
xi cada uno de los datos,
!
µ el promedio y
!
n el tamaño de la muestra
(número de datos).
Los grados de libertad
!
v del sistema se calculan mediante la siguiente relación:
Donde
!
u =s2
2
s1
2.
En el caso del test t estándar, cuando las varianzas son iguales, los grados de
libertad se obtienen usando una relación más simple:
Es necesario definir un nivel de confianza para los resultados del análisis. Este
parámetro indica la probabilidad de que el eventual rechazo de la hipótesis nula haya sido
sólo por coincidencia o suerte. Es decir, si las poblaciones de datos evaluadas son
consideradas distintas, existe una probabilidad igual al nivel de confianza de que esta
diferencia se establezca por casualidad y no sea significativa. En general se considera
adecuado un valor de 0,05 para el nivel de confianza.
Para aceptar o rechazar la hipótesis nula, se extrae un valor teórico para el
parámetro t (
!
tTeórico
) desde tablas de distribución de test t de Student, usando los grados
de libertad calculados previamente y el nivel de confianza.
!
v =
1
n1
+u
n2
"
# $
%
& '
2
1
n1
2n1(1( )
+u2
n2
2n2(1( )
!
v = n1+ n
2" 2
!
s2 =
xi"µ( )#
2
n "1
142
La hipótesis nula se rechaza sólo si
!
t > tTeórico
.
Las comparaciones que involucraron un grupo de datos y un determinado
valor único se efectuaron mediante un test t estándar de una muestra. En este caso, el
parámetro t se obtiene a través de la relación:
Donde
!
µ,
!
s2 y
!
n son el promedio, la varianza y el tamaño del grupo de datos,
respectivamente, y
!
x0 es el valor comparado.
Los grados de libertad corresponden a:
!
t =µ " x
0
s2
n
!
v = n "1
143
ANEXO III
Ecuaciones para cálculo de parámetros termodinámicos
La influencia de la temperatura sobre las constantes cinéticas en reacciones
enzimáticas puede ser descrita mediante la ecuación de Arrhenius (ecuación 70, Anexo 1)
o la teoría del estado de transición (ecuación 81, Anexo 1).
La ecuación de Arrhenius se deriva de una relación homóloga a la ecuación
de van’t Hoff (ecuación 69, Anexo 1):
De igual forma, una expresión para la derivada en función del
tiempo del logaritmo natural de la constante catalítica se puede obtener a partir de la
teoría del estado de transición (ecuaciones 80 y 81, Anexo 1):
El valor de
!
"G# se puede obtener directamente reordenando la ecuación 2:
!
" lnkCAT
"T
#
$ %
&
' ( =
Ea
kT2
(1)
!
kCAT
=kBT
he"S
#Re#"H
#RT (3)
!
ln kCAT
= lnkBT
h
"
# $
%
& ' (
)H #
RT+)S#
R
(4)
!
" lnkCAT
"T
#
$ %
&
' ( =
1
T+)H #
RT2
=)H #
+ RT
RT2
(5)
!
kCAT
=kT
he"#G
#RT (2)
144
Combinando las ecuaciones 1 y 5 queda:
Resolviendo para la entalpía de activación se obtiene:
La entropía de activación se calcula a partir de la conocida expresión para la
energía libre de Gibbs (ver ecuación 16, Anexo 1):
!
!
"G# = RT ln k
BT h( ) # ln kCAT[ ] (6)
!
Ea
RT2
="H
#+ RT
RT2
(7)
!
"H#
= Ea# RT (8)
!
"G#
= "H## T"S
#
!
"S# = "H
## "G
#( ) T
(9)
(10)
145
ANEXO IV
Códigos Python
Este anexo contiene los códigos en lenguaje Python de los siguientes
módulos:
• Structural_analysis.py
• Comparisons.py
• cliente_puentes_hidrogeno.py
• cliente_detalle_puente_hidrogeno.py
• cliente_electrostatic_plot.py
• cliente_puentes_salinos.py
• cliente_esterico.py
• cliente_calculo_NMA.py
• cliente_NMA_fluctuations_for_one_protein.py
• cliente_B_factor_X_ray.py
• cliente_vectores_NMA.py
• Pymol_Python.py
Además presenta ejemplos de los archivos pdf con los resultados generados
por el algoritmo de comparación de interacciones electrostáticas y el módulo para obtener
el detalle de interacciones específicas.
146
ANEXO V:
Alineamiento de las celulasas mesofílicas y pscrofílicas
Cel5 SVE----PLSVNGNKIY-AGEKAKSFAGNSLFWSNNGWGGEKFYTADTVASLKKDWKSSI 55 Cel5A SVVEEHGQLSISNGELVNERGEQVQLKGMSS--HGLQWYG-QFVNYESMKWLRDDWGINV 57 Cel5G AVE----KLTVSGNQIL-AGGENTSFAGPSLFWSNTGWGAEKFYTAETVAKAKTEFNATL 55 CelA8 AVE----PLNVSGNQIL-ADGKSVSFAGTSLFWSNTGWGGEDFYTADTVAKAKSEFGATI 55 :* *.:...:: : .: * * . * . .* . ::: : :: .: Cel5 VRAAMGV-QESGGYLQ-DPAGNKAKVERVVDAAIANDMYAIIGWHSH---SAENNRSEAI 110 Cel5A FRAAMY--TSSGGYID-DP-SVKEKVKEAVEAAIDLDIYVIIDWHILSDNDPNIYKEEAK 113 Cel5G IRAAIGHGTSTGGSLNFDWEGNMSRLDTVVNAAIAEDMYVIIDFHSH---EAHTDQATAV 112 CelA8 IRAAIGHGASAGGSLNYDWDGNMNRLDTVVNAAIAQDMYVIIDFHSH---EAHTDQATAV 112 .***: .:** :: * . ::. .*:*** *:*.**.:* ... : * Cel5 RFFQEMARKYGNKPNVIYEIYNEPL--QVSWSNTIKPYAEAVISAIRAIDPDNLIIVGTP 168 Cel5A DFFDEMSELYGDYPNVIYEIANEPNGSDVTWGNQIKPYAEEVIPIIRNNDPNNIIIVGTG 173 Cel5G RFFEDVATKYGQYDNVIYEIYNEPL--QISWVNDIKPYAETVIDKIRAIDPDNLIVVGTP 170 CelA8 RFFEEVATKYGEYDNVIYEIYNEPL--QISWANAIKPYAETVIDKIRAIDPDNLIVVGTP 170 **:::: **: ****** *** :::* * ****** ** ** **:*:*:*** Cel5 SWSQNVDEASRDPINAKNIAYTLHFYAGTHGESLRNKARQALNNGIALFVTEWGTVNADG 228 Cel5A TWSQDVHHAADNQLADPNVMYAFHFYAGTHGQNLRDQVDYALDQGAAIFVSEWGTSAATG 233 Cel5G TWSQDVDVASQNPIDRANIAYTLHFYAGTHGQSYRNKAQTALDNGIALFATEWGTVNADG 230 CelA8 TWSQDVDVASLDPIDRANIAYTLHFYAGTHGQSYRNKAQTALDNGIALFATEWGTVNADG 230 :***:*. *: : : *: *::********:. *::. **::* *:*.:**** * * Cel5 NGGVNQTETDAWVTFMRDNNISNANWALNDKNEGASTYYPDS--------KNLTESGKKV 280 Cel5A DGGVFLDEAQVWIDFMDERNLSWANWSLTHKDESSAALMPGANPTGGWTEAELSPSGTFV 293 Cel5G NGGVNINETDAWMAFFKTNNISHANWALNDKNEGASLFTPGG----SW--NSLTSSGSKV 284 CelA8 NGSVNVNETDAWMAFFKTNNISHANWALNDKNEGASTFTPGG----GW--DSLTASGTKV 284 :*.* *::.*: *: .*:* ***:*..*:*.:: *.. .*: **. * Cel5 KSIIQSWPYKA 291 Cel5A REKIR----ES 300 Cel5G KEIIQGW--GG 293 CelA8 KEIIKGW--QG 293 :. *: .