universidad de chile facultad de ciencias fisicas y ...a pesar de lo anterior, las aplicaciones...

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS DEPARTAMENTO DE INGENIERIA QUIMICA Y BIOTECNOLOGIA

BASES ESTRUCTURALES DE LA PSICROFILICIDAD: PREDICCION E INGENIERIA DE UNA ENDOGLUCANASA

TESIS PARA OPTAR AL GRADO DE DOCTOR EN CIENCIAS DE LA INGENIERIA MENCION QUIMICA

JUAN MATIAS SAAVEDRA SALINAS

SANTIAGO DE CHILE AGOSTO 2011

ii

UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FISICAS Y MATEMATICAS DEPARTAMENTO DE INGENIERIA QUIMICA Y BIOTECNOLOGIA

BASES ESTRUCTURALES DE LA PSICROFILICIDAD: PREDICCION E INGENIERIA DE UNA ENDOGLUCANASA

TESIS PARA OPTAR AL GRADO DE DOCTOR EN CIENCIAS DE LA INGENIERIA MENCION QUIMICA

JUAN MATIAS SAAVEDRA SALINAS

PROFESOR GUIA: JUAN ASENJO DE LEUZE

PROFESOR GUIA 2: BARBARA ANDREWS FARROW

MIEMBROS DE LA COMISION:

MARIA ELENA LIENQUEO CONTRERAS GONZALO NAVARRO BADINO

OCTAVIO MONASTERIO OPAZO

SANTIAGO DE CHILE AGOSTO 2011

iii

A mis Padres,

“Petit à petit l’oiseau fait son nid”

iv

Resumen

Gran variedad de procesos industriales basados en reacciones catalizadas

químicamente han sido reemplazados durante las últimas décadas por procesos

biotecnológicos que involucran enzimas. En particular, el uso de enzimas criofílicas, cuya

actividad se mantiene alta a bajas temperaturas, supone considerables ahorros de

energía y recursos. Diversos factores y variables han sido asociados a la adaptación de

enzimas a bajas temperaturas. Entre estos, la flexibilidad aparece como uno de los más

aceptados. En efecto, la movilidad de las proteínas, especialmente en la vecindad del sitio

activo, es esencial para la catálisis, y a bajas temperaturas, ésta se ve comprometida.

Con el fin de detectar aspectos estructurales vinculados al proceso de adaptación

mencionado en celulasas pertenecientes a la familia 5 de las glicósido-hidrolasas, se

realizó una serie de estudios comparativos entre estructuras homólogas mesofílicas y

psicrofílicas. El análisis se centró en parámetros asociados con la dinámica del edificio

molecular, como las interacciones electrostáticas (puentes de hidrógeno y puentes

salinos), la compactación estructural y las fluctuaciones atómicas, calculadas mediante

análisis de modos normales. La celulasa Cel5A de Bacillus agaradhaerens se usó como

modelo experimental y sus propiedades catalíticas fueron evaluadas. La catálisis en

Cel5A es favorecida por un factor entrópico, que contraresta el efecto negativo de su alta

energía de activación (Ea), mientras que en las otras celulasas homólogas estudiadas,

Cel5 de Erwinia chrysanthemi (mesofílica) y Cel5G de Pseudoalteromonas haloplanktis

(psicrofílica), la actividad es impulsada entálpicamente. Estos resultados fueron

interpretados en términos estructurales. Se identificó 5 residuos potencialmente

vinculados con el patrón de actividad catalítica exhibido por Cel5A, tres de éstos situados

en la vecindad del sitio activo y los otros dos en un sitio de unión a calcio. Mediante

mutagénesis sitio-dirigida se modificó algunas de las posiciones seleccionadas y se

caracterizó la actividad de las mutantes. Tres variantes resultaron ser significativamente

más activas que Cel5A a bajas temperaturas (N138L, I99A e I99A/A134Y) evidenciando

paralelamente una disminución de la Ea (y la entalpía de activación). Los resultados

obtenidos sugieren que el concepto de psicrofilicidad como criterio de clasificación de

enzimas es aún precario y sujeto a relatividad.

v

Indice de Contenidos

1. INTRODUCCIÓN ........................................................................................................................................... 1

1.1. INDUSTRIA QUÍMICA V/S INDUSTRIA BIOTECNOLÓGICA ............................................................................ 1 1.2. INDUSTRIA DE LAS ENZIMAS....................................................................................................................... 1 1.3. ENZIMAS ADAPTADAS A CONDICIONES EXTREMAS ................................................................................... 2 1.4. ENZIMAS ADAPTADAS A BAJAS TEMPERATURAS ....................................................................................... 4

1.4.1. El comienzo ......................................................................................................................................... 4 1.4.2. Aplicaciones biotecnológicas ............................................................................................................ 5

1.5. CATÁLISIS ENZIMÁTICA.............................................................................................................................. 7 1.5.1. Las enzimas son estructuras dinámicas ............................................................................................ 8 1.5.2. Flexibilidad ......................................................................................................................................... 9 1.5.3. Flexibilidad y actividad....................................................................................................................11 1.5.4. Flexibilidad y estabilidad.................................................................................................................12 1.5.5. Catálisis enzimática a bajas temperaturas .....................................................................................14 1.5.6. Adaptación al frío: compromisos y controversias..........................................................................16

1.6. ESTUDIO DE LA DINÁMICA DE PROTEÍNAS ...............................................................................................23 1.6.1. Métodos experimentales...................................................................................................................23 1.6.2. Métodos computacionales................................................................................................................25

1.7. HIPÓTESIS DE TRABAJO.............................................................................................................................27 1.8. MODELO DE ESTUDIO: CELULASAS PERTENECIENTES A LA FAMILIA GH5-2 .........................................27

2. OBJETIVOS ...................................................................................................................................................29

2.1. OBJETIVO GENERAL ..................................................................................................................................29 2.2. OBJETIVOS ESPECÍFICOS ...........................................................................................................................29

3. MATERIALES Y MÉTODOS ....................................................................................................................30

3.1. MATERIALES .............................................................................................................................................30 3.1.1. Cepas bacterianas ............................................................................................................................30 3.1.2. Reactivos ...........................................................................................................................................30 3.1.3. Vectores de clonamiento y expresión ..............................................................................................30 3.1.4. Medios de cultivo líquidos ...............................................................................................................32 3.1.5. Medios de cultivo sólidos.................................................................................................................32 3.1.6. Antibióticos .......................................................................................................................................33 3.1.7. Soluciones Stock ...............................................................................................................................33 3.1.8. Recursos informáticos ......................................................................................................................33

vi

3.2. MÉTODOS ..................................................................................................................................................34 3.2.1. Teoría del análisis de modos normales...........................................................................................34 3.2.2. Fluctuaciones atómicas, matriz Hessiana y modos normales .......................................................38 3.2.3. Energía potencial y funciones de campo de fuerza ........................................................................41 3.2.4. Cálculo de compactación.................................................................................................................44 3.2.5. Análisis de modos normales ............................................................................................................45 3.2.6. Interacciones electrostáticas ...........................................................................................................46 3.2.7. Algoritmos de comparación .............................................................................................................47 3.2.8. Cultivo de microorganismos ............................................................................................................60 3.2.9. Extracción de DNA plasmidial ........................................................................................................60 3.2.10. Mutaciones sitio-dirigidas .............................................................................................................61 3.2.11. Amplificación del DNA por PCR...................................................................................................61 3.2.12. Electroforesis de DNA....................................................................................................................64 3.2.13. Purificación de DNA a partir de geles de agarosa ......................................................................64 3.2.14. Digestión del DNA..........................................................................................................................64 3.2.15. Reacciones de ligación...................................................................................................................64 3.2.16. Preparación de células electrocompetentes .................................................................................65 3.2.17. Transformación de células electrocompetentes ...........................................................................65 3.2.18. PCR de colonias .............................................................................................................................66 3.2.19. Clonamiento del dominio catalítico de la celulasa Cel5A en el plásmido de expresión

pET22(+) .........................................................................................................................................................66 3.2.20. Producción recombinante de las celulasas ..................................................................................67 3.2.21. Electroforesis de proteínas (SDS-PAGE) .....................................................................................68 3.2.22. Determinación de la concentración de proteínas ........................................................................68 3.2.23. Ensayos de actividad enzimática...................................................................................................69 3.2.24. Determinación de los parámetros cinéticos de las enzimas recombinantes ..............................70 3.2.25. Determinación de los parámetros termodinámicos de activación ..............................................70 3.2.26. Modelamiento estructural del dominio catalítico de CelA8........................................................71

4. RESULTADOS...............................................................................................................................................72

4.1. PARÁMETROS VINCULADOS CON LA ACTIVIDAD DE CEL5A A DISTINTAS TEMPERATURAS ..................75 4.2. ALGORITMOS DE COMPARACIÓN..............................................................................................................77 4.3. ESTUDIO COMPARATIVO E IDENTIFICACIÓN DE RESIDUOS CANDIDATOS PARA MUTAGÉNESIS .............77

4.3.1. Interacciones electrostáticas ...........................................................................................................78 4.4. COMPACTACIÓN ESTRUCTURAL ...............................................................................................................80 4.5. ANÁLISIS DE MODOS NORMALES ..............................................................................................................83 4.6. SITIO DE UNIÓN A CALCIO: POSIBLE ADAPTACIÓN DE CEL5G A BAJAS TEMPERATURAS.......................85 4.7. MUTACIONES SITIO-DIRIGIDAS.................................................................................................................88

vii

5. DISCUSIÓN....................................................................................................................................................94

6. CONCLUSIONES .......................................................................................................................................102

7. BIBLIOGRAFÍA .........................................................................................................................................104

ANEXO I BASES TERMODINÁMICAS DE LA CATÁLISIS ..................................................................118

ANEXO II TEST DE STUDENT ......................................................................................................................140

ANEXO III ECUACIONES PARA CÁLCULO DE PARÁMETROS TERMODINÁMICOS..............143

ANEXO IV CÓDIGOS PYTHON.....................................................................................................................145

ANEXO V ALINEAMIENTO DE LAS CELULASAS MESOFÍLICAS Y PSICROFÍLICAS.............

146

1

1. Introducción

1.1. Industria química v/s industria biotecnológica

La industria química tradicional ha contribuido en gran medida a nuestra actual

calidad de vida, sin embargo, se encuentra bajo crecientes presiones que apuntan a

cambiar los procesos existentes por alternativas más amigables con el medio ambiente y

sustentables (Poliakoff et al., 2002; Gavrilescu y Chisti, 2005). Las desventajas asociadas

a la industria química incluyen su dependencia en energía y recursos no renovables, la

existencia de procesos cuyos desechos y subproductos constituyen potenciales peligros

para el medio ambiente, productos finales que no son fácilmente reciclados o

biodegradados al terminar su vida útil, entre otros aspectos (Gavrilescu y Chisti, 2005).

Entre las principales nuevas tecnologías surgidas desde los años 1970, la

biotecnología ha despertado un particular interés mundial. Esta nueva disciplina ha

demostrado ser capaz de generar riqueza y bienestar, influenciando todos los sectores

relevantes de la economía (Gavrilescu y Chisti, 2005).

El desarrollo de la biotecnología ha permitido desvincular el crecimiento

económico con los impactos ambientales adversos, mediante un cambio radical en los

procesos productivos. La aparición de nuevas técnicas y prácticas ha posibilitado la

explotación de nuevos recursos renovables, al tiempo que ha permitido el surgimiento de

nuevos procesos, productos y servicios menos contaminantes y persistentes.

Siguiendo esta tendencia, gran variedad de procesos industriales basados en

reacciones catalizadas químicamente han sido reemplazados durante las últimas décadas

por procesos biotecnológicos que involucran células vivas o enzimas (Stottmeister et al.,

2005). Como consecuencia de aquello, se han posicionado en forma robusta en el

mercado nuevas industrias basadas en el desarrollo de biocatalizadores.

1.2. Industria de las enzimas

Uno de los ámbitos en que el desarrollo de la biotecnología moderna ha tenido

mayor impacto es la aplicación de enzimas industriales. Más de 500 productos que cubren

diversas aplicaciones en industrias tan diversas como los detergentes y la producción de

2

cerveza, suponen el uso de enzimas producidas a gran escala mediante fermentaciones

(Cherry y Fidantsef, 2003). El mercado mundial de enzimas industriales, estimado en 1,5

billones de dólares en el año 2000 (McCoy, 2000) se compone de tres segmentos

principales. las enzimas técnicas, aplicadas en las industrias de detergentes, cuero, textil,

papel y cuidado personal, entre otras, acaparan la mayor parte del mercado con el 65%

de las ventas. Las enzimas utilizadas en industrias de alimentos como lácteos, cerveza,

vino, jugos, grasas, aceites y pan, constituyen el segundo segmento en importancia con

un 25%. Finalmente, las enzimas incorporadas en alimentos para animales contribuyen

con el 10% del mercado (Cherry y Fidantsef, 2003).

Las enzimas ofrecen importantes ventajas en comparación con los

catalizadores químicos. En efecto, estas macromoléculas representan recursos

renovables, son biodegradables y tienden a presentar una notable selectividad

estereoquímica (Rozzell, 1999). Es así como los fosfatos en detergentes han sido

reemplazados progresivamente por proteasas y celulasas, los agentes químicos

emulsificadores en la industria del pan por lipasas y el hidróxido de sodio en la industria

textil por amilasas y pectinasas (Cherry y Fidantsef, 2003).

A pesar de lo anterior, las aplicaciones enzimáticas compiten fuertemente con

los procesos químicos tradicionales, que en muchos casos son extremadamente baratos.

El advenimiento de los avances derivados de la biotecnología moderna, como la

fermentación a gran escala y la tecnología del ADN recombinante, no sólo han convertido

las enzimas en una alternativa económicamente viable, sino que han permitido el

desarrollo de biocatalizadores mejor adaptados a las condiciones específicas requeridas

en los diversos procesos productivos, frecuentemente extremas (Cherry y Fidantsef,

2003).

1.3. Enzimas adaptadas a condiciones extremas

A pesar de que en la actualidad se ha identificado más de 3000 enzimas

diferentes, y muchas de ellas han encontrado aplicaciones biotecnológicas, aún no es

posible cubrir satisfactoriamente todas las demandas industriales (Van den Burg, 2003).

En efecto, muchas de las enzimas conocidas no son capaces de funcionar

satisfactoriamente en las difíciles condiciones impuestas por algunos procesos (Demirjian

et al., 2001).

3

Las enzimas provenientes de microorganismos adaptados a condiciones

extremas (frío, calor, radiación, salinidad, pH, presión, etc.) presentan diversas

propiedades únicas que favorecen su aplicabilidad biotecnológica (Rothschild y Mancinelli,

2001; Demirjian et al., 2001; Schiraldi y De Rosa, 2002; Van den Burg, 2003; Gomes y

Steiner, 2004).

Las enzimas resistentes a altas temperaturas (> 60°C), presentes en

organismos termófilos e hipertermófilos, son frecuentemente requeridas para procesos

que involucran la degradación de polímeros como quitina, celulosa o almidón. Bajo estas

condiciones, la solubilidad y accesibilidad de los sustratos se optimiza (Van den Burg,

2003).

Las enzimas adaptadas a altas concentraciones salinas (2-5 M NaCl),

provenientes de organismos halófilos tienen el potencial para catalizar reacciones en

sistemas con solventes orgánicos (Marhuenda-Egea y Bonete, 2002).

Diversos organismos capaces de sobrevivir bajo condiciones extremas de pH,

alcalófilos (pH > 9) y acidófilos (pH < 2-3), han sido usados para aislar enzimas

(frecuentemente extracelulares) adaptadas a esas particulares condiciones (Van den

Burg, 2003).

La presión parece no ejercer una fuerza selectiva sobre la función de enzimas

(Gros y Jainicke, 1994). Esta aseveración se basa en que presiones superiores a 400

MPa son necesarias para inducir la denaturación de proteínas de cadena simple y los

microorganismos que viven en las profundidades marinas están expuestos a presiones

que no superan los 120 MPa. Sin embargo, existen ejemplos de estabilización de

proteínas mediante alzas de presión (Hei y Clark, 1994). Enzimas resistentes a altas

presiones pueden ser útiles, especialmente en la industria de alimentos, donde se

encuentra esta condición en numerosos procesos (Van den Burg, 2003).

Existen otros ejemplos de microorganismos y enzimas adaptados a

condiciones extremas. Los metalófilos son capaces de crecer en presencia de altas

concentraciones de metales, los radiófilos resisten alta radiación, y la lista puede

continuar (Van den Burg, 2003).

Un aspecto particularmente sensible en las distintas economías del planeta es

el consumo energético. El uso eficiente de la energía no sólo disminuye los costos

asociados a diversas actividades industriales y sociales, sino que además refuerza el

concepto de desarrollo sustentable. En este contexto, un grupo particular de enzimas

extremófilas adaptadas a bajas temperaturas, ha suscitado creciente interés. Estas

4

enzimas provienen de organismos psicrófilos, que han sido capaces de colonizar

exitosamente nichos ambientales extremos cuya temperatura permanece baja (< 5°C)

durante todo el año. Estos ambientes constituyen más del 75 % de la superficie del

planeta e incluyen regiones polares o montañosas, océanos, cuevas además de las

regiones frías en forma estacional (Van den Burg, 2003; Hoyoux et al., 2004). Las

enzimas psicrofílicas presentan alta actividad en frío y baja estabilidad térmica, cualidades

que fundamentan su interés biotecnológico. En efecto, permiten ahorrar energía al

catalizar reacciones sin necesidad de calentar el medio, minimizar la ocurrencia de

reacciones químicas indeseadas que pueden ocurrir a altas temperaturas y optimizar los

recursos disponibles al disminuir la cantidad de biocatalizador indicado en comparación

con el uso de enzimas mesofílicas en frío. Además, son fácilmente inactivadas a

temperaturas moderadamente altas, lo que favorece su aplicación en procesos

industriales que requieren la eliminación selectiva de actividades enzimáticas sin afectar

el contenido de medios complejos o productos inestables (Cavicchioli et al., 2002;

Margesin et al., 2002).

El interés evolutivo y biotecnológico de las enzimas psicrofílicas ha

incentivado su estudio, con el fin de comprender en detalle los mecanismos moleculares

responsables de su exitosa adaptación.

1.4. Enzimas adaptadas a bajas temperaturas

1.4.1. El comienzo

La vida a bajas temperaturas ya había sido identificada por Hooker en 1840

mediante la detección de algas asociadas a hielo marino (Hoyoux et al., 2004). En 1887,

Forster fue el primero en reportar el crecimiento de microorganismos a 0 °C (Hoyoux et

al., 2004). El término “psicrofílico” fue introducido por Schmidt-Nielsen para describir los

organismos adaptados al frío.

Un psicrófilo se define como un organismo, procariótico o eucariótico, capaz de

vivir permanentemente a temperaturas cercanas al punto de congelamiento del agua y en

equilibrio térmico con el ambiente (Hoyoux et al., 2004).

La primera enzima psicrofílica proveniente de microorganismos de la antártica en

ser caracterizada fue una fosfatasa alcalina (Kobori et al., 1984; Marx et al., 2007), dando

5

paso a una gran cantidad de estudios relacionados con este tipo de enzimas extremófilas

y un creciente interés por sus implicancias evolutivas y aplicaciones biotecnológicas.

1.4.2. Aplicaciones biotecnológicas

Como consecuencia de sus propiedades únicas de eficiencia catalítica y

estabilidad, las enzimas adaptadas a bajas temperaturas encuentran múltiples y muy

variadas aplicaciones comerciales. A continuación se describe algunos ejemplos.

1.4.2.1. Detergentes

Los detergentes constituyen la aplicación principal de las enzimas industriales.

El mercado de proteasas, lipasas, amilasas y celulasas, enzimas usadas comúnmente

como aditivos en detergentes, representa cerca del 40% de las ventas totales (Marx et al.,

2007). Las enzimas adaptadas al frío tienen gran potencial en el desarrollo de detergentes

eficientes a temperatura ambiente.

1.4.2.2. Alimentos

Las β-galactosidasas criofílicas representan alternativas interesantes para la

remoción de lactosa en la leche con el fin de incrementar la digestibilidad y el dulzor.

Pueden ser usadas durante el transporte y almacenamiento (Marx et al., 2006).

Se ha utilizado xilanasas activas a bajas temperaturas en la fabricación de pan

para asegurar un volumen atractivo y aumentar la calidad de la miga (Collins et al., 2006).

Nuestro laboratorio también está tramitando una patente internacional para una xilanasa

psicrofílica bacteriana de origen antártico (WO/2010/089302).

Existen antecedentes de uso de pectinasas en los procesos de clarificación de

jugos; lipasas en el desarrollo de sabores gracias a su alta especificidad de sustrato; y

proteasas para incrementar la digestibilidad de alimento animal y ablandar carnes (Marx

et al., 2006).

6

Estas enzimas pueden ser usadas adicionalmente en la producción de

compuestos químicos de alto valor agregado, tales como péptidos, ácidos grasos,

polisacáridos, etc. (Marx et al., 2006).

1.4.2.3. Textil

Las celulasas psicrofílicas son usadas en el tratamiento de telas de algodón

para restaurar la suavidad y reducir la formación de pelusas, originadas a partir de fibrillas

prominentes. Este procedimiento se denomina “biopulido”. Producto de su inestabilidad

intrínseca, las celulasas psicrofílicas pierden su actividad en forma progresiva. Esto

minimiza la perdida de resistencia mecánica en los tejidos, inconveniente tradicional

asociado al biopulido (Gerday et al., 2000; Marx et al., 2006).

1.4.2.4. Biología molecular y producción de proteínas

Mediante el uso de una fosfatasa alcalina y una polinucleotido quinasa es

posible efectuar marcaje radioactivo de ácidos nucleicos. Por su naturaleza psicrofílica, la

fosfatasa alcalina puede ser inactivada a temperaturas moderadamente altas antes de

incorporar la quinasa, lo que incrementa el rendimiento de la operación (Marx et al.,

2006).

Otra aplicación prometedora es el uso de ligasas psicrofílicas para unir

fragmentos de ADN. Estas reacciones se ejecutan a bajas temperaturas para optimizar su

rendimiento (Georlette et al., 2003a; Marx et al., 2006).

También se están realizando estudios para desarrollar sistemas de expresión

de proteínas a bajas temperaturas usando hospederos psicrofílicos. Esto tiene el potencial

de reducir drásticamente la formación de cuerpos de inclusión, y consecuentemente

aumentar la producción de proteínas solubles correctamente plegadas, producto del

debilitamiento de las interacciones hidrofóbicas en ambientes fríos (Duilio et al., 2004).

7

1.4.2.5. Biocombustibles

Algunas glicósido-hidrolasas psicrofílicas tienen el potencial para ser utilizadas

en la producción renovable de etanol a bajo costo energético (Hildebrandt et al., 2009).

Ciertas lipasas son capaces de efectuar la reacción de transesterificación de

triglicéridos en presencia de alcohol para generar Biodiesel (ésteres de ácidos grasos)

(Fukuda et al., 2001). El uso de una lipasa psicrofílica permitiría rebajar la temperatura de

reacción generando un importante ahorro de energía (Luo et al., 2006).

Las extraordinarias características de las enzimas psicrofílicas suscitan gran

interés desde el punto de vista evolutivo e industrial. Para poder explorar los distintos

aspectos de la adaptación molecular de estos biocatalizadores a bajas temperaturas es

necesario primero comprender nociones básicas de termodinámica y catálisis, tanto

química como enzimática. Estos conceptos constituyen los fundamentos del mecanismo

enzimático.

1.5. Catálisis enzimática

Las reacciones químicas son aceleradas mediante la acción de catalizadores.

Enlaces químicos relevantes en biología, como el enlace fosfodiester presente en la

molécula de ADN son hidrolizados en forma espontánea a temperatura ambiente en

lapsos de tiempo que superan los 130.000 años (vida media) (Radzicka y Wolfenden,

1995). Sin embargo, en todas las células vivas, el ADN es hidrolizado en el contexto de

diversos procesos esenciales que suceden a escalas de tiempo acordes con la cinética de

desarrollo de cada célula. La vida es posible porque las reacciones bioquímicas ocurren a

velocidades razonables producto de la acción de biocatalizadores. Las enzimas

constituyen catalizadores muy efectivos, pudiendo llegar a acelerar reacciones en un

factor de 1017 (Radzicka y Wolfenden, 1995; Wolfenden et al., 1998).

Es importante subrayar que los catalizadores, tanto biológicos como químicos,

son incapaces de modificar el equilibrio natural y los parámetros termodinámicos

subyacentes de las reacciones. La diferencia de energía libre de Gibbs entre los

reactantes y productos será la misma, sin importar la presencia o ausencia de catalizador

(Dill y Bromberg, 2003).

8

¿Como funcionan las enzimas? La búsqueda de respuestas para esta

pregunta fundamental ha sido el foco de numerosos esfuerzos por más de un siglo. La

evolución del conocimiento en esta área descansa en ciertos hitos reconocibles.

El químico estadounidense Linus Pauling propuso en 1946 que los

catalizadores químicos y las enzimas funcionan por medio de la estabilización del estado

de transición de las reacciones (Pauling, 1946).

Algunos años más tarde, se determinó por primera vez la estructura

tridimensional de una enzima, la lisozima del huevo de gallina, con una resolución de 2 Å,

mediante cristalografía de rayos X (Blake et al., 1965). Este acontecimiento marcó el inicio

de los estudios estructurales a nivel atómico.

En 1971, Page y Jencks propusieron una nueva explicación para la catálisis

enzimática basada en la termodinámica. Según sus postulados, la pérdida de entropía

durante la unión del sustrato a la enzima produce la energía libre suficiente para catalizar

la reacción química (Page y Jencks, 1971). Para que esto ocurra, el sustrato debe unirse

de manera muy específica y ser orientado con gran precisión.

Estos conceptos son ampliamente reconocidos, y han representado la base

para la aparición de propuestas más recientes como la pre-organización del sitio activo

(Bruice y Benkovic, 2000) y la reducción de energía libre de reorganización (Warshel,

1998). La enzima plegada proveería un ambiente predefinido en el cual los elementos

relevantes se encuentran pre-orientados para estabilizar el estado de transición (Benkovic

y Hammes-Schiffer, 2003).

La visión actual de la catálisis enzimática considera todos los aportes recién

descritos (Garcia-Viloca, et al., 2004) e incorpora un nuevo aspecto que ha cobrado gran

relevancia y que será tratado en las próximas secciones: la dinámica.

1.5.1. Las enzimas son estructuras dinámicas

Los modelos tridimensionales de la estructura de las proteínas, obtenidos por

medio de cristalografía de rayos X y resonancia magnética nuclear, han permitido avanzar

en el entendimiento de los complejos plegamientos de las cadenas polipeptídicas, los

mecanismos catalíticos y las interacciones con moléculas relevantes (sustratos y

cofactores). Sin embargo, estas imágenes también generan la falsa impresión de que las

enzimas en solución se comportan como estructuras estáticas esperando rígidas la

9

llegada de un sustrato con el cual interactuar. Esto ha sido ampliamente descartado a

través del uso de diversas técnicas experimentales, tales como intercambio hidrógeno-

deuterio en agua pesada, apagamiento dinámico de fluorescencia, espectroscopia de

Mössbauer y de absorción de fotones y dispersión de neutrones, entre otras (Zavodszky

et al., 1998; Zaccai, 2000; Fields, 2001; Siddiqui y Cavicchioli, 2006).

Una enzima activa en solución puede ser representada en forma más precisa

por una distribución estadística de microestados con conformaciones espaciales

ligeramente distintas, determinadas por diferencias locales en el plegamiento (Bai et al.,

1995; Wooll et al., 2000; Mulder et al., 2001). Estos microestados presentan afinidades

diferentes por los potenciales sustratos (Ma et al., 1999). De hecho, al momento de unirse

un sustrato, el equilibrio de la población de microestados puede desplazarse hacia

aquellas conformaciones más favorables para la catálisis (Kumar et al., 2000; Hoyoux et

al., 2004; Hanson et al., 2007). La distribución de conformaciones ocupadas por la

población de moléculas es considerada como el “estado nativo” de la enzima y puede ser

influenciada por las condiciones del ambiente (temperatura, pH, fuerza iónica, presencia

de cofactores, etc.) (Kumar et al., 2000).

1.5.2. Flexibilidad

Gran cantidad de información acerca de la cinética y termodinámica de las

reacciones catalizadas por enzimas se ha obtenido mediante el estudio de la conversión

de sustratos a productos. Sin embargo, el conocimiento sobre la cinética y aspectos

energéticos de los procesos dinámicos conformacionales en las proteínas es aún precario

(Eisenmesser et al, 2005).

Una cadena polipeptídica es intrínsicamente flexible porque muchos de los

enlaces covalentes que participan en su esqueleto y cadenas laterales tienen cierta

libertad rotacional (Daniel et al, 2003).

La flexibilidad en proteínas implica dos fenómenos distinguibles entre sí. El

primero consiste en movimientos moleculares de gran escala, en los que porciones de la

estructura se desplazan como cuerpos rígidos. Este tipo de movimiento se relaciona

frecuentemente con la unión de sustratos o eventos alostéricos, por lo que pueden ser

detectados mediante comparación de estructuras resueltas con y sin sustratos o

cofactores (Kumar et al., 2001). De hecho, este tipo de comparaciones masificadas ha

10

llevado a la creación de una base de datos de movimientos macromoleculares (Gerstein y

Krebs, 1998). El segundo tipo de flexibilidad involucra movimientos a pequeña escala,

reflejados en un conjunto de isómeros conformacionales que constituyen el estado nativo

de la proteína en la base de su superficie de energía potencial (Kumar et al., 2001). Es así

como las proteínas globulares exhiben un amplio rango de movimientos internos. Estos

movimientos cubren amplitudes entre 0,01 Å y 10 Å, y escalas de tiempo entre 10-15 s y

más de 1 s. Las fluctuaciones pueden ser de carácter local o involucrar grandes porciones

de la estructura (Daniel et al, 2003) (Figura 1).

El solvente ejerce una importante influencia sobre la flexibilidad de una proteína. A

temperaturas fisiológicas, las proteínas deshidratadas son más rígidas que las hidratadas

y se acepta comúnmente que carecen de actividad. Aunque, algunos trabajos han

demostrado la existencia de actividad enzimática en muestras deshidratadas (10% de la

superficie molecular cubierta por agua) (Daniel et al, 2003) y en cristales de proteínas

usados para cristalografía de rayos X (Varrot et al., 2000). El aumento de la flexibilidad en

medio acuoso puede en parte deberse al debilitamiento de las interacciones

RANGO DE FUNCIÓN ENZIMÁTICA

Catalasa Anhidrasa carbónica

Ciclofilina A Acetilcolinesterasa

Dihidrofolato reductasa

Quimotripsina RuBisCO

RANGO DE EVENTOS DINÁMICOS EN PROTEÍNAS Movimientos de “breathing”

Rotaciones de cadenas laterales en superficie

Vibraciones elásticas

!

kBT h Vibraciones de

enlaces

Figura 1. Escala temporal de eventos dinámicos estructurales y ligados a la conversión de sustratos. Extraído de Agarwal, 2006. Se expone el factor universal de frecuencia (

!

kBT h )

usado en la teoría del estado de transición (ver capítulo 1.5.5 y anexo I).

11

electrostáticas en la superficie de la molécula, debido a la alta constante dieléctrica del

ambiente (Daniel et al, 2003). Además, la red fluctuante de puentes de hidrógeno entre la

superficie de la estructura y el agua puede inducir cambios transcientes en el nivel de

energía de determinadas conformaciones espaciales, ampliando el universo de posibles

estados (Böde et al., 2007). En tanto, la presencia de actividad enzimática en condiciones

de baja hidratación y ausencia aparente de fluctuaciones, puede deberse al

mantenimiento de flexibilidad local en el sitio activo, que no es percibida con precisión por

las técnicas experimentales actuales (Daniel et al, 2003).

Investigaciones detalladas han logrado discriminar entre movimientos

dependientes de las contribuciones del solvente y otros independientes (Fenimore et al.,

2002).

1.5.3. Flexibilidad y actividad

La necesidad de flexibilidad para sostener la actividad catalítica enzimática es

una noción que encuentra amplia aceptación en la actualidad aunque su influencia directa

no se ha logrado entender tal como se entiende el rol de la estructura (Daniel et al, 2003;

Eisenmesser et al., 2005).

La habilidad de cubrir un amplio espacio conformacional es esencial para la

funcionalidad de las enzimas (Zavodszky et al., 1998; Zaccai, 2000). Estas

macromoléculas deben ser capaces de adaptar su geometría para facilitar y permitir la

unión de sustratos y cofactores, poner en contacto las especies químicas reactivas en el

complejo enzima-sustrato, crear un ambiente con las características fisicoquímicas

apropiadas para la catálisis en el sitio activo o liberar los productos resultantes de la

reacción catalizada (Fields et al., 2001). El modelo de “calce inducido”, sostenido por

Koshland en 1958 (Koshland, 1958) para describir la interacción entre una enzima y su

sustrato, complemento del tradicional modelo “llave-cerradura” propuesto en 1890 por

Fischer, supone la ocurrencia de cambios conformacionales que optimizan la orientación

de los grupos químicos catalíticos en el complejo enzima-sustrato (Daniel et al, 2003).

La existencia de fluctuaciones específicamente seleccionadas durante la

evolución para incrementar la tasa de catálisis constituye un tema de debate (Daniel et al,

2003), aunque se ha relacionado movimientos específicos con la ocurrencia del ciclo

catalítico (Miller y Benkovic, 1998; Bruice y Benkovic, 2000; Radkiewicz y Brooks, 2000).

12

Los movimientos que determinan directamente el funcionamiento enzimático

corresponden al desplazamiento de estructuras secundarias o cambios conformacionales

en las proteínas. Estos movimientos son generalmente amplios, concertados y ocurren en

escalas de tiempo situadas en el rango

!

µs"ms. Las fluctuaciones térmicas de los átomos

individuales, en el rango de los

!

ps, actúan como el lubricante que hace posible los

cambios conformacionales importantes para la función enzimática (Zaccai, 2000) (Figura

1).

A temperaturas bajas (cercanas a 0°C), las enzimas usualmente pierden un alto

porcentaje de su actividad biológica. Se comportan como materiales rígidos: sus átomos

están anclados fuertemente en el contexto de la estructura, atrapados en un único estado

conformacional. Los movimientos térmicos en estas condiciones consisten en vibraciones

armónicas alrededor de posiciones de equilibrio (Zaccai, 2000). A temperaturas

suficientemente altas, los átomos son capaces de superar las barreras energéticas que

separan un estado conformacional de otro, y la estructura puede explorar un mayor

número de distribuciones espaciales. En este caso, los desplazamientos atómicos se

vuelven inarmónicos. Los átomos ya no vibran al rededor de posiciones fijas, sino que

pueden alcanzar diversos nuevos estados de equilibrio, que corresponden a distintas

conformaciones (Zaccai, 2000).

Trabajos experimentales recientes realizados en la enzima prolil cis-trans

isomerasa ciclofilina A (CypA), participante en el proceso de virulencia del VIH, sostienen

que los movimientos característicos detectados durante la catálisis, con frecuencias

correspondientes a la tasa de reacción (del orden de milisegundos), ocurren también en la

enzima libre de sustrato (Eisenmesser et al, 2005). Se concluye que la dinámica

necesaria para la catálisis es una propiedad intrínseca de la proteína.

1.5.4. Flexibilidad y estabilidad

En condiciones ambientales adecuadas, usualmente las proteínas se pliegan

espontáneamente alcanzando su estructura nativa. El modelo más aceptado para explicar

este comportamiento es el “cono de plegamiento” (“folding Funnel”) (Bryngelson et al.,

1995). Este modelo sostiene que la superficie de energía potencial de una proteína tiene

la forma de un cono, de paredes relativamente lisas, correspondiendo el estado plegado

(conformación más probable y de menor energía) al fondo del cono. Sin importar su

13

distribución espacial inicial, una proteína desplegada seguirá el gradiente de energía

hasta alcanzar un estado nativo (Rose et al., 2006) (Figura 2).

La energía de estabilización neta de las proteínas es usualmente muy baja

(Zaccai, 2000). Corresponde a la energía de unos pocos puentes de hidrógeno (Jaenicke,

2000). Datos experimentales sugieren que bastaría con interrumpir algunas de las

interacciones débiles en una estructura para inducir su denaturación (Zaccai, 2000). Se

asume que esta aparente inestabilidad estructural es una condición necesaria para la

flexibilidad y actividad enzimática (Zavodszky et al., 1998).

La mantención de un balance adecuado entre estabilidad molecular y

flexibilidad estructural es un aspecto clave para la función de las proteínas. La estabilidad

es necesaria para evitar la denaturación de la proteína y asegurar la geometría molecular

que permite la interacción con el sustrato, mientras que un nivel apropiado de flexibilidad

es indispensable para la unión eficiente de sustratos, la catálisis y la liberación de los

productos resultantes (Hoyoux et al., 2004; Henzler-Wildman et al., 2007).

Diversos estudios han establecido relaciones entre dinámica, estabilidad y

función en enzimas (Zaccai, 2000). De hecho, ciertos datos experimentales sugieren que

Figura 2. Modelo del “cono de plegamiento” (“folding Funnel”). Extraído de Rose et al., 2006. La línea roja representa un camino de plegamiento posible desde el estado desplegado hasta el estado nativo único (N).

14

la actividad catalítica es incompatible con altos niveles de estabilidad, siendo usualmente

inhibida en regimenes armónicos de vibraciones moleculares (Zavodszky et al., 1998;

Cordone et al., 1999; Zaccai, 2000).

La estabilidad global de una proteína no necesariamente responde a la

flexibilidad de su sitio activo. La dinámica en regiones específicas cercanas al sitio activo

puede diferir notablemente respecto del panorama global (Daniel et al, 2003).

Según el criterio Lindemann, a temperaturas fisiológicas, el interior de las

proteínas en su estado nativo se comporta como un sólido, bien estructurado, mientras

que la superficie tiene características dinámicas propias de los líquidos. La solidez del

interior de la estructura asegura la estabilidad del estado nativo y disminuye enormemente

la probabilidad de ocurrencia de conformaciones inactivas parcialmente denaturadas en

condiciones adecuadas. En tanto, la fluidez de la superficie hace posible la actividad

enzimática (Zhou et al., 1999).

La necesidad de las enzimas por mantener un cierto umbral de flexibilidad que

asegure su funcionalidad puede determinar los niveles de estabilidad permitidos en los

diversos nichos térmicos (Fields, 2000).

1.5.5. Catálisis enzimática a bajas temperaturas

Las temperaturas bajas disminuyen fuertemente la velocidad de las

reacciones químicas. La dependencia entre la velocidad de reacción (a través de la

constante catalítica) y la temperatura puede ser descrita por la ecuación de Arrhenius (ver

anexo I, ecuación 70) (Arrhenius, 1889) y la teoría del estado de transición (ver anexo I,

ecuación 80) (Evans y Polanyi, 1935; Eyring, 1935; Laidler y King, 1983).

donde A es un factor pre-exponencial,

!

Ea es la energía de activación de la reacción,

!

" es

el coeficiente de transmisión dinámica (se asume 1 generalmente para soluciones no

!

kCAT

= A"e#Ea RT

!

kCAT

="kT

he#$G

#RT

(1)

(2)

15

viscosas) (Garcia-Viloca et al., 2004), R es la constante de los gases ideales (8,314 JK-

1mol-1), T es la temperatura absoluta en grados Kelvin,

!

h es la constante de Planck,

!

k es

la constante de Boltzmann y

!

"G# es la energía libre de activación. Cabe señalar que la

constante de Boltzmann (

!

k ) es equivalente a la constante de los gases ideales (

!

R),

siendo la primera expresada en unidades de energía por partícula y la segunda en

unidades de energía por mol.

!

"G# representa la diferencia de energía libre entre el

complejo enzima-sustrato y el complejo enzima-sustrato activado (en el estado de

transición). El componente

!

kBT h es un factor de frecuencia equivalente a 6 ps-1 a una

temperatura de 300°K, para la conversión del estado de transición a productos, válido

tanto en solución como en fase gaseosa (Garcia-Viloca et al., 2004).

A partir de estas ecuaciones se puede deducir que cualquier disminución en la

temperatura producirá una disminución exponencial en la tasa de reacción. En la mayoría

de los sistemas biológicos, una caída de 10°C baja la velocidad de reacción en un factor

de 2 a 3. Esto corresponde al Q10 de la reacción (razón de las tasas de reacción medidas

a intervalos de 10°C) (Hoyoux et al., 2004).

Un aspecto adicional a tener en consideración es el coeficiente de transmisión

dinámica

!

" . Este coeficiente está gobernado por 3 factores: traspasos de la barrera

energética en sentido inverso al de la reacción, es decir del estado activado al complejo

enzima-sustrato basal, con influencia negativa en la tasa de reacción; el efecto túnel, que

corresponde a la formación de productos sin la necesidad de cruzar la barrera energética

de activación, con influencia positiva en la tasa de reacción; y desviaciones del sistema

con respecto al equilibrio asumido, con influencia positiva o negativa en la tasa de

reacción (Garcia-Viloca et al., 2004). En relación a la adaptación a bajas temperaturas, la

viscosidad del medio constituye la principal influencia sobre el coeficiente

!

" . En efecto, la

viscosidad del medio aumenta progresivamente al descender la temperatura, y se ha

demostrado experimentalmente que esto afecta negativamente la actividad enzimática

(Marx et al., 2007). Se conoce diversos métodos para calcular el coeficiente

!

" , tanto

experimentalmente como en forma teórica (Watney et al., 2003; Siddiqui y Cavicchioli,

2006).

Las enzimas psicrofílicas contrarrestan los impedimentos físicos asociados al

frío por medio de diversas estrategias, pudiendo alcanzar actividades a bajas

temperaturas hasta 10 veces mayores que las exhibidas por sus homólogas mesofílicas o

termofílicas (Hoyoux et al., 2004; Siddiqui y Cavicchioli, 2006).

16

1.5.6. Adaptación al frío: compromisos y controversias

Las enzimas psicrofílicas se caracterizan por una alta eficiencia catalítica en

frío. Generalmente, esta capacidad responde a una baja energía de activación (ver

ecuación de Arrhenius (ecuación 70 anexo I)), originada posiblemente por un incremento

en la flexibilidad local o global y una consecuente disminución de la estabilidad estructural

(D’Amico et al., 2002). Se observa con frecuencia que la temperatura a la cual estas

enzimas alcanzan su mayor actividad en condiciones experimentales definidas, es más

baja que la de sus homólogas mesofílicas (D’Amico et al., 2002; Marx et al., 2007). La

Figura 3 muestra la tendencia general observada con respecto a los efectos relativos de la

temperatura sobre la actividad de enzimas psicrofílicas y mesofílicas.

A continuación exploraremos en detalle el estado del arte que explica la lógica

de las adaptaciones térmicas mencionadas, y los mecanismos moleculares que las

determinan, marcados por compromisos y controversias.

Temperatura

Figura 3. Dependencia térmica de la constante catalítica de una enzima psicrofílica y su homóloga mesofílica. Extraído de D’Amico et al., 2002. Los puntos negros corresponden a una α-amilasa psicrofílica de Pseudoalteromonas haloplanktis; los puntos blancos representan un homólogo termoestable de Bacillus amyloliquefaciens.

17

1.5.6.1. Estabilidad

Se ha demostrado experimentalmente, mediante técnicas espectroscópicas y

calorimétricas que las enzimas psicrofílicas son menos estables que sus homólogas

mesofílicas y termofílicas (Marx et al., 2007). Las temperaturas de denaturación de

enzimas homólogas ortólogas y los rangos de temperatura de sus nichos ecológicos de

origen tienden a ser directamente proporcionales (McFall-Ngai y Horwitz, 1990; Maes et

al., 1999).

Se ha podido calcular los parámetros termodinámicos de estabilización para

algunas enzimas psicrofílicas (Feller et al., 1999; D’Amico et al., 2003; Georlette et al.,

2003b; Xu et al., 2003). La energía libre de estabilización (

!

"GEST

), que corresponde a la

energía necesaria para destruir la estructura molecular nativa a una temperatura dada,

entrega valiosa información acerca de la estabilidad conformacional de una enzima.

!

"GEST

para cualquier temperatura se obtiene a partir de parámetros experimentales de

denaturación mediante la ecuación de Gibbs-Helmholtz (Siddiqui y Cavicchioli, 2006):

donde

!

Tm

es la(s) temperatura(s) de denaturación,

!

"Hm

es el cambio de entalpía

a la

!

Tm

, y

!

"CP

es la capacidad calorífica del sistema a presión constante. La Figura 4

muestra la energía libre de estabilización de α-amilasas homólogas adaptadas a distintas

temperaturas (psicrofílica, mesofílica y termofílica). Se puede observar que la energía de

estabilización máxima de las tres α-amilasas se alcanza a temperatura ambiente, patrón

común a una gran variedad de proteínas (Kumar et al., 2002, Feller et al., 2007). Esto es

presumiblemente debido a la optimización del efecto hidrofóbico (crucial en el plegamiento

y mantención de la estructura proteica) a esta temperatura (Baldwin, 1986; Kumar et al.,

2002). De este tipo de estudios se concluye también que las enzimas psicrofílicas son

más sensibles, tanto a la denaturación por calor, como a la denaturación por frío

(intersección de las curvas con el eje x, donde

!

"GEST

= 0). La denaturación por frío es un

concepto poco intuitivo, que consiste en la pérdida de estructura terciaria producto de la

hidratación de interacciones iónicas, polares y apolares a temperaturas suficientemente

bajas (López et al., 2007).

Las energías de estabilización máxima de ciertas enzimas psicrofílicas se

encuentran en rangos muy cercanos al limite de denaturación (14-15 kJ/mol), lo que

reafirma la noción de inestabilidad en estas macromoléculas (Marx et al., 2007).

!

"G(T ) = "Hm(1# T T

m)+ "C

P(T # T

m)# T"C

Pln(T T

m) (3)

18

1.5.6.2. Flexibilidad

El incremento de la flexibilidad estructural de las enzimas psicrofílicas aparece en

la actualidad como una de las potenciales adaptaciones a bajas temperaturas para la cual

existe mayor consenso (Lonhienne at al., 2000; D’Amico et al., 2003; Violot et al., 2005;

Marx et al., 2007; Papaleo et al., 2007). La importancia de la flexibilidad estructural para la

actividad enzimática ya fue discutida en el capítulo 1.5.3. La Figura 5 muestra un modelo

de cono de plegamiento, desarrollado a partir de una recopilación de información

bioquímica y biofísica relevante, que ilustra diferencias importantes entre las enzimas

psicrofílicas y sus homólogas termofílicas (D’Amico et al., 2003). La flexibilidad estructural

se traduce en el modelo como una distribución más amplia de isómeros conformacionales

en equilibrio, con débiles barreras energéticas entre uno y otro (D’Amico et al., 2003). Al

interactuar con un sustrato, las enzimas psicrofílicas son capaces de desplazar el

equilibrio hacia las conformaciones más activas a un menor costo energético, lo que les

permite mantener altas actividades a bajas temperaturas (D’Amico et al., 2003) (ver

capítulo 1.5.1). Sin embargo, el amplio universo de conformaciones accesibles también

puede influir negativamente sobre la Km al aumentar el tiempo ocupado en

Temperatura (°C)

Figura 4. Energía de estabilización de 3 α-amilasas adaptadas a distintas temperaturas. Extraído de D’Amico et al., 2003. AHA, psicrofílica de Pseudoalteromonas haloplanktis; PPA, mesofílica de cerdo; BAA, termofílica de Bacillus amyloliquefaciens.

19

conformaciones sub-óptimas para la interacción con los sustratos (Siddiqui y Cavicchioli,

2006).

En el caso de las enzimas termofílicas, las altas temperaturas ambientales

posibilitan, mediante un valor positivo de la entropía de estabilización, un descenso en

!

"GEST

. Esto asegura la mantención de un nivel de flexibilidad apropiado para la catálisis.

La flexibilidad de las enzimas psicrofílicas, por el contrario, está asociada a un valor

negativo en la entalpía de estabilización a bajas temperaturas (Marx et al., 2007; Feller,

2007). Este valor obedece al gran número de interacciones (puentes de hidrógeno)

favorables entre las moléculas de agua que se producen al denaturarse la estructura

nativa y exponerse los residuos hidrofóbicos a temperaturas suficientemente bajas (Dill y

Bromberg, 2003). En estas condiciones, la fuerza que mantiene la estructura

tridimensional en su estado nativo es de naturaleza entrópica (producto del ordenamiento

de las moléculas de agua en la vecindad de los residuos hidrofóbicos en la proteína

desplegada) (Marx et al., 2007; Feller, 2007).

Coordenadas conformacionales

Psicrofílicas Termofílicas

Figura 5. Modelo de cono de plegamiento propuesto para enzimas psicrofílicas y termofílicas. Extraído de D’Amico et al., 2003. En estos esquemas, la energía potencial (E) se representa en función de la diversidad conformacional.

20

Una observación interesante es que la inactivación térmica de las enzimas

adaptadas a bajas temperaturas frecuentemente precede la denaturación de la estructura

completa (Collins et al., 2003; D’Amico et al., 2003; Georlette et al., 2003b). Esto no

sucede con sus homólogas mesofílicas o termofílicas, en cuyo caso la temperatura de

máxima actividad coincide con la etapa de transición hacia la denaturación, por lo que, en

estas enzimas, la pérdida de actividad es consecuencia directa de la denaturación general

(Collins et al., 2003; D’Amico et al., 2003; Georlette et al., 2003b). Estos resultados

incorporan el concepto de “flexibilidad local” que describe la alta actividad en frío como

resultado de una disminución de la estabilidad en regiones específicas de la estructura,

particularmente en la vecindad del sitio activo (Hoyoux et al., 2004; Marx et al., 2007). Sin

embargo, a través del estudio de enzimas silvestres y mutantes, también se ha asociado

un incremento global de la flexibilidad con el carácter de criofilicidad (Siddiqui y

Cavicchioli, 2006).

1.5.6.3. Relación entre flexibilidad, estabilidad, actividad y adaptación al frío

A pesar de lo descrito en los capítulos precedentes, el entendimiento de la

relación entre flexibilidad, actividad y adaptación al frío aún es precario. Existe

controversia acerca de la relación entre la flexibilidad y la alta actividad a bajas

temperaturas (Hoyoux et al., 2004; Marx et al., 2007). Mientras algunos estudios

experimentales comparativos entre enzimas psicrofílicas, mesofílicas y termofílicas han

tenido éxito estableciendo esta relación (Fields, 2001; Zecchinon et al., 2001; D’Amico et

al., 2003; Georlette et al., 2003b; Bae y Phillips, 2004; Siddiqui y Cavicchioli, 2006), otros

han sido incapaces de confirmarla (Svingor et al., 2001; Zecchinon et al., 2001).

Los datos experimentales disponibles sugieren la existencia de un

compromiso entre estabilidad y actividad en el contexto de la adaptación enzimática a

bajas temperaturas (Siddiqui y Cavicchioli, 2006). Para numerosas enzimas silvestres y

mutantes, un incremento en la actividad coincide con una disminución de la estabilidad,

dándose la situación inversa también (Zecchinon et al., 2001; Hoyoux et al., 2004;

Siddiqui y Cavicchioli, 2006). La gran cantidad de ejemplos de este tipo en la literatura

indican que se trata de un principio general. Sin embargo, existen algunos casos en los

que este compromiso es desafiado. Se ha obtenido por medio de evolución dirigida y

modificaciones químicas, mutantes que presentan simultáneamente alta estabilidad y

21

actividad a bajas temperaturas (Giver et al., 1998; Miyazaki et al., 2000; Zhang et al.,

2003; Siddiqui y Cavicchioli, 2005). Con respecto a esto, se ha propuesto que la baja

estabilidad de las enzimas psicrofílicas responde a la ausencia de presión selectiva por

estructuras estables en sus ambientes naturales, y no se encuentra necesariamente

ligada al proceso de adaptación de la actividad catalítica (Wintrode y Arnold, 2000).

Por otro lado, en enzimas psicrofílicas que contienen múltiples dominios

catalíticos y no catalíticos, se ha observado que el dominio catalítico tiende a ser

termolábil, mientras que los otros dominios pueden ser altamente estables (Bentahir et al.,

2000; Lonhienne et al., 2001). Considerando estas observaciones, resulta poco probable

que la ausencia de presión selectiva afecte cada dominio de manera desigual (Hoyoux et

al., 2004).

Un estudio comparativo en el que se construyeron quimeras compuestas de

dominios provenientes de 3 adenilato kinasas homólogas adaptadas a distintas

temperaturas, reveló que los parámetros de actividad y estabilidad podían ser

determinados en forma separada por dominios diferentes. Mientras un dominio es

responsable de la termoestabilidad de la enzima, otro es el que determina el incremento

de actividad a bajas temperaturas (Bae y Phillips, 2006).

En definitiva, a pesar de las múltiples alternativas factibles, la mayor

flexibilidad y baja estabilidad, global o local, de las enzimas psicrofílicas podría constituir

la estrategia de adaptación al frío más simple en ausencia de presión selectiva por

estructuras estables, pero en presencia de una fuerte presión por biocatalizadores más

activos (Hoyoux et al., 2004).

1.5.6.4. Adaptaciones moleculares al frío: tendencias generales

Se ha observado que las enzimas psicrofílicas tienden a presentar menor

hidrofobicidad interna. Esto se traduce en un aumento del número y volumen de

cavidades, generándose estructuras menos compactas y más flexibles (Leiros et al.,

2003; Bae y Phillips, 2004; Garsoux et al., 2004). Por el contrario, la superficie de estas

enzimas contiene usualmente mayor cantidad de residuos hidrofóbicos (Smalas et al.,

1994; Aghajari et al., 1998; Russell et al., 1998; de Backer et al., 2002; Van Petegem et

al., 2003; Bae y Phillips, 2004). La exposición de residuos apolares es un fenómeno que

22

contribuye entrópicamente a la desestabilización de la estructura, incrementando su

flexibilidad a bajas temperaturas (Feller, 2003; Saunders et al., 2003).

Algunas enzimas psicrofílicas exhiben una mayor cantidad de cargas,

especialmente negativas, en su superficie (Feller et al., 1997; Russell et al., 1998; Leiros

et al., 2000; de Backer et al., 2002; Garsoux et al., 2004; Arnorsdottir et al., 2005). Esto

incrementa las interacciones con el solvente, favoreciendo la flexibilidad a bajas

temperaturas (ver capítulo 1.5.2) (Feller et al., 1999).

El análisis de estructuras 3D, frecuentemente revela que los sitios activos y de

unión a sustrato en las enzimas psicrofílicas son más amplios y accesibles, en relación a

los de enzimas mesofílicas o termofílicas (Aittaleb et al., 1997; Russell et al., 1998;

Aghajari et al., 2003). Esto se logra por medio de distintas adaptaciones específicas, que

suponen cambios conformaciones o ausencia de “loops” al borde del sitio activo; o

reemplazo de cadenas laterales voluminosas por otras más pequeñas en ubicaciones

claves (Feller, 2003; Hoyoux et al., 2004). La amplitud del bolsillo de unión podría permitir

la acomodación de los sustratos a costos energéticos bajos y facilitar la liberación de los

productos (Feller, 2003; Hoyoux et al., 2004).

Sin embargo, la situación opuesta también ha sido documentada. En una

xilanasa psicrofílica, la accesibilidad del sitio de unión a sustrato es sustancialmente

menor en comparación con su homólogo termofílico, debido al plegamiento particular de

un “loop” vecino (Van Petegem et al., 2003).

Otras adaptaciones generales involucran un aumento en el número de

aminoácidos pequeños como glicina, disminución de prolinas (lo que provee mayor

flexibilidad de “loops”), disminución de argininas (capaces de formar múltiples

interacciones iónicas y puentes de hidrógeno), alteraciones desfavorables que debilitan la

interacción carga-dipolo en los extremos de hélices α y una menor cantidad de

interacciones electrostáticas y aromáticas (Feller, 2003).

Cada enzima adopta estrategias de adaptación al frío que le son propias

combinando uno o más de los factores mencionados, además de posibles aspectos aún

desconocidos. En consecuencia existe una gran diversidad de mecanismos efectivos para

alcanzar las capacidades observadas, en su mayoría vinculados con la dinámica de las

estructuras.

23

1.6. Estudio de la dinámica de proteínas

El entendimiento de los aspectos dinámicos relacionados con la actividad, la

estabilidad y la adaptación térmica de enzimas ha avanzado gracias al desarrollo de

herramientas de estudio adecuadas, tanto experimentales como de simulación in silico.

Estas herramientas, cada vez más sofisticadas, permiten a los investigadores presenciar

eventos microscópicos que ocurren a escalas temporales que van generalmente desde

picosegundos hasta varios segundos (Figura 1).

1.6.1. Métodos experimentales

La flexibilidad en proteínas puede ser determinada mediante una variedad de

técnicas como: cristalografía de rayos X (factores B o de Debye-Waller), intercambio

hidrógeno-deuterio en agua pesada, apagamiento dinámico de fluorescencia,

espectroscopia de Mössbauer y de absorción de fotones, dispersión de neutrones y

resonancia magnética nuclear (Zavodszky et al., 1998; Zaccai, 2000; Siddiqui y

Cavicchioli, 2006). Estas metodologías, sin embargo, presentan limitaciones. Sus

resultados son esencialmente cualitativos, la tecnología de rayos X se circunscribe a

cristales solamente y la espectroscopía Mössbauer se restringe generalmente a muestras

sólidas. Adicionalmente, varias de estas metodologías sólo describen el movimiento

general de la estructura, sin distinguir aspectos locales (Daniel et al., 2003).

Los experimentos de NMR permiten estudiar la dinámica de proteínas en solución. Arrojan

un conjunto de confórmeros, de acuerdo a ciertas restricciones geométricas, que

describen parte del universo de microestados posibles en la estructura nativa (Kumar et

al., 2001). La relevancia de los resultados depende en gran medida del espacio

conformacional efectivamente cubierto y de la calidad o resolución de los confórmeros. No

obstante, existen antecedentes experimentales que validan esta técnica como un medio

razonable para el estudio de la estructura y dinámica de proteínas (MacArthur y Thornton,

1993). Para poder establecer correlaciones entre las mediciones experimentales de

dinámica y la actividad en enzimas, es necesario que éstas se encuentren activas bajo las

condiciones particulares de cada metodología. Los ensayos de relajación de NMR

cumplen con este requisito al utilizar sistemas en solución (Eisenmesser et al, 2005).

24

La dispersión de neutrones permite evaluar cuantitativamente el movimiento

global y local de macromoléculas en una gran variedad de estados físicos (polvo,

solución, membranas), no necesariamente cristales. Mediante esta metodología es

posible estudiar, además de estructuras proteicas aisladas, células enteras, obteniéndose

valores promedio que incluyen todas las proteínas en el ambiente celular. La dispersión

de neutrones es una herramienta poderosa y versátil de gran potencial en el estudio de la

dinámica de sistemas biológicos complejos (Réat et al., 1998; Zaccai, 2000).

La espectroscopía de Mössbauer detecta el movimiento de una sonda de

hierro en la estructura (Daniel et al., 2003). Las técnicas de intercambio hidrógeno-

deuterio miden la accesibilidad de los aminoácidos al solvente, que es proporcional a la

tasa de recambio entre los átomos de hidrógeno en la proteína y el deuterio del solvente

(Siddiqui y Cavicchioli, 2006). En la técnica de apagamiento dinámico de fluorescencia

una molécula denominada “apagador” (por ejemplo acrilamida) se infiltra hacia el interior

de la proteína producto de los movimientos de la estructura, donde provoca un

decaimiento en la fluorescencia de triptófanos. La flexibilidad es entonces proporcional a

la permeabilidad de la proteína con respecto al agente apagador (Siddiqui y Cavicchioli,

2006).

Un parámetro altamente recurrido para evaluar la flexibilidad relativa de

residuos y átomos en una proteína es el factor B (o factor de Debye-Waller) obtenido a

partir de los mapas de densidad electrónica en cristalografía de rayos X. Este parámetro

es proporcional al promedio del cuadrado de las fluctuaciones para cada átomo (ecuación

(4)) sin embargo otros factores como el desorden en los cristales también influyen en su

valor (Bahar et al., 1997; Parthasarathy y Murthy, 2000).

Las amplitudes, pero no las frecuencias de las fluctuaciones térmicas pueden

ser estimadas a partir del factor B (Zaccai, 2000).

Cada técnica experimental es capaz de capturar movimientos a distintas

escalas de tiempo específicas. La cristalografía de rayos X promedia horas, la

espectroscopía Mössbauer detecta movimientos del orden de 10-7 s, la dispersión de

neutrones muestrea escalas temporales en el rango 10-12 - 10-8 s y nuevos métodos

basados en resonancia magnética nuclear son capaces de caracterizar los movimientos

!

Bk

=8" 2

3< #R

k.#R

k> (4)

25

directamente relacionados con el ciclo catalítico en el rango 10-6 – 10-3 s (Eisenmesser et

al., 2005).

1.6.2. Métodos computacionales

Las simulaciones computacionales han alcanzado un nivel de desarrollo que

permite generar modelos realistas de la dinámica de macromoléculas complejas como las

proteínas y su entorno (solvente) (Dodson y Verma, 2006). Los datos generados a través

de estas herramientas concuerdan cualitativamente con las mediciones experimentales

(Dodson y Verma, 2006).

La primera visión detallada de los movimientos atómicos en una proteína

surgió en 1977 mediante simulaciones de dinámica molecular en el inhibidor de tripsina

pancreática (McCammon et al., 1977; Karplus y Kuriyan, 2005). Desde estos trabajos

pioneros de Martin Karplus y colegas, el incremento acelerado de la capacidad de cálculo

en los computadores y el desarrollo de parámetros que definen de manera más exacta las

propiedades fisicoquímicas de los sistemas (campos de fuerza) han posibilitado hoy la

realización rutinaria de simulaciones detalladas (Dodson y Verma, 2006). Sin embargo, la

mayoría de los protocolos y sistemas para efectuar dinámica molecular permiten explorar

escalas de tiempo relativamente pequeñas, del orden de los nanosegundos (Agarwal et

al., 2006), aunque se ha reportado simulaciones mas largas (Duan y Kollman, 1998). Para

obtener un muestreo conformacional significativo del estado nativo de una proteína es

necesario efectuar múltiples dinámicas moleculares de larga duración (Kazmirski et al.,

1999). El resultado de estas dinámicas moleculares de larga duración se superpone de

manera significativa con los conjuntos de estructuras obtenidos experimentalmente a

través de NMR (Abseher et al., 1998).

Las fluctuaciones atómicas armónicas pueden ser aproximadas

satisfactoriamente a través de técnicas físico-matemáticas como el análisis de modos

normales (NMA, sus siglas en inglés) (Rader, 2006).

Este método ha sido usado frecuentemente en el campo de las ciencias

físicas para describir movimientos en la vecindad de un estado de equilibrio (Hinsen 1998;

Hayward 2001). Por su simplicidad, permite analizar sistemas macromoleculares

complejos, a escalas de tiempo amplias, que no pueden ser simuladas mediante dinámica

molecular producto del alto costo computacional asociado (Becker y Watanabe, 2001;

26

Hayward, 2001). El NMA se basa en una aproximación armónica de la energía potencial

de un sistema en un mínimo local para determinar las fluctuaciones atómicas y las

frecuencias vibratorias de cada modo de movimiento. Estos parámetros corresponden a

los valores y vectores propios de la matriz hesiana de la función de energía potencial

(Hinsen, 1998; Hayward, 2001). A pesar de los supuestos y gruesas simplificaciones que

conlleva su aplicación, el NMA es reconocido como una herramienta coherente, de

comprobada utilidad en la exploración de la dinámica de proteínas (Hayward, 2001;

Rader, 2006).

Como resultado de la popularidad del NMA, diversos estudios han sido

dedicados a la introducción de nuevos modelos más simples y menos costosos desde el

punto de vista computacional, basados en mecánica de redes de polímeros. El modelo de

red Gaussiana (GNM, sus siglas en inglés) es probablemente el más simple. Consiste en

una red elástica (Elastic Network Model) con potencial armónico único y uniforme. El GNM

fue originalmente propuesto por Bahar y colaboradores (Bahar et al., 1997), basándose en

los trabajos de Tirion (Tirion, 1996) y Flory (Flory 1976), como un método minimalista para

explorar el rol y contribución de restricciones puramente topológicas, determinadas por la

estructura 3-D, en la dinámica colectiva de las proteínas. Sin embargo, estos métodos

minimalistas son incapaces de distinguir cambios específicos que no generan

modificaciones notables en la topología general de las estructuras, como las mutaciones

puntuales.

Una ventaja sustancial que presentan los métodos teóricos para estimar

parámetros dinámicos es que sus resultados son directamente comparables. Esto

frecuentemente no sucede con los datos experimentales. Por ejemplo, cuando existe

disponibilidad de estructuras resueltas mediante difracción de rayos X, los factores B

constituyen un índice útil para detectar regiones de la proteina particularmente flexibles o

rígidas. Sin embargo, si se requiere comparar los factores B de dos o más proteínas el

escenario se complica ya que frecuentemente las condiciones experimentales

(temperatura de cristalización, temperatura de los patrones de difracción, posición de las

moléculas en los cristales, interacciones establecidas dentro de los cristales, etc.), son

desiguales, y por consecuencia los datos generados no son directamente comparables

(Marx et al., 2007).

27

1.7. Hipótesis de trabajo

Es posible identificar residuos claves en la celulasa Cel5A de Bacillus

agaradherans que definen su comportamiento catalítico a diversas temperaturas mediante

análisis comparativos in silico de factores vinculados con la flexibilidad de su estructura y

evaluación experimental de mutantes sitio-dirigidas.

1.8. Modelo de estudio: celulasas pertenecientes a la familia GH5-2

Para validar experimentalmente la hipótesis planteada, se propone usar

celulasas como modelo de estudio. Las celulasas son enzimas capaces de hidrolizar los

enlaces β-1,4-glicosídicos de la celulosa, el polímero más abundante en la biomasa

vegetal y ampliamente distribuido en productos comerciales como prendas textiles, papel

y materias primas para la industria de alimentos (Davies et al., 1998; Violot et al., 2005).

El gran potencial de aplicación de estas enzimas justifica el interés que existe por

entender los aspectos estructurales y mecanísticos de su funcionamiento.

La mayoría de las celulasas exhibe una organización modular, con un dominio

catalítico unido a uno o más dominios sin actividad hidrolítica (Davies et al., 1998;

Henrissat y Davies, 2000). Estos dominios adicionales son responsables de la unión de la

enzima a sustratos poliméricos insolubles, como la celulosa cristalina.

Debido a aspectos relacionados con la disponibilidad de información

estructural adecuada para el análisis in silico, se utilizó únicamente los dominios

catalíticos de las celulasas seleccionadas. Todas las estructuras estudiadas en este

trabajo son homólogas, pertenecientes a la familia 5, sub-familia 2, clan A de las glicósido-

hidrolasas (GH5-2), caracterizadas por un plegamiento tipo barril (α/β)8. Estas enzimas

presentan un mecanismo de catálisis de doble desplazamiento, con retención de la

configuración anomérica (Barras et al., 1992). El centro catalítico está conformado por dos

ácidos glutámicos, un dador de protones (ácido/base) y un nucleófilo (Wang et al., 1993).

Como modelo experimental se utilizó la celulasa mesofílica Cel5A (GH5-2)

proveniente de Bacillus agaradhaerens AC 13 (ATCC 700163), una bacteria alcalofílica

estricta (Nielsen et al., 1995; Davies et al., 1998). Tanto la bacteria de origen, como la

celulasa Cel5A, se encuentran protegidas por patentes internacionales pertenecientes a

28

las empresas danesas Novo Nordisk A/S y Novozymes A/S, respectivamente

(WO9401532, 1994; US6280984, 2001).

29

2. Objetivos

2.1. Objetivo general

Identificar aspectos determinantes de la dinámica estructural en celulasas

pertenecientes a la familia 5-2 de las glicósido-hidrolasas, vinculados con la adaptación de

su actividad catalítica a diversas temperaturas, mediante el uso de herramientas biofísicas

y bioinformáticas.

2.2. Objetivos específicos

1. Diseñar y codificar algoritmos computacionales para efectuar comparaciones de

aspectos estructurales estáticos (interacciones electrostáticas, compactación) y

dinámicos (modos normales) entre proteínas homólogas.

2. Identificar residuos potencialmente involucrados en la adaptación de la actividad

catalítica de celulasas (GH5-2) a diversas temperaturas mediante la aplicación de

los algoritmos computacionales generados en estudio de homólogos estructurales

psicrofílicos y mesofílicos.

3. Validar los resultados obtenidos in silico a través de la construcción y

caracterización bioquímica de mutantes sitio-dirigidas.

30

3. Materiales y Métodos

3.1. Materiales

3.1.1. Cepas bacterianas

• E. coli cepa DH5α: F-, endA1, hsdR17, supE44, thi-1, recA1, gyrA96, relA1,

deoR, Δ(lacZYA-argF), U169 (lacZΔM15).

• E. coli BL21(DE3): F- ompT hsdSB (rB-mB

+) gal dcm (DE3).

• Bacillus agaradherans AC 13 (ATCC 700163; DSM 8721)

3.1.2. Reactivos

Los reactivos utilizados durante el trabajo de tesis y el laboratorio proveedor

se detallan en la Tabla 1.

3.1.3. Vectores de clonamiento y expresión

El plásmido comercial pGEM-T Easy se utilizó como vector de clonamiento de

productos de PCR. Este plásmido se distribuye en forma linearizada y posee una timina

no apareada en el extremo 3’ de cada una de sus hebras. Esto permite la ligación directa

de segmentos de DNA amplificados mediante Taq DNA polimerasa, que poseen extremos

3’ con una adenina no apareada.

Para la producción de proteínas recombinantes en E. coli se utilizó el vector

de expresión comercial pET22b(+) (Novagen). Este vector cuenta con el sistema promotor

del bacteriófago T7, que reconoce la T7 RNA polimerasa, una enzima muy activa y

específica que al ser inducida involucra gran parte de los recursos celulares en la síntesis

de la proteína blanco. La proteína generada contiene un hexapéptido de histidinas en el

extremo C-terminal, lo que facilita su purificación mediante sistemas de afinidad. El

31

plásmido además posee el gen bla (beta-lactamasa), marcador de resistencia a ampicilina

o carbenicilina y la secuencia lider pelB (extremo N-terminal) que dirige la proteína

recombinante al espacio periplásmico.

Laboratorio Reactivos

PROMEGA (WI-USA) Taq DNA polimerasa, pGem-t easy

INVITROGEN (CA-USA) T4 dna ligasa, elongasa, estándar de tamaño molecular 100 kb, dNTPs, cepa E. coli DH5α

SIGMA (MO-USA) X-gal, IPTG

FERMENTAS Estándar de tamaño molecular preteñido de proteínas

DIFCO (DT- USA) Triptona, extracto de levadura, agar

NEW ENGLAND BIOLABS (MA-USA)

Enzimas de restricción NdeI, XhoI

NOVAGEN, MADISON (WI-USA) pET22b(+), E. coli BL21(DE3)

QIAGEN Los sistemas de purificación de productos de PCR, de dna plasmidial y de extracción de DNA desde geles de agarosa, resina Ni-NTA superflow

WINKLER Tris, glicina, SDS, glicerol

J. T. BACKER Cloruro de sodio y ácido bórico.

FERMELO Agarosa

MERK El resto de las sales, ácidos, bases, bromuro de etidio y solventes de grado analítico o de biología molecular

Tabla 1. Reactivos.

32

3.1.4. Medios de cultivo líquidos

3.1.4.1. Medio Luria-Bertani

El medio LB contiene por cada 100 ml de solución: 1 g de triptona, 0,5 g de

extracto de levadura y 0,5 g de cloruro de sodio. Se prepara en agua Milli-Q, se esteriliza

por autoclave y se almacena a temperatura ambiente. Opcionalmente se puede ajustar su

pH a 7.

3.1.4.2. Medio SOB

El medio SOB contiene por cada litro de solución: 20 g de triptona, 5 g de

extracto de levadura, 0,5 g de cloruro de sodio, 10 ml de una solución de cloruro de

potasio 250 mM y 5 ml de una solución de cloruro de magnesio 2 M. Se prepara en agua

Milli-Q. Antes de agregar el cloruro de magnesio, se ajusta el pH del medio a 7 y se

esteriliza por autoclave. La solución de cloruro de magnesio se esteriliza por separado

mediante filtración.

3.1.4.3. Medio Molitor

El medio Molitor contiene por 100 ml de solución: 2 g de triptona, 0,5 g de

extracto de levadura y 0,36 mL de glicerol. Se prepara en agua Milli-Q, se esteriliza por

autoclave y se almacena a temperatura ambiente. Opcionalmente se puede ajustar su pH

a 7 (Salazar et al., 2001).

3.1.5. Medios de cultivo sólidos

Para la preparación de placas con medio sólido se agregó a los medios

líquidos agar al 1,5% P/V.

33

3.1.6. Antibióticos

Los medios líquidos y sólidos fueron suplementados, cuando fue requerido,

con carbenicilina o ampicilina a una concentración final de 100 µg/ml. Estos antibióticos se

esterilizaron por filtración (ver punto 3.1.7).

3.1.7. Soluciones Stock

• IPTG: Solución 0,1 M en agua Milli-Q. Se esteriliza por filtración usando un filtro

con tamaño de poro de 0,2 µm (Sartorius, Hannover-Alemania). Se almacena a

4°C.

• X-Gal: Solución 50 mg/ml en N,N’- dimetil-formamida. Se almacena a -20 °C en un

tubo tapado con papel metálico (alusa) para impedir el paso de la luz.

• Ampicilina y carbenicilina: Solución 100 mg/ml en agua Milli-Q. Se esteriliza por

filtración usando un filtro con tamaño de poro de 0,2 µm. Se almacena a -20 °C.

3.1.8. Recursos informáticos

Los experimentos computacionales fueron realizados en un equipo laptop

Macintosh PowerBook G4, con procesador PowerPC G4 de 1,5 GHz y memoria RAM de

1,25 GB.

Todas las funciones desarrolladas en este trabajo fueron codificadas mediante

el lenguaje de alto nivel “Python”, utilizando herramientas del módulo PDB de Biopython

(www.biopython.org), un proyecto de libre acceso con librerías Python aplicables a

estudios bioinformáticos de biología molecular y estructural (Hamelryck y Manderick,

2003). Los códigos comentados se encuentran en el anexo 4.

34

3.2. Métodos

3.2.1. Teoría del análisis de modos normales

La teoría del análisis de modos normales se basa en la resolución de las

ecuaciones de movimiento de Newton, con la hipótesis de que la función de energía

potencial del sistema en estudio tiene forma cuadrática. Esto ocurre cuando se está en un

mínimo local de energía.

En efecto, la función de energía potencial

!

V r( ) de una molécula constituida

por N átomos puede ser expandida para pequeños desplazamientos atómicos como una

serie de Taylor:

Las sumatorias se efectúan sobre un total de 3N elementos ya que la posición

de cada átomo del sistema se define a través de 3 coordenadas espaciales (x, y, z). El

índice 0, representa el estado inicial y se refiere al sistema en un mínimo local de energía

potencial. Por lo tanto, el término

!

"V "ri( )0

= 0. Adicionalmente, se puede definir la

energía del sistema relativa al estado inicial, lo que se traduce en

!

V r0( ) = 0 . Finalmente,

para desplazamientos los suficientemente pequeños, los elementos de la serie de orden

mayor que dos pueden ignorarse.

Con los supuestos mencionados, la función de energía potencial del sistema

queda de forma cuadrática:

Donde

!

ki, j = " 2V "ri"rj( )0 representa la constante de fuerza relativa a los

elementos i y j.

!

V r( ) = V r0( ) +

"V

"ri

#

$ %

&

' ( 0

ri ) ri0( ) +

1

2

" 2V

"ri"rj

#

$ %

&

' ( 0

ri ) ri0( )

i, j=1

3N

*i=1

3N

* rj ) rj0( ) + ...

!

V r( ) =1

2ki, j ri " ri

0( )i, j

3N

# rj " rj0( )

(5)

(6)

35

En la ecuación (6) la función de energía potencial coincide con la ley de Hooke

que describe el potencial de sistemas tipo resorte:

Donde

!

x corresponde al desplazamiento con respecto a la posición de

equilibrio (

!

x = r " r0) y F es la fuerza aplicada sobre el sistema y

!

k es la constante de

fuerza.

Combinando la ley de Hooke con la expresión de la fuerza según las leyes de

Newton, se tiene:

Resolviendo esta expresión para obtener su extensión en función del tiempo

queda:

Donde

!

" es la frecuencia y A la amplitud de vibración. La segunda derivada

de esta expresión con respecto al tiempo es:

Combinando las ecuaciones (8) y (10) queda:

La ecuación (11) constituye la base para el cálculo de los modos normales de

un sistema.

!

V =1

2kx

2

!

k =d2V

dx2

(7) !

F = "dV

dx= "kx

!

F = ma

!

md2x

dt2

= "kx

!

x t( ) = Asen 2"#t( )

!

d2x

dt2

= "4# 2$ 2x

(8)

(9)

(10)

!

"4# 2$ 2mx = "kx (11)

36

En el caso particular de una molécula, se debe evaluar el movimiento de cada

átomo en las tres coordenadas espaciales (x, y, z).

Para una molécula conformada por N átomos, existen 3N x 3N posibles

segundas derivadas de la energía potencial y, por consecuencia, el mismo número de

constantes de fuerza (ver ecuación (7)). Estas constantes de fuerza se refieren al

movimiento de un átomo individual sujeto a la influencia de todos los demás átomos

presentes en su contexto espacial. Por ejemplo,

es la constante de fuerza aplicada al átomo 1 en la dirección

!

x al desplazarse el átomo 1

en la dirección

!

x . De igual forma,

es la constante de fuerza aplicada al átomo 1 en la dirección

!

x al desplazarse el átomo 2

en la dirección

!

y .

Al describir el comportamiento de cada átomo del sistema en cada

coordenada espacial mediante la ecuación (11), se genera el siguiente conjunto de 3N

ecuaciones:

El segundo termino en cada ecuación, que contiene las constantes de fuerza,

corresponde al negativo de la derivada parcial de la energía potencial total del sistema

con respecto al desplazamiento atómico asociado (ver ecuaciones (6) y (7)). La fuerza

total ejercida sobre el átomo i equivale a la suma de las fuerzas ejercidas por todos los

demás átomos sobre i.

!

" 2V

"x1

2= k

xx

11

!

" 2V

"x1"y

2

= kxy12

!

"4# 2$ 2m1x1= "kxx

11x1" kxy

11y1" kxz

11z1" kxx

12x2" kxy

12y2" ..." kxz

1NzN

"4# 2$ 2m1y1= "kyx

11x1" kyy

11y1" kyz

11z1" kyx

12x2" kyy

12y2" ..." kyz

1NzN

M

"4# 2$ 2m2x2

= "kxx21x1" kxy

21y1" kxz

21z1" kxx

22x2" kxy

22y2" ..." kxz

2NzN

M

"4# 2$ 2mNzN = "kzxN1x1" kzy

N1y1" kzx

N1z1" kzx

N 2x2" kzy

N 2y2" ..." kzz

NNzN

(12)

(13)

(14)

37

Existen diversos métodos numéricos para resolver sistemas de ecuaciones

lineales como el recién descrito. Sin embargo, el problema puede simplificarse

incorporando coordenadas ponderadas por masa. Los desplazamientos quedan de la

siguiente forma:

y las constantes de fuerza:

Con coordenadas ponderadas por masa, las ecuaciones del conjunto (14)

quedan de la forma:

El sistema de ecuaciones (14), expresado en coordenadas ponderadas por

masa (17) puede ser expresado con más claridad en forma matricial:

donde

!

K es una matriz simétrica de tamaño 3N x 3N, que contiene las segundas

derivadas de la energía potencial, o constantes de fuerza, ponderadas por masa

!

˜ k ,

denominada Hessiana,

!

U es un vector de tamaño 3N que contiene los desplazamientos

!

˜ x de cada átomo, y

!

" es una matriz diagonal de tamaño 3N x 3N con las frecuencias

cuadradas

!

" 2, correspondientes a cada vector

!

U . La resolución de esta ecuación

constituye un problema de valores y vectores propios que genera 3N soluciones,

conformadas por un vector propio

!

U y un valor propio

!

" cada una.

El conjunto de vectores

!

U y valores

!

" equivale a los modos normales y

frecuencias normales de la molécula analizada, respectivamente.

En la mayoría de los casos, los modos normales se calculan mediante

diagonalización de la matriz Hessiana

!

K . El proceso de diagonalización permite extraer

los vectores y valores propios de una matriz.

!

˜ x 2

= m2x

2

!

˜ x 1

= m1x

1 (15)

!

˜ k xx

12=

kxx

12

m1

m2

(16)

!

"4# 2$ 2˜ x 1

= " ˜ k xx

11˜ x 1" ˜ k xy

11˜ y 1" ˜ k xz

11˜ z 1" ˜ k xx

12˜ x

2" ˜ k xy

12˜ y

2" ..." ˜ k xz

1N˜ z N (17)

!

K.U = "4# 2$.U (18)

38

Los modos normales se definen como un conjunto de vectores ortogonales de

desplazamientos atómicos, asociados a una determinada frecuencia de vibración, que

constituyen la base del comportamiento dinámico harmónico de una molécula. En

consecuencia, cualquier movimiento harmónico de la molécula en cuestión puede ser

descrito mediante una combinación lineal de sus modos normales.

3.2.2. Fluctuaciones atómicas, matriz Hessiana y modos normales

El movimiento harmónico de los átomos se expresa usualmente como el

promedio del cuadrado de sus fluctuaciones. Si no se consideran los cuadrados de los

desplazamientos, este promedio tiende a cero al anularse los movimientos en direcciones

opuestas.

Las fluctuaciones atómicas cuadradas promedio se pueden obtener a partir de

la información contenida en la matriz Hessiana, aplicando algunos conceptos de mecánica

estadística.

Según la ley de distribución de Boltzmann (capítulo 3, anexo 1), la

probabilidad

!

p(xi) de que una partícula o átomo

!

i en un sistema con volumen y

temperatura constantes se encuentre a una distancia

!

x con respecto a su posición de

equilibrio es:

donde

!

V (xi) es la energía potencial del sistema en función de la posición de la partícula

en cuestión,

!

kB

es la constante de Boltzmann y

!

T es la temperatura absoluta.

El valor del desplazamiento cuadrado promedio de esta partícula corresponde

al ancho de la distribución de probabilidad

!

p(xi) :

!

p(xi) =e"V (xi ) kBT

e"V (xi ) kBT dx

"#

+#

$(19)

!

< xi2

>= xi2p(xi)dxi

"#

#

$ (20)

39

Si consideramos como sistema de estudio la molécula descrita en el capítulo

anterior, con N átomos capaces de interactuar entre sí, las ecuaciones (19) y (20) deben

adoptar una forma matricial. Reemplazando

!

V (x) con la expresión (6) queda:

donde

!

X es un vector columna que contiene los desplazamientos de todos los átomos,

!

XT es la transpuesta de

!

X , y

!

K es la matriz Hessiana del sistema. La matriz Hessiana

contiene todas las segundas derivadas de la energía potencial, es decir las constantes de

fuerza que se establecen en el contexto de las interacciones entre átomos (ecuaciones

(12) y (13)).

Resolviendo la integral en el denominador de la ecuación (21), se obtiene la función de

distribución de probabilidad:

porque

!

e"ax 2

dx = # a

"$

+$

% .

Reemplazando la ecuación (23) en la ecuación (22) queda:

Resolviendo la integral de la ecuación (24), se obtiene la siguiente expresión

para la fluctuación cuadrada promedio:

!

p(X) =K

2"kBT

#

$ %

&

' (

1 2

e)X .K .X T

2kBT

!

< X .XT

>= X .XTp(X)dX =

K

2"kBT

#

$ %

&

' (

1 2

X .XTe)X .K .X T

2kBT dX)*

+*

+)*

+*

+

(23)

(24)

!

p(X ) =e"X .K .X T

2kBT

e"X .K .X T

2kBTdX"#

#

$(21)

!

< X.XT

>= X.XTp(X )dX

"#

#

$ (22)

40

porque

!

x2e"ax 2

dx = 1 4a( ) # a

0

$

% y

!

= 20

"

#$"

"

# .

Las fluctuaciones cuadradas promedio de cada átomo corresponden a los

elementos diagonales de la matriz de autocorrelación

!

< X .XT

>, obtenida a partir de la

inversa de la matriz Hessiana, según la siguiente expresión:

La inversa de la matriz Hessiana se puede calcular a partir de los vectores y

valores propios de la matriz Hessiana original según el método de descomposición

siguiente:

siendo

!

U la matriz con los vectores propios y

!

" la matriz diagonal con los valores propios

de

!

K .

En conformidad con las ecuaciones (26) y (27), las fluctuaciones cuadradas

promedio para cada átomo

!

i pueden obtenerse a partir de los modos normales y sus

frecuencias de acuerdo a:

donde

!

r u

ni

2 es el cuadrado de la norma del modo normal

!

n para el átomo

!

i , y

!

"n

2 es el

cuadrado de la frecuencia angular del modo normal

!

n . Es importante destacar que las

coordenadas de los modos normales expresados en la ecuación (28) no están

ponderadas por masa. En el caso de usarse modos normales ponderados por masa es

necesario dividir la expresión anterior por el producto de la raíz cuadrada de las masas

atómicas correspondientes.

!

< X .XT

>= kBT.K

"1(25)

!

< xi.xi

>= kBT .K

ii

"1

!

K"1

= U.#"1.UT

(26)

(27)

!

< xi.x

i>= k

BT.K

ii

"1= k

BT. #

n

"1.U

ni.U

ni

T

n

$ = kBT.

r u

ni

2

%n

2

n

$ (28)

41

El grado de correlación en el movimiento entre pares de átomos se puede

calcular a partir de los elementos situados fuera de la diagonal de la matriz Hessiana,

mediante la siguiente relación:

Donde:

El valor de

!

Cij se sitúa entre -1 y 1. Correlaciones negativas representan

movimientos antiparalelos y correlaciones positivas representan movimientos paralelos. A

mayor valor absoluto de

!

Cij , mayor correlación entre los átomos i y j.

Combinando las ecuaciones (4) y (28) resulta la siguiente expresión para

calcular el factor B en las estructuras resueltas por difracción de rayos X (ver capítulo

1.6.1):

3.2.3. Energía potencial y funciones de campo de fuerza

La obtención de una función capaz de describir la energía potencial total del

sistema estudiado constituye la primera etapa del análisis de modos normales. Esta

función es esencial para satisfacer el principal supuesto del método: contar con una

conformación particular del sistema que se encuentre en la vecindad de un mínimo local o

global de energía potencial. Además, constituye un prerrequisito para el cálculo de la

matriz Hessiana, a partir de la cual se obtienen los modos normales mediante

diagonalización.

!

Bi

=8" 2

3x

i.x

i=8" 2

kBT

3

r u

ni

2

vn

2

n

# (31)

!

Cij ="xi ."xj

"xi ."xi1/ 2

"xj ."xj1/ 2 (29)

!

< xi .x j >= kBT.

r u i .

r u j

" n

2

n

# (30)

42

En el caso de pequeños sistemas químicos, se ha utilizado con éxito

aproximaciones de mecánica cuántica para calcular funciones de energía potencial

(MacKerrel, 2001). Sin embargo, no se han desarrollado aún aproximaciones de este tipo

para explorar grandes sistemas macromoleculares, como es el caso de las proteínas

(MacKerrel, 2001). Por otra parte, la naturaleza dinámica de los sistemas

macromoleculares supone la realización de cálculos para un gran número de

conformaciones distintas. En consecuencia, se requiere de funciones de energía

relativamente simples, que permitan la realización de un gran número de cálculos en

sistemas de gran tamaño y en tiempos aceptables, recurriendo a la capacidad de

procesamiento computacional disponible.

Las funciones de energía empíricas cumplen con los requerimientos para ser

aplicadas en sistemas bioquímicos y biofísicos (MacKerrel, 2001). A través de ecuaciones

relativamente simples, que describen las interacciones físicas más relevantes, permiten

calcular la energía potencial total como función de la estructura tridimensional del sistema

en cuestión (MacKerrel, 2001).

Las ecuaciones (32), (33) y (34) representan una función de energía potencial

empírica, en la que se separan los términos relacionados con los enlaces covalentes y

aquellos relacionados con las interacciones no-covalentes.

En la ecuación (33), el primer componente da cuenta del cambio de energía

en función del largo de los enlaces covalentes, el segundo componente evalúa el efecto

del cambio en los ángulos de enlace y el tercer componente constituye el aporte de las

variaciones en los ángulos diedros. En la ecuación (34) se consideran los efectos de las

!

V(R)total = V(R)covalente +V(R)no covalente (32)

!

V(R)covalente = KBb " b0( )

2+ K# # "# 0( )

2+ K$ 1+ cos n$ " %( )[ ]

ángulos dihedros

&ángulos

&enlaces

& (33)

!

V(R)no covalente = " ij

Rmin, ij

rij

#

$ %

&

' (

12

)Rmin, ij

rij

#

$ %

&

' (

6*

+

, ,

-

.

/ / +qiqj

"Drij

#

$

% %

&

'

( (

pares de átomos no enlazados

0 (34)

43

interacciones no covalentes entre pares de átomos como las fuerzas de dispersión o Van

der Waals y las fuerzas atractivas o repulsivas entre cargas.

Las variables extraídas de la estructura del sistema son el largo de los enlaces

covalentes (

!

b), los ángulos de valencia (

!

" ), los ángulos diedros o de torsión (

!

" ) y la

distancia entre átomos

!

i, j (

!

rij ). Los demás términos en las ecuaciones corresponden a

parámetros específicos para cada tipo de átomo e interacción. Los parámetros con

subíndice 0 representan los respectivos estados en el equilibrio.

Las variaciones en el largo de los enlaces covalentes y en los ángulos de

valencia son tratadas mediante simples potenciales harmónicos (componentes 1 y 2 en

ecuación (33)), en los que

!

Kb y

!

K" representan las respectivas constantes de fuerza.

Como los enlaces y los ángulos se mantienen cerca de sus posiciones de equilibrio a

temperatura ambiente, estos potenciales harmónicos reproducen en forma precisa la

superficie de energía potencial. Las variaciones en los ángulos de torsión generan

cambios energéticos de naturaleza oscilatoria (la rotación de un enlace puede inducir

cambios periódicos entre conformaciones con distinta energía), por lo que son modelados

eficazmente a través de funciones sinusoidales (tercer componente en ecuación (33)).

Estas funciones sinusoidales se componen de una constante de fuerza,

!

K" , que

determina la barrera energética para la rotación, un índice de periodicidad,

!

n , que indica

el número de ciclos por cada rotación completa (en 360°) y una fase

!

" . Cada ángulo de

torsión puede ser descrito por una sumatoria de varias funciones sinusoidales con

diferentes parámetros, lo que permite aumentar el número de conformaciones modeladas

y en consecuencia reproducir de manera más exacta los resultados experimentales

(MacKerrel, 2001). Para modelar las fuerzas de dispersión se utilizan potenciales del tipo

Lennard-Jones (LJ) (primer componente en ecuación (34)). Estas funciones se rigen por

dos parámetros: la profundidad de la depresión energética,

!

"ij , que señala la magnitud de

las fuerzas de dispersión de London (atractivas) entre los dos átomos considerados

!

i, j , y

la distancia interatómica

!

Rmin

, correspondiente al valor mínimo de potencial. La función de

potencial que describe el comportamiento de las interacciones electrostáticas se deriva de

la ley de Coulomb (segundo componente en ecuación (34)) y considera parámetros de

carga

!

q para cada átomo y la constante dieléctrica

!

"D

del medio (usualmente igual a 1,

correspondiente al vacío) (MacKerrel, 2001).

Los valores de los parámetros descritos se ajustan en función de una gran

variedad de datos experimentales sobre sistemas similares al estudiado.

44

Las funciones de energía potencial empíricas, como la descrita en las

ecuaciones (32)-(34), satisfacen el compromiso entre simplicidad y exactitud, necesario

para su aplicación en sistemas biológicos complejos.

3.2.4. Cálculo de compactación

Para cuantificar la compactación de una proteína es necesario establecer

relaciones físicas que vinculen los distintos elementos de la estructura. Generalmente se

establece un umbral de distancia entre átomos sobre el cual se basan criterios de

conectividad. Este umbral varía usualmente entre 4,0 Å y 8,5 Å dependiendo del método

(Böde et al., 2007; Gunasekaran y Nussinov, 2007) y se define en función de distintas

consideraciones teóricas, tales como la distribución radial de átomos en las estructuras

(Bahar y Jernigan, 1997; Halle, 2002), los radios de Van der Waals (Pattabiraman et al.,

1995), el límite de influencia de las fuerzas atractivas de London-Van der Waals (Greene y

Higman, 2003; del Sol et al., 2006); o empíricas (Plaxco et al., 1998; Robinson-Rechavi et

al., 2006). Diversos métodos que responden a los criterios recién mencionados, como el

OS (occluded surface) (Pattabiraman et al., 1995) y el volumen de Voronoi (Richards,

1974), han probado ser efectivos para estudiar la compactación de proteínas (Fleming y

Richards, 2000). Sin embargo, en este trabajo se optó por el concepto de densidad de

contacto (Halle, 2002; Gunasekaran y Nussinov, 2007). Definimos la densidad de contacto

de un residuo como el número de átomos que hacen contacto con éste. Un átomo está en

contacto con un residuo si se encuentra a una distancia menor que un umbral

!

d = 4 Å con

respecto a cualquiera de los átomos que conforman ese residuo. Esto permite extraer

información detallada acerca del entorno inmediato de cada residuo.

3.2.4.1. Cálculo de la densidad de contacto

La función “residue_contacts_calculator” de la clase “Protein” en el módulo

“structural_analysis.py” calcula la densidad de contacto de un residuo en una proteína

dada, de acuerdo a lo descrito en el párrafo anterior. Sólo los átomos pertenecientes a

residuos separados por más de 3 posiciones en la cadena polipeptídica son considerados

en los cálculos con el fin de evitar información trivial (Robinson-Rechavi et al., 2006).

45

La función “residue_compactation_score_dico_calculator” de la clase “Protein”

en el módulo “structural_analysis.py” aplica la función “residue_contacts_calculator” para

calcular la densidad de contacto de la totalidad de los residuos de una proteína.

La función “protein_compactation_score_dico_generator” del módulo

“cliente_esterico.py” genera como resultado un diccionario que contiene la densidad de

contacto por residuo para todas las proteínas estudiadas.

3.2.5. Análisis de modos normales

Todos los cálculos se efectuaron mediante las herramientas disponibles en la

librería de programas de libre acceso para aplicaciones de simulación molecular, MMTK

(Molecular Modelling Tool Kit, http://dirac.cnrs-orleans.fr/MMTK) (Hinsen, 2000).

La energía potencial de las estructuras estudiadas, disponibles en archivos

formato pdb (protein data bank), se obtuvo mediante la aplicación de funciones de campo

de fuerza contenidas en el paquete AMBER94, disponible en MMTK.

Previo al análisis de modos normales, las estructuras fueron sometidas a una

minimización de energía potencial, utilizando el método de gradiente conjugado. El

proceso se extendió hasta alcanzar un valor de gradiente igual a 0,01 kJoules/nm,

instante en el que se consideró que las estructuras se encontraban en la vecindad de un

mínimo local.

Para disminuir el tiempo de cálculo, se utilizó una metodología particular que

crea un sub-espacio en el cual sólo los movimientos en que los residuos se desplazan

como unidades rígidas son considerados (Hinsen et al., 2000, Tama et al., 2000).

Mediante este procedimiento se descartan todas las vibraciones atómicas internas de

cada residuo, altamente localizadas, que no aportan en la descripción del comportamiento

dinámico general (Hinsen et al., 2000). Por constituir cuerpos rígidos, el análisis de las

fluctuaciones de cada residuo se limita a la evaluación de sus respectivos carbonos alfa.

Los códigos relacionados con los análisis de modos normales se encuentran

en el módulo “cliente_comparacion_NMA.py” (anexo 4).

46

3.2.6. Interacciones electrostáticas

En este trabajo se estudian dos tipos de interacciones electrostáticas

presentes en las estructuras proteicas. Los puentes de hidrógeno y los puentes salinos (o

interacciones iónicas).

Los criterios utilizados para calcular ambos tipos de interacciones a partir de

las coordenadas estructurales son esencialmente geométricos:

Puentes de hidrógeno (McDonald y Thornton, 1994; Torshin el al., 2002)

• Se considera los grupos amino y carboxilo del esqueleto peptídico en todos los

residuos, y todos los grupos dadores y aceptores de puentes de hidrógeno en las

cadenas laterales (ver código en módulo “structural_analysis.py”, clase “Protein”,

anexo 4).

• Distancia entre átomo aceptor e hidrógeno de átomo dador menor que 2,5 Å.

• Ángulo entre átomo dador, hidrógeno y átomo aceptor mayor que 90º.

Puentes salinos (Kumar y Nussinov, 1999)

• Sólo se consideran residuos con cargas opuestas (ver código en módulo

“structural_analysis.py”, clase “Protein”, anexo 4).

• Distancia entre los centroides de los grupos cargados (en las cadenas laterales)

de cada residuo menor que 4 Å.

• Al menos un par de átomos de oxígeno carboxílico y nitrógeno de la cadena lateral

de cada residuo se encuentra a una distancia menor que 4 Å.

Para poder efectuar los cálculos relacionados con la identificación de puentes de

hidrógeno, es necesario conocer las coordenadas de los átomos de hidrógeno

involucrados en tales interacciones. Sin embargo, en la mayoría de las estructuras

proteicas resueltas por cristalografía de rayos X, la posición de los átomos de hidrógeno,

de bajo poder de difracción de rayos X, no puede ser determinada satisfactoriamente (Shu

et al., 2000). En consecuencia, estas coordenadas deben ser calculadas.

La posición de los átomos de hidrógeno se determinó mediante criterios

geométricos estándar usando la librería de programas Python para aplicaciones de

simulación molecular, MMTK (Hinsen, 2000). Las coordenadas de los átomos de

hidrógeno que pueden rotar, y por consecuencia explorar varias conformaciones, se

47

obtuvieron mediante minimización de la energía potencial de las estructuras (capítulo

3.2.5).

Los códigos relacionados con el cálculo de interacciones electrostáticas se

encuentran en los módulos “cliente_puentes_hidrogeno.py”, “cliente_puentes_salinos.py”

y “structural_analysis.py”.

Durante el cálculo de puentes de hidrógeno, se recopila información detallada

sobre cada interacción, como la distancia entre átomos dadores y aceptores, ángulos

dador-hidrógeno-aceptor, la identidad de los átomos dadores y aceptores y la identidad de

los residuos involucrados.

3.2.7. Algoritmos de comparación

Las comparaciones se basan en alineamientos múltiples asistidos por estructura,

formato ClustalW (Higgins y Sharp, 1988) (ver alineamiento de celulasas en anexo 5),

obtenidos a través del programa de libre acceso 3DCoffee (Poirot et al., 2004), desde los

cuales se extrae información acerca de la identidad y posición de los residuos

equivalentes (comparables). Las proteínas estudiadas se clasifican en dos grupos en

función de características diferenciales. Esta información se complementa con los

cálculos de interacciones electrostáticas, de compactación y de modos normales en cada

estructura para generar los respectivos análisis comparativos. Las diferencias detectadas

en los promedios de cada grupo de comparación son validadas estadísticamente

mediante test de Student para varianzas desiguales con un nivel de confianza de 0,05

(ver anexo 2). Para aplicar el test de Student se asume que la distribución de las variables

es normal.

Los códigos de las funciones que extraen información desde los archivos de

alineamientos múltiples junto con el detalle de su funcionamiento se encuentran en la

clase “Alignment” del módulo “structural_analysis.py”, disponible en el anexo 4.

3.2.7.1. Compactación y factores B calculados

Los algoritmos usados para efectuar tanto comparaciones de compactación

como de factores B (o fluctuaciones atómicas) calculados mediante análisis de modos

48

normales son idénticos. Las funciones homólogas “compactation_score_comparator”

(módulo “cliente_esterico.py”) y “protein_groups_Bfactor_comparator” (módulo

“cliente_comparacion_NMA.py”) llevan a cabo las comparaciones de compactación y

factores B calculados, respectivamente, usando la información extraída de los

alineamientos múltiples para identificar los residuos comparables. Estas funciones

además calculan los parámetros requeridos para el análisis estadístico mediante test de

Student (anexo 2). Sólo aquellos datos que presentan diferencias estadísticamente

significativas son considerados en el resultado.

Las funciones “create_compactation_difference_results_file” y

“create_fluctuations_difference_results_file” generan archivos de texto con los resultados

de las comparaciones de compactación y fluctuaciones atómicas, respectivamente. Estos

archivos de texto son interpretados por la función “PymolPython.py” que expone

gráficamente los resultados a través del programa de visualización PyMOL (DeLano,

2002).

3.2.7.2. Interacciones electrostáticas

3.2.7.2.1. Formato de interacciones

Interacciones:

Las interacciones se expresan mediante tuplas (forma de representar un punto

en el espacio, en este caso dos coordenadas) con dos cifras correspondientes a la

posición en el alineamiento múltiple que ocupa cada uno de los residuos involucrados (por

ejemplo: (20,135) representa una interacción entre los residuos que ocupan la posición 20

y 135 en el alineamiento múltiple).

Listas de interacciones:

Las listas de interacciones contienen “sublistas de tuplas” (una sublista se

entiende por una lista contenida o anidada en otra lista). Si hay varias tuplas en una

sublista determinada, se trata de “interacciones equivalentes” (por ejemplo:

[(20,135),(21,136)] es una sublista que contiene dos interacciones equivalentes). El

criterio para considerar dos interacciones como “equivalentes” se describe más adelante.

49

Comparaciones:

Si se detecta dos sublistas de tuplas “idénticas” o “equivalentes” (ver criterios

de comparación) en una comparación el resultado contendrá todas las tuplas no

redundantes de ambas sublistas. Por ejemplo, las sublistas [(15,124),(16,124)] y

[(16,124),(17,125)] generan la sublista resultado [(15,124),(16,124),(17,125)].

3.2.7.2.2. Criterios de comparación

Interacciones equivalentes:

Dos interacciones equivalentes conectan zonas de la estructura que no

difieren en más de x residuos en la cadena lineal, siendo x un determinado valor umbral.

Por ejemplo las interacciones (15,150) y (18,147) se consideran equivalentes si x = 4, ya

que las zonas conectadas difieren de sólo 3 residuos cada una.

Grupos de interacciones equivalentes

Para que un grupo de interacciones equivalentes sea equivalente a otro grupo

de interacciones equivalentes, todas las interacciones individuales que componen ambos

grupos deben ser equivalentes entre sí. Si al menos una de las tuplas no es considerada

equivalente a las demás, los dos grupos son distintos.

Interacciones idénticas

Como definición general, se considera que dos grupos de interacciones son

idénticos cuando contienen exactamente las mismas interacciones o cuando una de las

listas está contenida por completo en la otra.

Ejemplo 1: [(A,B),(C,D),(E,F)] y [(A,B),(C,D)]

Ejemplo 2: [(A,B),(C,D),(E,F)] y [(A,B)]

Ejemplo 3: [(A,B)] y [(A,B)]

Parametro de equivalencia entre interacciones

Para cuantificar la equivalencia entre dos interacciones (o tuplas), se calculan

4 diferencias:

1) la diferencia entre el primer elemento de la tupla 1 y el primer elemento de la tupla 2.

Esta magnitud se denomina “diferencia paralela 1” (DP1).

50

2) la diferencia entre el segundo elemento de la tupla 1 y el segundo elemento de la tupla

2. Esta magnitud se denomina “diferencia paralela 2” (DP2).

3) la diferencia entre el primer elemento de la tupla 1 y el segundo elemento de la tupla 2.

Esta magnitud se denomina “diferencia antiparalela 1” (DA1).

4) la diferencia entre el segundo elemento de la tupla 1 y el primer elemento de la tupla 2.

Esta magnitud se denomina “diferencia antiparalela 2” (DA2).

Considerando las siguientes dos sublistas de tuplas: [(A1,A2)] y [(B1,B2)]:

DP1 = abs(A1 – B1)

DP2 = abs(A2 – B2)

DA1 = abs(A1 – B2)

DA2 = abs(A2 – B1)

Se considera el valor absoluto de cada diferencia para que no se generen

valores negativos.

Estas cuatro diferencias permiten cubrir todas las configuraciones en las que se

puede encontrar un par de tuplas.

Sólo se validan las diferencias menores a un determinado valor umbral (ver

“interacciones equivalentes” en capítulo 3.2.7.2.2).

Un valor parcial del parámetro de equivalencia se obtiene al sumar las dos

diferencias paralelas o antiparalelas entre sí, con la condición de que hayan sido

validadas.

DP1 + DP2 = parámetro parcial paralelo (PPP)

DA1 + DA2 = parámetro parcial antiparalelo (PPA)

Finalmente el parámetro de equivalencia entre las tuplas comparadas es el

mínimo entre los parámetros parciales.

A continuación se ilustra el método a través de tres ejemplos, considerando un

valor umbral de 4.

Ejemplo 1:

Tupla1 = [(10,15)]

51

Tupla2 = [(12,14)]

DP1 = abs(10 – 12) = 2 < 4

DP2 = abs(15 – 14) = 1 < 4

DA1 = abs(10 – 14) = 4 < 4

DA2 = abs(15 – 12) = 3 < 4

En este caso, todas las diferencias cumplen el criterio de equivalencia, por lo

que son validadas.

PPP = DP1 + DP2 = 2 + 1 = 3

PPA = DA1 + DA2 = 4 + 3 = 7

Parámetro de equivalencia = min {PPP;PPA} = min {3;7} = 3

Ejemplo 2:

Tupla1 = [(10,120)]

Tupla2 = [(12,117)]

DP1 = abs(10 – 12) = 2 < 4

DP2 = abs(120 – 117) = 3 < 4

DA1 = abs(10 – 117) = 107 > 4

DA2 = abs(120 – 12) = 108 > 4

En este caso, sólo las diferencias paralelas son válidas.

PPP = DP1 + DP2 = 5 = parámetro de equivalencia

Ejemplo 3:

Tupla1 = [(120,10)]

Tupla2 = [(12,117)]

DP1 = abs(120 – 12) = 108 > 4

DP2 = abs(10 – 117) = 107 > 4

DA1 = abs(120 – 117) = 3 < 4

DA2 = abs(10 – 12) = 2 < 4

52

En este caso, sólo las diferencias paralelas son válidas.

PPA = DA1 + DA2 = 3 + 2 = 5 = parámetro de equivalencia

Parámetro de equivalencia entre grupos de interacciones equivalentes

El parámetro de equivalencia correspondiente a la comparación de dos grupos

de interacciones equivalentes es el mínimo entre los parámetros de equivalencia de cada

par de interacciones comparadas, sin considerar las interacciones idénticas, cuyo

parámetro de equivalencia es cero.

Porcentaje de ocurrencia total de sublistas de tuplas en la comparación intergrupal

Para poder comparar el porcentaje de ocurrencia en ambos grupos de las

sublistas generadas en la comparación intergrupal, es necesario establecer un parámetro

que describa la situación general. El porcentaje de ocurrencia total de una sublista

determinada corresponde a la suma de sus porcentajes de ocurrencia en cada grupo . De

esta manera, una sublista que se encuentra en el 100% de los elementos en ambos

grupos, exhibirá un porcentaje de ocurrencia total de 200%.

3.2.7.2.3. Pseudocódigos de comparación

Comparación de dos listas de interacciones:

• Para cada sublista1 en lista1:

• Se compara esa sublista con todas las sublistas de la lista2 a fin de detectar

interacciones idénticas o equivalentes.

• Las interacciones equivalentes detectadas se dividen en dos categorías:

• semi-idéntica: parte de las tuplas comparadas son idénticas y otras son

equivalentes,

• no-idéntica: todas las tuplas comparadas son equivalentes, no hay tuplas

idénticas.

Esta clasificación permite priorizar la selección de sublistas que contienen al

menos una tupla idéntica. Si no se clasificaran las sublistas “equivalentes” algunas

sublistas del tipo “semi-equivalente” podrían ser eliminadas por sublistas del tipo

“no-equivalente” con parámetro de equivalencia menor. Para entender este

53

escenario es necesario conocer todas las etapas del algoritmo (ver ejemplo 2 en

capítulo 3.2.7.2.5).

• El “loop” sigue corriendo aunque se detecte una sublista de tuplas “idéntica” a la

sublista evaluada, ya que puede haber más de una sublista en la lista 2 que

contenga esta sublista y sea considerada como “idéntica” (ver ejemplo 1 en

capítulo 3.2.7.2.5).

• Las sublistas de tuplas “idénticas” se almacenan directamente en la llave “idéntica”

del diccionario “tuples_in_both_lists” que tiene además llaves “semi-idéntica” y “no-

idéntica”.

• Todas las sublistas “equivalentes” a la sublista1 que son detectadas en la lista2,

junto con su parámetro de equivalencia, se almacenan en listas provisorias

diferenciadas en función de su clasificación (“semi-idéntica”, “no-idéntica”).

• La función “selected_similar_tuples_final_format_generator()” extrae de las listas

provisorias aquellas sublistas que presentan el menor parámetro de equivalencia,

es decir, las que presentan mayor identidad en la comparación. De una misma lista

provisoria pueden ser seleccionadas varias sublistas que presenten el mismo

parámetro de equivalencia (mínimo).

• Las sublistas seleccionadas son incorporadas a las llaves “semi-idéntica” y “no-

idéntica” del diccionario “tuples_in_both_lists”.

• El “loop” anterior completa el diccionario “tuples_in_both_lists” incorporando aquellas

sublistas de tuplas que resultan seleccionadas en el proceso de comparación entre

cada sublista de la lista1 y cada sublista de la lista2.

• Todas las sublistas contenidas en la llave “idéntica” del diccionario

“tuples_in_both_lists” son incorporadas al resultado final como interacciones presentes

en las dos listas comparadas.

• La función “common_tuples_list_filler” analiza las sublistas contenidas en las llaves

“semi-idéntica” y “no-idéntica” del diccionario “tuples_in_both_lists”.

• Se compara todas las sublistas que tengan en común el elemento proveniente de

la lista2 con el fin de elegir aquella que presente el menor parámetro de

equivalencia. Una sublista determinada de la lista2 puede tener varias sublistas

“idénticas” (ver ejemplo 1 en capítulo 3.2.7.2.5) o “equivalentes” en la lista1, por lo

que es necesario seleccionar la pareja más parecida. Es posible que de este

54

proceso resulten seleccionadas más de una sublista con el mismo parámetro de

equivalencia.

• Se incorpora al resultado final las sublistas seleccionadas mediante la función

“_get_format_result_tuple_sublist()” que impone una condición:

• Ninguna tupla perteneciente a la sublista evaluada puede estar contenida en

una sublista previamente clasificada como “idéntica” (esto prioriza la inclusión

de sublistas “idénticas” al resultado final por sobre las “equivalentes”).

Obtención del perfil de interacciones en cada grupo evaluado:

A cada proteína analizada se le asigna una letra del alfabeto. Se definen dos

grupos de comparación, supongamos grupo 1: (A,B,C) y grupo 2: (D,E,F). Para cada

grupo se establecen todas las combinaciones posibles de comparación entre sus

miembros. Para el grupo 1, éstas serían tres: (AB), (AC), (BC) y (ABC).

Las sublistas de tuplas asignadas a una combinación en particular corresponden a

aquellas conservadas entre las combinaciones que cumplen los siguientes dos criterios:

1) Contener una letra (o proteína) menos que la combinación evaluada.

2) Estar completamente contenida en la combinación evaluada.

Este procedimiento es equivalente a seleccionar las sublistas de tuplas

conservadas entre una combinación que cumple con los dos criterios recién mencionados

y la proteína (o letra) restante para completar la combinación evaluada.

Para asignar sublistas de tuplas de manera exclusiva a cada combinación, las

sublistas que se repiten en combinaciones más grandes son eliminadas de las más

pequeñas. Por ejemplo, las sublistas contenidas tanto en la combinación (AB) como en la

combinación (ABC), son eliminadas de la primera.

Comparación de interacciones entre dos grupos:

En la comparación intergrupal la función “_get_format_result_tuple_sublist” no

impone condiciones para la incorporación de nuevas sublistas de tuplas al resultado. Por

lo tanto, una sublista que contiene una tupla en común con otra sublista proveniente de la

categoría “idéntica”, puede formar parte de las tuplas conservadas en los dos grupos

55

analizados. Esta medida evita la pérdida de información en algunos casos particulares

(ver ejemplo 3 en capítulo 3.2.7.2.5), sin embargo, genera algunos inconvenientes

adicionales. El ejemplo 4 en el capítulo 3.2.7.2.5 ilustra un escenario en el cual el

resultado final de sublistas conservadas presenta sublistas contenidas en otras más

grandes (redundantes), y sublistas que comparten las tuplas provenientes de uno u otro

grupo. Éstas últimas no son detectadas ni tratadas en los pasos anteriores del algoritmo

de comparación ya que las tuplas compartidas no provienen de la misma lista. La

condición que afecta estas listas se denominará en adelante “solapamiento cruzado”.

Para refinar el resultado final de la comparación intergrupal se incorpora al

algoritmo tres etapas de selección adicionales. Estas etapas se describen a continuación

mediante un pseudocódigo:

• Para cada “sublista1” en lista de resultados:

• Se compara esa sublista con todas las otras “sublistas2” que conforman la lista de

resultados a fin de detectar aquellas sublistas que comparten al menos una tupla

con la sublista evaluada.

• Todas las “sublistas2” que comparten al menos una tupla con la “sublista1”

evaluada son almacenadas en una lista provisoria denominada “prov_list1” (este

nombre se aplica sólo en el presente pseudocódigo y no aparece en el código

real).

• La “sublista1” evaluada es incorporada al resultado final procesado sólo si cumple

con los siguientes tres requisitos, por orden de prioridad:

1) Su porcentaje de ocurrencia total (ver definición en capítulo 3.2.7.2.2)

debe corresponder al máximo entre las “sublistas2” almacenadas en

“prov_list1”. Si alguna de las “sublistas2” de “prov_list1” presenta un

mayor porcentaje de ocurrencia total, la evaluación de la “sublista1” se

detiene, ésta no es incorporada al resultado final y el “loop” pasa a la

próxima “sublista1”, sin que se ejecuten las siguientes etapas de

selección. Esto se realiza mediante el comando “continue”. En el caso

de haber varias “sublistas2” en “prov_list1” que presentan el porcentaje

de ocurrencia total máximo junto con la “sublista1”, éstas son

almacenadas en una nueva lista provisoria denominada “prov_list2”.

2) El tamaño de la “sublista1”, es decir el número de tuplas que la

componen, debe corresponder al mínimo entre las “sublistas2” de

“prov_list2”. Si existe alguna “sublista2” en “prov_list2” de menor tamaño

56

que la “sublista1”, la evaluación se detiene, la “sublista1” no es

incorporada al resultado final y el “loop” continúa sin que se ejecute la

siguiente etapa de selección. En el caso de haber varias “sublistas2” en

“prov_list2” compuestas por el número de tuplas mínimo al igual que la

“sublista1”, éstas son almacenadas en una última lista provisoria

denominada “prov_list3”.

3) El parámetro de equivalencia (ver definición en capítulo 3.2.7.2.2) de la

“sublista1” debe corresponder al mínimo entre las “sublistas2” de

“prov_list3”. Si alguna de las “sublistas2” de “prov_list3” presenta un

parámetro de equivalencia menor al de la “sublista1”, la evaluación se

detiene, la “sublista1” no es incorporada al resultado final y el “loop”

continúa. Por el contrario, si se cumple esta última condición, la

“sublista1” es incorporada al resultado final y el proceso se repite para la

próxima “sublista1” de la lista original de resultados.

3.2.7.2.4. Resultados

A partir de la lista de interacciones conservadas en ambos grupos y los

resultados de las comparaciones efectuadas por separado en cada grupo se establecen 6

categorías de resultados:

• Interacciones presentes sólo en grupo 1


• Interacciones más abundantes en grupo 1

• Interacciones más abundantes en grupo 2

• Interacciones totalmente conservadas en ambos grupos

• Interacciones presentes en igual proporción

La función “inter_group_comparator”, además de efectuar la comparación

intergrupal final, clasifica los resultados en 3 categorías iniciales:



• Interacciones presentes en ambos grupos

57

Las “interacciones presentes en ambos grupos” son usadas por la función

“groups_comparison_tuple_list_sorter” para construir las restantes cuatro categorías de

clasificación.

El resultado final es entregado a través de un archivo pdf construido por la

función “pdb_results_generator” utilizando la librería Python de acceso libre, ReportLab

(www.reportlab.org/). Este archivo expone los porcentajes de ocurrencia de cada

interacción en los grupos de comparación y la identidad de los residuos involucrados por

proteína para las 6 categorías señaladas (anexo 4).

Mediante el módulo “cliente_detalle_puente_hidrogeno.py” se genera un

archivo pdf con información más detallada acerca de una interacción en particular

(distancias, ángulos, etc.) (anexo 4).

3.2.7.2.5. Casos particulares

Ejemplo 1: Varias sublistas idénticas en una comparación

En una lista de tuplas conservadas resultante de una comparación, puede

haber dos o más sublistas que contengan una misma tupla. Esto ocurre cuando una tupla

perteneciente a una de las listas comparadas es equivalente a dos o más tuplas en la otra

lista.

Supongamos que:

• En la lista 1 existe la sublista: [(15,125)].

• En la lista 2 existen las sublistas [(10,120)] y [(20,130)].

Como resultado de la comparación de ambas listas, surgirán dos sublistas de

tuplas equivalentes con el mismo valor de parámetro de equivalencia considerando un

valor umbral de 5 (ver “Interacciones equivalentes en capítulo 3.2.7.2.2):

[(10,120),(15,125)] y [(20,130),(15,125)]. Ambas sublistas contienen la tupla (15,125).

Si el resultado anterior es sometido a una nueva comparación con una lista que

contiene la sublista [(15,125)], se detectará dos sublistas que cumplen con los requisitos

para ser clasificadas como “idénticas”.

Ejemplo 2: Clasificación de sublistas equivalentes

Consideremos las dos listas de interacciones siguientes:

58

• Lista 1: [ ..... [(11,121),(13,123)] ...... [(14,124)] ..... ]

• Lista 2: [ ..... [(13,123),(15,125)] ...... ]

El resultado del proceso de comparación sería:

• Sublista A en categoría de tuplas “semi-idénticas”: [(11,121),(13,123),(15,125)].

• Sublista B en categoría de tuplas “no-idénticas”: [(14,124),(13,123),(15,125)].

A y B comparten la misma sublista proveniente de la lista 2 ([(13,123),(15,125)]),

por lo que si no estuvieran clasificadas en dos categorías independientes, sus parámetros

de equivalencia serían comparados por la función “common_tuples_list_filler” con el

objetivo de seleccionar el menor. En este escenario, se seleccionaría sólo la sublista B

con parámetro de equivalencia igual a 1, y la sublista A, con parámetro de equivalencia

igual a 2, quedaría fuera del resultado a pesar de compartir una tupla con una sublista de

la lista 2.

La clasificación y tratamiento independiente de sublistas “semi-idénticas” y “no-

idénticas” permite evitar esta pérdida de información.

Ejemplo 3: Incorporación de nuevas sublistas de tuplas al resultado de la comparación

intergrupal

Consideremos 4 proteínas A, B, C y D; y dos grupos de comparación, grupo 1: (AB) y

grupo 2: (CD); con las interacciones siguientes:

• A: [(116,113)]

• B: [(115,112)]

• C: [(115,112)] y [(116,113)]

• D: [(115,111)]

El resultado del proceso de comparación para cada grupo sería:

• Grupo 1: [(116,113),(115,112)]

• Grupo 2: [(115,112),(115,111)] y [(116,113)]

La potencial sublista [(116,113),(115,111)] en el grupo 2 se descarta del resultado

ya que es comparada directamente con la sublista [(115,112),(115,111)], que pertenece a

la misma clasificación (ver ejemplo 2) y presenta un parámetro de equivalencia menor.

Por esta razón queda seleccionada en el resultado la sublista [(116,113)], presente sólo

en la proteína C.

Si la comparación final intergrupal se realizara bajo las mismas condiciones que

las comparaciones en el seno de cada grupo, surgiría la sublista [(116,113),(115,112)]

59

(producto de la comparación entre la sublista [(116,113),(115,112)] del grupo 1 y la

sublista [(116,113)] del grupo 2) clasificada como “idéntica” . Esto impediría la

incorporación de la potencial sublista [(116,113),(115,112),(115,111)] al resultado final

(ver condición impuesta por la función “_get_format_result_tuple_sublist()” en el capítulo

3.2.7.2.3).

El escenario recién descrito genera errores en la asignación de porcentajes de

ocurrencia a las interacciones en cada grupo. En efecto, la sublista [(115,112),(115,111)]

resultante de la comparación en el grupo 2, al no estar representada en la comparación

intergrupal, a través de la sublista [(116,113),(115,112),(115,111)], aparecería clasificada

en la categoría “Interacciones presentes sólo en grupo 2” (ver capítulo 3.2.7.2.4). Sin

embargo, esta sublista contiene la tupla (115,112) existente en la proteína B del grupo 1.

Para evitar inconvenientes como el recién descrito, la función

“_get_format_result_tuple_sublist” no impone condiciones para la incorporación de nuevas

sublistas de tuplas al resultado en la comparación intergrupal.

Ejemplo 4: Comparación intergrupal sin imponer condición establecida en función

“_get_format_result_tuple_sublist”.

Consideremos 4 proteínas A, B, C y D; y dos grupos de comparación, grupo 1: (AB) y

grupo 2: (CD); con las interacciones siguientes:

• A: [(294,276)], [(294,277)] y [(279,292)]

• B: [(294,276)], [(294,277)] y [(279,292)]

• C: [(294,276)], [(294,277)] y [(279,292)]

• D: [(294,276)], [(294,277)] y [(279,292)]

El resultado del proceso de comparación para cada grupo sería:

• Grupo 1: [(294,276)], [(294,277)] y [(279,292)]

• Grupo 2: [(294,276)], [(294,277)] y [(279,292)]

El resultado de la comparación intergrupal, que no impone la condición establecida en la

función “_get_format_result_tuple_sublist” sería:

• Sublista A: [(294,276)] presente en el 100% de las proteínas

• Sublista B: [(294,277)] presente en el 100% de las proteínas

• Sublista C: [(279,292)] presente en el 100% de las proteínas

• Sublista D: [(294,276),(294,277)] presente en el 100% de las proteínas

• Sublista E: [(294,277),(279,292)] presente en el 100% de las proteínas

60

Las sublistas A, B y C están contenidas en las sublistas D y E, lo que genera

redundancia.

Las sublistas D y E comparten una tupla que proviene del grupo 2 en el caso de D

y del grupo 1 en el caso de E. Esta condición se denomina “solapamiento cruzado”.

3.2.8. Cultivo de microorganismos

3.2.8.1. Mantención de microorganismos

Para ser almacenadas por períodos cortos, las cepas de E. coli se crecieron

O.N. a 37 °C en placas con medio sólido LB suplementado con ampicilina o carbenicilina

cuando era requerido. Estos cultivos se mantuvieron a 4°C y se renovaron cada 30 días.

Para almacenamientos por períodos mayores a 30 días, las cepas se crecieron O.N. en

medio líquido LB suplementado con antibióticos cuando era requerido. Los cultivos se

criopreservaron a -80°C en el mismo medio, suplementado con glicerol al 25% v/v.

3.2.8.2. Crecimiento de cepas en cultivos líquidos

Las cepas de E. coli se inocularon en los medios correspondientes y se

incubaron a 37ºC en un agitador orbital (MaxQ 4000, Barnstead, Lab-Line, Iowa, USA)

hasta alcanzar la D.O. deseada.

3.2.9. Extracción de DNA plasmidial

El DNA plasmidial se extrajo a partir de un cultivo en 4 mL de medio LB

incubado por 16 h a 37ºC y 200 rpm. Para esto se utilizó el kit QIAprep Spin Miniprep

(QIAGEN). Este kit está basado en el método de lisis alcalina (Birnboim y Doly, 1979), y

en la unión específica del ADN a sílica en presencia de una elevada concentración salina.

El protocolo consta de tres etapas principales: lisis celular con SDS y NaOH, adsorción

del ADN a una columna de sílica y lavado/elución del ADN. La extracción se realizó según

las instrucciones del fabricante.

61

3.2.10. Mutaciones sitio-dirigidas

Para realizar mutaciones sitio-dirigidas se utilizó un procedimiento basado en

el método del kit QuikChange (Stratagene). Este método permite mutar secuencias de

DNA en una gran variedad de plásmidos sin requerir sitios de restricción específicos o

múltiples etapas de clonamiento.

Mediante una reacción de PCR utilizando 2 partidores complementarios entre

sí que contienen la mutación, se amplifica directamente el DNA plasmidial

sobreenrrollado. Para esto se empleó la enzima KOD Hot Start DNA polimerasa

(Novagen). Al término de los ciclos de amplificación se obtiene una población de

plásmidos mutantes con cortes en el extremo 5’ de cada primer. La mezcla de reacción se

somete a una digestión con Dpn I, una endonucleasa de restricción que reconoce sólo

DNA metilado o hemi-metilado. Durante esta etapa se degrada en forma selectiva el

plásmido original usado como templado, que al provenir de una cepa de E. coli dcm+

(BL21 (DE3)), se encuentra metilado. Los plásmidos cortados que contienen los genes

mutantes se transforman en una cepa de E. coli receptora, donde son reparados. Para

comprobar el éxito del procedimiento, se extrae el DNA plasmidial de colonias

seleccionadas y se constata la presencia de la mutación mediante secuenciación.

3.2.11. Amplificación del DNA por PCR

En este trabajo se utilizó la reacción en cadena de la polimerasa (PCR) para

amplificar y clonar la secuencia del módulo catalítico de las celulasas estudiadas, evaluar

la presencia de inserto en colonias aisladas resultantes de los procesos de clonación y

generar mutantes sitio-dirigidas mediante el método descrito en el punto anterior.

3.2.11.1. Partidores

Los partidores utilizados en este trabajo se resumen en la tabla 2. Las Tm se

calcularon mediante la siguiente relación, recomendada en el manual del kit QuikChange

(Stratagene):

62

donde

!

%GC es el porcentaje de guaninas y citosinas en la secuencia,

!

N es el

largo del partidor en número de nucleótidos y

!

%PBNA es el porcentaje de bases no

apareadas. Es recomendable que las Tm de los partidores mutagénicos sean iguales o

superiores a 78 °C.

Todos los oligonucleótidos se mandaron a sintetizar a Fermelo y Macrogen

(Corea).

NOMBRE SECUENCIA (5’→ 3’) Ta (°C)

CEL5A-MC-NDEI-FW CATATGGTTGTAGAAGAACATGGGCAATTAAG 55

CEL5A-MC-XHOI-RV CTCGAGTGGCGGAATAGATGCTGATTCTC 55

Y134-CEL5A-FW CCGAATGTGATATACGAAATTTACAATGAACCGAATGGTAGTGATG 59

Y134-CEL5A-RV CATCACTACCATTCGGTTCATTGTAAATTTCGTATATCACATTCGG 59

F134-CEL5A-FW CCGAATGTGATATACGAAATTTTCAATGAACCGAATGGTAGTGATG 59

F134-CEL5A-RV CATCACTACCATTCGGTTCATTGAAAATTTCGTATATCACATTCGG 59

I99A-CEL5A-FW GTGATCATTGATTGGCATGCCCTTTCAGACAATGACCC 59

I99A-CEL5A-RV GGGTCATTGTCTGAAAGGGCATGCCAATCAATGATCAC 59

N138L-CEL5A-FW AATGAACCGCTTGGTAGTGATGTTACGTGGGGC 59

N138L-CEL5A-RV GCCCCACGTAACATCACTACCAAGCGGTTCATT 59

Tabla 2. Partidores. En los partidores Cel5A-MC-NdeI-Fw y Cel5A-MC-XhoI-Rv, los nucleótidos destacados con letra gruesa corresponden a las secuencias de reconocimiento de las enzimas de restricción NdeI y XhoI, respectivamente. En los partidores mutagénicos, los codones destacados con letra gruesa corresponden a los residuos modificados. Ta: temperatura de “annealing” usada en los programas de PCR.

!

Tm

= 81,5 + 0,41 %GC( ) " 675 N "% PBNA (35)

63

3.2.11.2. Mezclas de reacción

Las mezclas de reacción utilizadas para los ensayos de PCR con Taq DNA

polimerasa y KOD Hot Start DNA polimerasa se detallan en la Tabla 3.

TAQ DNA POLIMERASA KOD HOT START DNA POLIMERASA

COMPONENTE CANTIDAD COMPONENTE CANTIDAD

Buffer 5x 10 µl Buffer 10x 2 µl

MgCl2 (25 mM) 4 µl MgSo4 (25 mM) 0,8 µl

dNTP (10 mM) 1 µl dNTP (10 mM) 0,4 µl

Partidor 1 (10 mM) 2 µl Partidor 1 (10 mM) 0,8 µl

Partidor 2 (10 mM) 2 µl Partidor 2 (10 mM) 0,8 µl

DNA templado 2 µl DNA templado 2 µl

Taq DNA polimerasa 1 µl KOD Hot Start DNA polimerasa 0,5 µl

H2O 28 µl H2O 12,7 µl

TOTAL 50 µL TOTAL 20 µL

3.2.11.3. Programas

El programa de PCR utilizado para generar mutaciones sitio-dirigidas con la

enzima KOD Hot Start DNA polimerasa consistió en una etapa de activación de la

polimerasa (2 min a 95°C), 30 ciclos de amplificación (45 s a 95°C, 45 s a la Ta elegida

(ver Tabla 2) y 9 min a 70°C) y un ciclo de extensión final (10 min a 70°C).

Para todos los PCR realizados con la enzima Taq DNA polimerasa se utilizó el

mismo programa pero con una temperatura y tiempo de extensión de 72°C y 1 min 30 s,

respectivamente. Los programas se llevaron a cabo en un termociclador Eppendorf

Mastercycler gradient.

Tabla 3. Mezclas de reacción para Taq DNA polimerasa y KOD Hot Start DNA polimerasa.

64

3.2.12. Electroforesis de DNA

Las muestras se mezclaron en proporción 5:1 con buffer de carga 6X (glicerol

30% p/v y azul de bromofenol 0,25% p/v) y se cargaron en geles de agarosa al 0,8%

preparados con buffer TAE (Tris 40 mM, acetato 20 mM y EDTA 1 mM) y bromuro de

etidio 0,2 µg/mL. Las electroforesis se realizaron en una cámara horizontal Horizon-58

(Gibco-BRL Life Technologies, Inc., MA-USA) con un voltaje constante de 100 V generado

por una fuente de poder modelo 500 de BRL Life Technologies, Inc., MD-USA. Se empleó

TAE como buffer de corrida. Las bandas de DNA se visualizaron mediante un

transiluminador UV.

3.2.13. Purificación de DNA a partir de geles de agarosa

La extracción y purificación de DNA desde geles de agarosa se realizó

mediante el kit QIAEX II Gel Extraction (Qiagen), según las instrucciones del fabricante.

3.2.14. Digestión del DNA

Para digerir el DNA plasmidial se usó las endonucleasas de restricción

indicadas en los procedimientos, según protocolos estándares (Ausubel et al., 1992).

3.2.15. Reacciones de ligación

Las ligaciones en el vector de clonamiento pGEM-T Easy (Promega) se

realizaron de acuerdo a las instrucciones del fabricante usando los reactivos

suplementados en el kit.

Las ligaciones en el vector de expresión pET22b(+) se efectuaron mediante el

sistema T4 DNA ligasa (Invitrogen) de acuerdo a las instrucciones del fabricante.

Las mezclas de reacción, con un volumen final de 10 µl, se incubaron O.N. a

16 °C.

Se usó 1 µl de la mezcla de reacción para transformar las cepas de E. coli.

65

3.2.16. Preparación de células electrocompetentes

Se inoculó 10 mL de medio SOB con una colonia de la cepa requerida y se

creció el cultivo a 37ºC con agitación durante 16 h. Se midió la densidad óptica (D.O) del

cultivo a una longitud de onda de 620 nm, utilizando como blanco medio estéril, y se

inoculó 1 L de medio estéril fresco con el volumen adecuado para establecer una D.O620

inicial de 0,05. Se incubó el cultivo a 37ºC con agitación hasta alcanzar un valor de D.O620

entre 0,6 y 0,8 (2-4 h). El cultivo se enfrió en hielo durante 10 min y se centrifugó a 5.000

x gv

y 4ºC durante 10 min (centrífuga Sorvall® RC-28S y rotor GS-3 Sorvall®, DuPont,

CT, USA). El precipitado se lavó 4 veces con glicerol 10% v/v estéril preparado en agua

Milli-Q. Luego del último lavado, el precipitado se resuspendió en el residuo de glicerol, y

se alicuotó en volúmenes precisos para su utilización (entre 25 y 100 µL). Las células

electrocompetentes se almacenaron a -80ºC.

3.2.17. Transformación de células electrocompetentes

Se agregó 1 µL de mezcla de ligación sobre 20 µL de células

electrocompetentes. La electroporación se realizó en un equipo Cell-Porator®

Electroporation System (Gibco-BRL Life Technologies, Inc., MD-USA) bajo las siguientes

condiciones: 420 V, 330 µF, baja impedancia, tasa de carga rápida y tiempo máximo de

2,5 mseg. Las células transformadas se mezclaron con 1 mL de medio LB precalentado a

37ºC y se incubaron con agitación (200 rpm) a la misma temperatura, durante 1 h. Se

plaqueó entre 20 y 100 µL del precultivo en placas selectivas de medio LB suplementado

con carbenicilina (100 µg/mL). El volumen restante de precultivo se centrifugó a 13.000

rpm (centrífuga Eppendorf 5403 de Eppendorf AG, Hamburgo, Alemania) durante 1 min y

se descartó 850 µL de sobrenadante. El precipitado se resuspendió en el medio

remanente y se plaqueó 50 µL de la suspensión en las placas de medio selectivo ya

descritas. Este procedimiento permite cubrir un rango de concentraciones celulares

amplio, lo que aumenta las probabilidades de obtener un número aceptable de colonias

aisladas.

66

3.2.18. PCR de colonias

Este procedimiento permite evaluar en forma rápida y eficiente la presencia de

determinados genes en colonias de células aisladas. Las colonias se transfirieron

paralelamente, mediante una punta amarilla estéril, a una placa con medio LB agar

suplementado con carbenicilina para ser almacenadas, y a un tubo Eppendorf con 100 µL

de agua Milli-Q estéril. La suspensión resultante en el tubo Eppendorf se incubó a 100ºC

durante 10 min para inducir la lisis celular y se centrifugó a 13.000 x gv

por 1 min. El

sobrenadante se usó como DNA templado en una reacción de PCR con Taq DNA

polimerasa y los partidores adecuados para amplificar el gen requerido (Tabla 3). El

resultado de la amplificación se analizó mediante electroforesis en gel de agarosa.

3.2.19. Clonamiento del dominio catalítico de la celulasa Cel5A en el plásmido de

expresión pET22(+)

La secuencia de ADN codificante para la celulasa Cel5A se clonó en el

plásmido de expresión pET22b(+) sin el péptido señal pelB en el extremo amino terminal.

La secuencia de DNA codificante para el módulo catalítico de la celulasa

mesofílica Cel5A (Cel5A-MC) se amplificó desde el DNA total de Bacillus agaradherans

AC 13 (ATCC 700163) mediante PCR de colonias usando KOD Hot Start DNA

polimerasa. En este procedimiento se utilizó la pareja de partidores Cel5A-MC-NdeI-

Fw/Cel5A-MC-XhoI-Rv, que incorpora sitios de corte para las endonucleasas NdeI y XhoI

en los extremos 5’ y 3’ de la secuencia amplificada, respectivamente. Los sitios de corte

mencionados permiten incorporar la secuencia de Cel5A-MC en el vector de expresión

pET22b(+) sin la secuencia del péptido señal pelB en el extremo 5’ y justo antes de la cola

de poli-histidina.

El resultado de la amplificación se ligó al vector de clonación pGEM-T Easy y

se incorporó a células de E. coli DH5α electrocompetentes mediante electroporación. La

presencia de inserto en las colonias resultantes se determinó por PCR de colonias. Se

seleccionó colonias con inserto y se les extrajo el DNA plasmidial. Este DNA se digirió con

las enzimas de restricción correspondientes (NdeI y XhoI), los fragmentos producidos se

separaron mediante electroforesis en gel de agarosa, se purificaron y se ligaron en

pET22b(+) previamente digerido y purificado de manera homóloga. La mezcla de ligación

67

se transformó en células de E. coli BL21(DE3). Se seleccionó 3 colonias con inserto por

PCR de colonias, se extrajo su DNA plasmidial y se comprobó la presencia del gen

deseado mediante secuenciación.

Las células de E. coli BL21(DE3) son lisógenos del fago λDE3, y por lo tanto

cuentan con una copia cromosomal del gen de la RNA polimerasa del fago T7, bajo el

control del promotor lacUV5 (inducido por IPTG). Producto de esto, representan un

huésped adecuado para la expresión de proteínas recombinantes mediante el sistema

pET22(+).

3.2.20. Producción recombinante de las celulasas

3.2.20.1. Inducción de la síntesis de proteínas recombinantes

Se inoculó una colonia de células BL21(DE3) recombinantes, que contienen el

vector pET22b(+) con el gen de interés, en 8 ml de medio Molitor suplementado con

carbenicilina. El cultivo se creció a 37°C O.N con agitación de 200 rpm. Se inició un nuevo

cultivo en 400 ml del mismo medio fresco inoculando la totalidad del pre-cultivo O.N, y se

creció en las mismas condiciones. Al alcanzar una O.D600 de 1,45 (aproximadamente 6 h),

el cultivo se separó en dos fracciones idénticas de 200 ml. Una fracción se usó como

control sin inducir y la otra se indujo agregando IPTG a una concentración final de 0,5

mM. Las fracciones se incubaron O.N a 18°C bajo las mismas condiciones de agitación.

3.2.20.2. Purificación de las proteínas recombinantes

Las células se recolectaron mediante centrifugación a 5.000 x gv

por 10 min

(centrífuga Sorvall® RC-28S y rotor GS-3 Sorvall®, DuPont, CT, USA). El sobrenadante, o

fracción extracelular, se descartó. El sedimentado, que contiene las fracciones

intracelulares solubles e insolubles se resuspendió en 10 ml de buffer de unión (NaCl 300

mM, NaH2PO4 50 mM, Imidazol 4 mM, pH 8), se sonicó (Sonicador Microson, Equilab) en

baño de hielo con 5 pulsos de 30 s aplicando potencia máxima, y se centrifugó a 10.000 x

gv

durante 30 min. El sobrenadante, que corresponde a la fracción intracelular soluble, se

guardó a 4°C para ser usado en los pasos posteriores de purificación.

68

Las celulasas recombinantes se purificaron por afinidad mediante una resina

de níquel (Ni-NTA superflow, QIAGEN), siguiendo la instrucciones del proveedor. Esta

resina interactúa con la cola de poli-histidina incorporada por el sistema de expresión

pET22b(+). Se agregó 0,5 ml de resina al sobrenadante obtenido en la etapa anterior y se

incubó la mezcla en baño de hielo durante 2 h con agitador magnético suave.

Posteriormente la resina se empacó en una columna, se lavó con 4 ml de buffer de unión

y se eluyó con 2,5 ml de buffer de elución (NaCl 300 mM, NaH2PO4 50 mM, Imidazol 250

mM, pH 8). La pureza de las proteínas recombinantes fue evaluada mediante

electroforesis (SDS-PAGE).

3.2.21. Electroforesis de proteínas (SDS-PAGE)

Las separaciones electroforéticas en condiciones desnaturantes se realizaron

en una cámara vertical MiniProtean II (Bio-Rad Laboratories Inc., CA-USA). Las muestras

se mezclaron en proporción 4:1 con buffer de carga 5X (Tris/HCl 60 mM, glicerol 25% v/v,

SDS 2% p/v, 2-mercaptoetanol 14,4 mM y azul de bromofenol 0,1% p/v pH 6,8), se

desnaturaron mediante incubación a 100°C durante 5 min y posteriormente se cargaron

en geles de acrilamida/bis-acrilamida preparados de acuerdo a los procedimientos

estándares (Bollag et al., 1996). Las electroforesis se realizaron bajo voltaje constante de

200 V (fuentes de poder Power Pac 1000 de Bio-Rad Laboratories Inc., CA-USA o Power

Supply EPS 3500XL de Pharmacia Biotech AB, Uppsala, Suecia). Como buffer de corrida

se utilizó Tris-glicina-SDS (Tris 25 mM, glicina 192 mM y SDS 0,1% p/v) (Bollag et al.,

1996).

Para visualizar las proteínas, cada gel se tiñó durante 30 min en una solución

de tinción Coomasie (45% metanol, 10% ácido acético, 45% agua destilada y 1 g de azul

de Coomasie), y se destiñó en una solución de destinción (45% metanol, 10% ácido

acético, 45% agua destilada) hasta la aparición de bandas bien definidas (30-60 min).

3.2.22. Determinación de la concentración de proteínas

La concentración de proteína se determinó mediante un ensayo de Bradford

(Bradford, 1976) modificado, para lo cual se mezcló: 1,2 mL de agua destilada, 0,5 mL de

69

Coomassie 1 g/L preparado en HCl 2,2% v/v y 50 µL de muestra o proteína estándar de

calibración. Se midió la absorbancia de la mezcla a 465 (abs465) y 595 nm (abs595) y se

calculó la razón abs595/ abs465. El valor control obtenido en ausencia de proteína se restó a

todos los resultados. Las cuantificaciones se realizaron en base a una curva de

calibración con BSA (seroalbúmina de bovino) en un rango de concentraciones entre 0,06

y 1 mg/mL.

A pesar de los pasos de purificación, las proteínas recombinantes se

obtuvieron mezcladas con bajas concentraciones de otras proteínas contaminantes. Por lo

tanto, para determinar su concentración a partir de la información generada por los

ensayos de Bradford fue necesario establecer su porcentaje en relación al total. Para esto

se utilizó el programa Gel-Pro Analyzer versión 4 (Media Cybernetics, L.P. 1996-2000),

que permite obtener una imagen digitalizada de los geles de poliacrilamida o agarosa y

calcular el porcentaje representado por cada banda. En todos los casos el nivel de pureza

de las proteínas recombinantes superó el 50% (entre 50% y 60%).

3.2.23. Ensayos de actividad enzimática

Para medir la actividad de las celulasas recombinantes, se usó el sustrato

sintético p-nitrofenil-β-D-celobiósido (pNFC), cuya hidrólisis genera p-nitrofenol (pNF), un

compuesto amarillo de fácil detección por medio de espectrofotometría.

Se mezcló 45 µl de pNFC 20 mM preparado en buffer Hepes 50 mM (pH 7,5)

con 5 µl de celulasa purificada. Se incubó la mezcla de reacción a una temperatura

determinada, en el rango entre 10°C y 40°C, usando un termociclador Eppendorf

Mastercycler gradient como incubador, hasta la aparición de color amarillo. La enzima se

inactivó agregando 100 µl de Na2CO3 1M. Se traspasó una alícuota de 100 µl a

microplacas desechables de 96 pocillos (Falcon 3912) para determinar su absorbancia a

405 nm en un lector de placas (Anthos 2010). La variación de absorbancia durante el

período de incubación en todos los ensayos mostró un comportamiento lineal.

La concentración de pNF generado se calculó a partir de los valores de

absorbancia, en base a una curva de calibración construida con distintas concentraciones

del mismo compuesto. A todos los valores experimentales obtenidos se les restó el valor

del blanco, consistente en la mezcla de reacción sin enzima y sometida a los mismos

tratamientos que las muestras.

70

La actividad enzimática se expresó en µmoles de pNF liberados por litro de

reacción y por minuto (

!

µmoles min.L ). La actividad específica corresponde a la actividad

por mg de enzima.

3.2.24. Determinación de los parámetros cinéticos de las enzimas recombinantes

Los parámetros cinéticos

!

VMAX

y

!

Km

se calcularon mediante una regresión no

lineal de las curvas de saturación (velocidad de reacción v/s concentración de sustrato)

usando la ecuación cinética de Michaelis-Menten.

La

!

kCAT

se calculó en base a las ecuaciones siguientes:

donde

!

VMAX

es la velocidad máxima de conversión de sustrato y

!

E[ ]saturada

es

la concentración de enzima en condiciones saturantes.

3.2.25. Determinación de los parámetros termodinámicos de activación

La energía de activación

!

Ea de las reacciones enzimáticas se calculó a partir

de la pendiente de gráficos de Arrhenius.

Aplicando logaritmo a la ecuación de Arrhenius (ecuación 70 anexo I) se

obtiene:

!

VMAX

= kCAT. E[ ]

saturada (36)

!

kCAT

=VMAX

E[ ]saturada

(37)

!

log kCAT ="Ea

RT+ logA (38)

71

En un gráfico de Arrhenius, que expone la dependencia del logaritmo de la

constante catalítica en función de la inversa de la temperatura, la pendiente corresponde

a

!

"EaR .

Los parámetros termodinámicos de activación se calcularon usando las

siguientes ecuaciones (Lonhienne et al., 2000):

3.2.26. Modelamiento estructural del dominio catalítico de CelA8

La estructura 3D del dominio catalítico de la celulasa psicrofílica CelA8 se

determinó mediante modelación por homología, a través del programa de acceso libre

MODELLER versión 8v2 (Sali y Blundell, 1993), usando como templado la secuencia y

estructura de la celulasa psicrofílica de Pseudoalteromonas haloplanktis, Cel5G (Violot et

al., 2005). Las secuencias que codifican para los módulos catalíticos de las celulasas

Cel5G y CelA8 presentan un alto porcentaje de identidad (88%). Esto permitió obtener un

alineamiento de buena calidad usando el programa ClustalW (Higgins y Sharp, 1988), que

no requirió modificaciones posteriores. Para ser usado por el programa MODELLER, el

alineamiento de secuencias debe ser presentado en formato pir.

El módulo “CelA8.py” contiene el código en lenguaje Python utilizado para

generar 50 modelos candidatos. La calidad de los modelos se evaluó mediante el

programa de libre acceso VERIFY3D (Bowie et al., 1991; Lüthy et al., 1992). Este

programa evalúa el ambiente estructural de cada aminoácido y establece un parámetro de

calidad usando como referencia información extraída desde estructuras correctamente

plegadas. Se eligió el modelo candidato de mejor calidad.

!

"G# = RT ln k

BT h( ) # ln kCAT[ ]

!

"H#

= Ea# RT

!

"S# = "H

## "G

#( ) T

(39)

(40)

(41)

72

4. Resultados

Se realizó un análisis estructural comparativo del dominio catalítico de 5

celulasas adaptadas a distintos rangos de temperaturas: una celulasa termofílica, Cel5B,

de Thermobifida fusca (código PDB: 2CKS), 2 celulasas mesofílicas, Cel5 (ex CelZ) de

Erwinia chrysanthemi (código PDB: 1EGZ) (Chapon et al., 2001) y Cel5A de Bacillus

agaradherans (código PDB: 1QHZ) (Davies et al., 1998; Varrot et al., 2000), y 2 celulasas

psicrofílicas, Cel5G de Pseudoalteromonas haloplanktis (código PDB: 1TVN) (Violot et al.,

2005) y CelA8, aislada en nuestro laboratorio desde una cepa de Pseudoalteromonas de

origen marino antártico.

Debido a la carencia de información estructural experimental sobre la celulasa

psicrofílica CelA8, fue necesario confeccionar un modelo por homología de la

conformación tridimensional de su dominio catalítico (ver capítulo 3.2.26).

Todas las estructuras estudiadas son homólogas. Pertenecen a la familia 5

(sub-familia 2) de las glicósido-hidrolasas y comparten el mismo plegamiento (ver capítulo

1.8). Las diferencias estructurales son sutiles y se concentran principalmente a nivel de

los “loops” (Figura 6). Esto posibilita la realización de análisis comparativos. La Tabla 4 y

la Tabla 5 exponen los datos de similitud de secuencia y estructural, respectivamente,

entre cada una de las enzimas.

Cel5A (M) Cel5B (T) Cel5G (P) CelA8 (P)

Cel5 (M) 47 % 36 % 64 % 66 %

Cel5A (M) - 38 % 42 % 40 %

Cel5B (T) - - 33 % 34 %

Cel5G (P) - - - 88 %

Tabla 4. Porcentaje de identidad de secuencia entre las celulasas Cel5, Cel5A, Cel5B, Cel5G y CelA8. Se especifica la naturaleza psicrofílica (P), mesofílica (M) o termofílica (T) de cada enzima.

73

Cel5A (M) Cel5B (T) Cel5G (P) CelA8 (P)

Cel5 (M) 0,89 (90%) 1,09 (88%) 0,58 (98%) 0,60 (98%)

Cel5A (M) - 1,04 (92%) 0,89 (90%) 0,88 (90%)

Cel5B (T) - - 1,11 (86%) 1,13 (87%)

Cel5G (P) - - - 0,15 (100%)

Tabla 5. Valor de la raíz de la desviación cuadrada promedio (root mean square deviation, rmsd) en angstrom (Å) de la superposición estructural de las celulasas Cel5, Cel5A, Cel5B, Cel5G y CelA8. Los valores entre paréntesis corresponden al porcentaje de átomos equivalentes considerados para el cálculo, en base a la secuencia más larga. La superposición se efectuó a través del programa Swiss PDB Viewer (Guex y Peitsch, 1997; Guex et al., 1999). Se especifica la naturaleza psicrofílica (P), mesofílica (M) o termofílica (T) de cada enzima.

Figura 6. Superposición estructural de las celulasas Cel5 (café), Cel5A (azul), Cel5B (rosado), Cel5G (violeta) y CelA8 (naranja). La figura se confeccionó mediante el programa PyMOL (DeLano, 2002).

74

La celulasa Cel5A, usada en este trabajo como modelo experimental, presenta

actividad en un rango amplio de pH (Figura 7). El pH óptimo de esta enzima, bajo las

condiciones experimentales impuestas, se sitúa entre 6 y 7. Sin embargo, con el fin de

poder establecer equivalencias, los ensayos de actividad se realizaron tal como los

describieron previamente Garsoux et al. al caracterizar las celulasas Cel5 y Cel5G

(Garsoux et al., 2004).

Cel5A ha sido ampliamente caracterizada desde el punto de vista estructural,

representando un modelo para el estudio de la relación estructura-función en glicósido-

hidrolasas de la familia 5 (Davies et al., 1998; Varrot et al., 2000; Varrot y Davies, 2003).

En contraste, los parámetros vinculados con su actividad catalítica a distintas

temperaturas no son conocidos.

Figura 7. Efecto del pH en la actividad de Cel5A. Los buffers usados para los distintos rangos de pH fueron: citrato 50 mM (pH 4-5), fosfato 50 mM (pH 6-8), glicina/NaOH 50 mM (pH 9-10).

75

4.1. Parámetros vinculados con la actividad de Cel5A a distintas temperaturas

Se comparó el comportamiento catalítico de Cel5A con el de Cel5 y Cel5G en

función de la temperatura utilizando datos cinéticos de Cel5 y Cel5G extraídos de la

literatura (Garsoux et al., 2004; Sonan et al., 2007). La celulasa Cel5A presenta una

actividad notablemente superior a la de Cel5 en todo el rango de temperaturas estudiado.

La diferencia se acentúa a medida que aumenta la temperatura. A 40°C la actividad de

Cel5A es 50 veces más alta que la de Cel5. Con respecto a su homóloga psicrofílica

Cel5G, la situación es similar, aunque las diferencias son menores. Particularmente,

alrededor de los 10°C las actividades de ambas enzimas tienden a igualarse y

eventualmente, siguiendo la tendencia observada, Cel5G podría superar a Cel5A a

temperaturas aún más bajas. Esto concuerda con la naturaleza psicrofílica de Cel5G

(Figura 8). Las actividades catalíticas de Cel5 y Cel5G son menos sensibles a los cambios

de temperatura en relación a Cel5A.

La Ea influye fuertemente sobre la relación entre la velocidad de una reacción

y la temperatura (Ver ecuación de Arrhenius, capítulo 1.5.5 y sección 7 en anexo I).

Según la ecuación de Arrhenius, un descenso en el valor de la Ea provocaría un aumento

de la constante catalítica de la reacción. Sin embargo, esto no se cumple en el caso de

Cel5, que a pesar de presentar una Ea menor que Cel5A, también es menos activa. La

respuesta a lo anterior se encuentra en la Tabla 6. De acuerdo a la teoría del estado de

transición, la mayor contribución a la constante catalítica (kcat) proviene de la energía libre

de activación (

!

"G# ) y la temperatura, por encontrarse estos términos en el factor

exponencial (Benkovic y Hammes-Schiffer, 2003). La clásica ecuación de Gibbs-

Helmholtz (ecuación 16 anexo I),

!

"G° = "H°#T"S°, define la relación entre la energía

libre, la entalpía y la entropía. Considerando lo anterior, se observa que Cel5A compensa

el efecto negativo de altas Ea y

!

"H# sobre su actividad, aumentando

!

"S# (Tabla 6).

Aunque todas las celulasas consideradas en este estudio comparten el mismo mecanismo

de catálisis, Cel5A parece seguir una estrategia distinta. La catálisis efectuada por Cel5A

aparece favorecida entrópicamente, mientras que la catálisis efectuada por Cel5 y Cel5G

es dominada mayoritariamente por factores entálpicos.

En esta tesis se supone que la adaptación de la actividad de las enzimas a

distintas temperaturas está ligada principalmente a cambios en la flexibilidad de su

estructura. Con el fin de detectar aspectos estructurales vinculados al proceso de

76

adaptación mencionado, se realizó una serie de estudios comparativos considerando

diferencias estructurales asociadas con la dinámica molecular. Los parámetros

investigados fueron las interacciones electrostáticas (puentes de hidrógeno y puentes

salinos), la compactación estructural y las fluctuaciones atómicas, calculadas mediante

análisis de modos normales. Estos parámetros se determinaron y compararon usando

algoritmos originales.

Figura 8. Efecto de la temperatura sobre la actividad catalítica de Cel5 (naranja), Cel5G (celeste) y Cel5A (azul) con pNFC. Los datos para Cel5 y Cel5G fueron extraídos de la literatura (Garsoux et al., 2004; Sonan et al., 2007).

Tabla 6. Parámetros termodinámicos de activación para la hidrólisis enzimática de pNFC a 30°C. Los datos para Cel5 y Cel5G fueron extraídos de la literatura (Garsoux et al., 2004; Sonan et al., 2007).

Celulasa Ea (kJ/mol) (kJ/mol) (kJ/mol) (J/mol °K)

Cel5A 103,2 71,1 100,8 101,3

Cel5 68,1 79,5 65,6 -46,0

Cel5G 48,5 73,8 46,0 -91,9!

"G#

!

"H#

!

"S#

77

4.2. Algoritmos de comparación

Se desarrolló algoritmos que permiten comparar parámetros entre residuos

equivalentes pertenecientes a proteínas homólogas clasificadas en dos grupos según

características de interés. Estos algoritmos identifican los residuos equivalentes a partir de

información extraída desde alineamientos estructurales múltiples (en formato ClustalW).

El algoritmo diseñado para comparar puentes de hidrógeno, además de

detectar interacciones que involucran residuos en posiciones idénticas, es capaz de

reconocer interacciones equivalentes, cuya posición varía levemente entre una estructura

y otra. Esto permite lidiar con la ocurrencia de cambios posicionales irrelevantes.

4.3. Estudio comparativo e identificación de residuos candidatos para

mutagénesis

La celulasa Cel5A, sorpresivamente exhibe características que la diferencian

claramente con respecto a las celulasas Cel5 y Cel5G. Estas propiedades motivaron un

análisis más profundo. Para poder identificar posiciones claves en la estructura de Cel5A,

relacionadas con sus características catalíticas distintivas, se investigó los aspectos

estructurales que la diferencian de sus homólogas Cel5, Cel5G y CelA8. De igual manera,

aprovechando la misma plataforma analítica, se estudió los aspectos distintivos de Cel5G

y CelA8 potencialmente responsables de su adaptación a bajas temperaturas. Los

resultados fueron usados para definir mutaciones sitio-dirigidas.

La información disponible acerca de las capacidades cinéticas de la celulasa

termofílica Cel5B es escasa, razón por la cuál no conviene utilizarla como referencia. A

CelA8, la celulasa identificada y clonada en nuestro laboratorio, se le asignó las mismas

propiedades catalíticas que Cel5G, por su alto nivel de identidad en la estructura primaria

(Tabla 4).

Para facilitar el análisis de las comparaciones, los residuos de todas las

enzimas se numeraron de acuerdo a las posiciones equivalentes en Cel5A. Esta

numeración se basa en el alineamiento múltiple y no coincide necesariamente con los

correspondientes archivos PDB.

78

4.3.1. Interacciones electrostáticas

A modo de análisis global, se cuantificó las interacciones electrostáticas

existentes en la estructura de cada celulasa estudiada. El número total de puentes de

hidrógeno no varía significativamente entre las celulasas mesofílicas y psicrofílicas. La

celulasa termofílica Cel5B tiene más puentes de hidrógeno por residuo, con respecto a las

demás estructuras (Tabla 7). Esto podría constituir un factor de adaptación a altas

temperaturas. Se observa además que las estructuras mesofilicas presentan una mayor

cantidad de puentes salinos en comparación con las estructuras adaptadas a bajas

temperaturas. Sin embargo, esta tendencia no se mantiene en el caso de la estructura

termofílica, que contiene igual número de puentes salinos que su homóloga psicrofílica

Cel5G.

Al inspeccionar los resultados de la Tabla 7, no es posible detectar un patrón

evidente que relacione el número de interacciones en cada estructura con la temperatura

del nicho ecológico al que pertenecen.

La Figura 9 muestra los resultados del análisis comparativo en el contexto de

la estructura primaria de Cel5A. Para mayor claridad, aparecen únicamente aquellas

interacciones ausentes en Cel5A, pero conservadas en Cel5, Cel5G y CelA8, aunque el

caso contrario también fue considerado. Cinco interacciones llaman la atención por su

cercanía con los residuos Glu136 (ácido/base catalítico) y Asn135 (que interactúa con el

sustrato), y por encontrarse en una zona altamente conservada de la secuencia. Dos de

Cel5B Cel5 Cel5A Cel5G CelA8

Número de residuos 305 291 300 293 293

Puentes de hidrógeno / residuos 0,95 0,89 0,89 0,89 0,89

Puentes de hidrogeno totales 290 260 269 260 261

peptídico - peptídico 192 188 184 185 195

peptídico - lateral 63 40 53 48 47

lateral - lateral 35 32 32 27 19

Puentes salinos 11 13 16 11 8

Tabla 7. Puentes de hidrógeno y puentes salinos en celulasas adaptadas a distintas temperaturas.

79

estas interacciones involucran directamente el residuo catalítico ácido/base, y las otras

tres se sitúan a un residuo de distancia. Para tener una visión más amplia de esta zona,

se graficó las interacciones presentes en Cel5 y Cel5A de manera homóloga a lo

propuesto por Bikadi y colaboradores (Bikadi et al., 2007) (Figura 10).

Según estos gráficos, el número de interacciones en la vecindad del residuo

catalítico ácido/base no cambia mayormente entre las celulasas (3 en Cel5, Cel5G y

CelA8, 4 en Cel5A). Las interacciones aparentemente perdidas en Cel5A, expuestas en la

Figura 9, son en definitiva reemplazadas por otras potencialmente equivalentes,

generándose un patrón distinto en esa zona. Al inspeccionar las estructuras 3D

Figura 9. Secuencia aminoacídica del dominio catalítico de Cel5A con resultados de los estudios comparativos. Los residuos con menor densidad de contacto en Cel5A aparecen destacados en negro. Los asteriscos señalan aquellos residuos conservados en el alineamiento múltiple de las secuencias de Cel5, Cel5G, CelA8 y Cel5A. Los números dispuestos arriba de los residuos representan interacciones electrostáticas (puentes salinos y puentes de hidrógeno) conservadas en Cel5, Cel5G y CelA8 pero ausentes en Cel5A. Cada número identifica el índice del otro residuo participante en la interacción. Los residuos seleccionados son equivalentes a los que conforman las respectivas interaccciones en Cel5, Cel5G y CelA8. Los dos residuos catalíticos se destacan con cuadrados negros. Todos los residuos cuyos carbonos alfa se sitúan a menos de 10 Å de los residuos catalíticos se encuentran subrayados. Los residuos que interactúan con el sustrato, según Varrot y Davies (Varrot y Davies, 2003) se destacan con cuadros grises. Los índices de los residuos corresponden al alineamiento múltiple.

80

experimentales disponibles para Cel5, Cel5G y Cel5A (códigos PDB: 1EGZ, 1TVN y

1QHZ, respectivamente), se confirmó lo anterior y se detectó diferencias adicionales

(Figura 11). El residuo catalítico ácido/base establece dos puentes de hidrógeno a través

de su esqueleto peptídico en todas las celulasas. Sin embargo, los aminoácidos

involucrados varían de una estructura a otra. En Cel5, Cel5G y CelA8, la serina 99 y la

histidina 100 actúan como receptor y dador, respectivamente. En cambio, la asparagina

138 y la isoleucina 99 cumplen esta función en Cel5A. La tirosina 134 forma un tercer

puente de hidrógeno con el ácido glutámico 103 en Cel5 y Cel5G. Esta interacción se

pierde en Cel5A ya que la posición 134 es ocupada por una alanina, cuya cadena lateral

no puede establecer puentes de hidrógeno. Sin embargo, Cel5A contiene puentes de

hidrógeno adicionales que pueden cubrir esta pérdida. La asparagina 138, además de

interactuar con el residuo catalítico, está ligada a la leucina 100 (un puente de hidrógeno)

y la asparagina 103 (dos puentes de hidrógeno, detectados como uno sólo por los

algoritmos al tratarse del mismo residuo). El “loop” en el que se encuentra la asparagina

103 en Cel5A es más largo y adopta una conformación espacial que favorece el contacto

con la posición 138. La isoleucina 99 forma un puente de hidrógeno con la asparagina

135, no detectado por los algoritmos porque la distancia que separa el hidrógeno

(Asn135) del oxígeno (Ile99) es levemente mayor (2,59 Å) al umbral arbitrario definido

(capítulo 3.2.6). Como resultado, Cel5A presenta 6 puentes de hidrógeno, contra 3 de

Cel5 y Cel5G, en una zona que contiene 3 residuos directamente involucrados con la

actividad enzimática, el ácido glutámico 136 (acido/base), la asparagina 135 y la histidina

98 (ambos ligandos del sustrato) (Varrot y Davies, 2003). El largo y el ángulo de los

puentes de hidrógeno equivalentes son similares en todas las celulasas.

4.4. Compactación estructural

Para evaluar la compactación local a nivel de cada residuo en las estructuras

estudiadas, se utilizó un concepto descrito previamente: la densidad de contacto (Halle,

2002; Gunasekaran y Nussinov, 2007) (capítulo 3.2.4).

La Figura 9 destaca sólo los residuos que presentan menor densidad de

contacto en Cel5A, aunque el caso inverso también se evaluó.

81

Indi

ces

de re

sidu

os

Indices de residuos

Indi

ces

de re

sidu

os

A

B Indices de residuos

Figura 10. Gráficos de interacciones electrostáticas. A, Cel5; B, Cel5A. Para facilitar el análisis, se muestra sólo la zona de interés. Cada punto representa una interacción. Las interacciones que solamente están presentes en la estructura evaluada se destacan en negro. Las interacciones relevantes en la vecindad del residuo catalítico ácido/base se señalan con círculos rojos y aquellas que involucran directamente éste residuo se identifican con flechas. Los índices corresponden al alineamiento múltiple de Cel5, Cel5G y Cel5A, no a los archivos PDB. Cel5G tiene las mismas características que Cel5 en la zona tratada.

82

Se observa diferencias en varias zonas de interés (altamente conservadas o cercanas a

residuos clave para la catálisis), incluyendo las secuencias adyacentes a ambos residuos

catalíticos. Entre éstas destaca la posición 173, que corresponde a una glicina en Cel5A y

a una prolina en el resto de las celulasas. La glicina y la prolina otorgan características

mecánicas muy distintas a las cadenas peptídicas que las contienen. La glicina no posee

cadena lateral, por lo que permite configuraciones del esqueleto peptídico muy variadas.

La prolina en cambio, restringe enormemente la libertad de movimiento y rigidiza la

cadena peptídica (MacArthur et al., 1991; Sriprapundh et al., 2000; Tian et al., 2010). Sin

embargo, nuestra atención fue puesta nuevamente en el residuo ácido/base catalítico y la

alanina 134 colindante, cuyas densidades de contacto son menores en Cel5A, debido

probablemente al reordenamiento estructural local evidenciado en la sección anterior.

Figura 11. Estructura de Cel5 (A) y Cel5A (B) en la vecindad del residuo catalítico ácido/base. El residuo catalítico ácido/base aparece en azul. Los residuos que interactúan con el sustrato se destacan en celeste (Varrot y Davies, 2003). Los átomos de oxígeno y nitrógeno se exponen en azul oscuro y rojo, respectivamente. Las interacciones se representan con líneas punteadas. Los índices de aminoácidos corresponden a las posiciones equivalentes en Cel5A según el alineamiento múltiple realizado (Figura 9), a excepción del residuo Glu103 de Cel5 que no se encuentra en Cel5A. En caso de no coincidir, los índices publicados en los archivos pdb 1EGZ y 1QHZ de cel5 y Cel5A, respectivamente, se indican entre paréntesis. Cel5G y CelA8 presentan las mismas características que Cel5 en esta zona.

A B

His98(101)

Ile99(102)

Leu100(103)

Asn103(106)

Glu136(139)

Asn138(141)

Asn135(138)

Glu136(133)

Asn135(132)

Pro137(134)

His98

Ser99

Ala134(137)

Tyr134 (131)

His100

Glu103

83

4.5. Análisis de modos normales

Se aplicó análisis de modos normales (NMA, por sus siglas en inglés) para

estimar en forma teórica la magnitud de las fluctuaciones atómicas cuadradas promedio

para cada residuo en las dos celulasas mesofílicas Cel5 y Cel5A, y las dos celulasas

psicrofílicas Cel5G y CelA8 (capítulo 3.2.1).

Las figuras 12, 13 y 14 muestran una comparación entre los factores B

calculados mediante NMA (capítulo 3.2.2) y los factores B experimentales (capítulo 1.6.1)

extraídos directamente de los archivos PDB, de Cel5, Cel5A y Cel5G, respectivamente.

La comparación no se efectuó con los datos de CelA8 ya que no existe información

experimental acerca de los factores B para esta enzima. Se puede observar que los

factores B calculados se ajustan razonablemente al patrón experimental. La coincidencia

es especialmente buena en el caso de Cel5G (rmsd=2,55). Esto concuerda con otros

resultados publicados (Miller y Agard, 1999). Sin embargo, el nivel de correspondencia

entre los datos calculados y los datos experimentales, según nuestro criterio, no es

satisfactorio en el contexto de un análisis cuantitativo detallado. De hecho, se ha

comprobado que el método de NMA es más efectivo para predecir la dirección,

correlación (ver más adelante) y grado de colectividad de los movimientos (Skjaerven et

al., 2009), que para estimar su amplitud (Alexandrov et al., 2005). Producto de lo anterior,

se resolvió caracterizar las propiedades dinámicas generales de cada celulasa mediante

el análisis de las correlaciones (capítulo 3.2.2) en los movimientos de los distintos

componentes estructurales (átomos, residuos, elementos de estructura secundaria, etc.),

sin basarse en la amplitud de las fluctuaciones cuadradas promedio como único

parámetro de estudio.

El patrón general de correlaciones es similar en todas las celulasas (Figura 15

a y b). No fue posible establecer diferencias que pudieran vincularse con las propiedades

catalíticas de alguna enzima en particular. Algunas de las características conservadas

involucran al bolsillo de unión, y por lo tanto podrían estar relacionadas con procesos

importantes para el funcionamiento de la enzima. Los índices de correlación entre pares

de residuos situados en un mismo lado del bolsillo tienden a ser más altos, lo que sugiere

un desplazamiento coordinado. Esto podría responder a la necesidad de mantener la

posición relativa de estos residuos con el fin de optimizar la interacción con el sustrato

(Figura 15 c).

84

Figura 13. Factores B experimentales y calculados para cada resíduo de Cel5A. Los datos calculados fueron escalados para minimizar la raiz de la desviación cuadrada promedio (rmsd = 6,11).

Figura 12. Factores B experimentales y calculados para cada resíduo de Cel5. Los datos calculados fueron escalados para minimizar la raiz de la desviación cuadrada promedio (rmsd = 8,6).

85

4.6. Sitio de unión a calcio: posible adaptación de Cel5G a bajas temperaturas

Utilizando la misma plataforma analítica anterior, se evaluó las

particularidades estructurales de la celulasa psicrofílica Cel5G, potencialmente ligadas

con su comportamiento dinámico. Se detectaron diferencias importantes en la zona

equivalente al sitio de unión a calcio de Cel5 y Cel5A conformado por los “loops” que

conectan la hélice α 3 con la hoja β 4 y la hélice α 4 con la hoja β 5 (Varrot et al., 2000;

Chapon et al., 2001). Las cadenas laterales de los residuos equivalentes a la asparagina

165 y la asparagina 166, que participan en la coordinación del ion calcio, presentan una

configuración distinta en Cel5G, afectando dramáticamente la topología de esa zona

(Figura 16 A). Lo mismo ocurre con la arginina 160 que interactúa con el ácido aspártico

163 (también parte del sitio de unión a calcio) y la asparagina 166 en las estructuras

mesofílicas mediante 3 puentes de hidrógeno.

Figura 14. Factores B experimentales y calculados para cada resíduo de Cel5G. Los datos calculados fueron escalados para minimizar la raiz de la desviación cuadrada promedio (rmsd = 2,55).

86

Res

iduo

s

Residuos

Res

iduo

s

Asn135

His98

Tyr63 His32

Tyr199

Ala231

Glu266

Residuos

A B

C

Figura 15. Análisis de correlaciones. A y B, matrices de correlaciones de Cel5 y Cel5A, respectivamente. Las barras laterales indican el código de color usado para expresar el valor de los índices de correlación. Los círculos destacan pares de residuos situados en la vecindad del bolsillo de unión. Los gráficos se hicieron mediante Matplotlib (Hunter, 2007). C, modelo 3D de la estructura de Cel5A. Los residuos catalíticos se muestran en azul y los residuos que conforman el bolsillo de unión, en celeste. Los índices corresponden al alineamiento múltiple realizado. La figura se generó usando PyMol (DeLano, 2002).

87

A

B

Gly124

Asp163 Asn165

Asn166

Asp163 Arg160

Asn166

Figura 16. Superposición estructural del sitio de unión a calcio de Cel5 (café), Cel5A (rosado) y Cel5G (azul). A, Sitio de unión a calcio (Chapon et al., 2001). B, Red de puentes de hidrógeno entre la arginina 160 y el sitio de unión a calcio. Cuando es requerido, los átomos de oxígeno y nitrógeno se exponen en celeste y amarillo, respectivamente. Los residuos rotulados corresponden a Cel5A y los índices representan las posiciones en el alineamiento múltiple realizado. La superposición se efectuó a través del programa Swiss PDB Viewer (Guex y Peitsch, 1997; Guex et al., 1999). La figura se generó mediante PyMol (DeLano, 2002).

88

Producto del cambio conformacional de su cadena lateral, esta arginina no interactúa con

el ácido aspártico 163 en Cel5G, pero establece un nuevo puente de hidrógeno con el

oxígeno carboxílico de la cadena lateral desplazada de la asparagina 166.

El efecto estabilizador de la interacción de cationes bivalentes con sitios

específicos de las estructuras proteicas ha sido ampliamente documentado (Arnold y

Zhang, 1994; Feller et al., 1999; Miyazaki et al., 2000; Stoner et al., 2005). El

debilitamiento o pérdida de este tipo de interacción en Cel5G producto de las

modificaciones topológicas descritas podría constituir un mecanismo de adaptación a

bajas temperaturas induciendo mayor flexibilidad estructural.

4.7. Mutaciones sitio-dirigidas

Los antecedentes expuestos hasta aquí permitieron identificar residuos

potencialmente relacionados con el proceso de adaptación a diversas temperaturas de

enzimas modelo pertenecientes a la familia 5, sub-familia dos, clan A de las glicosil

hidrolasas.

Las posiciones 134 y 138 aparecen como candidatas atractivas para

mutagénesis. Ambas están relacionadas con variaciones estructurales significativas en la

vecindad del sitio activo. La alanina 134 de Cel5A corresponde a una tirosina en Cel5,

Cel5G y CelA8. La presencia de una tirosina en esa posición aumenta la compactación

estructural y permite la formación de un puente de hidrógeno inexistente en Cel5A. La

asparagina 138 de Cel5A parece jugar un rol clave en la configuración espacial de su

entorno. Participa en 4 puentes de hidrógeno con residuos vecinos, incluyendo el ácido

glutámico 136 (ácido/base catalítico). Esa posición es ocupada por una leucina incapaz de

formar puentes de hidrógeno mediante su cadena lateral en Cel5, Cel5G y CelA8.

La posición 173 en Cel5A está ocupada por una glicina, residuo mucho más

pequeño y que permite mayor libertad conformacional que la prolina presente en las

demás celulasas estudiadas. Esta modificación ocurre en una zona altamente

conservada, ubicada a menos de 10 Å del residuo ácido-base catalítico, por lo que

adquiere interés.

La celulasa psicrofílica Cel5G presenta un sitio de unión a calcio con una

topología alterada, producto de una reorganización de las cadenas laterales de los

89

residuos en posición 165 y 166. Esta alteración podría estar relacionada con su carácter

psicrofílico.

El objetivo de esta sección es validar experimentalmente las predicciones

teóricas resultantes del análisis in silico mediante la construcción y evaluación de

mutantes sitio-dirigidas usando como modelo la celulasa Cel5A de Bacillus agaradherans.

En este contexto, se optó por mutar las posiciones 134 y 138, relegando las

demás posibilidades a trabajos futuros.

La alanina 134 de Cel5A se reemplazó por tirosina, generándose la mutante

A134Y. Esta mutación fue elegida con el objeto de reproducir las características de Cel5,

Cel5G y CelA8 en esa posición. Las propiedades catalíticas y termodinámicas de la

mutante A134Y son muy similares a las de Cel5 desde un punto de vista cualitativo

(capítulo 4.1). El intercambio de alanina por tirosina provoca una disminución

concomitante de la constante catalítica y de la Ea (Figura 16; Figura 17 y Tabla 8). Al igual

que en el caso de Cel5, lo anterior responde a una entropía de activación desfavorable

que se impone por sobre la influencia positiva de la baja Ea (y

!

"H# ). Se observa que la

actividad de esta variante es menos sensible a los cambios de temperatura. A 30°C la

enzima nativa es 2 veces más activa que la mutante, mientras que a 10°C la diferencia es

sutil (Tabla 8). La tirosina en posición 134 también provoca un aumento de la Km en más

de 20 veces. Para poder discriminar entre los efectos relacionados con el volumen de la

cadena lateral y aquellos ligados a la formación de un puente de hidrógeno con residuos

cercanos, tal como ocurre en las celulasas Cel5 y Cel5G entre la tirosina 134 y la

asparagina 103, se construyó una mutante de Cel5A con una fenilalanina en posición 134

(A134F). Las estructuras de la fenilalanina y la tirosina son muy parecidas. La única

diferencia entre ambas es un grupo hidroxilo situado en el anillo aromático de la tirosina

que disminuye su hidrofobicidad y le otorga la capacidad de establecer puentes de

hidrogeno. La mutante A134F no presentó cambios significativos con respecto a la enzima

silvestre en sus parámetros catalíticos y termodinámicos. Este hecho sugiere que la

capacidad de formar puentes de hidrógeno de la tirosina es un factor relevante en el

comportamiento catalítico de la mutante A134Y. Una inspección detallada de las

respectivas estructuras 3D (Figura 11) demuestra que la cadena lateral de la tirosina 134

en el contexto espacial de Cel5A no puede adoptar la conformación observada en las

otras celulasas debido a impedimentos estéricos producidos por la cadena lateral de la

isoleucina 99 (serina en Cel5, Cel5G y CelA8). Esta conformación supone el

establecimiento de un puente de hidrógeno con el residuo asparagina 103.

90

Tabl

a 8.

Par

ámet

ros

cata

lític

os y

term

odin

ámic

os p

ara

la h

idró

lisis

de

pNPC

por

Cel

5A y

las

enzi

mas

mut

ante

s a

10°C

y 3

0°C

.

Celu

lasa

10°C

30°C

10°C

30°C

10°C

30°C

10°C

30°C

10°C

30°C

Ea (

kJ/

mol)

Cel5

A0,3

04,5

0,6

30,6

172,1

70,5

100,9

100,7

101,8

99,8

103,3

A134Y

0,2

82,2

13,1

22,8

72,2

72,3

70,1

69,9

-7,4

-7,7

72,5

N138L

0,7

16,6

1,5

3,7

70,0

69,5

82,3

82,1

43,3

41,5

84,7

I99A

0,5

16,2

1,6

1,9

70,8

69,7

88,9

88,7

63,8

62,7

91,2

I99A/A

134Y

0,6

56,3

4,3

5,3

70,3

69,6

77,7

77,5

26,2

25,9

80,0

A134F

0,2

84,5

0,4

7N

.D.

72,3

70,5

97,7

97,5

89,7

03

89,1

100,0

(

kJ/

mol)

(J/m

ol °K)

(

kJ/

mol)

Kcat

(seg-1

)Km

(m

M)

!

"G#

!

"H#

!

"S#

91

Figura 17. Actividad relativa de Cel5A y sus variantes mutadas a distintas temperaturas, con el sustrato pNFC. Las actividades relativas corresponden a los valores de kcat normalizados con respecto a Cel5A, para cada temperatura.

Figura 16. Efecto de la temperatura sobre la actividad catalítica de Cel5A y sus variantes mutadas, con el sustrato pNFC. El recuadro interno muestra los respectivos gráficos de Arrhenius para calcular la energía de activación.

92

Teniendo en consideración lo anterior, aparece razonable relacionar los efectos de la

mutación A134Y sobre la actividad, la Ea y la Km de Cel5A con la ocurrencia de un

cambio conformacional local, inducido para mantener el puente de hidrógeno entre la

tirosina 134 y la asparagina 103 a pesar de los impedimentos estéricos impuestos por la

isoleucina 99. Este reordenamiento podría afectar la distribución espacial de los residuos

Glu136, Asn135 y/o His98 involucrados en la catálisis y la unión al sustrato (Figura 11).

Para explorar esta posibilidad con más detalle se decidió reemplazar la

isoleucina 99 por una alanina en la mutante A134Y, generándose la mutante doble

I99A/A134Y. La alanina es el aminoácido con la cadena lateral más pequeña (un grupo

metilo) y por lo tanto debiera presentar menos interferencia estérica con la tirosina en

posición 134. Paralelamente se construyó la mutante simple I99A para individualizar los

efectos del reemplazo de la isoleucina por alanina en posición 99. La mutante doble

A134Y/I99A no presenta indicios de los efectos negativos causados por la tirosina en

A134Y. Su comportamiento catalítico es comparable al de I99A, con una actividad

superior a bajas temperaturas (Figura 16; Figura 17 y Tabla 8). Esto indica que las

consecuencias de la mutación A134Y en Cel5A tienen relación con el tamaño de la

cadena lateral en posición 99, lo que robustece la hipótesis planteada anteriormente. Las

mutantes I99A e I99A/A134Y resultaron ser más activas que la enzima nativa,

particularmente a bajas temperaturas (Figura 17). La mutante I99A y la mutante doble son

casi 2 y 3,5 veces más activas que Cel5A a 5°C, respectivamente. El efecto de la

mutación A134Y en el contexto de la mutante doble sigue siendo difícil de interpretar en

términos de relación estructura función. La asparagina 103 establece un puente de

hidrógeno con la asparagina 138 en Cel5A a través de su oxígeno peptídico (Figura 11).

La eventual formación del puente de hidrógeno entre la tirosina 134 y la asparagina 103

involucraría el mismo átomo de oxígeno y podría ejercer algún tipo de influencia sobre la

primera interacción. Una interpretación razonable de los efectos producidos por la tirosina

134 requiere contar con información estructural experimental detallada de las mutantes.

En la mutante I99A, la disminución del volumen ocupado por la alanina podría significar

un aumento en la flexibilidad del sitio activo, lo que respaldaría su alta actividad a bajas

temperaturas.

La asparagina 138 de Cel5A se reemplazó por una leucina, tal como ocurre en

Cel5, Cel5G y CelA8. La mutante resultante, N138L, es más activa que la enzima nativa

en un amplio rango de temperaturas, particularmente en frío (Figura 16 y Figura 17). A

5°C, N138L es casi 3 veces más activa que Cel5A. Este incremento en la actividad

93

catalítica es favorecido entálpicamente (disminución de Ea y

!

"H# ). Lo mismo ocurre con

las mutantes I99A e I99A/A134Y (Tabla 8). En Cel5A, los residuos asparagina 138 e

isoleucina 99 conforman puentes de hidrógeno con el residuo ácido-base catalítico. Por lo

tanto, modificaciones en ambas posiciones tienen el potencial de alterar interacciones

entálpicas centrales en el sitio activo de la enzima.

Todas las mutantes generadas, a excepción de A134Y y A134F, pueden ser

consideradas versiones psicrofílicas de Cel5A, ya que presentan valores más bajos de

Ea, son más activas en frío y a temperaturas lo suficientemente altas su actividad es

menor (Figura 17). Sin embargo, los valores de Ea, parámetro ampliamente utilizado para

clasificar enzimas adaptadas a diversos nichos térmicos, siguen siendo altos en

comparación con sus homólogas Cel5 y Cel5G.

94

5. Discusión

La endoglucanasa Cel5A de Bacillus agaradhaerens ha sido ampliamente

caracterizada desde el punto de vista estructural. De hecho, fue la primera estructura de

una glicósido-hidrolasa perteneciente a la familia 5 resuelta experimentalmente mediante

cristalografía de rayos X (Davies et al, 1998) y usada como modelo para el estudio de la

relación estructura-función en estas enzimas (Varrot et al, 2000; Varrot y Davies, 2003).

Sin embargo, poco se conoce acerca de sus propiedades cinéticas (Hirasawa et al.,

2006).

En este trabajo se evaluó el desempeño catalítico de Cel5A, por medio de la

obtención e interpretación de parámetros cinéticos y termodinámicos de activación.

Los parámetros termodinámicos de activación (

!

"G# ,

!

"H# y

!

"S# ) son usados

frecuentemente en el estudio de la relación estructura-función de las enzimas, y han

probado ser muy útiles en la caracterización de factores estructurales vinculados a la

adaptación a diversas temperaturas (Lonhienne et al., 2000; Garsoux et al., 2004; Violot et

al., 2005). Sin embargo, su significado físico debe ser interpretado con cautela, porque

derivan de un modelo simplificado de las reacciones químicas, que considera diversas

aproximaciones y suposiciones arbitrarias: la teoría del estado de transición (Lonhienne et

al., 2000; Pineda y Schwartz, 2006). Entre otras consideraciones, la teoría del estado de

transición supone la existencia de un estado activado, en equilibrio con el complejo

enzima sustrato, a través del cual los reactantes fluyen en su conversión a productos.

Además, el coeficiente de transmisión

!

" que incorpora variados fenómenos cuánticos

relevantes, como el efecto “túnel” y los traspasos múltiples de la barrera energética

(Garcia-Viloca et al., 2004), es usualmente ignorado (Lonhienne et al., 2000). Las

complicaciones ligadas a las limitaciones de este modelo se atenuaron mediante la

interpretación de las variaciones entre los parámetros calculados para distintas enzimas,

sin considerar los valores absolutos (Lonhienne et al., 2000).

Los resultados obtenidos permitieron identificar aspectos distintivos de Cel5A

que validan su uso como modelo para avanzar en el entendimiento de la relación entre la

catálisis enzimática y la temperatura.

A pesar de provenir de una bacteria alcalófila, Cel5A presenta mayor actividad

en el rango neutro de pH (máxima actividad entre pH 6 y 7) con el sustrato sintético

pNPC. Otra enzima de Bacillus agaradhaerans, una xilanasa perteneciente a la familia

95

GH11, muestra un patrón similar (Poon et al., 2003). Sin embargo, ambas enzimas

retienen un porcentaje significativo de su actividad a pH alcalino (30% a pH 9 en el caso

de Cel5A) lo que les permite funcionar en esas condiciones.

La expresión de kCAT derivada de la teoría del estado de transición (capítulo

1.5.5) puede ser escrita con el término exponencial detallado de la siguiente manera:

donde

!

"H# es la entalpía de activación y

!

"S# es la entropía de activación. La Ea en la

ecuación de Arrhenius es equivalente a

!

"H# en la teoría del estado de transición. Ambos

parámetros representan la diferencia de energía en términos de calor entre el estado de

transición y el complejo basal enzima-sustrato (anexo I) (Lonhienne et al., 2000). Una Ea

o

!

"H# baja supone una menor dependencia de la constante catalítica (kCAT) con respecto

a la temperatura. Estas consideraciones tienen implicancias de alta relevancia en el

contexto de la adaptación de enzimas al frío (Marx et al., 2007). De hecho, se ha

sugerido, en base a numerosos estudios, que la superioridad catalítica de las enzimas

psicrofílicas, particularmente a bajas temperaturas, responde principalmente a una

reducción de su Ea o

!

"H# (Lonhienne et al., 2000; Tsigos et al., 2001; Siddiqui y

Cavicchioli, 2006).

Cel5A, sin embargo, parece contradecir esta hipótesis siendo más activa que

sus homólogas Cel5 y Cel5G en un amplio rango de temperaturas, a pesar de tener una

Ea más alta. Una explicación para este comportamiento se obtuvo mediante la

determinación de los parámetros termodinámicos de activación. Observando la expresión

para kCAT derivada de la teoría del estado de transición se puede notar que tanto una

reducción de

!

"H# como un incremento de

!

"S# producen un aumento de la tasa de

reacción, y vice versa. Cel5A es capaz de contrarrestar el efecto negativo causado por el

alto valor de Ea y

!

"H# a través de una

!

"S# alta. En Cel5 se aprecia la situación inversa.

El valor negativo de

!

"S# tiende a disminuir la kCAT a pesar de la contribución de una

!

"H#

más baja. Los resultados sugieren la existencia de una relación antagonista entre

!

"H# y

!

"S# , que acota las variaciones de kCAT y define el comportamiento catalítico. De hecho,

en las enzimas psicrofílicas, una reducción de

!

"H# siempre se ve acompañada por una

reducción concomitante de

!

"S# (Collins et al., 2003; Siddiqui y Cavicchioli, 2006; Marx et

al., 2007). Sin una compensación entrópica-entálpica la actividad de las enzimas

!

kCAT

=kBT

he" #H

#RT"#S

#R( )

(42)

96

adaptadas al frío podría superar ampliamente la de sus contrapartes mesofílicas, en sus

respectivas temperaturas ambientales.

La comparación de los parámetros termodinámicos permite el establecimiento

de un contexto racional que facilita la interpretación de las observaciones experimentales.

Sin embargo, para entender los acontecimientos físicos subyacentes se debe interpretar

la información termodinámica en términos estructurales.

La magnitud de

!

"H# es directamente proporcional a la cantidad y fuerza de

las interacciones inducidas entálpicamente que deben ser modificadas o destruidas para

alcanzar el estado de transición (Gerday et al., 1997; Hoyoux et al., 2004). A partir de

esto, es posible generar una explicación para el efecto compensatorio entre

!

"H# y

!

"S#

utilizando argumentos estructurales.

!

"S# representa la diferencia de entropía entre el

estado de transición y el complejo enzima-sustrato. Una disminución del número o de la

fuerza de las interacciones inducidas entálpicamente tiene el potencial de reducir

!

"S#

(junto con

!

"H# ) aumentando la flexibilidad (universo de posibles configuraciones

espaciales) de elementos estructurales claves vinculados con la catálisis y por

consecuencia la entropía del complejo enzima sustrato (D’Amico et al., 2002). Un

incremento de estas interacciones tendría el efecto opuesto. De acuerdo a lo anterior, el

mayor número de puentes de hidrógeno cerca del residuo ácido/base catalítico en Cel5A

podría ser la causa de sus altos valores de Ea (

!

"H# ) y

!

"S# en comparación con Cel5 y

Cel5G. Sin embargo, el mecanismo físico a través del cual Cel5A logra alcanzar

actividades ampliamente superiores a las de Cel5 sigue siendo un dilema. Más aún,

según los valores de

!

"S# , Cel5A posee un sitio activo más rígido que Cel5, lo que,

aplicando la noción de la flexibilidad como un aspecto clave en la catálisis (Zaccai, 2000;

Daniel et al., 2003; Eisenmesser et al., 2005; Agarwal, 2006), aparece como una

contradicción.

Para entender lo anterior es necesario considerar que el término general

“flexibilidad” designa dos conceptos distinguibles entre sí, la flexibilidad estática y la

flexibilidad dinámica (Siddiqui y Cavicchioli, 2006). La flexibilidad estática corresponde al

universo de posibles conformaciones que puede adoptar la estructura. La flexibilidad

dinámica considera la velocidad de interconversión entre las distintas conformaciones

(escala temporal de los movimientos). Se ha demostrado experimentalmente la existencia

de movimientos asociados con la catálisis que ocurren a escalas de tiempo del orden de

los microsegundos-milisegundos (Agarwal et al., 2004; Wolf-Watz et al., 2004;

97

Eisenmesser et al., 2005; Agarwal, 2006). Este rango temporal concuerda con la tasa de

conversión de sustrato a producto en diversas enzimas (Boehr et al., 2006). Las

fluctuaciones térmicas de átomos individuales, que ocurren a una escala de tiempo mucho

más rápida, del orden de los picosegundos-nanosegundos (Boehr et al., 2006), también

han sido vinculadas con el proceso catalítico. Por medio de simulaciones teóricas

computacionales se ha identificado y caracterizado, en las enzimas alcohol

deshidrogenasa (Caratzoulas et al., 2002) y lactato deshidrogenasa (Basner y Schwartz,

2004), vibraciones en el rango de los picosegundos que promueven la reacción catalítica

influyendo sobre la barrera energética. Sin embargo, poco se entiende acerca de la

relación entre las fluctuaciones locales de alta frecuencia y los movimientos colectivos

más amplios y lentos en el rango temporal de la reacción catalítica, fuera del hecho de

que pueden estar fuertemente correlacionadas (Henzler-Wildman et al., 2007). Pineda y

Schwartz propusieron recientemente, en base a simulaciones teóricas, que sólo una

pequeña fracción del universo de posibles conformaciones estructurales ofrece un entorno

apropiado para la catálisis (Pineda y Schwartz, 2006). En consecuencia, la brecha

temporal entre las vibraciones atómicas de alta frecuencia y la tasa de reacción

enzimática probablemente responde a la necesidad de una búsqueda estocástica para

encontrar las escasas configuraciones requeridas.

En base a las consideraciones expuestas, es posible establecer una relación

lógica entre la actividad catalítica, los parámetros termodinámicos y la información

estructural de Cel5A. El mayor número de puentes de hidrógeno en la vecindad del

residuo catalítico ácido/base podría afectar la flexibilidad estática local, restringiendo el

universo de posibles conformaciones y favoreciendo la ocurrencia de aquellas

compatibles con la catálisis. La exploración de conformaciones con potencial catalítico en

el plegamiento nativo es un concepto que ha sido validado experimentalmente con la

enzima ciclofilina A (Eisenmesser et al., 2005). La actividad catalítica de Cel5 y Cel5G es

favorecida entálpicamente. Una menor cantidad de interacciones entálpicas que deben

ser modificadas para alcanzar el estado de transición implica una disminución de la

barrera energética de la reacción. La actividad de Cel5A, por otro lado, es impulsada por

una alta entropía de activación, generada probablemente por un complejo enzima-sustrato

más ordenado.

El análisis comparativo computacional realizado en este trabajo permitió

identificar varias posiciones en la secuencia de Cel5A potencialmente vinculadas con la

modulación de su actividad catalítica a diversas temperaturas, algunas de las cuales

98

fueron seleccionadas para efectuar un estudio de mutagénesis sitio-dirigida. De esta

manera se construyó las mutantes A134Y y N138L. Adicionalmente se generó las

mutantes A134F, I99A e I99A/A134Y como complemento de la mutación simple A134Y.

La posibilidad teórica de impedimentos estéricos e interferencias entre interacciones, con

la potencialidad de generar distorsiones mayores en la topología del esqueleto peptídico,

impidieron la identificación de factores específicos relacionados con el comportamiento

catalítico de A134Y e I99A/A134Y. El reemplazo de la alanina 134 por una fenilalanina,

permitió asociar el grupo hidroxilo de la tirosina (que le confiere capacidad para formar

puentes de hidrógeno) con los efectos negativos causados por la mutación A134Y.

Todas las mutantes evidenciaron un aumento de la Km y una disminución de

la Ea comparado con Cel5A. Estudios de mutagénesis en una lactato deshidrogenasa han

demostrado que la energía de activación puede ser modificada sin influenciar la Km

cuando las mutaciones se sitúan lejos del sitio activo (Fields y Houseman, 2004). Sin

embargo, la Km usualmente varía en forma inversa a la energía de activación cuando las

mutaciones ocurren en la vecindad del sitio activo (Fields y Houseman, 2004), lo que

concuerda con nuestro resultado. También se ha establecido que la Km tiende a

aumentar en conjunto con la kCAT (Tindbaek et al., 2004), fenómeno frecuentemente

asociado al incremento en la flexibilidad del sitio de unión requerida para sostener una

actividad más alta. Los parámetros cinéticos de las mutantes N138L, I99A e I99A/A134Y,

corroboran esta aseveración, aunque cabe señalar que existen excepciones en las que el

aumento de kCAT coincide con una baja en la Km (Taguchi et al., 2000).

En este estudio no se utilizó el parámetro kCAT/Km, referido generalmente

como eficiencia catalítica ya que no es apto para comparar la actividad de distintas

enzimas sobre un mismo sustrato (Eisenthal et al., 2007). Esto se puede constatar

observando las curvas de saturación usadas para calcular la Km de Cel5A y sus

derivadas (Figura 18). La mutante doble I99A/A134Y es más activa que Cel5A e I99A a

concentraciones de sustrato por encima de 10 mM. En cambio, a concentraciones

suficientemente bajas, la situación se invierte. Utilizando los datos de la Tabla 8, se tiene

que la eficiencia catalítica de Cel5A a 10°C es mayor que la de I99A/A134Y, sin embargo

su actividad es menor en un amplio rango de concentraciones de sustrato. Lo anterior

sugiere que la constante catalítica como parámetro de comparación entre enzimas

también debe ser aplicado con cautela ya que refleja la actividad de una enzima en

condiciones saturantes y a una temperatura dada. El escenario puede cambiar

radicalmente si es que se modifican las condiciones mencionadas. Teniendo en cuenta lo

99

anterior, se puede afirmar que las mutantes N138L, I99A e I99A/A134Y presentan mayor

actividad catalítica que Cel5A a bajas temperaturas y en un amplio rango de

concentraciones del sustrato sintético pNPC, como consecuencia de una Ea más baja y

valores de Km que presentan variaciones menores. En la celulasa Cel5A de La histidina

138 de Thermotoga maritima, equivalente a la asparagina 138 de nuestra celulasa modelo

homónima, se intercambió por una tirosina, produciéndose una leve disminución en la

actividad

Nuestros resultados demuestran que la sustitución de un solo aminoácido

puede cambiar dramáticamente las propiedades de la celulasa Cel5A. Existen muchos

ejemplos en la literatura que atribuyen importantes adaptaciones catalíticas a

modificaciones estructurales muy sutiles (Taguchi et al., 2000; Wintrode et al., 2000;

Tsigos et al., 2001; D’Amico et al., 2002; Fields y Houseman, 2004; Henzler-Wildman et

al., 2007). Desgraciadamente, los efectos observados no se pueden extrapolar

directamente a otras enzimas homólogas ya que las consecuencias de una mutación

Figura 18. Curvas de saturación de Cel5A y enzimas mutantes con pNPC a 10°C.

100

dependen del complejo contexto estructural en el que está inmersa. Es así como la

leucina en posición 100 de Cel5A no es tolerada en el contexto homólogo de Cel5 (Bortoli-

German et al., 1995) y una mutación relevante para la adaptación de la subtilisina BPN a

bajas temperaturas se encuentra también en una estructura homóloga termofílica con

propiedades opuestas (Taguchi et al., 2000).

Es importante resaltar el hecho de que todas las mutaciones seleccionadas en

este estudio se localizan en las cercanías de residuos importantes para la actividad y la

unión del sustrato. En la naturaleza, las adaptaciones estructurales frecuentemente se

encuentran fuera del sitio activo, que permanece altamente conservado (Feller, 2003;

Zeng et al., 2006). Cambios en posiciones periféricas pueden modular los parámetros de

actividad modificando las propiedades dinámicas y conformacionales del centro reactivo

(Feller, 2003). Sin embargo, son más difíciles de detectar.

Hasta ahora, ningún aspecto estructural específico en el dominio catalítico de

Cel5G ha podido ser vinculado con sus propiedades psicrofílicas. Análisis comparativos

anteriores han descrito tendencias generales relacionadas con la adaptación de este

dominio a bajas temperaturas, pero no existe información acerca de mecanismos

particulares (Violot et al., 2005). Usando nuestra plataforma analítica detectamos

anomalías en la configuración espacial del sitio de unión a calcio de Cel5G situado en los

“loops” que conectan la hélice α 3 con la hoja β 4 y la hélice α 4 con la hoja β 5. La unión

de metales bivalentes, como el calcio, es un factor estabilizante en las estructuras

proteicas (Arnold y Zhang, 1994; Feller et al., 1999; Miyazaki et al., 2000; Stoner et al.,

2005). Una menor afinidad por calcio supone una estructura más flexible. De hecho, esta

condición es considerada como una posible adaptación estructural al frío en las enzimas

psicrofílicas (Feller et al., 1994; Villeret et al., 1997; Wintrode et al., 2000). Un residuo

vecino al sitio de unión a calcio, la arginina 160 (numeración correspondiente a Cel5A,

según secuencia aminoacídica), también se encuentra desplazado en Cel5G. Se ha

reportado que esta arginina juega un papel clave en la estabilización de la estructura,

posiblemente a través de interacciones electrostáticas (Bortoli-German et al., 1995). Es

probable que los cambios topológicos observados en, y alrededor del sitio de unión a

calcio de Cel5G afecten su funcionalidad, provocando un efecto desestabilizador, que

podría relacionarse con la adaptación de esta enzima al frío. En base a lo anterior y con el

propósito de validar nuestras predicciones teóricas, proponemos a los residuos

asparagina 165 y asparagina 166 de Cel5A, equivalentes a los ligandos de calcio

101

potencialmente disfuncionales en Cel5G, como blancos para mutagénesis sitio-dirigida en

estudios futuros.

El concepto de psicrofilicidad para designar organismos que viven a bajas

temperaturas es relativamente ambiguo y se encuentra, desde hace más de un siglo, en

constante evolución (Feller y Gerday, 1997). La clasificación de enzimas como

psicrofílicas o adaptadas a bajas temperaturas es una tarea igualmente compleja (Gerday

et al., 1997). Se acepta generalmente que las enzimas psicrofílicas son más activas a

bajas temperaturas y más termolábiles que sus contrapartes mesofílicas (Feller y Gerday,

2003, Papaleo et al., 2006; Siddiqui y Cavicchioli, 2006). Sin embargo, nuestros

resultados confirman la existencia de muchos parámetros independientes susceptibles de

ser usados como criterios de evaluación y cuyas combinaciones pueden dar origen a un

amplio espectro de comportamientos intermedios. En este contexto, la clasificación se

puede tornar relativa y dependiente de propiedades específicas de interés. Cel5A, sólo

por el hecho de ser más activa que Cel5 alrededor de 15°C, podría ser considerada más

psicrofílica.

102

6. Conclusiones

En base a los objetivos planteados, se despenden las siguientes conclusiones

del trabajo realizado:

• El carácter aproximado del análisis de modos normales dificulta su aplicación en el

estudio detallado de los mecanismos moleculares que gobiernan la catálisis

enzimática.

• La alta actividad catalítica de Cel5A con respecto a sus homólogas estructurales

podría ser impulsada por la desestabilización entrópica del complejo enzima-

sustrato.

• La actividad catalítica de las enzimas estudiadas se ve favorecida por factores

aparentemente antagonistas: el beneficio entrópico posiblemente asociado a la

rigidez de componentes específicos del sitio activo, en Cel5A, y el beneficio

entálpico ligado a la disminución de interacciones electrostáticas, que sugiere un

aumento de la flexibilidad local, observado en las mutantes.

• Cambios muy sutiles en la estructura de Cel5A pueden influenciar fuertemente su

comportamiento catalítico. El acceso a información estructural experimental de alta

resolución constituye una condición indispensable para el estudio y entendimiento

de la catálisis enzimática en éste y otros modelos.

• La inclusión de conceptos ligados a la dinámica estructural, tales como la

búsqueda estocástica de conformaciones favorables y las vibraciones promotoras,

en el estudio de la catálisis enzimática, podría complementar los parámetros

termodinámicos clásicos y permitir la elaboración de modelos más realistas y

descriptivos.

• La definición de psicrofilicidad como criterio para clasificar enzimas es aún

precaria y sujeta a relatividad. El limitado entendimiento de los fenómenos

fisicoquímicos subyacentes impide el establecimiento de reglas claras y

103

consensuadas. El razonamiento depende más bien del contexto temático, los

objetivos y los antecedentes considerados.

• Todas las mutantes generadas, a excepción de A134Y y A134F, pueden ser

consideradas versiones psicrofílicas de Cel5A.

104

7. Bibliografía

Abseher, R., Horstink, L., Hilbers, C. W. & Nilges, M. 1998. Essential spaces defined by NMR structure ensembles and molecular dynamics simulation show significant overlap. Proteins 31: 370-382. Agarwal, P. K. 2006. Enzymes: An integrated view of structure, dynamics and function. Microb. Cell Fact. 5: 2. Agarwal, P. K., Geist, A. & Gorin, A. 2004. Protein dynamics and enzymatic catalysis: Investigating the peptidyl-prolyl cis-trans isomerization activity of cyclophilin A. Biochemistry 43: 10605-10618. Aghajari, N., Feller, G., Gerday, C. & Haser, R. 1998. Crystal structures of the psychrophilic ∝-amylase from Alteromonas haloplanctis in its native form and complexed with an inhibitor. Prot. Sci. 7: 564-572. Aghajari, N., Van Petegem, F., Villeret, V., Chessa, J. P., Gerday, C., Haser, R. & Van Beeumen, J. 2003. Crystal structures of a psychrophilic metalloprotease reveal new insights into catalysis by cold-adapted proteases. Proteins 50: 636-647. Aittaleb, M., Hubner, R., Lamotte-Brasseur, J. & Gerday, C. 1997. Cold adaptation parameters derived from cDNA sequencing and molecular modelling of elastase from antarctic fish Notothenia neglecta. Prot. Eng. 10: 475-477. Alexandrov, V., Lehnert, U., Echols, N., Milburn, D., Engelman, D. & Gerstein, M. 2005. Normal modes for predicting protein motions: a comprehensive database assessment and associated web tool. Prot. Sci. 14: 633-643. Arnold, F. H. & Zhang, J. H. 1994. Metal-mediated protein stabilization. Trends Biotechnol. 12: 189-192. Arnorsdottir, J., Kristjansson, M. M. & Ficner, R. 2005. Crystal structure of a subtilisin-like serine proteinase from a psychrotrophic Vibrio species reveals structural aspects of cold adaptation. FEBS. J. 272: 832-845. Arrhenius, S. 1889. On the reaction velocity of the inversion of cane sugar by acids. Z. Phys. Chem. 4: 226-248. Ausubel, F., Brent, R., Kingstone, R., Moore, D., Seidman, J., Smith, J. & Struhl, K. (ed.) 1992. Short protocols in molecular Biology. Green Publidhing Associates and John Wiley & Sons. Bae, E. & Phillips, G. N. Jr. 2004. Structures and analysis of highly homologous psychrophilic, mesophilic and thermophilic adenylate kinases. J. Biol. Chem. 279: 28202-28208.

105

Bahar, I., Atilgan, A. R. & Erman, B. 1997. Direct evaluation of thermal fluctuations in proteins using a single-parameter harmonic potential. Fold. Des. 2: 173-181. Bahar, I. & Jernigan, R. L. 1997. Inter-residue potentials in globular proteins and the dominance of highly specific hydrophilic interactions at close separation. J. Mol. Biol. 266: 195-214. Bai, Y. W., Sosnick, T.R., Mayne, L. & Englander, S. W. 1995. Protein-folding intermediates: native-state hydrogen-exchange. Science 269: 192-197. Baldwin, R. 1986. Temperature dependence of the hydrofobic interaction in protein folding. PNAS 83: 8069-8072. Barras, F., Bortoli-German, I., Bauzan, M., Rouvier, J., Gey, C., Heyraud, A. & Henrissat, B. 1992. Stereochemistry of the hydrolisis reaction catalyzed by endoglucanase Z from Erwinia chrysanthemi. FEBS Lett. 300: 145-148. Basner, J. E. & Schwartz, S. D. 2004. Donor-acceptor distance and protein promoting vibration coupling to hydride transfer: A possible mechanism for kinetic control in isozymes of human lactate dehydrogenase. J. Phys. Chem. B 108: 444-451. Becker, O. & Watanabe, M. 2001. Dynamic Methods, en Computational Biochemistry and Biophysics, Becker O., MacKerell Jr, A., Roux, B. & Watanabe, M. eds. (New York, Marcel Dekker, Inc.), 39-67.

Benkovic, S.J. & Hammes-Schiffer, S. 2003. A perspective on enzyme catalysis. Science 301: 1196-1202. Bentahir, M., Feller, G., Aittaleb, M., Lamotte-Brasseur, J., Himri, T., Chessa, J.-P. & Gerday, C. 2000. Structural, kinetic, and calorimetric characterization of the cold-active phosphoglycerate kinase from the antarctic Pseudomonas sp. TACII18. J. Biol. Chem. 275: 11147-11153. Bikadi, Z., Demko, L. & Hazai, E. 2007. Functional and structural characterization of a protein based on analysis of its hydrogen bonding network by hydrogen bonding plot. Arch. Biochem. Biophys. 461: 225-234. Birnboim, H. C. & Doly, J. 1979. A rapid alkaline extraction procedure for screening recombinant plasmid DNA. Nucl. Acids Res. 7: 1513-1523. Blake, C. C., Koenig, D. F., Mair, G. A., North, A. C., Phillips, D. C. & Sarma, V. R. 1965. Structure of hen egg-white lysozyme. A three-dimensional Fourier synthesis at 2 Angstrom resolution. Nature 206: 757-761. Böde, C., Kovács, I., Szalay, M., Palotai, R., Korcsmáros, T. & Csermely, P. 2007. Network analysis of protein dynamics. FEBS Letters 581: 2776-2782. Boehr, D. D., Dyson, J. & Wright, P. E. 2006. An NMR perspective on enzyme dynamics. Chem. Rev. 106: 3055-3079.

106

Bollag, D. M., Rozycki, M. D., Edelstein, S. J. (ed.) 1996. Protein methods. Wiley-Liss, Inc., New York. Bortoli-German, I., Haiech, J., Chippaux, M. & Barras, F. 1995. Informational suppression to investigate structural functional and evolutionary aspects of the Erwinia chrysanthemi cellulase EGZ. J. Mol. Biol. 246: 82-94. Bradford, M. M. 1976. A rapid and sensitive method for the quantitation of microgram quantities of protein utilizing the principle of protein-dye binding. Anal. Biochem. 72: 248-254. Bruice, T. C. & Benkovic, S. J. 2000. Chemical basis for enzyme catalysis. Biochemistry 39: 6267-6274. Bryngelson, J. D., Onuchic, J. N., Socci, N. D. & Wolynes, P.G. 1995. Funnels, pathways, and the energy landscape of protein folding: a synthesis. Proteins 21: 167-195.

Cannon, W.R., Singleton, S.F. & Benkovic, S.J. 1996. A perspective on biological catalysis. Nat. Struct. Biol. 3: 821-833. Caratzoulas, S., Mincer, J. S. & Schwartz, S. D. 2002. Identification of a protein-promoting vibration in the reaction catalyzed by horse liver alcohol dehydrogenase. J. Am. Chem. Soc. 124: 3270-3276.

Cavicchioli, R., Siddiqui, K.S., Andrews, D. & Sowers, K.R. 2002. Low-temperature extremophiles and their applications. Curr. Opin. Biotechnol. 13: 253-261. Chapon, V., Czjzek, M., Hassouni, M., Py, B., Juy, M. Barras, F. 2001. Type II protein secretion in Gram-negative pathogenic bacteria: the study of the structure/secretion relationships of the cellulase Cel5 (formerly EGZ) from Erwinia chrysanthemi. J. Mol. Biol. 310: 1055-1066. Cherry, J.R. & Fidantsef, A.L. 2003. Directed evolution of industrial enzymes: an update. Curr. Opin. Biotech. 14: 438-443. Collins, T., Meuwis, M. A., Gerday, C. & Feller, G. 2003. Activity, stability and flexibility in glycosidases adapted to extreme thermal environments. J. Mol. Biol. 328: 419-428. Collins, T. H., Dutron, A., Georis, J., Genot, B., Dauvrin, T., Arnaut, P., Gerday, C. & Feller, G. 2006. Use of glycoside hydrolase family 8 xylanases in baking. J. Cereal Sci. 43: 79-84. Collins, T., Meuwis, M-A., Gerday, C. & Feller, G. 2003. Activity, stability and flexibility in glycosidases adapted to extreme thermal environments. J. Mol. Biol. 328: 419-428. Cordone, L., Ferrand, M., Vitrano, E. & Zaccai, G. 1999. Harmonic behavior of trehalose-coated carbon-monoxy-myoglobin at high temperature. Biophys. J. 76: 1043-1047.

107

D’Amico, S., Claverie, P., Collins, T., Georlette, D., Gratia, E., Hoyoux, A., Meuwis, M.-A., Feller, G. & Gerday, C. 2002. Molecular basis of cold adaptation. Philos. Trans. R. Soc. London Ser. B 357: 917-925. D’Amico, S., Gerday, C. & Feller, G. 2002. Structural determinants of cold adaptation and stability in a psychrophilic α-amylase. Biologia, Bratislava 57: 213-219. D’Amico, S., Marx, J.-C., Gerday, C. & Feller, G. 2003. Activity-stability relationships in extremophilic enzymes. J. Biol. Chem. 278: 7891-7896. Daniel, R. M., Dunn, R. V., Finney, J. L. & Smith, J. C. 2003. The role of dynamics in enzyme activity. Annu. Rev. Biophys. Biomol. Struct. 32: 69-92. Davies, G., Dauter, M., Brzozowski, M., Bjørnvad, M. E., Andersen, K. V. & Schülein, M. 1998. Structure of the Bacillus agaradherans family 5 enduglucanase at 1.6 Å and its cellobiose complex at 2.0 Å resolution. Biochemistry 37: 1926-1932. De Backer, M., McSweeney, S., Rasmussen, H. B., Riise, B., Lindley, P. & Hough, E. 2002. The 1,9 Å crystal structure of heat-labile shrimp alkaline phosphatase. J. Mol. Biol. 318: 1265-1274. DeLano, W. L. 2002. The PyMOL Molecular Graphics System. DeLano Scientific, San Carlos, CA, USA. del Sol, A., Fujihashi, H., Amoros, D. & Nussinov, R. 2006. Residues crucial for maintaining short paths in network communication mediate signaling in proteins. Mol. Sys. Biol. 2: 2006.0019. Demirjian, D.C., Moris-Varas, F. & Cassidy, C.S. 2001. Enzymes from extremophiles. Curr. Opin. Chem. Biol. 5: 144-151. Dill, K. & Bromberg, S. 2003. Molecular driving forces: statistical thermodynamics in chemistry and biology. Garland Science, New York. Dodson, G. & Verma, C. S. 2006. Protein flexibility: its role in structure and mechanism revealed by molecular simulations. Cell. Mol. Life Sci. 63: 207-219. Duan, Y. & Kollman, P. A. 1998. Pathways to a protein folding intermediate observed in a 1-microsecond simulation in aqueous solution. Science 282: 740-744. Duilio, A., Tutino, M.-L. & Marino, G. 2004. Recombinant protein production in Antarctic Gram-negative bacteria. Meth. Mol. Biol. 267: 225-237. Eisenmesser, E., Millet, O., Labeikovsky, W., Korzhnev, D., Wolf-Watz, M., Bosco, D., Skalicky, J., Kay, L. & Kern, D. 2005. Intrinsic dynamics of an enzyme underlies catalysis. Nature 438: 117-121. Eisenthal, R., Danson, M. J. & Hough, D. W. 2007. Catalytic efficiency and kCAT/Km: a useful comparator? Trends Biotechnol. 25: 247-249.

108

Evans, M. G. & Polanyi, M. 1935. Some applications of the transition state method to the calculation of reaction velocities, especially in solution. Trans. Faraday Soc. 31: 875-894. Eyring, H. 1935. The activated complex in chemical reactions. J. Chem. Phys. 3: 107-115. Feller, G., Payan, F., Theys, F., Qian, M., Haser, R. & Gerday, C. 1994. Stability and structural analysis of a α-amylase from antarctic psychrophile Alteromonas haloplanctis A23. Eur. J. Biochem. 222: 441-447. Feller, G. & Gerday, C. 1997. Psychrophilic enzymes: molecular basis of cold adaptation. Cell. Mol. Life Sci. 53: 830-841. Feller, G., Zekhnini, Z., Lamotte-Brasseur, J. & Gerday, C. 1997. Enzymes from cold-adapted microorganisms-the class C β-lactamase from the antarctic psychrophile Psychrobacter Immobilis A5. Eur. J. Biochem. 244: 186-191. Feller, G., D’Amico, D. & Gerday, C. 1999. Thermodynamic stability of a cold-active α-amylase from the antarctic bacterium Alteromonas haloplanctis. Biochemistry 38: 4613-4619. Feller, G. 2003. Molecular adaptations to cold in psychrophilic enzymes. Cell. Mol. Life Sci. 60: 648-662. Feller, G. & Gerday, C. 2003. Psychrophilic enzymes: hot topics in cold adaptation. Nat. Rev., Microbiol. 1: 200-208. Feller, G. 2007. Life at low temperatures: is desorder the driving force? Extremophiles 11: 211-216. Fenimore, P. W., Frauenfelder, H., McMahon, B. H. & Parak, F. G. 2002. Slaving: solvent fluctuations dominate protein dynamics and functions. Proc. Natl. Acad. Sci. USA 99: 16047-16051. Fersht, A. 1985. The basic equations of enzyme kinetics, In Enzyme structure and mechanism. W.H. Freeman and Company, New York, 98-120. Fields, P. 2001. Review: Protein function at thermal extremes: balancing stability and flexibility. Comp. Biochem. Physiol. 129: 417-431. Fields, P. A. & Houseman, D. E. 2004. Decreases in activation energy and substrate affinity in cold-adapted A4-lactate dehydrogenase: Evidence from the antarctic notothenioid fish Chaenocephalus aceratus. Mol. Biol. Evol. 21: 2246-2255. Fleming, P. & Richards, F. 2000. Protein packing: dependence on protein size, secondary structure and amino acid composition. J. Mol. Biol. 299: 487-498. Flory, P. J. 1976. Statistical Thermodynamics of Random Networks. Proc. R. Soc. Lond. A. 351: 351-380. Fukuda, H., Kondo, A. & Noda, H. 2001. Biodiesel fuel production by transesterification of oils. J. Biosci. Bioeng. 92: 405-416.

109

Garcia-Viloca, M., Gao, J., Karplus, M. & Truhlar, D. G. 2004. How enzymes work: analysis by modern rate theory and computer simulations. Science 303: 186-195. Garsoux, G., Lamotte, J., Gerday, C. & Feller, G. 2004. Kinetic and structural optimization to catalysis at low temperatures in a psychrophilic cellulase from the antarctic bacterium Pseudomonas haloplanktis. Biochem. J. 384: 247-253. Gavrilescu, M. & Chisti, Y. 2005. Biotechnology – a sustainable alternative for chemical industry. Biotech. Adv. 23: 471-499. Georlette, D., Blaise, V., Dohmen, C., Bouillenne, F., Damien, B., Depiereux, E., Gerday, C., Uversky, V. N. & Feller, G. 2003a. Cofactor binding modulates the conformational stabilities and unfolding patterns of NAD(+)-dependent DNA ligases from Escherichia coli and Thermus scotoductus. J. Biol. Chem. 278: 49945-49953. Georlette, D., Damien, B., Blaise, V., Depiereux, E., Uversky, V., Gerday, C. & Feller, G. 2003b. Structural and functional adaptations to extreme temperatures in psychrophilic, mesophilic, and thermophilic DNA ligases. J. Biol. Chem. 278: 37015-37023. Gerday, C., Aittaleb, M., Arpigny, J. L., Baise, E., Chessa, J. P., Garsoux, G., Petrescu, I. & Feller, G. 1997. Psychrophilic enzymes: a thermodynamic challenge. Biochim. Biophys. Acta 1342: 119-131. Gerday, C., Aittaleb, M., Bentahir, M., Chessa, J. P., Claverie, P., Collins, T., D’Amico, S., Dumont, J., Garsoux, G., Georlette, D., Hoyoux, A., Lonhienne, T., Meuwis, M.-A. & Feller, G. 2000. Cold-adapted enzymes: from fundamentals to biotechnology. Trends Biotechnol. 18: 103-107. Gerstein, M. & Krebs, W. 1998. A database of macromolecular motions. Nucl. Acids Res. 26: 4280-4290. Giver, L., Gershenson, A., Freskgard, P. O. & Arnold, F. H. 1998. Directed evolution of a thermostable esterase. Proc. Natl. Acad. Sci. USA 95: 12809-12813. Gomes, J. & Steiner, W. 2004. The biocatalytic potential of extremophiles and extremozymes. Food Technol. Biotechnol. 42: 223-235. Greene, L. H. & Higman, V. A. 2003. Uncovering network systems within protein structures. J. Mol. Biol. 334: 781-791. Gromiha, M. M. & Selvaraj, S. 2004. Inter-residue interactions in protein folding and stability. Prog. Biophys. Mol. Biol. 86: 235-277. Gros, M. & Jainicke, R. 1994. Protein under pressure. Eur. J. Biochem. 221: 617-630. Guex, N., Diemand, A. & Peitsch, M. C. 1999. Protein modelling for all. Trends Biochem. Sci. 24: 364-367. Guex, N. & Peitsch, M. C. 1997. SWISS-MODEL and the Swiss-PdbViewer: an environment for comparative protein modeling. Electrophoresis 18: 2714-2723.

110

Gugolya, Z., Dosztanyi, Z. & Simon, I. 1997. Interresidue interactions in protein classes. Proteins 27: 360-366. Gunasekaran, K. & Nussinov, R. 2007. How different are structurally flexible and regid binding sites? Sequence and structural features discriminating proteins that do and do not undergo conformational change upon ligand binding. J. Mol. Biol. 365: 257-273. Halle, B. 2002. Flexibility and packing in proteins. Proc. Natl. Acad. Sci. USA 99: 1274-1279. Hamelryck, T. & Manderick, B. 2003. PDB file parser and structure class implemented in Python. Bioinformatics 19: 2308-2310. Hanson, J., Duderstadt, K., Watkins, L., Bhattacharyya, S., Brokaw, J., Chu, J.-W. & Yang, H. PNAS 104: 18055-18060. Hayward S. 2001. Normal Mode Analysis of Biological Molecules en Computational Biochemistry and Biophysics, Becker O., A. MacKerell Jr, B. Roux y M. Watanabe eds., Marcel Dekker, Inc. Hei, D.J. & Clark, D.S. 1994. Pressure stabilization of proteins from extreme thermophiles. Appl. Environ. Microbiol. 60: 932-999. Henrissat, B. & Davies, G. 2000. Glycoside hydrolases and glycosyltransferases. Families, modules and implications for genomics. Plant Physiol. 124: 1515-1519. Henzler-Wildman, K., Lei, M., Thai, V., Kerns, S. J., Karplus, M. & Kern, D. 2007. A hierarchy of timescales in protein dynamics is linked to enzyme catalysis. Nature 450: 913-918. Higgins, D. G. & Sharp, P. M. 1988. CLUSTAL: a package for performing multiple sequence alignment on a microcomputer. Gene 73: 237-244 (http://www.ebi.ac.uk/clustalw). Hildebrandt, P., Wanarska, M. & Kur, J. 2009. A new cold-adapted β-D-galactosidase from the antarctic Arthrobacter sp. 32c – gene cloning, overexpression, purification and properties. BMC Microbiol. 9: 151-161. Hinsen K. 1998. Analysis of Domain Motions by Approximate Normal Mode Calculations. Proteins 33: 417-429. Hinsen, K. 2000. The molecular modelling tool kit: a new approach to molecular simulations. J. Comp. Chem. 21: 79-85. Hinsen, K & Kneller, G. R. 2000. Projection methods for the analysis of complex motions in macromolecules. Mol. Sim. 23: 275-292. Hirasawa, K., Uchimura, K., Kashiwa, M., Grant, W. D., Ito, S., Kobayashi, T. & Horikoshi, K. 2006. Salt-activated endoglucanase of a strain of alkaliphilic Bacillus agaradhaerens. Ant. van Leeuwenhoek 89: 211-219.

111

Hoyoux, A., Jennes, I., Dubois, P., Genicot, S., Dubail, F., François, J. M., Baise, E. & Gerday, C. 2001. Cold-adapted β-galactosidase from the antarctic psychrophile Pseudoalteromonas haloplanktis. Appl. Environ. Microbiol. 67: 1529-1535. Hoyoux, A., Blaise, V., Collins, T., D’Amico, S., Gratia, E., Huston, A.L., Marx, J.C., Sonan, G., Zeng, Yinxin, Feller, G. & Gerday C. 2004. Extreme catalysts from low-temperature environments. J. Biosci. Bioeng. 98: 317-330. Hunter, J. D. 2007. Matplotlib: a 2D graphics environment. Comp. Sci. E ng. 9: 90-95. Jaenicke, R. 2000. Stability and stabilization of globular proteins in solution. J. Biotechnol. 79: 193-203. Karplus, M. & Kuriyan, J. Molecular dynamics and protein function. Proc. Natl. Acad. Sci. USA 102: 6679-6685. Kazmirski, S. L., Li, A. & Daggett, V. Analysis methods for comparison of multiple molecular dynamics trajectories: applications to protein unfolding pathways and denatured ensembles. J. Mol. Biol. 290: 283-304. Koshland, D. E. 1958. Aplication of a theory of enzyme specificity to protein synthesis. Proc. Natl. Acad. Sci. USA 44: 98-105. Kumar, S. & Nussinov, R. 1999. Salt bridge stability in monomeric proteins. J. Mol. Biol. 293: 1241-1255. Kumar, S., Ma, B., Tsai, C.-J., Sinha, N. & Nussinov, R. 2000. Folding and binding cascades: Dynamic landscapes and population shifts. Prot. Sci. 9: 10-19. Kumar, S., Wolfson, H & Nussinov, R. 2001. Protein flexibility and electrostatic interactions. IBM J. Res & Dev. 45: 499-512. Kumar, S., Tsai, C.-J. & Nussinov, R. 2002. Maximal stabilities of reversible two-state proteins. Biochemistry 41: 5359-5374. Laidler, K. J. & King, M. C. 1983. The development of Transition-State-Theory. J. Phys. Chem. 87: 2657-2664. Leiros, H. K., Willassen, N. P. & Smalas, A. O. 2000. Structural comparison of psychrophilic and mesophilic trypsins. Elucidating the molecular basis of cold-adaptation. Eur. J. Biochem. 267: 1039-1049. Leiros, I., Moe, E., Lanes, O., Smalas, O. & Willassen, P. 2003. The structure of uracil-DNA glycosylase from atlantic cod (Gadus morhua) reveals cold-adaptation features. Acta Crystallogr. D Biol. Crystallogr. 59: 1357-1365. Lonhienne, T., Gerday, C. & Feller, G. 2000. Psychrophilic enzymes: revisiting the thermodynamic parameters of activation may explain local flexibility. Biochim. Biophys. Acta 1543: 1-10.

112

Lonhienne, T., Zoidakis, J., Vorgias, C. E., Feller, G., Gerday, C. & Bouriotis, V. 2001. Modular structure, local flexibility and cold-activity of a novel chitobiase from a psychrophilic antarctic bacterium. J. Mol. Biol. 310: 291-297. Lopez, C. F., Darst, R. K. & Rossky, P. J. 2007. Mechanistic elements of protein cold denaturation. J. Phys. Chem. B 112: 5961-5967. Luo, Y., Zheng, Y., Jiang, Z., Ma, Y. & Wei, D. 2006. A novel psychrophilic lipase from Pseudomonas fluorescens with unique property in chiral resolution and biodiesel production via transesterification. Appl. Microbiol. Biotechnol. 73: 349-355. Ma, B., Kumar, S., Tsai, C.-J. & Nussinov, R. 1999. Folding funnels and binding mechanisms. Protein Eng. 12: 713-720. MacArthur, M. W. & Thornton, J. M. 1991. Influence of proline residues on protein conformation. J. Mol. Biol. 218: 397-412. MacArthur, M. W. & Thornton, J. M. 1993. Conformational analysis of protein structures derived from NMR data. Proteins 17: 232-251. MacKerell, A. D. 2001. Atomistic models and force fields, en Computational Biochemistry and Biophysics, Becker O., MacKerell Jr, A., Roux, B. & Watanabe, M. eds. (New York, Marcel Dekker, Inc.), 7-38. McDonald, I. K. & Thornton, J. M. 1994. Satisfying hydrogen bonding potential in proteins. J. Mol. Biol. 238: 777-793. Maes, D., Zeelen, J. P., Thanki, N., Beaucamp, N., Alvarez, M., Thi, M. H. D., Backmann, J., Martial, J. A., Wyns, L., Jaenicke, R. & Wierenga, R. K. 1999. The crystal structure of triosephosphate isomerase (TIM) from Thermotoga maritima: a comparative thermostability structural analysis of ten different TIM structures. Proteins Struct. Funct. Genet. 37: 441-453. Margesin, R., Feller, G., Gerday, C. & Russell, N. 2002. Cold-adapted microorganisms: adaptation strategies and biotechnological potential. In Bitton, G. (ed.), The encyclopedia of environmental microbiology. John Wiley & Sons, New York, 871-885. Marhuenda-Egea, F.C. & Bonete, M.J. 2002. Extreme halophilic enzymes in organic solvents. Curr. Opin. Biotechnol. 13: 385-389. Marx, J.-C., Collins, S., D’Amico, G., Feller, C. & Gerday, C. 2007. Cold-adapted enzymes from marine antarctic microorganisms. Mar. Biotech. 9: 293-304. McCoy, M. 2000. Novozymes emerges. Chem. Eng. News 19: 23-25. McFall-Ngai, M. J. & Horwitz, J. 1990. A comparative study of the thermal stability of the vertebrate eye lens: antarctic ice fish to the desert iguana. Exp. Eye Res. 50: 703-709. Miller, G. L. 1959. Use of dinitrosalicylic acid reagent for determination of reducing sugars. Anal. Chem. 31: 426-428.

113

Miller, G. P. & Benkovic, S. J. 1998. Stretching exercices-flexibility in dihydrofolate reductase catalysis. Chem. Biol. 5: 105-113. Miller, D. W. & Agard, D. A. 1999. Enzyme specificity under dynamic control: a normal mode analysis of α-lytic protease. J. Mol. Biol. 286: 267-278. Miyazaki, K., Wintrode, P. L., Grayling, R. A., Rubingh, D. N. & Arnold, F. H. 2000. Directed evolution study of temperature adaptation in a psychrophilic enzyme. J. Mol. Biol. 297: 1015-1026. Morrison, K. L. & Weiss, G. A. 2001. Combinatorial alanine-scanning. Curr. Opin. Chem. Biol. 5: 302-307. Mulder, F. A. A., Mittermaier, A., Hon, B., Kahlquist, F. W. & Kay, L. E. Studying excited states of proteins by NMR spectroscopy. Nature Struct. Biol. 8: 932-935. Nielsen, P., Fritze, D. & Priest, F. G. 1995. Phenetic diversity of alkaliphilic Bacillus strains: proposal for nine new species. Microbiology 141: 1745-1761. Page, M. I. & Jencks, W. P. 1971. Entropic contributions to rate accelerations in enzymic and intramolecular reactions and the chelate effect. Proc. Natl. Acad. Sci. USA 68: 1678-1683. Papaleo, E., Riccardi, L., Villa, C., Fantucci, P. & De Gioia, L. 2006. Flexibility and enzymatic cold-adaptation: A comparative molecular dynamics investigation of the elastase family. Biochim. Biophys. Acta 1764: 1397-1406. Papaleo, E., Olufsen, M., De Gioia, L. & Brandsdal, B. O. 2007. Optimization of electrostatics as a strategy for cold-adaptation: a case study of cold- and warm-active elastases. J. Mol. Graph. Mod. 26: 93-103. Parthasarathy, S. & Murthy M. R. N. 2000. Correlating dynamics to conformational properties: an analysis of atomic displacement parameters (B-values) in high-resolution protein structures. Science 78: 1123-1126. Pattabiraman, N., Ward, K. B. & Fleming, P. J. 1995. Occluded molecular surface: analysis of protein packing. J. Mol. Recognit. 8: 334-344. Pauling, L. 1946. Molecular architecture and biological reactions. Chem. Eng. News 24: 1375-1377. Pineda, J. R. E. T. & Schwartz, S. D. 2006. Protein dynamics and catalysis: the problems of transition state theory and the subtlety of dynamic control. Phil. Trans. R. Soc. B 361: 1433-1438. Plaxco, W. K., Simons, K. T. & Baker, D. 1998. Contact order, transition state placement and the refolding rates of single domain proteins. J. Mol. Biol. 277: 985-994.

114

Poirot, O., Suhre, K., Abergel, C., O’Toole, E. & Notredame, C. 2004. 3DCoffee@igs: a web server for combining sequences and structures into a multiple sequence alignment. Nucleic Acids Res. 32 (Web Server issue): 37-40. Poliakoff, M., Fitzpatrick, J.M., Farren, T.R., Paul, T & Anastas, P.T. 2002. Green chemistry: science and politics of change. Science 297: 807-810. Poon, D. K. Y., Webster, P., Withers, S. G. & McIntosh, L. P. 2003. Characterizing the pH-dependent stability and catalytic mechanism of the family 11 xylanase from the alkalophilic Bacillus agaradhaerens. Carbohydr. Res. 338: 415-421. Rader, A. J., Chennubhotla, Ch., Yang, L.-W., & Bahar, I. 2006. The Gaussian Network Model: Theory and Applications, in Normal Mode Analysis: Theory and Applications to Biological and Chemical Systems. Eds. Cui, Q. & Bahar, I., Chapman & Hall / CRC Mathematical and Computational Biology Series, CRC Press, Taylor & Francis Group, 41-64. Radkiewicz, J. & Brooks, C. L. 2000. Protein dynamics in enzymatic catalysis: exploration of dihydrofolate reductase. J. Am. Chem. Soc. 122: 225-231. Radzicka, A. & Wolfenden, R. 1995. A proficient enzyme. Science 267: 90-93. Réat, V., Patzelt, H., Ferrand, M., Pfister, C., Oesterhelt, D. & Zaccai, G. 1998. Dynamics of different functional parts of bacteriorhodopsin: H-2H labeling and neutron scattering. Proc. Natl. Acad. Sci. USA 95: 4970-4975. Richards, F. M. 1974. The interpretation of protein structures: total volume, group volume distributions and packing density. J. Mol. Biol. 82: 1-14. Robinson-Rechavi, M., Alibés, A. & Godzik, A. 2006. Contribution of electrostatic interactions, compactness and quaternary structure to protein thermostability: lessons from structural genomics of Thermotoga maritima. J. Mol. Biol. 356: 547-557. Rose, G., Fleming, P., Banavar, J. & Maritan, A. 2006. A backbone-based theory of protein folding. Proc. Natl. Acad. Sci. USA 103: 16623-16633. Rothschild, L. J., & Mancinelli, R.L. 2001. Life in extreme environments. Nature 409: 1092-1101. Rozzell, J.D. 1999. Commercial scale biocatalysis: myths and realities. Bioorg. Med. Chem. 7: 2253-2261. Russell, R. J., Gerike, U., Danson, M. J., Hough, D. W. & Taylor, G. L. 1998. Structural adaptations of the cold-active citrate synthase from an antarctic bacterium. Structure 6: 351-361. Ruxton, G. D. 2006. The unequal variance t-test is an underused alternative to Student’s t-test and the Mann-Whitney U test. Behav. Ecol. 17: 688-690.

115

Salazar, O., Molitor, J., Lienqueo, M. E. & Asenjo, J. A. 2001. Overproduction, purification and characterization of β-1,3-glucanase type II in Escherichia coli. Protein Expr. Purif. 23: 219-225. Sali, A. & Blundell, T. L. 1993. Comparative protein modelling by satisfaction of spatial restraints. J. Mol. Biol. 234: 779-815. Schiraldi, C. & De Rosa, M. 2002. The production of biocatalysts and biomolecules from extremophiles. Trends Biotechnol. 20: 515-521. Shu, F., Ramakrishnan, V. & Schoenborn, B. P. 2000. Enhanced visibility of hydrogen atoms by neutron crystallography on fully deuterated myoglobin. Proc. Natl. Acad. Sci. USA 97: 3872-3877. Siddiqui, K. S. & Cavicchioli, R. 2005. Improved thermal stability and activity in the cold-adapted lipase B from Candida antarctica following chemical modification with oxidized polysaccharides. Extremophiles 9: 471-476. Siddiqui, K. S. & Cavicchioli, R. 2006. Cold-adapted enzymes. Annu. Rev. Biochem. 75: 403-433. Smalas, A. O., Heimstad, E. S., Hordvik, A., Willassen, N. P. & Male, R. 1994. Cold adaptation of enzymes: structural comparison between salmon and bovine trypsins. Proteins 20: 149-166. Sonan, G. K., Receveur-Brechot, V., Duez, C., Aghajari, N., Czjzek, M., Haser, R. & Gerday, C. 2007. The linker region plays a key role in the adaptation to cold of the cellulase from an Antarctic bacterium. Biochem. J. 407: 293-302. Sriprapundh, D., Vieille, C. & Zeikus, J. G. 2000. Molecular determinants of xylose isomerase thermal stability and activity: analysis of thermozymes by site-directed mutagenesis. Protein Eng. 13: 259-265. Stoner, M. R., Dale, D. A., Gualfetti, P. J., Becker, T. & Randolph, T. W. 2005. Ca2+-surfactant interactions affect enzyme stability in detergent solutions. Biotech. Prog. 21: 1716-1723. Süel, G. M., Lockloss, S. W., Wall, M. A. & Ranganathan, R. 2003. Evolutionarily conserved networks of residues mediate allosteric communication in proteins. Nat. Struct. Biol. 10: 59-69. Svingor, A., Kardos, J., Hajdu, I., Nemeth, A. & Zavodszky, P. 2001. A better enzyme to cope with cold. Comparative flexibility studies on psychrotrophic, mesophilic, and thermophilic ipmdhs. J. Biol. Chem. 276: 28121-28125. Taguchi, S., Komada, S. & Momose, H. 2000. The complete amino acid substitutions at position 131 that are positively involved in cold adaptation of subtilisin BPN. Appl. Environ. Microbiol. 66: 1410-1415. Tama, F., Gadea, F., Marques, O. & Sanejouand, Y.-H. 2000. Building-block approach for determining low-frequency normal modes of macromolecules. Proteins 41: 1-7.

116

Tian, J., Wang, P., Gao, S., Chu, X., Wu, N. & Fan, Y. 2010. Enhanced thermostability of methyl parathion hydrolase from Ochrobactrum sp. M231 by rational engineering of a glycine to proline mutation. FEBS J. 277: 4901-4908. Tindbaek, N., Svendsen, A., Oestergaard, P. R. & Draborg, H. 2004. Engineering a substrate-specific cold-adapted subtilisin. Protein Eng. Des. Sel. 17: 149-156. Tirion, M.M. 1996. Large Amplitude Elastic Motions in Proteins from a Single –Parameter Atomic Analysis. Phys. Rev. Lett. 77: 1905-1908. Torshin, I. Y., Weber, I. T. & Harrison, R. W. 2002. Geometric criteria of hydrogen bonds in proteins and identification of “bifurcated” hydrogen bonds. Prot. Eng. 15: 359-363. Tsigos I., Mavromatis, K., Tzanodaskalaki, M., Pozidis, C., Kokkinidis, M. & Bouriotis, V. 2001. Engineering the properties of a cold active enzyme through rational redesign of the active site. Eur. J. Biochem. 268: 5074-5080. Urban, A., Neukirchen, S. & Jaeger, K.-E. 1997. A rapid and efficient method for site-directed mutagenesis using one-step overlap extension PCR. Nucl. Acids Res. 25: 2227-2228. Van den Burg, B. 2003. Extremophiles as a source for novel enzymes. Curr. Opin. Microbiol. 6: 213-218. Van Petegem, F., Collins, T, Meuwis, M.-A., Gerday, C., Feller, G. & Van Beeumen, J. 2003. The structure of a cold-adapted family 8 xylanase at 1.3 Å resolution, structural adaptations to cold and investigation of the active site. J. Biol. Chem. 278: 7531-7539. Varrot, A., Schülein, M. & Davies, G. J. 2000. Insights into ligand-induced conformational change in Cel5A from Bacillus agaradhaerens revealed by a catalytically active crystal form. J. Mol. Biol. 297: 819-828. Varrot, A. & Davies, G. J. 2003. Direct experimental observation of the hydrogen-bonding network of a glycosidase along its reaction coordinate revealed by atomic resolution analyses of endoglucanase Cel5A. Acta Cryst. D 59: 447-452. Villeret, V., Chessa, J.-P., Gerday, C. & Van Beeumen, J. 1997. Preliminary crystal structure determination of the alkaline protease from the antarctic psychrophile Pseudomonas aeruginosa. Prot. Sci. 6: 2462-2464. Violot, S., Aghajari, N., Czjzek, M., Feller, G., Sonan, G. K., Gouet, P., Gerday, C., Haser, R., Receveur-Bréchot, V. 2005. Structure of a full length psychrophilic cellulase from Pseudoalteromonas haloplanktis revealed by X-ray diffraction and small angle X-ray scattering. J. Mol. Biol. 348: 1211-1224. Wang, Q., Tull, D., Meinke, A., Gilkes, N., Warrens, A., Aebersold, R. & Withers, S. 1993. Glu280 is the nucleophile in the active site of Clostridium thermocellum CelC, a family A endo-β-1,4-glucanase. J. Biol. Chem. 268: 14096-14102. Ward, S., Curtis, C. & Hulme, E. 1999. Alanine-scanning mutagenesis of transmembrane

117

domain 6 of the M1 muscarinic acetylcholine receptor suggests that Tyr381 plays key roles in receptor function. Mol. Pharmacol. 56: 1031-1041. Warshel, A. 1998. Electrostatic origin of the catalytic power of enzymes and the role of preorganized active sites. J. Biol. Chem. 273: 27035-27038. Wintrode, P. L. & Arnold, F. H. 2000. Temperature adaptation of enzymes: lessons from laboratory evolution. Adv. Protein Chem. 55: 161-225. Wintrode, P. L., Miyazaki, K. & Arnold, F. H. 2000. Cold adaptation of a mesophilic subtilisin-like protease by laboratory evolution. J. Biol. Chem. 275: 31635-31640. Wolfenden, R.; Ridgway, C. & Young, G. 1998. Spontaneous hydrolysis of ionized phosphate monoesters and diesters and the proficiencies of phosphatases and phosphodiesterases as catalysts. J. Am. Chem. Soc. 120: 833-834. Wolf-Watz, M., Thai, V., Henzler-Wildman, K., Hadjipavlou, G., Eisenmesser, E. Z. & Kern, D. 2004. Linkage between dynamics and catalysis in a thermophilic-mesophilic enzyme pair. Nature Struct. Mol. Biol. 11: 945-949. Wooll, J. O., Wrabl, J. O. & Hilser, V. J. 2000. Ensemble modulation as an origin of denaturant-independent hydrogen exchange in proteins. J. Mol. Biol. 301: 247-256. Xu, Y., Feller, G., Gerday, C. & Glansdorff, N. 2003. Moritella cold-active dihydrofolate reductase: are there natural limits to optimization of catalytic efficiency at low temperature? J. Bact. 185: 5519-5526. Zaccai, G. 2000. How soft is a protein? A protein dynamics force constant measured by neutron scattering. Science 288: 1604-1607. Zavodszky, P., Kardos, J., Svingor, A. & Petsko, G. 1998. Adjustment of conformational flexibility is a key event in the thermal adaptation of proteins. Proc. Natl. Acad. Sci. USA 95: 7406-7411. Zecchinon, L., Claverie, P., Collins, T., D’Amico, S., Delille, D., Feller, G., Georlette, D., Gratia, E., Hoyoux, A., Meuwis, M. A., Sonan, G. & Gerday, C. 2001. Did psychrophilic enzymes really win the challenge? Extremophiles 5: 313-321. Zeng, R., Xiong, P. & Wen, J. 2006. Characterization and gene cloning of a cold-active cellulase from a deep-sea psychrtrophic bacterium Pseudoalteromonas sp. DY3. Extremophiles 10: 79-82. Zhang, N., Suen W.-C., Windsor, W., Xiao, L., Madison, V. & Zaks, A. 2003. Improving tolerance of Candida antarctica lipase B towards irreversible thermal inactivation through directed evolution. Prot. Eng. 16: 599-605. Zhou, Y., Vitkup, D. & Karplus, M. 1999. Native proteins are surface-molten solids: application of the Lindemann criterion for the solid versus liquid state. J. Mol. Biol. 285: 1371-1375.

118

ANEXO I

Bases termodinámicas de la catálisis

En esta sección se revisará los conceptos termodinámicos básicos que

permiten describir y estudiar el comportamiento enzimático.

1. Ecuaciones termodinámicas fundamentales

Los conceptos termodinámicos básicos de energía interna y entropía, marcan el

inicio del razonamiento que nos llevará finalmente a entender el fenómeno de catálisis

enzimática. La energía interna de un sistema es la suma de las energías de cada partícula

que lo compone. La entropía (S) es una magnitud que, según la famosa relación de

Ludwig Boltzmann,

!

S = k lnW , donde k es la constante de Boltzmann y W es la

multiplicidad de grados de libertad, da cuenta del nivel de “orden” o “desorden” de un

sistema (Dill y Bromberg, 2003). Ambas propiedades son extensivas, ya que dependen

del tamaño del sistema.

Se puede demostrar que un sistema termodinámico, para alcanzar el equilibrio,

siempre tiende a una máxima multiplicidad de estados, es decir, según la relación de

Boltzmann, a una máxima entropía (Dill y Bromberg, 2003).

Las ecuaciones fundamentales para los conceptos de entropía y energía libre se

basan en la noción de que la tendencia de un sistema hacia una máxima multiplicidad de

estados (entropía) puede explicar diversos comportamientos físicos macroscópicos.

Cuando el volumen puede variar, la tendencia hacia máxima entropía predice la

expansión de los gases, cuando el número de partículas puede cambiar, la tendencia

hacia máxima entropía predice el fenómeno de mezcla y cuando la energía puede variar,

la tendencia hacia máxima entropía predice el flujo de calor (Dill y Bromberg, 2003).

Así, la ecuación termodinámica fundamental para la entropía depende de 3

variables: U (energía interna), V (volumen) y N (número de partículas):

!

dS ="S

"U

#

$ %

&

' ( V ,N

dU +"S

"V

#

$ %

&

' ( U ,N

dV +"S

"N j

#

$ % %

&

' ( (

j=1

M

)U ,V ,Ni* j

dN j (1)

119

La ecuación fundamental para la energía interna depende de S (entropía), V

(volumen) y N (número de partículas):

!

Cada derivada parcial en la ecuación de energía se asocia a una propiedad física

intensiva:

Siendo T, p y

!

µ, la temperatura, presión y potencial químico de un sistema,

respectivamente. Estas magnitudes se comportan como fuerzas que gobiernan procesos

como transferencia de calor, trabajo y mezcla respectivamente (Dill y Bromberg, 2003).

Incorporando las definiciones recién mencionadas, las ecuaciones termodinámicas

fundamentales de la entropía y la energía interna quedan de la siguiente manera:

2. Energía libre y equilibrio

Un sistema combinado, conformado por un subsistema y su entorno, evoluciona

hacia su estado de equilibrio cuando la suma de las variaciones de entropía del

subsistema y el entorno es positiva. En el equilibrio las variaciones de entropía suman

cero, es decir se maximiza la entropía. Esto se basa en el hecho de que una máxima

multiplicidad de estados tiene la mayor probabilidad de ocurrencia.

Se tiene:

!

dU ="U

"S

#

$ %

&

' ( V ,N

dS +"U

"V

#

$ %

&

' ( S,N

dV +"U

"Nj

#

$ %

&

' (

j=1

M

)S,V ,Ni* j

dNj

!

"U

"Nj

#

$ %

&

' ( S,V ,Ni) j

= µ j

!

"#U

#V

$

% &

'

( ) S,N

= p

!

"U

"S

#

$ %

&

' ( V ,N

= T

!

dU = TdS" pdV + µ jdNj

j=1

M

#

!

dS =1

T

"

# $

%

& ' dU +

p

T

"

# $

%

& ' dV (

µ j

T

"

# $

%

& '

j=1

M

) dNj

(2)

(3)

(4)

(5)

120

donde Ssc es la entropía del sistema combinado, Ss es la entropía del subsistema y Sa es

la entropía del ambiente.

Suponiendo que el sistema combinado es aislado, es decir no intercambia energía

en sus fronteras, se puede establecer una relación que describe el equilibrio considerando

sólo parámetros del subsistema de interés, sin incorporar parámetros del ambiente. Esta

relación introduce un nuevo concepto: la energía libre.

Sistema combinado aislado:

La idea es eliminar los parámetros que describen el ambiente. Considerando la

ecuación (5), manteniendo V y N constantes se tiene:

Según (7),

!

dUa

= "dUs, por lo tanto

Sustituyendo la ecuación (9) en la ecuación (6):

De la ecuación (10) surge una expresión que describe la aproximación a un estado

de equilibrio en términos del subsistema estudiado únicamente. Esta relación define la

cantidad F, denominada Energía Libre de Helmholtz:

Derivando la ecuación (11) y considerando T constante, se obtiene la ecuación

(10). La energía libre de Helmhotz depende de 3 variables: T, V y N. Examinando las

!

dSsc

= dSs+ dS

a" 0 (6)

!

dUs+ dU

a= 0 (7)

!

dSa

=1

T

"

# $

%

& ' dUa

(8)

!

dSa

= "1

T

#

$ %

&

' ( dUs (9)

!

dSs"1

T

#

$ % &

' ( dUs

) 0

!

dUs" TdS

s# 0 (10)

!

F =U "TS (11)

121

ecuaciones (10) y (11) se establece que cuando se alcanza el equilibrio (ecuación (10)

igual a cero), la cantidad F se encuentra en un mínimo.

La energía libre de Helmholtz describe el estado de equilibrio a T, V y N

constantes. Siguiendo el mismo razonamiento, es posible encontrar una relación a S, p y

N constantes. Retomando la ecuación fundamental de la energía interna (4), y

considerando que a presión y numero de partículas constante

!

Va

= "Vs (ley de los gases

ideales), se tiene:

Reemplazando la ecuación (12) en la ecuación de conservación de la energía (7)

se obtiene:

De la ecuación (13) surge otra función fundamental, la entalpía (H):

A pesar de la validez de las 4 ecuaciones termodinámicas fundamentales recién

presentadas, éstas dependen de variables difíciles de imponer en condiciones de

laboratorio. La última ecuación termodinámica fundamental, que da origen a la Energía

Libre de Gibbs (G) depende de variables fácilmente controlables como T, p y N. Por esta

razón, G es considerada una de las ecuaciones fundamentales más importantes e útiles

para describir el estado de equilibrio de los sistemas termodinámicos.

Para deducir la ecuación fundamental de G, es necesario fijar las variables T, p

y N como constantes. En estas condiciones, el término entrópico de la ecuación (4) no se

cancela. Aplicando el mismo tipo de resolución que para el caso de la entalpía y la

Energía Libre de Helmholtz se obtiene:

!

dUa = pdVs (12)

!

dUs + pdVs = 0 (13)

!

H = U + pV (14)

!

dUs + pdVs " TdSs # 0 (15)

122

Finalmente combinando las ecuaciones (14) y (15), se obtiene la relación

fundamental para la Energía Libre de Gibbs:

Cuando un sistema termodinámico alcanza el equilibrio a T, p y N constantes,

la energía libre de Gibbs se encuentra en un mínimo y su diferencial es cero.

3. Ley de distribución de Boltzmann

Las propiedades termodinámicas de un sistema se pueden predecir mediante

funciones de distribución, como la de Boltzmann.

La ley de distribución de Boltzmann describe el equilibrio entre átomos y

moléculas. A continuación se presenta las etapas que permiten la deducción de la ley de

distribución de Boltzmann.

Ludwig Boltzmann relacionó el concepto de entropía con fundamentos

probabilísticos en la relación:

Donde S es la entropía, k es la constante de Boltzmann (1,380662*10-23 J/K) y

pj es la probabilidad de ocurrencia del estado j.

Al diferenciar con respecto a pj se obtiene:

Se plantea que la energía interna del sistema en estudio consiste en el

promedio de las energías discretas de cada partícula que lo compone:

!

G = H "TSs

(16)

!

S

k= " pj ln pj

j=1

t

# (17)

!

dS = "k 1+ ln pj( )dpjj=1

t

# (18)

!

U =< E >= pjEjj=1

t

" (19)

123

Donde pj es la probabilidad de ocurrencia de cada nivel energético discreto.

Derivando:

Tal como la energía interna U, los niveles de energía discretos de cada

partícula del sistema dependen de V y N. Sin embargo, a diferencia de U, no dependen de

S y T. Siguiendo un principio fundamental de la mecánica cuántica, sólo las

probabilidades de un estado, pj(T), y no los niveles de energía Ej, dependen de la

temperatura. Considerando esto, la energía promedio del sistema depende de la

temperatura.

Considerando V y N constantes, Ej no varía y por lo tanto su derivada es igual

a cero. Así, la ecuación (20) queda de la forma:

Se busca la función de probabilidad que satisfaga la condición de equilibrio

dada por la energía libre de Helmholtz,

!

dF = d < E > "TdS = 0 , sujeta a la restricción de

que la suma de las probabilidades de cada estado en el sistema sumen 1 (

!

p j =1j=1

t

" ).

Sustituyendo las ecuaciones (18) y (21) en y

expresando la restricción impuesta como un multiplicador de Lagrange (ya que la

restricción es una función constante), se tiene:

De acuerdo con el método del multiplicador de Lagrange, la función F alcanza

un extremo cuando el valor pj satisface la ecuación (22) para cada j. Por lo tanto se tiene t

ecuaciones de la forma:

!

dU = d < E >= Ejdpj + pjdEjj=1

t

" (20)

!

d < E >= Ejdpjj=1

t

" (21)

!

dF = d < E > "TdS = 0

!

E j + kT 1+ ln p j( ) +"[ ] = 0j=1

t

# (22)

124

Aplicando exponencial queda:

Finalmente para eliminar el factor desconocido α de la ecuación, se sustituye la

ecuación de restricción

!

p j =1j=1

t

" en la ecuación (24), y se utiliza este término como

denominador en la ecuación (24). El resultado es:

donde Q es la función de partición.

La función de partición Q da cuenta del número total de estados energéticos

efectivamente alcanzables por un sistema en función de la temperatura (esto se puede

apreciar al estudiar los límites de Q cuando T es cero o infinito).

4. Propiedades termodinámicas y ley de distribución

En esta sección utilizaremos la ley de distribución de Boltzmann para deducir

propiedades termodinámicas relevantes.

!

ln pj = "Ej

kT"#

kT"1 (23)

!

pj = e"Ej kTe

"# kT( )"1 (24)

!

pj =e"Ej kT

e"Ej kT

j=1

t

#=e"Ej kT

Q(25)

!

Q = e"Ej kT

j=1

t

# (26)

125

Energía interna:

Si sustituimos la ecuación (25) en la ecuación (19) para la energía interna se

tiene:

Donde β=1/kT. La suma de la parte derecha de la ecuación (27) se puede expresar como

derivada de la función de partición (ecuación (26)):

Reemplazando la ecuación (28) en la ecuación (27) se logra una relación mas simple:

Como β=1/kT:

Multiplicando el lado izquierdo de la ecuación (30) por

!

"1 kT2 y el lado derecho por

!

"# "T , se obtiene:

!

U = Q"1

Eje"#Ej

j=1

t

$ (27)

!

"Q

"#

$

% &

'

( ) =

"

"#e*#Ej

j=1

t

+ = * Eje*#Ej

j=1

t

+ (28)

!

U = "1

Q

#Q

#$

%

& '

(

) * = "

# lnQ

#$

%

& '

(

) *

!

"#

"T

$

% &

'

( ) = *

1

kT2

(29)

(30)

!

U

kT2

=" lnQ

"T

#

$ %

&

' ( (31)

!

U = kT2 " lnQ

"T

#

$ %

&

' ( (32)

126

Entropía y energía libre de Helmholtz:

Si sustituimos la ecuación (25) en la ecuación (17) para la entropía, se tiene:

Considerando la ecuación (27) para la energía interna, y reemplazándola en la

ecuación (33) resulta la relación para la entropía:

Por lo tanto, la dependencia de la energía libre de Helmholtz con la función de

partición de Boltzmann es:

Potencial químico:

El potencial químico es una función que depende del número de partículas del

sistema (N). Por esta razón, es conveniente expresar la función de distribución de

Boltzmann en términos de N.

La ley de distribución de Boltzmann se aplica a sistemas con diversos grados

de complejidad. Por ejemplo supongamos un sistema compuesto por N moléculas

poliméricas, que pueden adquirir diversos estados. Los posibles niveles discretos de

energía del sistema (Ej) corresponderán a la suma de los distintos niveles discretos de

energía presentados por cada molécula (

!

"i

A ,

!

i =1,2,...,a para la molécula A;

!

"m

B ,

!

m =1,2,....,b para la molécula B; etc.),

!

E j = "iA

+ "mB

+ ...+ "nN . Suponiendo que las

moléculas del sistema son independientes, existirá una función de distribución específica

para cada una de ellas. Para un sistema simplificado con dos moléculas:

!

S

k= "

1

Qe"Ej kT

#

$ %

&

' ( ln

1

Q

#

$ %

&

' ( "

Ej

kT

#

$ %

&

' (

j=1

t

) (33)

!

S = k lnQ +U

T(34)

!

F = U " TS = "kT lnQ (35)

127

La cantidad de estados discretos de energía que puede adoptar el sistema

completo corresponde al número de combinaciones de los estados discretos de energía

de las N partículas que lo componen. Es decir,

!

t = ab para el caso del sistema con 2

partículas A y B, siendo

!

t el número de estados energéticos del sistema completo,

!

a el

número de estados energéticos de la partícula A y

!

b el número de estados energéticos de

la partícula B. Generalizando lo anterior, se tiene que para

!

N partículas que pueden

presentar

!

n estados energéticos discretos cada una,

!

t = nN .

Recordando que la función de distribución da cuenta de la cantidad de estados

energéticos efectivamente alcanzables por el sistema en función de la temperatura, se

tiene, en forma análoga al cálculo de

!

t , para N partículas independientes con función de

distribución q:

La ecuación (36) es válida sólo si las partículas que conforman el sistema son

distinguibles entre sí. En un sistema en el que las partículas no son distinguibles entre sí,

como un gas ideal, muchas de las combinaciones de estados energéticos discretos entre

las partículas son idénticas o equivalentes. En efecto, en un sistema con dos partículas

independientes indistinguibles, si una ocupa el nivel energético 15 y la otra ocupa el nivel

energético 20, es imposible discernir el escenario inverso. Por esta razón, es necesario

corregir el número de estados por

!

N!. Con esta restricción, la ecuación (36) queda de la

forma:

La expresión para la energía libre de Helmholtz de un gas ideal se obtiene

sustituyendo la ecuación (37) en la ecuación (35):

!

qB = e"#m

B kT

m=1

b

$

!

qA = e"#i

AkT

j=1

t

$

!

Q = qN

(36)

!

Q =qN

N!(37)

!

F = "kT lnQ = "kT lnqN

N!= "kT ln

eq

N

#

$ %

&

' (

N

= " NkT lneq

N

#

$ %

&

' ( (38)

128

El factor

!

e proviene de una aproximación de Stirling para

!

N! (

!

x!" x e( )x ).

Combinando las ecuaciones termodinámicas fundamentales para la energía

interna (4) y la energía libre de Helmholtz (11), se puede derivar la siguiente definición

para el potencial químico (

!

µ):

!

µ = "F "N( )T ,V

. Aplicando esta relación en la ecuación (37)

surge una expresión para el potencial químico de un gas ideal en términos de su función

de partición:

Partiendo de la ecuación (39), el potencial químico puede ser expresado en

función de la presión. Factorizando el volumen en la función de partición se tiene:

Aplicando la relación (40) y la ley de los gases ideales,

!

pV = nkT (que puede

ser derivada a partir de las ecuaciones (39), (40) y la definición proveniente de las

ecuaciones termodinámicas fundamentales

!

p = " #F #V( )T ,N

), en la ecuación (39) queda:

La expresión

!

q0kT tiene unidades de presión y se define como

!

pint

0 (presión

parcial estándar). Luego:

Donde

!

µ0 = "kT ln pint

0 se define como el potencial químico estándar. Las magnitudes

!

pint

0

y

!

µ0 dependen de la naturaleza de la partícula o molécula y de la temperatura.

5. La ecuación de van’t Hoff

La ecuación de van’t Hoff describe la dependencia del equilibrio químico con

respecto a la temperatura.

!

µ = kT lnN

eq

"

# $

%

& ' + kT = (kT ln

q

N

"

# $

%

& ' (39)

!

q = q0V (40)

!

µ = "kT lnq0kT

p

#

$ %

&

' ( (41)

!

µ = "kT lnpint

0

p

#

$ %

&

' ( = µ0 + kT ln p (42)

129

La condición para que exista equilibrio químico a T y p constantes se puede

deducir a partir de la ecuación fundamental de la energía libre de Gibbs (combinación

entre ecuaciones (4), (14) y (16):

La ecuación (43) describe un sistema con 2 tipos de moléculas en equilibrio

(

!

A" B). La condición de equilibrio dicta que

!

dG = 0. Considerando T y p constantes,

queda:

Si todas las moléculas se encuentran en estado A o B, el número total de

moléculas

!

NTOTAL

es constante:

Con estas consideraciones, la ecuación (44) puede ser escrita en función de

!

dNA

únicamente:

Esta relación debe ser válida para cualquier variación

!

dNA

, por lo que la

condición para el equilibrio es:

Esta condición expresada en términos de la ecuación (42) queda:

La constante de equilibrio basada en la presión,

!

Kp , para un sistema

conformado por dos especies

!

A" B, se define como:

!

dG = "SdT +Vdp + µAdNA + µBdNB (43)

!

dG = µAdN

A+ µ

BdN

B= 0 (44)

!

NA

+ NB

= NTOTAL

" dNA

+ dNB

= 0" dNA

= #dNB

(45)

!

µA" µ

B( )dNA= 0 (46)

!

µA

= µB (47)

!

µA

0 + kT ln pA = µB

0 + kT ln pB (48)

130

Entonces, aplicando

!

Kp en la ecuación (48) se tiene:

El potencial químico tiene diversas definiciones equivalentes, dependiendo de

la ecuación termodinámica fundamental de la cual derive:

Siguiendo la definición de energía libre en la ecuación (16), se puede expresar

la energía libre de Gibbs molar parcial en términos de sus componentes molares parciales

entrópicos y entálpicos:

Donde

!

h j y

!

s j son la entalpía y entropía molar parcial, respectivamente.

Teniendo lo anterior en consideración, la dependencia de la ecuación (50) con

respecto a la temperatura esta dada por:

!

Kp =pB

pA

(49)

!

lnKp = lnpB

pA

"

# $

%

& ' =

( µB

0 ( µA

0( )kT

= ()µ 0

kT

(50)

!

µ j ="G

"Nj

#

$ %

&

' ( T, p,Ni) j

="U

"Nj

#

$ %

&

' ( V , S,Ni) j

="H

"Nj

#

$ %

&

' ( S, p,Ni) j

="F

"Nj

#

$ %

&

' ( T,V ,Ni) j

(51)

!

µ j ="G

"Nj

#

$ %

&

' ( T, p,Ni) j

="H

"Nj

#

$ %

&

' ( T, p,Ni) j

* T"S

"Nj

#

$ %

&

' ( T, p,Ni) j

= hj * Tsj (52)

!

" lnKp

"T

#

$ %

&

' ( = )

"

"T

*µ 0

kT

#

$ %

&

' ( = )

"

"T

*h0 ) T*s0

kT

#

$ %

&

' ( (53)

131

Suponiendo que

!

"h0

= hB

0# h

A

0 y

!

"s0

= sB

0# s

A

0 son independientes de la

temperatura, se obtiene la relación de van’t Hoff:

6. Relación entre la energía libre de Gibbs y el equilibrio químico

La ecuación (42) que define el potencial químico en función de la presión en

conjunto con la ecuación (51) permiten deducir una de las relaciones más útiles para la

energía libre de Gibbs: su dependencia con respecto al equilibrio químico.

Retomando la ecuación (51) se tiene:

El término de la derecha es válido ya que G es una función homogénea de

primer orden.

Supongamos un sistema en equilibrio conformado por 4 especies (A,B,C y D),

que reaccionan entre sí de la siguiente manera:

Según la ecuación (55), la energía libre de Gibbs para ese sistema en

equilibrio corresponde a:

Si perturbamos el estado de equilibrio redistribuyendo las especies, dejándolas

en estados A’, B’, C’ y D’, la nueva energía libre de Gibbs del sistema corresponderá a:

!

" lnKp

"T

#

$ %

&

' ( =

)h0

kT2

(54)

!

µ j ="G

"Nj

#

$ %

&

' ( T,P,Ni) j

* dG = µ jdNj *G = µ j Nj

j=1

M

+j=1

M

+ (55)

!

A+ 2B " 3C +D (56)

!

G = µAN

A+ µ

BN

B+ µ

CNC

+ µDN

D (57)

132

En combinación con la ecuación (42), se puede expresar el cambio de energía

libre de Gibbs al retornar el sistema a su estado de equilibrio de la siguiente forma:

Como el número de especies del sistema es constante, y teniendo en cuenta la

estequiometría de la reacción (ecuación (56)), las diferencias en la cantidad de cada

especie entre el estado perturbado y de equilibrio obedecen las siguientes relaciones:

Reordenando la ecuación (59) teniendo en cuenta la ecuación (60), queda:

Por definición, tal como queda demostrado en las ecuaciones (45), (46) y (47),

en el estado de equilibrio se tiene:

Por lo tanto, el primer término de la ecuación (61) se anula. Finalmente el

cambio de energía libre de Gibbs queda como sigue:

!

G '= µA 'N

A '+ µ

B 'N

B '+ µ

C 'N

C '+ µ

D 'N

D ' (58)

!

"G = µA

0 + kT ln pA '( )NA ' # µA

0 + kT ln pA( )NA + µB

0 + kT ln pB '( )NB ' # µB

0 + kT ln pB( )NB +

µC

0 + kT ln pC '( )NC ' # µC

0 + kT ln pC( )NC + µD

0 + kT ln pD '( )ND' # µD

0 + kT ln pD( )ND

(59)

!

ND '" N

D( ) = " NA '" N

A( ) = "2 NB '" N

B( ) = 3 NC '" N

C( ) (60)

!

"G = ND' # ND( ) #µA

0 # 2µB

0 + 3µC

0 + µD

0( ) + ND ' # ND( ) #kT lnpA '

pA

$

% &

'

( ) # 2kT ln

pB '

pB

$

% &

'

( ) + 3kT ln

pC '

pC

$

% &

'

( ) + kT ln

pD'

pD

$

% &

'

( )

*

+ ,

-

. / (61)

!

"µA" 2µ

B+ 3µ

C+ µ

D= 0 (62)

!

"G = ND' # ND( ) kT lnpA pB

2pC '3pD '

pA 'pB '2pC3pD

$

% &

'

( )

*

+ ,

-

. /

!

"G = ND' # ND( ) #kT lnpC3pD

pA pB2

$

% &

'

( ) + kT ln

pC '3pD '

pA 'pB '2

$

% &

'

( )

*

+ ,

-

. /

133

Donde

!

Keq es la constante de equilibrio de la reacción y

!

Q es un cuociente de reacción

en un estado fuera del equilibrio.

Las ecuación (63) es más conocida de la siguiente forma:

Donde

!

"G0 es el cambio de energía libre de Gibbs estándar por mol de producto (cambio

de energía entre el estado estándar (presión 1 atm, temperatura 25°C y todas las

concentraciones de las especies iguales a 1 molar) y el estado de equilibrio) y R es la

constante de Boltzmann en J/mol.

En efecto, si

!

Q =1 (condiciones estándar), entonces:

En las ecuaciones (63) y (64), las variables

!

Keq y

!

Q pueden ser expresadas en términos

de concentraciones o presiones indistintamente. Según la ley de los gases ideales, la

concentración de una especie en un medio puede expresarse asi:

Por lo tanto, si se expresa la ecuación (63) en función de concentraciones y

éstas se sustituyen empleando la ecuación (66) el resultado no debiera cambiar:

!

"G

ND ' # ND( )= #kT lnKeq + kT lnQ (63)

!

"G = "G0

+ RT lnQ (64)

!

C =n

V=

p

RT(66)

!

"G = #RT lnC0

+ RT lnC

!

= "RT lnp0

RT

#

$ %

&

' ( + RT ln

p

RT

#

$ %

&

' (

!

"G = "G0

= #RT lnKeq(65)

134

!

"G es expresado como cantidad molar. Esta equivalencia es posible gracias a

la presencia de los logaritmos en las relaciones.

7. Cinética de las reacciones químicas y ecuación de Arrhenius

En este capítulo entenderemos, a través de los conceptos termodinámicos

fundamentales que revisamos anteriormente, la fuerte dependencia entre la velocidad de

las reacciones químicas y la temperatura.

Consideremos la siguiente reacción binaria:

La tasa de generación de producto puede expresarse de la siguiente manera:

Donde

!

P[ ] ,

!

A[ ] y

!

B[ ] corresponden a las concentraciones de las especies A, B y P,

respectivamente, y

!

kR

representa la constante cinética de la reacción. Por definición

!

kR

es independiente de las concentraciones de A y B, sin embargo, depende fuertemente de

la temperatura.

Se ha observado que la dependencia de la constante cinética de una reacción

con respecto a la temperatura es mucho mayor de lo esperable, suponiendo un

incremento normal de los movimientos térmicos de las moléculas (energía térmica =

!

kT )

(Dill y Bromberg, 2003). En 1889, el físico y químico sueco Svante Arrhenius propuso una

explicación para este fenómeno, basándose en la ecuación de van’t Hoff (54) que

!

= "RT ln p0

+ RT lnRT + RT ln p " RT lnRT

!

= "RT ln p0

+ RT ln p

!

A + BkR" # " P (67)

!

d P[ ]dt

= kRA[ ] B[ ] (68)

135

describe la dependencia entre el equilibrio químico y la temperatura (Arrhenius, 1889).

Recordando la ecuación de van’t Hoff se tiene:

Arrhenius propuso que las constantes cinéticas también tenían la forma de la

ecuación de van’t Hoff:

Donde

!

Ea tiene unidades de energía y es calculado de tal manera que concuerde con los

datos experimentales.

!

Ea es denominada la “energía de activación” de la reacción.

De acuerdo con la teoría de Arrhenius, la cinética de las reacciones no

depende de la energía promedio de los reactantes, sino que de las altas energías de las

moléculas “activadas”. La Figura A1. 1 muestra esta idea en un diagrama. Existen dos

plataformas energéticas, correspondientes a los reactantes y los productos. Se puede

observar un máximo, llamado “estado de transición”, que representa la energía que deben

alcanzar las moléculas activadas para transformarse de reactantes a productos.

Según la ley de distribución de Boltzmann, un pequeño aumento de la

temperatura puede producir un gran aumento de la proporción de moléculas en un estado

energético alto, y vise versa. Esto concuerda con la teoría de Arrhenius.

Integrando la ecuación (69) y expresando su exponencial se obtiene la

relación entre la constante cinética de la reacción y la temperatura:

Donde A es una constante.

!

" lnKp

"T

#

$ %

&

' ( =

)h0

kT2

!

" lnkR

"T

#

$ %

&

' ( =

Ea

kT2

(69)

!

d lnkR

=Ea

k

dT

T2""

!

kR

= Ae"E

akT

(70)

136

La ecuación de Arrhenius explica la fuerte dependencia entre la velocidad de

una reacción química y la temperatura. Sin embargo existe un modelo que permite

explicar este fenómeno a una escala más detallista: la teoría del estado de transición.

8. Teoría del estado de transición

La teoría del estado de transición supone la existencia de un intermediario de

alta energía a lo largo de las coordenadas de reacción, tal como lo muestra la Figura A1.

1. Este intermediario es muy inestable y puede desplazarse hacia los productos o hacia

los reactantes con igual facilidad. Como consecuencia de su alta energía, existe en una

proporción muy baja.

La constante cinética derivada de la ecuación de Arrhenius también puede

calcularse a partir de la teoría del estado de transición. Para hacerlo retomaremos la

reacción descrita en la ecuación (67). La idea es separar la reacción en dos etapas, como

lo muestra la siguiente ecuación:

Δh0

Ea

Reactantes Productos

!

"

E

!

A + B K#

" # $ AB( )# k

#

$ # $ P (71)

Figura A1. 1. Diagrama de energía de activación.

!

" indica la coordenada de progreso de la reacción. Ea es la energía de activación, Δh0 es la entalpía molar parcial estándar.

137

La primera etapa es un equilibrio entre los reactantes y el estado de transición

(o estado activado)

!

AB( )# , con una constante de equilibrio

!

K# . La segunda etapa

consiste en un paso directo desde el estado de transición hasta el producto, con una

constante cinética

!

k# .

Un aspecto crítico de la teoría del estado de transición es la presunción de un

estado de equilibrio entre los reactantes y las especies activadas, plasmado en la

constante

!

K# ,

aunque no se trate de un verdadero equilibrio producto de la inestabilidad de estas últimas

a lo largo de las coordenadas de reacción.

La tasa de generación de producto, considerando las ecuaciones (71) y (72)

es:

Combinando la ecuación (67) con la ecuación (73) queda:

Al ser

!

K# una constante de equilibrio, puede se expresada en función de la

energía libre de Gibbs, la entalpía y la entropía, según la ecuación (65):

Donde

!

"G# es el cambio de energía libre de Gibbs estándar molar que describe el

equilibrio entre los reactantes y el estado activado.

Por otro lado, la frecuencia a la cual el estado activado se descompone en

producto(s), la constante cinética

!

k# , corresponde a la frecuencia de vibración del enlace

que se está rompiendo:

!

K# =

AB( )#[ ]

A[ ] B[ ](72)

!

d P[ ]dt

= k#AB( )

#[ ] = k#K#A[ ] B[ ] (73)

!

kR

= k#K# (74)

!

"G#

= #RT lnK#

(75)

!

K#

= e"#G

#RT

138

Aquí surge otra suposición fundamental de la teoría del estado estacionario: la

frecuencia de vibración

!

v del enlace en el estado de transición ubicado en las

coordenadas de reacción (factor universal de frecuencia), puede ser obtenida a partir de

la equivalencia entre las energías de un oscilador, calculadas mediante la teoría cuántica

(ecuación (77)) y la física clásica (ecuación (78)):

A 25°C la frecuencia

!

v es de 6,212 x 1012 s-1. Combinando las ecuaciones

(74), (75), (76) y (79) se obtiene una expresión detallada para la constante cinética

homóloga a la ecuación de Arrhenius:

Recordando que el cambio de energía libre de Gibbs puede ser expresado en

términos de entalpía y entropía (

!

"G = "H #T"S ), la ecuación (80) queda de la siguiente

forma:

Producto de que el estado de transición en una reacción, al ser extremadamente

inestable, no puede ser detectado, el equilibrio químico entre éste y los reactantes sólo es

!

E = hv (77)

!

E = kT (78)

!

v =kT

h

(79)

!

k#

= v (76)

!

kR

=kT

he"#G

#RT (80)

!

kR

=kT

he"S

#Re#"H

#RT

(81)

139

considerado en forma cualitativa. Esto justifica las suposiciones críticas a las cuales

recurre la teoría.

140

ANEXO II

Test de Student

El test t de Student permite evaluar si dos grupos de datos son

significativamente diferentes de acuerdo a sus promedios y su desviación estándar.

Mediante un procedimiento matemático estandarizado, se acepta o rechaza una hipótesis

nula, cuya propuesta consiste en que los dos grupos evaluados no difieren

significativamente.

Para poder aplicar este tipo de análisis estadístico se debe asumir que los datos

estudiados presentan una distribución normal. En el caso del test t estándar, se debe

asumir además igualdad de varianzas entre los dos grupos de datos. Esta condición es

violada en diversos contextos, lo que induce la ocurrencia de errores e inexactitudes en

los resultados (Ruxton, 2006).

Cuando las varianzas de los grupos de datos comparados presentan

diferencias notables, o cuando no se puede determinar con exactitud su condición de

igualdad, se recomienda usar una versión del test t específica para varianzas desiguales

(Ruxton, 2006).

Se aplicó el test t para varianzas desiguales con el objeto de identificar

diferencias estadísticamente significativas en los análisis estructurales comparativos

efectuados in silico.

El procedimiento se inicia calculando el parámetro t de la siguiente manera:

Donde

!

µ es el promedio,

!

s2 es la varianza, y

!

n es el tamaño de los grupos

de datos comparados.

La varianza corresponde al cuadrado de la desviación estándar y se calcula

de la siguiente forma:

!

t =µ1" µ

2

s1

2

n1

+s2

2

n2

141

Siendo

!

xi cada uno de los datos,

!

µ el promedio y

!

n el tamaño de la muestra

(número de datos).

Los grados de libertad

!

v del sistema se calculan mediante la siguiente relación:

Donde

!

u =s2

2

s1

2.

En el caso del test t estándar, cuando las varianzas son iguales, los grados de

libertad se obtienen usando una relación más simple:

Es necesario definir un nivel de confianza para los resultados del análisis. Este

parámetro indica la probabilidad de que el eventual rechazo de la hipótesis nula haya sido

sólo por coincidencia o suerte. Es decir, si las poblaciones de datos evaluadas son

consideradas distintas, existe una probabilidad igual al nivel de confianza de que esta

diferencia se establezca por casualidad y no sea significativa. En general se considera

adecuado un valor de 0,05 para el nivel de confianza.

Para aceptar o rechazar la hipótesis nula, se extrae un valor teórico para el

parámetro t (

!

tTeórico

) desde tablas de distribución de test t de Student, usando los grados

de libertad calculados previamente y el nivel de confianza.

!

v =

1

n1

+u

n2

"

# $

%

& '

2

1

n1

2n1(1( )

+u2

n2

2n2(1( )

!

v = n1+ n

2" 2

!

s2 =

xi"µ( )#

2

n "1

142

La hipótesis nula se rechaza sólo si

!

t > tTeórico

.

Las comparaciones que involucraron un grupo de datos y un determinado

valor único se efectuaron mediante un test t estándar de una muestra. En este caso, el

parámetro t se obtiene a través de la relación:

Donde

!

µ,

!

s2 y

!

n son el promedio, la varianza y el tamaño del grupo de datos,

respectivamente, y

!

x0 es el valor comparado.

Los grados de libertad corresponden a:

!

t =µ " x

0

s2

n

!

v = n "1

143

ANEXO III

Ecuaciones para cálculo de parámetros termodinámicos

La influencia de la temperatura sobre las constantes cinéticas en reacciones

enzimáticas puede ser descrita mediante la ecuación de Arrhenius (ecuación 70, Anexo 1)

o la teoría del estado de transición (ecuación 81, Anexo 1).

La ecuación de Arrhenius se deriva de una relación homóloga a la ecuación

de van’t Hoff (ecuación 69, Anexo 1):

De igual forma, una expresión para la derivada en función del

tiempo del logaritmo natural de la constante catalítica se puede obtener a partir de la

teoría del estado de transición (ecuaciones 80 y 81, Anexo 1):

El valor de

!

"G# se puede obtener directamente reordenando la ecuación 2:

!

" lnkCAT

"T

#

$ %

&

' ( =

Ea

kT2

(1)

!

kCAT

=kBT

he"S

#Re#"H

#RT (3)

!

ln kCAT

= lnkBT

h

"

# $

%

& ' (

)H #

RT+)S#

R

(4)

!

" lnkCAT

"T

#

$ %

&

' ( =

1

T+)H #

RT2

=)H #

+ RT

RT2

(5)

!

kCAT

=kT

he"#G

#RT (2)

144

Combinando las ecuaciones 1 y 5 queda:

Resolviendo para la entalpía de activación se obtiene:

La entropía de activación se calcula a partir de la conocida expresión para la

energía libre de Gibbs (ver ecuación 16, Anexo 1):

!

!

"G# = RT ln k

BT h( ) # ln kCAT[ ] (6)

!

Ea

RT2

="H

#+ RT

RT2

(7)

!

"H#

= Ea# RT (8)

!

"G#

= "H## T"S

#

!

"S# = "H

## "G

#( ) T

(9)

(10)

145

ANEXO IV

Códigos Python

Este anexo contiene los códigos en lenguaje Python de los siguientes

módulos:

• Structural_analysis.py

• Comparisons.py

• cliente_puentes_hidrogeno.py

• cliente_detalle_puente_hidrogeno.py

• cliente_electrostatic_plot.py

• cliente_puentes_salinos.py

• cliente_esterico.py

• cliente_calculo_NMA.py

• cliente_NMA_fluctuations_for_one_protein.py

• cliente_B_factor_X_ray.py

• cliente_vectores_NMA.py

• Pymol_Python.py

Además presenta ejemplos de los archivos pdf con los resultados generados

por el algoritmo de comparación de interacciones electrostáticas y el módulo para obtener

el detalle de interacciones específicas.

146

ANEXO V:

Alineamiento de las celulasas mesofílicas y pscrofílicas

Cel5 SVE----PLSVNGNKIY-AGEKAKSFAGNSLFWSNNGWGGEKFYTADTVASLKKDWKSSI 55 Cel5A SVVEEHGQLSISNGELVNERGEQVQLKGMSS--HGLQWYG-QFVNYESMKWLRDDWGINV 57 Cel5G AVE----KLTVSGNQIL-AGGENTSFAGPSLFWSNTGWGAEKFYTAETVAKAKTEFNATL 55 CelA8 AVE----PLNVSGNQIL-ADGKSVSFAGTSLFWSNTGWGGEDFYTADTVAKAKSEFGATI 55 :* *.:...:: : .: * * . * . .* . ::: : :: .: Cel5 VRAAMGV-QESGGYLQ-DPAGNKAKVERVVDAAIANDMYAIIGWHSH---SAENNRSEAI 110 Cel5A FRAAMY--TSSGGYID-DP-SVKEKVKEAVEAAIDLDIYVIIDWHILSDNDPNIYKEEAK 113 Cel5G IRAAIGHGTSTGGSLNFDWEGNMSRLDTVVNAAIAEDMYVIIDFHSH---EAHTDQATAV 112 CelA8 IRAAIGHGASAGGSLNYDWDGNMNRLDTVVNAAIAQDMYVIIDFHSH---EAHTDQATAV 112 .***: .:** :: * . ::. .*:*** *:*.**.:* ... : * Cel5 RFFQEMARKYGNKPNVIYEIYNEPL--QVSWSNTIKPYAEAVISAIRAIDPDNLIIVGTP 168 Cel5A DFFDEMSELYGDYPNVIYEIANEPNGSDVTWGNQIKPYAEEVIPIIRNNDPNNIIIVGTG 173 Cel5G RFFEDVATKYGQYDNVIYEIYNEPL--QISWVNDIKPYAETVIDKIRAIDPDNLIVVGTP 170 CelA8 RFFEEVATKYGEYDNVIYEIYNEPL--QISWANAIKPYAETVIDKIRAIDPDNLIVVGTP 170 **:::: **: ****** *** :::* * ****** ** ** **:*:*:*** Cel5 SWSQNVDEASRDPINAKNIAYTLHFYAGTHGESLRNKARQALNNGIALFVTEWGTVNADG 228 Cel5A TWSQDVHHAADNQLADPNVMYAFHFYAGTHGQNLRDQVDYALDQGAAIFVSEWGTSAATG 233 Cel5G TWSQDVDVASQNPIDRANIAYTLHFYAGTHGQSYRNKAQTALDNGIALFATEWGTVNADG 230 CelA8 TWSQDVDVASLDPIDRANIAYTLHFYAGTHGQSYRNKAQTALDNGIALFATEWGTVNADG 230 :***:*. *: : : *: *::********:. *::. **::* *:*.:**** * * Cel5 NGGVNQTETDAWVTFMRDNNISNANWALNDKNEGASTYYPDS--------KNLTESGKKV 280 Cel5A DGGVFLDEAQVWIDFMDERNLSWANWSLTHKDESSAALMPGANPTGGWTEAELSPSGTFV 293 Cel5G NGGVNINETDAWMAFFKTNNISHANWALNDKNEGASLFTPGG----SW--NSLTSSGSKV 284 CelA8 NGSVNVNETDAWMAFFKTNNISHANWALNDKNEGASTFTPGG----GW--DSLTASGTKV 284 :*.* *::.*: *: .*:* ***:*..*:*.:: *.. .*: **. * Cel5 KSIIQSWPYKA 291 Cel5A REKIR----ES 300 Cel5G KEIIQGW--GG 293 CelA8 KEIIKGW--QG 293 :. *: .

universidad de chile facultad de ciencias fisicas y ...a pesar de lo anterior, las aplicaciones...

Documents