grid, el futuro en las comunicaciones

6

Click here to load reader

Upload: emelys-rukoz

Post on 06-Jun-2015

582 views

Category:

Documents


0 download

DESCRIPTION

Autor: José Arturo García MonroyE.T.S.I.Telecomunicación- Departamento Ingenieria Sistemas TelemáticosCiudad Universitaria s/n 28040 [email protected]

TRANSCRIPT

Page 1: GRID, el futuro en las comunicaciones

GRID, el futuro en las comunicaciones

José Arturo García Monroy E.T.S.I.Telecomunicación- Departmento Ingenieria Sistemas Telemáticos

Ciudad Universitaria s/n 28040 Madrid Teléfono 652 313 603 [email protected]

Resumen. Una evolución del computo distribuido, el cómputo en GRID, representa oportunidades enormes para que las organizaciones utilicen al máximo y exploten las capacidades y ventajas que este mundo de interconexiones nos ofrece. Existen diversos tipos de Grids, de Información, Recursos y Servicios, con diferentes características y usos específicos. Actualmente hay numerosos esfuerzos y asociaciones alrededor del mundo para perfeccionar esta tecnología tales como el Globus Project o el Datagrid Project. Son muchos los que apuestan por el Grid, y expertos concuerdan en que tiene el potencial de revolucionar las Tecnologías de la Información, de la misma forma que lo hizo el Internet en su tiempo.

1 Introducción

Debido a la situación económica actual, hay una presión constante en las organizaciones por reducir sus costes de investigación y desarrollo, el tiempo en el que sacan sus productos al mercado, y a la vez aumentar su capacidad de procesamiento. Típicamente, lo que se haría para eliminar los cuellos de botella, sería incrementar la potencia de procesamiento de la organización. Sin embargo, enormes cantidades de capacidad de computo existentes dentro de las infraestructuras informáticas de las organizaciones no están siendo aprovechadas, y las reducciones dramáticas en los presupuestos cierran la puerta a cualquier gasto injustificado de la tecnología. Así nace el Grid.

2 Antecedentes

El origen del Grid se encuentra en el cómputo distribuido, el cual trata los desafíos de la carga de trabajo agregando y asignando los recursos disponibles de una organización para proporcionar potencia de procesamiento ilimitada. En los últimos diez años, ha cambiado el concepto que se tenía en donde simplemente permitiría a las organizaciones el distribuir las cargas de trabajo a través de recursos de cómputo heterogéneos, a una solución ubicua que ha sido abrazada por diversas de las principales organizaciones en el mundo en múltiples sectores industriales.

El cómputo distribuido se asegura de que todos los servicios son confiables y disponibles a pesar de poder encontrarse en mantenimiento, el que

haya interrupciones de la energía, o fallas inesperadas. También ayuda a eliminar el problema del tiempo que pierden los usuarios al intentar localizar recursos disponibles para procesar cargas de trabajo, mientras que muchos otros sistemas dentro de la organización se encuentran inutilizados.

Aunque el computo distribuido logra utilizar el potencial máximo de los recursos existentes, al nivelar con eficacia los ciclos de proceso con la demanda creada por las aplicaciones, se dice que su importancia radica en que ha abierto el camino a la Computación en Grid, un enfoque global y mucho más eficaz para compartir información y recursos.

3 Grid

Una evolución del computo distribuido, el cómputo en Grid, representa oportunidades enormes para que las organizaciones utilicen ciclos de proceso de redes de ordenadores atravesando incluso múltiples límites geográficos.

Aunque la idea de Grid puede sonar complicada, se le puede comparar con el peer-to-peer (P2P), modelo que se hizo popular por la comunidad de compartición de archivos Napster. De la misma manera en que Napster permitía a los usuarios acceder y compartir música entre ordenadores de escritorio, el cómputo distribuido utiliza un modelo similar para reunir los recursos disponibles en clusters separados de PCs, servidores o superordenadores. Grid lleva a estos

Page 2: GRID, el futuro en las comunicaciones

clusters al siguiente nivel al conectarlos con otros múltiples clusters a través de áreas geográficas dispersas, logrando compartir los recursos y una colaboración mejorada.

.

3.1 Beneficios de la computación en Grid

Permite a las organizaciones agregar recursos a la infraestructura tecnológica sin importar en donde estén localizados. Elimina las situaciones en donde un solo sitio/servidor se encuentre trabajando en su máxima capacidad mientras otros tienen ciclos de procesamiento inutilizados.

Las organizaciones pueden mejorar dramáticamente la calidad y el tiempo de entrega de los productos y servicios que ofrecen, a la vez que reducen costos de IT al permitir la colaboración transparente y la compartición de recursos.

Permite a las compañías acceder y compartir bases de datos remotas. Esto es especialmente benéfico para las comunidades de investigación, en donde enormes cantidades de información son generadas y analizadas casi a diario.

Permite a organizaciones con diferentes sedes la fácil colaboración en proyectos en conjunto al permitir el compartir desde aplicaciones de software hasta planos o modelos de ingeniería.

Puede crear una infraestructura mas robusta y resistente y más capaz de responder a desastres.

Puede aprovechar los ciclos de procesamiento inutilizados de ordenadores de escritorio que se encuentren en diversas zonas geográficas. Por ejemplo, ordenadores que normalmente se encuentran inutilizados por la noche en una compañía en Europa, podrían ser utilizados en el día por una sede de operaciones en América.

4 Grid : La nueva era en Cómputo Distribuido

Definido como la forma coordinada, transparente y segura de compartir recursos de información a través de sitios distribuidos geográficamente, el cómputo en Grid se desarrolla y se basa en protocolos estándar y plataformas de referencia de

código libre para tener la máxima interoperabilidad.

Esencialmente, provee la habilidad de decrementar el coste de computo al entregar, bajo demanda, accesos confiables y económicos a recursos informáticos.

Utilizado inicialmente por investigadores y academia, la computación en Grid emerge rápidamente como el medio utilizado por empresas corporativas para colaborar, compartir datos y software, almacenar más información que en las redes existentes, y acceder grandes cantidades de poder de procesamiento sin invertir sumas significativas en costosos superordenadores.

Uno de los ejemplos pioneros de Grid es el proyecto SETI@home, establecido por el Instituto de Búsqueda de Inteligencia Extraterrestre (SETI). En la búsqueda por encontrar indicios que señalaran la existencia de inteligencia extraterrestre, utilizaron el Internet para establecer un superordenador virtual. Al reunir la potencia de procesamiento de mas de 500,000 ordenadores personales alrededor del mundo, SETI@home se aseguró de tener la capacidad necesaria para analizar Terabytes de datos previamente recopilados por un radiotelescopio, sin contar con el gasto de un superordenador.

Más allá de el mundo de la academia y la investigación, empresas corporativas como IBM, Sun Microsystems, Intel, HP reconocen y apuestan al gran potencial que ofrece Grid y lo adoptan con un ritmo asombroso. Cualquier organización que realice investigación o requiera intensivas cargas de trabajo a través de procesamiento se puede beneficiar del cómputo en Grid.

Aunque las implementaciones iniciales de Grid, que se enfocaban en proveer a las organizaciones acceso global a los recursos computacionales disponibles parezca algo simplista, su verdadero potencial es enorme.

A pesar de que muchos piensan que esta tecnología se encuentra en su infancia, emerge rápidamente hacia otros horizontes con el desarrollo de Grids de utilidad pública, las cuales venderán o alquilarán recursos de cómputo, incluyendo ancho de banda, aplicaciones y almacenamiento, cobrando de acuerdo a su uso o en base a un servicio solicitado, de la misma forma en que las compañías de luz cargan la

Page 3: GRID, el futuro en las comunicaciones

electricidad, todo esto hecho claro, a través del Internet.

5 Impulsar el concepto del Cómputo en Grid

Debido a que se necesita una enorme colaboración, esfuerzos de estandarización son de singular importancia para desplegar Grid:

• El "Globus Project" (www.globus.org) formado por múltiples instituciones de investigación y desarrollo, se concentra en las tecnologías centrales para Grids computacionales. Su producto primordial es el Globus Toolkit, de arquitectura abierta, un sistema de protocolos de código libre, servicios y herramientas que permiten una computación en Grid segura y distribuida.

• Global Grid Forum (www.golbalGridforum.com) es una comunidad en foro de investigadores individuales y usuarios que se enfocan en la promoción y el desarrollo de las tecnologías Grid y las aplicaciones mediante el desarrollo y la documentación de los avances, los mejores resultados, guías de implementación y estándares con énfasis en el consenso. Otros grupos como el New Productivity Initiative y el Peer-to-Peer Working Group han unido fuerzas con este forum para crear el mayor grupo global de estándares de cómputo en Grid .

• Data Grid Project: fundado por la Unión Europea, este proyecto se concentra en proveer la tecnología Grid necesaria en la investigación científica de próxima generación que requiere enormes cantidades de poder de procesamiento, análisis de datos y el tratamiento de millones de Gigabytes, a lo largo de diversas comunidades científicas dispersas geográficamente.

6 Los Tipos de Grid

Grid ha establecido un nuevo paradigma para entregar información, recursos y servicios a los

usuarios. Las implementaciones actuales abarcan diversas aplicaciones en la industria y centros de investigación. En este creciente mundo de interconexiones se pueden distinguir tres categorías del Grid.

Grid de Información

Grid de Recursos

Grid de Servicios

La figura 1 muestra la relación y la dependencia de estos tres Grids en cuanto al acceso uso y publicación de meta información.

acceso, uso publicación de meta información

Fig 1. Los tres tipos de Grid y sus relaciones conjuntas

6.1 Information Grid

Con la invención de la WWW en 1990, Tim Berners-Lee y Robert Calliau tomaron el primer y el más importante paso hacia la estructura global Grid. En solo unos años, el crecimiento exponencial de la Web creó una infraestructura de red pública y accesible, un Grid de Información omnipresente que entrega información de cualquier tipo a cualquier lugar en el mundo. Esta información se puede obtener al conectar cualquier ordenador a una red telefónica pública vía modem , que es tan sencillo como enchufarse a la red eléctrica.

Grid de Información

Web HTML

archivos compartidos

Grid de Servicios

OGSA

SOAP, WDSL, UDDI

XML

SEARCH ENGINES

Grid de Recursos .

Ancho de Banda Almacenamiento Poder de Procesamiento .......

Page 4: GRID, el futuro en las comunicaciones

Servicios de compartición de archivos como Napster, Gnutella Network, E-Donkey forman parte del Grid de Información actual. A diferencia de la Web, los datos compartidos no se encuentran respaldados por una organización o dueño de algún sitio Web, sino que el servicio para compartir archivos es dispuesto por personas que desean intercambiar archivos de música, películas, videos o software. El servicio de intercambio se mantiene gracias a los participantes, no hay un repartidor central involucrado. Es un ambiente distribuido, dinámico y altamente flexible.

6.11 Situación Actual

Desde su invención, se ha convertido en uno de los mayores éxitos en la tecnología y la comunicación, es usada por un gran numero de la población mundial para acceder a información actual.

Una de las razones de su éxito es el concepto de hipervínculo, una referencia hacia otras webs que es muy fácil de usar. El seguir los hipervínculos es comúnmente la manera más rápida para encontrar información sin tener que teclear la información. Debido a esto, la Web dominó rápidamente a ftp y a redes que existían con anterioridad.

Otra causa para el éxito de esta red ha sido la facilidad con la que se puede actualizar la información, de esta forma ésta se mantiene al día.

6.2 Grid de Recursos

Provee mecanismos para el uso coordinado de recursos como ordenadores, archivos de datos, servicios e instrumentos de laboratorio.

A diferencia del Grid de Información, usuarios anónimos no pueden acceder a este sin las credenciales necesarias a las facilidades y ventajas otorgadas por del Grid de Recursos. Solo usuarios autorizados y previamente registrados pueden utilizarlo.

La idea principal de este tipo de Grid es el proveer accesos sencillos, transparentes y eficientes a cualquier recurso independientemente de su localización. Estos recursos pueden ser desde poder de procesamiento, almacenamiento de información, ancho de banda, etc.

6.21 Situación Actual

Son un poco más difíciles de implementar y desplegar, ya que los recursos son costosos y no pueden ser entregados al público en general sin costo alguno.

En esta categoría se encuentran los Grids Computacionales, que permiten el acceso a superordenadores distribuidos para realizar tareas que consumen mucho tiempo. La mayoría se basan en la herramienta que se ha convertido en el estándar en esta área, el Globus Toolkit.

Hoy en día hay diversos prototipos de Grids específicos en investigación farmacéutica, química, astrofísica, tratamiento y representación de video, post producción, simulación del clima, geología, etc. Algunos de éstos utilizan portales Web, otros ocultan el acceso Grid dentro de la aplicación.

También están los Grids de Datos, los cuales proveen mecanismos para el almacenamiento seguro y redundante en sitios esparcidos geográficamente. Debido a los desafíos ocasionados al almacenar y procesar cantidades de Petabytes de datos en diferentes localizaciones, se convierte en un tema extendidamente demandante. Temas como la replicación, obtención, catalogación y la coordinación de estos datos deben ser aun refinados.

Otro ejemplo son las Aplicaciones paralelas como el ya mencionado proyecto SETI@home, fightcancer@home o distributed.net, los cuales han probado ser fácilmente ejecutables en ordenadores distribuidos. No necesitan Middleware ya que está integrado en la aplicación, la cual se encarga también de la ejecución de los trabajos remotos y la recolección de los resultados. Un aspecto importante de estas aplicaciones es la confianza implícita en ambas partes. El dueño del PC confía en la integridad del software sin verificar personalmente la autenticación y la autorización, y el que distribuye el software Grid confía que los resultados no han sido falsificados por el dueño del PC.

Los Grids de acceso también recaen dentro de esta categoría. Construyen la base técnica para la colaboración remota al proveer video conferencias interactivas y facilidades Blackboard.

6.3 Grid de Servicio

Entrega servicios y aplicaciones sin importar la ubicación geográfica, implementación o plataforma de hardware. Los servicios son

Page 5: GRID, el futuro en las comunicaciones

montados en los recursos concretos disponibles en el Grid de Recursos. Una de las mayores diferencias entre estos dos tipos de Grid se encuentra en que el Grid de Servicios provee servicios abstractos sin importar su localización, mientras que el Grid de Recursos facilita accesos a recursos concretos ofrecidos en un sitio en particular.

6.31 Situación Actual

Abarca los servicios disponibles como las maquinas de búsqueda, portales, paginas de servidor activas y de diverso contenido dinámico. Normalmente son gratuitos debido a patrocinios o publicidad. Servicios de email y autorización como Passport, GMX y Hotmail recaen en esta categoría.

Con los web services y el Open Grid Service Architecture OGSA están diseñados para proveer interoperabilidad entre los servicios sin importar la implementación, localización geográfica o plataforma de ejecución.

7 El Potencial de Grid, Conclusiones

Como hemos visto, la más simple y la primera forma de cómputo en Grid empezó con el concepto del cómputo distribuido. Pero hoy, se ve al Grid como la nueva generación en infraestructuras de Tecnologías de la Información, y se espera que transforme la computación, la comunicación y colaboración. Existirán diversas Grids, cada una dentro de su propio contexto, compartidas por comunidades que compartan intereses. Los Grids estarán basadas en servicios, con organizaciones accediendo a los recursos cuando sean requeridos, en una forma constante, o en base regular dependiendo del servicio requerido.

Se estima que la adopción a gran escala de Grid se hará por medio de tres fases. La primera, ocurriendo en estos momentos, se despliega a través de Grids en la Empresa. Esta fase implica la implementación comercial de Grids de producción dentro de grandes corporaciones con presencia global o con la necesidad de acceder recursos fuera de una sola localización. La adopción de el Grid Empresarial se simplifica y es posible hoy en día gracias a la colaboración virtual y la compartición de recursos disponibles que ocurren detrás de los firewalls corporativos.

La segunda fase, los Grids de "Partners" o socios, emergerán como organizaciones operando dentro de industrias similares y con mismas áreas de interés con colaboración de proyectos, y el uso compartido de recursos para alcanzar una meta en común. Por ejemplo, organizaciones enfocadas en investigación de ciencias de la vida trabajando en forma conjunta, podrían acelerar su tiempo de investigación al aprovechar el potencial de computo de los sistemas disponibles o al compartir grandes cantidades de información.

La tercera fase serán los Grids de Servicio, que se lograrán cuando los usuarios adapten al Grid como modelo de uso general.

De la misma forma en que hoy en día los consumidores y usuarios confían más en el uso de Internet, un reconocimiento global de los beneficios de la computación en Grid será lo que lo lleve al siguiente paso en su adaptación. Esta fase final, en donde los recursos computacionales serán alquilados en base a su uso o a las necesidades propias, ocurrirá solo cuando se compruebe que el modelo Grid es confiable, seguro y basado en una variedad de protocolos y estándares aceptados.

Para que Grid emerja como un modelo de compartición de recursos exitoso, se necesitan establecer asociaciones o sociedades entre las compañías de software que diseñan tecnologías Grid, los fabricantes de hardware que ensamblan los sistemas sobre los cuales funcionarían los Grids, y los desarrolladores de aplicaciones que utilizarán las capacidades del Grid. Adicionalmente, estándares y especificaciones de código libre deben ser establecidas para asegurar la interoperabilidad las soluciones heterogéneas de código libre y las soluciones propietarias que proveerán a los negocios con un amplio rango de opciones de donde escoger.

Afortunadamente, hay diversas compañías que ya están dedicándose al desarrollo de la tecnología Grid, estableciendo las bases para su uso comercial extenso. Los expertos concuerdan en que Grid tiene el potencial de revolucionar el mundo de las Tecnologías de la Información , de la misma forma en que el Internet transformó completamente la forma en que la gente y las empresas se comunican e intercambian información. Este tipo de iniciativas acelerarán la adopción de el cómputo en Grid más allá de las aplicaciones técnicas y científicas hacia su uso diario.

Page 6: GRID, el futuro en las comunicaciones

Referencias

[1] I. Foster, C. Kesselman, S. Tuecke. “The Anatomy of the Grid: Enabling Scalable Virtual Organizations”. International J. Supercomputer Applications, 15(3), 2001.

[2] Alexander Reinefeld, Florian Schintke. “Concepts and Technologies for a Worldwide Grid Infrastructure”. Euro-Par 2002 Parallel Processing, volume 2400 of Lecture Notes in Computer Science, pages 62-71, Springer 2002. (c) Springer-Verlag.

[3] I. Foster, C. Kesselman, J. Nick, S. Tuecke. “The Physiology of the Grid: An Open Grid Services Architecture for Distributed Systems Integration.” Open Grid Service Infrastructure WG, Global Grid Forum, June 22, 2002.

[4] Ian Baird. “Understanding Grid Computing” Daily News and Information for the Global Grid Community / July 1, 2002: vol. 1 no. 3

[5] Globus Project http://www.globus.org [6] EU Datagrid Project

http://web.datagrid.cnr.it

[7] I. Foster, C. Kesselman,. “Globus: A Metacomputing Infrastructure Toolkit”. International Journal of Supercomputer Applications, vol .11 no.2, 1997