grid cisco academy conference 2011 ( ) (9/6/2011) & seminario e-investigación en ciencias...

35
Grid CISCO Academy Conference 2011 (http://academy.aid-web.net) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert Hoeger Centro de Cálculo Científico y Centro de Simulación y Modelos, Universidad de Los Andes Proyecto GISELA 1

Upload: imelda-messa

Post on 16-Feb-2015

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

Grid

CISCO Academy Conference 2011 (http://academy.aid-web.net) (9/6/2011)

&Seminario e-Investigación en Ciencias Sociales y Humanas

(10/6/2011)

Herbert HoegerCentro de Cálculo Científico y Centro de Simulación y Modelos, Universidad de Los

AndesProyecto GISELA

1

Page 2: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

2

•Computación distribuida

•Sistemas Operativos Distribuidos

•Grid

•Clusters vs Grid

•Cloud vs Grid

•Necesidad de Grid: Large Hadron Collider – CERN

•Proyectos•EELA (Ene 2006 – Dic 2007)

•EELA-2 (Abr 2008 – Mar 2010)

•GISELA (Sep 2010 – Ago 2012)

Contenido

Page 3: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

3

Computación Distribuida: Es la utilización de múltiples sistemas, de alguna forma organizada, para trabajar en un objetivo común.

Conceptos Preliminares

Page 4: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

4

Computación Distribuida

•Requiere software para la coordinación de recursos y tareas.

•Computación paralela / HPC es computación distribuida.

•Computación Grid es computación distribuida.

Conceptos Preliminares

Page 5: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

5

Sistemas Operativos Distribuidos – Características

Transparencia: Provee la visión de una sola máquina

(máquina virtual)•Acceso: a recursos remotos igual que a locales.

•Ubicación:

•Independencia de nombre – ubicación.

•Independencia de máquina – recurso.

•Replicación: Las replicaciones mejoran el rendimiento y la disponibilidad – el uso, nombre y control de replicas debe ser transparente.

Conceptos Preliminares

Page 6: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

6

•Migración: por rendimiento, seguridad y disponibilidad, los objetos (procesos y/o datos) pueden migrar.

•Concurrencia: cada usuario tiene la impresión de ser el único usuario – así existan muchos.

•Escalabilidad: el sistema puede “crecer” sin afectar las actividades de los usuarios.

•Heterogeneidad: Soportar diferentes tipos de hardware y software.

•Seguridad: Protección contra destrucción y usos no autorizados.

Conceptos Preliminares

Page 7: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

7

•Disponibilidad: debe operar todo el tiempo aún bajo fallas (quizás con cierta degradación).

•Evitar fallas: usar componentes de calidad.

•Tolerar fallas: redundancia de componentes

•Detectar y recuperar fallas: usar hardware y software para descubrir y reparar fallas.

•Flexibilidad: Facilidad para reemplazar, modificar o agregar componentes.

•Rendimiento: Las aplicaciones deben correr mejor (o al menos igual) que en monoprocesadores.

Conceptos Preliminares

Page 8: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

8

•Los objetivos generales son los mismos que vimos para sistemas operativos distribuidos pero a un nivel superior.

•Debe operar con distintos sistemas operativos.

Computación Grid

Linux ASolaris

ABC

XYZDiscos

WindowsLinux B

Mac OS…

Aplicaciones

Grid Middleware

Recursos

Page 9: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

9

Computación Grid es computación distribuida llevada a un nivel multi-organizacional / multi-sistemas.

Computación Grid

Dpto.

Dpto.

Dpto.

Organización

Dpto.

Dpto.

Dpto.

Organización

Dpto.

Dpto.

Dpto.

Organización

Dpto.

Dpto.

Dpto.

Organización

Son muchos sistemas locales, manejados por personas/organizaciones distintas,

cooperando.

Page 10: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

10

Computación Grid

• Hoy en día tenemos:– Conectividad global a través de Internet.

– Disponibilidad y confiabilidad en el ancho de banda.

– La velocidad de las redes se duplica cada 9 meses.

Page 11: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

11

Computación Grid

Usar Internet como unaplataforma de servicios de

computación y no solo como una fuente de

información.

Page 12: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

12

Aplicaciones

Grid Middleware

Recursos

Computación Grid

Características

• Manejo de Recursos• Balanceo de cargas• Manejo de Fallas• Monitoreo• Garantizar el

rendimiento• Detección de intrusos• Escalabilidad, etc

• Autentificación• Políticas de

Autorización• Descubrimiento de

recursos• Ubicación de recursos• Acceso a data remota• Alta velocidad de

transferencia de data

Page 13: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

13

Cluster vs. Grid

CLUSTER

• Equipos homogéneos.

• Sistema operativo único.

• Administración y manejo centralizado - única.

• Equipos están concentrados.

• Objetivo: mejorar el rendimiento dedicando más recursos.

GRID

• Equipos heterogéneos.

• Múltiples sistemas operativos.

• Administración y manejo descentralizado – multidominio

• Equipos están dispersos.

• Objetivo: mejorar el rendimiento compartiendo recursos sub-utilizados en otras partes.

Page 14: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

14

Cluster

Page 15: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

15

Grid

Page 16: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

16

Cloud vs. Grid

CLOUD

• Foco: Comercial – Servicio.

• Muchos basados en grids.

• Fáciles de usar.

• Compartir no es objetivo. No colaborativo.

• Los usuarios no posen la infraestructura: no inviertas en recursos, alquílalos.

GRID

• Foco: HPC.

• Más complicados de usar.

• Compartir recursos, datos, conocimiento y trabajo (a través de VO - Virtual Organizations).

• Los usuarios aportan a la infraestructura: comparte/aporta recursos y podrás tener muchos más de lo que podrías adquirir por tu cuenta

Page 17: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

17

Analogía

• Grid (en inglés) ~ red eléctrica.

• Grid de Computo ~ red de recursos y servicios de computación.

Page 18: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

18

EL CERN (Centro Europeo de Investigaciones Nucleares)

• Esta a la vanguardia en tecnología de redes.

• Su lema: “where the web was born”

• Lidera algunos de los proyectos en Grid más ambiciosos del mundo.

Page 19: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

19

CERN - LHC: Large Hadron Collider

27 Km

Page 20: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

20

CERN: Large Hadron Collider

• Instrumento científico más grande del mundo.

• Los datos son una mina de oro para físicos alrededor del mundo.

• Descubrir partículas fundamentales de la materia.

Page 21: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

21

CERN

• Unos 10 Petabyte/año.

• Kilobyte KB 103 (o 210) • Megabyte MB 106 (o 220) • Gigabyte GB 109 (o 230) • Terabyte TB 1012 (o 240) • Petabyte PB 1015 (o 250) • Exabyte EB 1018 (o 260) • Zettabyte ZB 1021 (o 270) • Yottabyte YB 1024 (o 280)

Page 22: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

22

CERN

• 1 CD → 700 MB• 10 PB → 14.285.714 CDs• 7 CDs → 1 cm• 10 PB → 20,4 Kms de CDs

– 1 DVD → 6,7 CDs– 3 Kms de DVDs

Suponiendo los CDs o DVDs llenos!

Page 23: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

23

CERN

Page 24: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

24

CERN

• La solución posible para manejar/procesar esta enorme cantidad de información parece ser la computación Grid.

• Comentario de William Gropp: Con la computación Grid hay un fenómeno particular, la necesidad surgió antes que la tecnología.

Page 25: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

25

CERN

• El problema no es solo el manejo de datos.

• Son necesarios unos 100.000 PCs actuales para analizar estos datos.

• Al pasar los años, la data se acumula!

Page 26: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

26

LHC Computing Grid

Page 27: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

27

EELA

E-Infrastructure shared between Europe and Latin America

• Ene 2006 – Dic 2007

• Inicios

• Plataforma de prueba

• Red de personas

• Educación

• Entrenamiento

Page 28: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

28

EELA-2

E-science grid facility for Europe and Latin America

• Abr 2008 – Mar 2010

• Plataforma de calidad de producción

• Red de personas

• Educación

• Entrenamiento

Page 29: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

29

GISELA

Grid Initiatives for e-Science virtual communities in Europe and Latin

America

• Sep 2010 – Ago 2012

• Soporte a comunidades virtuales

• Educación

• Entrenamiento

• Transferencia a CLARA

Page 30: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

30

GISELA

15 Países (11 en América Latina)19 Miembros (14 en América Latina)12 Terceros (11 en América Latina)

UNIANDES• UIS• PUJ

UFRJ• CEFET-RJ

REUNA• UFRO• UTFSM

UNAM• CICESE• ITV• ITESM• IPN-CIC• UAEM• UNISON

Page 31: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

31

GISELA: http://www.gisela-grid.eu/

Paginaprincipal

Page 32: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

32

GISELA: http://indico.gisela-grid.eu/

Servidor deeventos

Page 33: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

33

GISELA: http://documents.gisela-grid.eu/

Servidor dedocumentos

Page 34: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

34

GISELA: http://applications.gisela-grid.eu/

Aplicaciones~70

Page 35: Grid CISCO Academy Conference 2011 (  ) (9/6/2011) & Seminario e-Investigación en Ciencias Sociales y Humanas (10/6/2011) Herbert

35

Finalmente…

• Que los recursos estén disponibles en cualquier lugar, en cualquier momento, en forma confiable y segura, que la ubicación de los procesos y datos sea transparente al usuario, y que el Grid sea fácil de usar, son metas en las que aún se trabaja arduamente.

• La implementación, operación y mantenimiento de un Grid no es fácil, pero el software esta madurando rápidamente.