cluster

31
Cluster BASE DE DATOS DISTRIBUIDA Selma M. Avalos Mateos Daniel Cruz Santos Julio López Vaca Cenobio Monjaraz García

Upload: juliocesar

Post on 13-Sep-2015

6 views

Category:

Documents


1 download

DESCRIPTION

Presentación con respecto a la teoría de clusters.

TRANSCRIPT

  • ClusterBASE DE DATOS DISTRIBUIDA

    Selma M. Avalos Mateos Daniel Cruz Santos Julio Lpez Vaca Cenobio Monjaraz Garca

  • CONTENIDO

    DIFERENCIA: CLUSTER Y GRID

    DEFINICIN

    ANTECEDENTES

    CARACTERISTICAS GENERALES

    ARQUITECTURA

    COMPONENTES

    TIPOS

    EJEMPLO

    REFERENCIAS

  • DEFINICIN

    El trmino clster se aplica a los

    conjuntos de computadoras

    unidos mediante una red de alta

    velocidad, construidos mediante

    la utilizacin de componentes de

    hardware comunes y que se

    comportan como si fuesen una

    nica computadora.

  • DEFINICIN

    Consta de un conjunto de computadoras independientes, interconectadasentre s, de tal manera que funcionan como un solo recursocomputacional. A cada uno de los elementos del cluster se le conoce comonodo. Estos pueden tener uno o varios procesadores, memoria RAM,interfaces de red, dispositivos de I/O, y SO.

    Comnmente, en un cluster existe una mquina (con monitor, teclado,ratn, etctera) que funciona como nodo-maestro y se encarga deadministrar, controlar y monitorear todas las aplicaciones y recursos delsistema, en tanto que el resto de los nodos est dedicado alprocesamiento de datos o a ejecutar operaciones aritmticas. Se lesconoce como nodos-esclavos.

  • Clasificacin de los Sistemas Distribuidos

    Una clasificacin altamente reconocida para los sistemas distribuidos es:

    Sistemas de cmputo. Sistemas de informacin. Sistemas masivos o embebidos.

    Sistemas distribuidos de cmputo

    utilizan para realizar tareas de

    cmputo de alto rendimiento.

    Computo en cluster Cmputo en malla(grid).

  • DIFERENCIAS: CLUSTER Y GRID

    En un clster todos los nodos se encuentran en el

    mismo lugar, conectados por una red local para as

    englobar todos los recursos.

    En cambio, en un grid no tienen por qu estar en el

    mismo espacio geogrfico; pueden estar en diferentes

    puntos del mundo.

    Tambin suele llamarse GRID al resultado obtenido de

    englobar las mquinas en una supercomputadora; con

    un clster solo se busca mejorar el rendimiento de las

    mquinas englobndolas en una sola.

  • ANTECEDENTES

    El comienzo de Cluster fue a finales de los aos 50 y principios delos aos 60.

    En 1967 Gene Amdahl de IBM public el papel inicial deprocesamiento en paralelo.

    El proyecto ARPANET en 1969 cre la primera red decomputadoras bsico basadas en el Cluster de computadoras.

    1977 sali el primer producto comercial de tipo Cluster, el ARCnetdesarrollado por Datapoint.

    En 1984 VAXcluster produjeron el sistema operativo VAX/VMS.

  • ARQUITECTURA

  • ARQUITECTURA

    Es un tipo ms de arquitectura paralela distribuida (MPM) pero con una

    caracterstica especial: cada

    computador puede utilizarse de forma

    independiente.

    Red de interconexin. Suele ser una red de altas prestaciones: Gigabit Ethernet,

    etc.

    Sistema Operativo. Pueden utilizarse la mayora de los S.O. del mercado: UNIX,

    Linux, Windows, etc.

    Protocolos rpidos de comunicacin. Active message, Fast messages, etc.

    Entornos y herramientas de programacin paralela.

    Programacin MPI, PVM, OpenMP, DSM

    Depuradores paralelos: TotalView

    Anlisis de rendimiento

    Administracin: Parmon

    Aplicaciones

    Aplicaciones paralelas o distribuidas, secuenciales.

  • VENTAJAS Y DESVENTAJAS

    VENTAJAS

    Alto rendimiento.

    El tamao del problema por resolver

    El precio de la mquina necesaria pararesolverlo.

    Escalabilidad. Habilidad para reaccionar yadaptarse sin perder calidad.

    Alta disponibilidad. Infraestructura yAplicacin

    Balance de Carga. Compartir el trabajorealizado entre varios procesos, ordenadores,

    discos, etc. Evita los cuellos de botella.

    DESVENTAJAS

    Software

    Problemas de administracin y gestin

    Memoria fsicamente distribuida -> utilizacin menos eficiente.

    Varias copias del sistema operativo.

    La red es el cuello de botella del sistema.

  • TIPOS DE TRABAJO A EJECUTAR

    Trabajos Secuenciales. Se ejecutan en un nico nodo.

    Trabajos paralelos. Se ejecutan en mltiples nodos.

    Trabajos interactivos. Ejecucin asociada a una terminal, ejecucin inmediata.

    Trabajos batch.

    No necesitan respuesta inmediata

    Se envan a una cola para su planificacin.

  • Componentes software de un clster

    Nodos

    Almacenamiento

    Sistemas operativos

    Conexiones de red

    middleware

    Protocolos de comunicacin y servicios

    Aplicaciones

    Ambientes de programacin paralela

  • COMPONENTES: Nodos

    Un Nodo es un punto de interseccin o unin devarios elementos que confluyen en el mismo lugar.

    Nodos dedicados, los nodos no disponen deteclado, ratn ni monitor y su uso est

    exclusivamente dedicado a realizar tareas

    relacionadas con el clster.

    Nodos no dedicados, los nodos disponen de teclado,ratn y monitor y su uso no est exclusivamente

    dedicado a realizar tareas relacionadas con el

    clster.

    Los nodos pueden ser PCs, workstation o SMPs

  • COMPONENTES: Sistema Operativo

    Un sistema operativo debe sermultiproceso y multiusuario.

    Facilidad de uso y acceso.

    Pueden utilizarse la mayora de losS.O. del mercado: UNIX, Linux, W2k,

    WXP, etc.

  • COMPONENTES: Conexiones de red

    Los nodos de un clster puedenconectarse mediante una simple

    red Ethernet con placas comunes

    (adaptadores de red o NICs), o

    utilizarse tecnologas especiales de

    alta velocidad como Fast Ethernet,

    Gigabit Ethernet, Myrinet,

    InfiniBand, SCI, etc.ec.

  • Componentes: Midleware

    El middleware es un software que generalmente acta entre el sistema operativo y las

    aplicaciones con la finalidad de proveer a un clster lo siguiente:

    Una interfaz nica de acceso al sistema, denominada SSI (Single System Image), lacual genera la sensacin al usuario de que utiliza un nico ordenador muy potente;

    Herramientas para la optimizacin y mantenimiento del sistema: migracin deprocesos, checkpoint-restart (congelar uno o varios procesos, mudarlos de servidor

    y continuar su funcionamiento en el nuevo host), balanceo de carga, tolerancia a

    fallos, etc.;

    Escalabilidad: debe poder detectar automticamente nuevos servidoresconectados al clster para proceder a su utilizacin.

  • Componentes: Ambientes de programacin

    paralela.

    Los ambientes de programacin paralela permiten implementaralgoritmos que hagan uso de recursos compartidos: CPU (central

    processing unit: unidad central de proceso), memoria, datos yservicios.

    Programacin: MPI, PVM, OpenMP, DSM (Threadmarks, Linda), etc.

    Depuradores paralelos: TotalView

    Anlisis de rendimiento: VT (IBM SP), MPE, Pablo, Vampir, etc.

    Administracin: Parmon.

  • TIPOS DE CLSTER

    Los clster pueden clasificarse segn sus caractersticas:

    HPCC (High Performance Computing Clster: clsteres de alto rendimiento).

    HA o HACC (High Availability Computing Clster: clsteres de altadisponibilidad).

    HT o HTCC (High Throughput Computing Clusters: cluster de alta eficiencia).

  • CLUSTER DE ALTO RENDIMIENTO [HPCC]

    Son clster en los cuales se ejecutan tareas que requieren de grancapacidad computacional, grandes cantidades de memoria, o

    ambos a la vez. El llevar a cabo estas tareas puede comprometer

    los recursos del clster por largos periodos de tiempo.

  • CLUSTER DE ALTA DISPONIBILIDAD [HACC]

    Son clster cuyo objetivo de diseo es el de proveer disponibilidad yconfiabilidad. Estos clster tratan de brindar la mxima disponibilidad de los

    servicios que ofrecen. La confiabilidad se provee mediante software que

    detecta fallos y permite recuperarse frente a los mismos, mientras que en

    hardware se evita tener un nico punto de fallos..

  • CLUSTER DE EFICIENCIA [HTCC]

    Son clster cuyo objetivo de diseo es el ejecutar la mayor cantidadde tareas en el menor tiempo posible. Existe independencia de datos

    entre las tareas individuales. El retardo entre los nodos del clster no es

    considerado un gran problema.

  • OTRA CLASIFICACIN.

    Clster comerciales (dealta disponibilidad y alta

    eficiencia).

    Clster cientficos (de altorendimiento).

  • CLUSTER EXISTENTES

    SE MENCIONAN ALGUNOS DE LOS ORDENADORES SPER POTENTES ACTUALES.

  • MARENOSTRUM

    (Top 5/77)

    4812 nodos

    JS21: 4 cores en dos procesadores IBM PowerPC

    dual-core 970MP de 64 bits

    a 2'3 GHz, 8 GB.

    63830 GFlops (LINPACK).

    20480 GB RAM

    280 TB Disco (GPFS).

    Red Myrinet x 12 Switches.

    GigaEthernet x 5 Switches.

  • MAGERIT

    (Top 34/335)

    y 1204 nodos (1036 nodos eServer BladeCenter JS20 y 168 nod os eServer

    BldC a e enter JS21 ).

    JS20: 2 cores en dos procesadores IBM PowerPC single-core 970FX de 64 bits a 2'2 GHz, 4 GB.

    y JS21: 4 cores en dos procesadores IBM PowerPC dual-core 970MP de 64 bits a 2'3 GHz, 8 GB.

    15955 GFlops (LINPACK).

    5488 GB RAM.

    65TB Disco (GPFS).

    Red Myrinet x 6 Switches.

    GigaEthernet x 2 Switches.

  • ROADRUNNER

    (Top 1/2)

    12240 + 6562 procesadores

    QS22: IBM PowerXCell 8i.

    AMD Opteron.

    1.026 PFlops (LINPACK).

    103.6 TB RAM.

    Triblade / Infiniband.

  • JAGUAR

    (Top 1)

    Cray XT5-HE

    224,256 AMD Opteron Six Core 2.6 GHz.

    1.75 PFlops (LINPACK).

    10 PB Disco (Spider/Lustre).

    598TB RAM.

    Cray SeaStar Network.

  • LIMITACIONES DE LOS CLUSTERS

    Sobrecarga por comunicacin

    Implementaciones de grano fino: difciles de disear, difciles de afinar y muchoms difciles de escalar.

    Las implementaciones de grano grueso son ms fciles. Pero, en este caso Senecesitan anchos de banda espectaculares?

    Mantenimiento:

    La ampliacin de un clster es costosa en grandes tamaos.

    Es una solucin escalable pero hasta que punto pueden hacerlo?

  • LIMITACIONES DE LOS CLUSTER

    Recursos infrautilizados:

    Los clster son instalaciones dedicadas.

    Una organizacin tpica tiene desperdiciado millones de ciclos de cmputo en sus ordenadores personales.

    Siempre existe un problema ms grande.

  • Referencias

    http://www.arcos.inf.uc3m.es/~dsd/lib/exe/fetch.php?media=cluster-grid.pdf

    http://es.wikipedia.org/wiki/Cl%C3%BAster_(inform%C3%A1tica)

    http://sistemasdistribuidos11.blogspot.mx/p/clusters.html

    http://sistemasoperativos.wikia.com/wiki/1.4._Sistemas_distribuidos_de_alto_rendimiento_a_bajo_costo_(clustering)_en_sistemas_operativos_de_libre_distribuci%C3%B3n.

    http://ais-sistemasdistribuidos.blogspot.mx/p/tema-10.html

    http://laurel.datsi.fi.upm.es/_media/docencia/asignaturas/ccg/intro-4pp.pdf

    http://www.muyinteresante.es/innovacion/tecno/articulo/el-ordenador-mas-potente-de-espana-esta-en-la-universidad-politecnica-de-madrid

    http://www.uhu.es/josem.bravo/AD/Tema3.pdf

    http://suseos.weebly.com/uploads/1/8/7/0/18707470/23-_cluster.pdf

    http://icaro.eii.us.es/descargas/segunda%20parte%20Sistemas%20Multiprocesadores%202006_2007.pdf

  • CLUSTER

    GRACIAS POR SU ATENCIN

    PREGUNTAS Y DUDAS??