cluster
DESCRIPTION
Presentación con respecto a la teoría de clusters.TRANSCRIPT
-
ClusterBASE DE DATOS DISTRIBUIDA
Selma M. Avalos Mateos Daniel Cruz Santos Julio Lpez Vaca Cenobio Monjaraz Garca
-
CONTENIDO
DIFERENCIA: CLUSTER Y GRID
DEFINICIN
ANTECEDENTES
CARACTERISTICAS GENERALES
ARQUITECTURA
COMPONENTES
TIPOS
EJEMPLO
REFERENCIAS
-
DEFINICIN
El trmino clster se aplica a los
conjuntos de computadoras
unidos mediante una red de alta
velocidad, construidos mediante
la utilizacin de componentes de
hardware comunes y que se
comportan como si fuesen una
nica computadora.
-
DEFINICIN
Consta de un conjunto de computadoras independientes, interconectadasentre s, de tal manera que funcionan como un solo recursocomputacional. A cada uno de los elementos del cluster se le conoce comonodo. Estos pueden tener uno o varios procesadores, memoria RAM,interfaces de red, dispositivos de I/O, y SO.
Comnmente, en un cluster existe una mquina (con monitor, teclado,ratn, etctera) que funciona como nodo-maestro y se encarga deadministrar, controlar y monitorear todas las aplicaciones y recursos delsistema, en tanto que el resto de los nodos est dedicado alprocesamiento de datos o a ejecutar operaciones aritmticas. Se lesconoce como nodos-esclavos.
-
Clasificacin de los Sistemas Distribuidos
Una clasificacin altamente reconocida para los sistemas distribuidos es:
Sistemas de cmputo. Sistemas de informacin. Sistemas masivos o embebidos.
Sistemas distribuidos de cmputo
utilizan para realizar tareas de
cmputo de alto rendimiento.
Computo en cluster Cmputo en malla(grid).
-
DIFERENCIAS: CLUSTER Y GRID
En un clster todos los nodos se encuentran en el
mismo lugar, conectados por una red local para as
englobar todos los recursos.
En cambio, en un grid no tienen por qu estar en el
mismo espacio geogrfico; pueden estar en diferentes
puntos del mundo.
Tambin suele llamarse GRID al resultado obtenido de
englobar las mquinas en una supercomputadora; con
un clster solo se busca mejorar el rendimiento de las
mquinas englobndolas en una sola.
-
ANTECEDENTES
El comienzo de Cluster fue a finales de los aos 50 y principios delos aos 60.
En 1967 Gene Amdahl de IBM public el papel inicial deprocesamiento en paralelo.
El proyecto ARPANET en 1969 cre la primera red decomputadoras bsico basadas en el Cluster de computadoras.
1977 sali el primer producto comercial de tipo Cluster, el ARCnetdesarrollado por Datapoint.
En 1984 VAXcluster produjeron el sistema operativo VAX/VMS.
-
ARQUITECTURA
-
ARQUITECTURA
Es un tipo ms de arquitectura paralela distribuida (MPM) pero con una
caracterstica especial: cada
computador puede utilizarse de forma
independiente.
Red de interconexin. Suele ser una red de altas prestaciones: Gigabit Ethernet,
etc.
Sistema Operativo. Pueden utilizarse la mayora de los S.O. del mercado: UNIX,
Linux, Windows, etc.
Protocolos rpidos de comunicacin. Active message, Fast messages, etc.
Entornos y herramientas de programacin paralela.
Programacin MPI, PVM, OpenMP, DSM
Depuradores paralelos: TotalView
Anlisis de rendimiento
Administracin: Parmon
Aplicaciones
Aplicaciones paralelas o distribuidas, secuenciales.
-
VENTAJAS Y DESVENTAJAS
VENTAJAS
Alto rendimiento.
El tamao del problema por resolver
El precio de la mquina necesaria pararesolverlo.
Escalabilidad. Habilidad para reaccionar yadaptarse sin perder calidad.
Alta disponibilidad. Infraestructura yAplicacin
Balance de Carga. Compartir el trabajorealizado entre varios procesos, ordenadores,
discos, etc. Evita los cuellos de botella.
DESVENTAJAS
Software
Problemas de administracin y gestin
Memoria fsicamente distribuida -> utilizacin menos eficiente.
Varias copias del sistema operativo.
La red es el cuello de botella del sistema.
-
TIPOS DE TRABAJO A EJECUTAR
Trabajos Secuenciales. Se ejecutan en un nico nodo.
Trabajos paralelos. Se ejecutan en mltiples nodos.
Trabajos interactivos. Ejecucin asociada a una terminal, ejecucin inmediata.
Trabajos batch.
No necesitan respuesta inmediata
Se envan a una cola para su planificacin.
-
Componentes software de un clster
Nodos
Almacenamiento
Sistemas operativos
Conexiones de red
middleware
Protocolos de comunicacin y servicios
Aplicaciones
Ambientes de programacin paralela
-
COMPONENTES: Nodos
Un Nodo es un punto de interseccin o unin devarios elementos que confluyen en el mismo lugar.
Nodos dedicados, los nodos no disponen deteclado, ratn ni monitor y su uso est
exclusivamente dedicado a realizar tareas
relacionadas con el clster.
Nodos no dedicados, los nodos disponen de teclado,ratn y monitor y su uso no est exclusivamente
dedicado a realizar tareas relacionadas con el
clster.
Los nodos pueden ser PCs, workstation o SMPs
-
COMPONENTES: Sistema Operativo
Un sistema operativo debe sermultiproceso y multiusuario.
Facilidad de uso y acceso.
Pueden utilizarse la mayora de losS.O. del mercado: UNIX, Linux, W2k,
WXP, etc.
-
COMPONENTES: Conexiones de red
Los nodos de un clster puedenconectarse mediante una simple
red Ethernet con placas comunes
(adaptadores de red o NICs), o
utilizarse tecnologas especiales de
alta velocidad como Fast Ethernet,
Gigabit Ethernet, Myrinet,
InfiniBand, SCI, etc.ec.
-
Componentes: Midleware
El middleware es un software que generalmente acta entre el sistema operativo y las
aplicaciones con la finalidad de proveer a un clster lo siguiente:
Una interfaz nica de acceso al sistema, denominada SSI (Single System Image), lacual genera la sensacin al usuario de que utiliza un nico ordenador muy potente;
Herramientas para la optimizacin y mantenimiento del sistema: migracin deprocesos, checkpoint-restart (congelar uno o varios procesos, mudarlos de servidor
y continuar su funcionamiento en el nuevo host), balanceo de carga, tolerancia a
fallos, etc.;
Escalabilidad: debe poder detectar automticamente nuevos servidoresconectados al clster para proceder a su utilizacin.
-
Componentes: Ambientes de programacin
paralela.
Los ambientes de programacin paralela permiten implementaralgoritmos que hagan uso de recursos compartidos: CPU (central
processing unit: unidad central de proceso), memoria, datos yservicios.
Programacin: MPI, PVM, OpenMP, DSM (Threadmarks, Linda), etc.
Depuradores paralelos: TotalView
Anlisis de rendimiento: VT (IBM SP), MPE, Pablo, Vampir, etc.
Administracin: Parmon.
-
TIPOS DE CLSTER
Los clster pueden clasificarse segn sus caractersticas:
HPCC (High Performance Computing Clster: clsteres de alto rendimiento).
HA o HACC (High Availability Computing Clster: clsteres de altadisponibilidad).
HT o HTCC (High Throughput Computing Clusters: cluster de alta eficiencia).
-
CLUSTER DE ALTO RENDIMIENTO [HPCC]
Son clster en los cuales se ejecutan tareas que requieren de grancapacidad computacional, grandes cantidades de memoria, o
ambos a la vez. El llevar a cabo estas tareas puede comprometer
los recursos del clster por largos periodos de tiempo.
-
CLUSTER DE ALTA DISPONIBILIDAD [HACC]
Son clster cuyo objetivo de diseo es el de proveer disponibilidad yconfiabilidad. Estos clster tratan de brindar la mxima disponibilidad de los
servicios que ofrecen. La confiabilidad se provee mediante software que
detecta fallos y permite recuperarse frente a los mismos, mientras que en
hardware se evita tener un nico punto de fallos..
-
CLUSTER DE EFICIENCIA [HTCC]
Son clster cuyo objetivo de diseo es el ejecutar la mayor cantidadde tareas en el menor tiempo posible. Existe independencia de datos
entre las tareas individuales. El retardo entre los nodos del clster no es
considerado un gran problema.
-
OTRA CLASIFICACIN.
Clster comerciales (dealta disponibilidad y alta
eficiencia).
Clster cientficos (de altorendimiento).
-
CLUSTER EXISTENTES
SE MENCIONAN ALGUNOS DE LOS ORDENADORES SPER POTENTES ACTUALES.
-
MARENOSTRUM
(Top 5/77)
4812 nodos
JS21: 4 cores en dos procesadores IBM PowerPC
dual-core 970MP de 64 bits
a 2'3 GHz, 8 GB.
63830 GFlops (LINPACK).
20480 GB RAM
280 TB Disco (GPFS).
Red Myrinet x 12 Switches.
GigaEthernet x 5 Switches.
-
MAGERIT
(Top 34/335)
y 1204 nodos (1036 nodos eServer BladeCenter JS20 y 168 nod os eServer
BldC a e enter JS21 ).
JS20: 2 cores en dos procesadores IBM PowerPC single-core 970FX de 64 bits a 2'2 GHz, 4 GB.
y JS21: 4 cores en dos procesadores IBM PowerPC dual-core 970MP de 64 bits a 2'3 GHz, 8 GB.
15955 GFlops (LINPACK).
5488 GB RAM.
65TB Disco (GPFS).
Red Myrinet x 6 Switches.
GigaEthernet x 2 Switches.
-
ROADRUNNER
(Top 1/2)
12240 + 6562 procesadores
QS22: IBM PowerXCell 8i.
AMD Opteron.
1.026 PFlops (LINPACK).
103.6 TB RAM.
Triblade / Infiniband.
-
JAGUAR
(Top 1)
Cray XT5-HE
224,256 AMD Opteron Six Core 2.6 GHz.
1.75 PFlops (LINPACK).
10 PB Disco (Spider/Lustre).
598TB RAM.
Cray SeaStar Network.
-
LIMITACIONES DE LOS CLUSTERS
Sobrecarga por comunicacin
Implementaciones de grano fino: difciles de disear, difciles de afinar y muchoms difciles de escalar.
Las implementaciones de grano grueso son ms fciles. Pero, en este caso Senecesitan anchos de banda espectaculares?
Mantenimiento:
La ampliacin de un clster es costosa en grandes tamaos.
Es una solucin escalable pero hasta que punto pueden hacerlo?
-
LIMITACIONES DE LOS CLUSTER
Recursos infrautilizados:
Los clster son instalaciones dedicadas.
Una organizacin tpica tiene desperdiciado millones de ciclos de cmputo en sus ordenadores personales.
Siempre existe un problema ms grande.
-
Referencias
http://www.arcos.inf.uc3m.es/~dsd/lib/exe/fetch.php?media=cluster-grid.pdf
http://es.wikipedia.org/wiki/Cl%C3%BAster_(inform%C3%A1tica)
http://sistemasdistribuidos11.blogspot.mx/p/clusters.html
http://sistemasoperativos.wikia.com/wiki/1.4._Sistemas_distribuidos_de_alto_rendimiento_a_bajo_costo_(clustering)_en_sistemas_operativos_de_libre_distribuci%C3%B3n.
http://ais-sistemasdistribuidos.blogspot.mx/p/tema-10.html
http://laurel.datsi.fi.upm.es/_media/docencia/asignaturas/ccg/intro-4pp.pdf
http://www.muyinteresante.es/innovacion/tecno/articulo/el-ordenador-mas-potente-de-espana-esta-en-la-universidad-politecnica-de-madrid
http://www.uhu.es/josem.bravo/AD/Tema3.pdf
http://suseos.weebly.com/uploads/1/8/7/0/18707470/23-_cluster.pdf
http://icaro.eii.us.es/descargas/segunda%20parte%20Sistemas%20Multiprocesadores%202006_2007.pdf
-
CLUSTER
GRACIAS POR SU ATENCIN
PREGUNTAS Y DUDAS??