estrategias de alta disponibilidad y diseño del almacenamiento en entornos de virtualización
TRANSCRIPT
Estrategias de Alta Disponibilidad y diseño del almacenamiento en entornos de virtualización
David Cervigón LunaIngeniero Preventa - Virtualizació[email protected]://blogs.technet.com/davidcervigon
Agenda
IntroducciónRepaso y Novedades de Failover Cluster en 2008 R2Configuración y diseño de la redConfiguración del Almacenamiento SANGeo-Clusters, Stretch-ClustersGuest ClusteringDimensionamiento y configuración fina
Windows Server 2008 R2 Hyper-V vs. Microsoft Hyper-V Server 2008 R2
Microsoft Hyper-V Server 2008 R2 (HVS)
Descarga gratuita que incluye el hypervisor y todos los componentes necesarios
para virtualizar (Windows Kernel, drivers, red, almacenamiento…)
Windows hypervisor
VM
Hardware
Parent Partition
VM
Microsoft Hyper-V Server
Hyper-V como role de Windows Server 2008 R2
Disponible como role en una instalación “full” o “Server Core” de Windows Server
2008
Hyper-V
VM
Hardware
Windows (parent
partition)
VM
Windows hypervisor
MISMAS FUNCIONALIDADES
Host ClusteringHA, Quick Migration, Live Migration, CSVs
Red Pública
Red de HeartBeat
“Intranet” Red Virtual
NODO2NODO1
Almacenamiento SANDC
Server Core Server Core
NIC3 - 192.168.100.1 NIC3 - 192.168.100.2
NIC1 - 192.168.0.1 NIC1 - 192.168.0.2
192.168.0.100192.168.0.100
NIC2 - 10.10.10.1 NIC2 - 10.10.10.2
Alta Disponibilidad en entornos virtualizadosRepaso y novedades de Failover Cluster en 2008 R2
Requerimientos del Almacenamiento para Clustering en Windows Server 2008
Solo se soporta el almacenamiento que admita Persistent Reservations (SCSI-3)No se soporta a parallel-SCSI
Fibre Channel iSCSI SAS
Tipos de BUS compartido soportados:
Nuevo modelo de QuorumMembresía al cluster basada en “Mayorías”
Quien y qué tiene un voto es totalmente configurable
Eliminación de puntos de falloEl diseño original asumía que el almacenamiento siempre estaría disponibleAhora el cluester puede sobrevivir a una perdida de conexión con los nodos
Nuevo modelo de quorumHíbrido del antiguo Majority Node Set (MNS) y Quorum basado en disco compartidoEste nuevo modelo reemplaza a los dos anteriores
Mayoría de Disco y NodosMayoría de nodos con un” modelo de quorum basado en un “disco testigo”3 votos en total, con dos necesarios para la mayoría
El Cluster puede sobrevivir a la pérdida de cualquiera de los elementos con un voto
Nodo 1 Nodo 2
El dispositivo del almacenamiento compartido tiene 1 voto
Cada nodo tiene 1 voto
SAN
VotoVoto
Voto
Mayoria de Nodos
Nodo 3Nodo 1Nodo 2
Voto Voto
Voto
Solamente los nodos tienen votoSe requieren 3+ nodos, y no hay necesidad de tener almacenamiento compartidoSe requiere la mayoría de los nodos para operar el Cluster
SAN
Mayoría de nodos y carpeta compartidaUn File Share Witness (testigo) permite tener un Cluster de dos
nodos sin disco compartidoExcelente solución para Clusteres geográficamente dispersosUn servidor de ficheros puede usarse para albergar los testigos de múltiples clústeres
Nodo 1 Nodo 2
Carpeta compartida en un servidor independiente
Cada nodo tiene 1 voto
Testigo
VotoVoto
SAN
Solo disco
Node 1 Node 2
El dispositivo de almacenamiento compartido es el master
SAN
Voto
Solamente un disco compartido tiene votoLos nodos no tienen voto, por lo que el disco de Quorum es el masterEl Cluster estará vivo solamente si un nodo puede alcanzar el discoMismo comportamiento que el tradicional modelo de Quorum
Generalmente no recomendado
Mejoras en la ValidaciónSe puede correr antes, durante o después del despliegue del clusterIncluye comprobaciones adicionales de buenas prácticas
Configuración del QuorumEstado de los recursos del clusterConfiguración del Network Name en un cluster multi-siteOfrece una guía prescriptiva para lograr mayor disponibilidad
Recoge información acerca de la configuración para documentación y soporte
PowerShell
Línea de comandos, lenguaje de scripting e interfaz programáticaGestión mejorada
Corre la validaciónCrea clusteres y clusteriza rolesGestiona Hyper-V y CSVGenera informes de dependecias
Server Core, Hyper-V Server 2008 R2, & Cliente RSATReemplaza a cluster.exe como herramienta CLI
Acceso en modo solo lectura
Acceso en solo lectura a la Cluster APIPrivilegios reducidos
Ver el clusterSin poder llevar a cabo accionesMinimiza el riesgo
Seguridad mejoradaÚtil para la primera capa de soporte, colaboración entre equipos, administración e investigaciónSoportado por Powershell
Quick Migration vs. Live MigrationQuick Migration
(Windows Server 2008 Hyper-V)
1. Salva el estado de ejecucióna) Crea la VM en el destinob) Escribe la memoria de la VM en el
almacenamiento compartido
2. Mueve la VMa) Mueve la conectividad del
almacenamiento del host origen al host destino
3. Restaura el estado y continua la ejecución
a) Lee la memoria de la VM del almacenamiento compartido y la restaura en el host destino
b) Continua la ejecución
Live Migration(Windows Server 2008 R2 Hyper-V)
1. Estado de la VM y Transferencia de la Memoria
a) Crea la VM en el destinob) Mueve páginas de memoria desde el
origen al destino via Ethernet de manera iterativa
2. Transferencia final del estado y restauración de la VM
a) Pausa la máquina virtualb) Mueve el almacenamiento desde el
origen al destino
3. Continua la ejecución
Host 1 Host 2 Host 1 Host 2
Cluster Shared VolumesTodos los servidores del cluster tienen acceso simultáneo a las mismas LUN del almacenamientoUtiliza NTFS, elimina los problemas de letras de unidad, mismas herramientas, sin modificaciones en la SAN…
DEMOPrerrequisitos y Validación de los nodos del cluster
Alta Disponibilidad en entornos virtualizados Configuración y Diseño de la red
Hyper-V NetworkingPartición Padre
Redes Virtuales enlazadas a NICs físicasExternas – Limitadas por el número de NICsInternas – IlimitadasPrivadas – Ilimitadas
Solo NICs Ethernet (no Wireless)Soporta VLANs
Trunking (VTP Protocol)
Máquina VirtualNIC SintéticaNIC Legacy (Intel 21140)12 NICs por VM
8 sintéticas4 legacy
Hasta 10Gb/sSoporta VLANs
NIC dedicada (Gestión) NIC enlazada a Hyper-V
Switches virtuales – Switches físicos
VM2VM1
Physical Network Switch
Los puertos del Switch Virtual son troncales
Trunk Port
VLAN1 VLAN2
VMBUS
VLAN2
VLAN1
Tarjeta física del Host
Virtual Switch
Cómo repartir las NICsMínimo 2, máximo… y mejor Gigabit2 NICs
NIC1: HeartBeat + LiveMigrationNIC2: Gestión + vSwitch
3 NICsNIC1: HeartBeat + LiveMigrationNIC2: GestiónNIC3: vSwitch
4 NICsNIC1: HeartBeat + LiveMigrationNIC2: GestiónNIC3: vSwitch1NIC4: vSwitch2
Si se va a utilizar iSCSI es conveniente dedicar una o dos (MultiPath) tarjetas conectadas a redes GigabitImportante segmentar/repartir el trafico en diferentes switches físicos
RendimientoTolerancia a fallos
DEMOConfiguración de las redes preferidas para Live Migration
Windows Server 2008 Hyper-V R2Configuración del Almacenamiento SAN
Fiber Channel vs. ISCSI
Disk ArrayGroup
LUN1 LUN2
SP1 SP2
Host
HBA1 HBA2
FC Switches
MPIO Store Port Driver
Disk ArrayGroup
LUN1 LUN2
SP1 SP2
Host
NIC1 NIC2
Switches de red Nivel 3
MPIO Store Port Driver
VDS/VSS Hardware Provider
VSP Virtual Storage Provider
VDS/VSS Hardware Provider
VSP Virtual Storage Provider
RecetaInstalar el Sistema OperativoInstalar los drivers del fabricanteInstalar Roles y Funcionalidades
Hyper-VMultipath I/OFailover Cluster
Desde el almacenamientoCrear las LUNs sobre los discos, con el nivel de RAID deseadoPresentar las LUNs que conformaran el almacenamiento compartido a todos los WWNames de los puertos correspondientes de las HBAs de todos los nodos del cluster.
Instalar el Device Specific Module (DSM) de la cabina de almacenamiento
Es frecuente ver los volúmenes correspondientes a cada LUN duplicados en el Administrador de Discos
BOOT from SANEs conveniente utilizar diferentes HBAs y Fabrics para separar el I/O de las LUNs de sistema y las LUNs del almacenamiento compartido
Los CSVs son LUNs normalesSolo cambia la forma en la que las maneja el cluster
En todos los nodos se montan en el mismo path: C:\ClusterStorage\VolumeXX
Hay que habilitar su soporte a nivel de clusterInterfaz gráficaCluster.exe /prop EnableSharedVolumes=1
Receta:Presentar la LUN que queremos que sea un CSV a todos los nodos del cluster
Tener en cuenta que tendrá un gran volumen de datos y un alto I/O
Agregar la LUN al cluster (conviene re-validar el cluster)Agregar el nuevo disco que aparece como almacenamiento disponible como un nuevo CSVs
Redirected I/O
La VM corriendo en el nodo 2 no
es afectada
Volumen montado en e l Nodo 1
Fallo de conectividad a la
SAN
VHD
Redirección del I/O por SMB
Las VMs todavía se pueden mover por Live Migration
SAN
CSVs vs. LUNs dedicadas
CSVs
ProsSimplifica el diseño del almacenamiento y el uso de herramientas específicas (p.e Backup, Clone, Mirror, etc.)Ahorra espacioFacilita la gestión del entorno virtualizadoMejores tiempos de respuesta en Live Migrations
ConsMuchos huevos en la misma cestaRendimiento (discutible)No permite Pass-Through
LUNs Dedicadas
ProsRendimiento (discutible)AislamientoPass-througGeo-ClusteringMigraciones vía SAN transfers/NPIV
ConsComplica el diseño almacenamientoComplica el aprovisionamiento de nuevas VMsPeores tiempos de Live Migration
Configuración del LAB
DEMOPaso a paso para crear un CSV
Alta Disponibilidad en entornos virtualizados Geo-Clusters, Multi-Site Clusters, Stretch Clusters
Ver: Windows Server 2008 Multi-Site Clustering Whitepaper
De HA a HA + DR + DPHyper-V + Failover Cluster ofrecen: Alta Disponibilidad Movimientos de máquinas virtuales sin tiempo de parada La posibilidad de extender estas ventajas a sites
geográficamente separados, convirtiéndose además en una excelente solución de Recuperación ante desastres y de protección continua de datos
Disaster Recovery (DR)
Alta Disponibilidad (HA)
Backup/Recovery
Continuidad del Negocio
Quick/Live Migration
VHD
Almacnamiento
Backup/Recovery
Clustering
Sitio SecundarioSitio Primario
Storage Array
Storage Array
Disaster Recovery
Backup/Recovery
Backup/Recovery
33
Geo-Clusters, Stretch Clusters, Multi-Site ClustersEl cluster se extiende a diferenten localizaciones físicas
En cada Site los nodos acceden a su propio sistema de almacenamientoEl almacenamiento replica la información entre los diferentes SitesEn caso de desastre en un Site, el failover se lleva a cabo de manera automática
Site BSite A
Replicación
Mayoría de nodos en Multi-Site
Site BSite A
Pérdida de conectividad entre
Sites
¿Puedo comunicarme con la
mayoría de los nodos del cluster?
Si, continúo encendido
¿Puedo comunicarme con la
mayoría de los nodos del cluster?
No, me apago
Cluster de 5 nodosMayoría = 3
SAN SAN
Mayoría en el nodo primario
Mayoría de nodos en Multi-Site
Site BSite AEl Site entero se cae
¿Puedo comunicarme con la
mayoría de los nodos del cluster?
Si, continúo encendido
Cluster de 5 nodosMayoría = 3
SAN SAN
Mayoría en el nodo primario
Mayoría de nodos en Multi-Site
Site BSite A
El site entero se cae
¿Puedo comunicarme con la
mayoría de los nodos del cluster?
No, me apago
Cluster de 5 nodosMayoría = 3
SAN SAN
Majority in Primary
Site
Se necesita forzar el Quorum
manualmente
Mayoría de Nodos y File Share
Site A Site BWAN
Site C
SANEl sitio entero se cae
¿Puedo comunicarme con la
mayoria de votos en el cluster?Si, continúo encendido
Cluster de 5 nodosMayoría = 3
SAN
File Share en un Site independiente
Mayoría de Nodos y File Share
Site A Site BWAN
Site C
Pérdida de conectividad entre
Sites
Cluster de 5 nodosMayoría = 3
¿Puedo comunicarme con la
mayoria de votos en el cluster?No, me apago
¿Puedo comunicarme con la
mayoria de votos en el cluster?Si, continúo encendido
SAN SAN
File Share en un Site independiente
Replicación Síncrona
Server
Write request Replicación
Write Com
plete
El host recibe la confirmación de escritura solamente después de que el almacenamineto notifique la correcta replicación del dato
Dato Dato
Almacenamiento Primario Almacenamiento SecundarioConfirmación
Replicación AsíncronaEl host recibe la confirmación de escritura del almacenamoento cuanddo el dato se ha escrito correctamente en el almacenamiento primarioNo usar nunca en multi-site clusters a menos que el mecanismo de replicación garantice que el orden de las operaciones de I/O se preservan
Server
Write request Replicación
Write Com
pleteDato Dato
Almacenamiento Primario Almacenamiento Secundario
Síncrona vs. AsíncronaSíncrona
Cortas distanciasSin pérdida de datosRequiere conexiones de alto ancho de banda y baja latenciaLa latencia en las escrituras puede impactar en el rendimiento
AsíncronaMayores distanciasPerdida potencial de datos en caso de fallo hardwareRequiere un ancho de banda suficiente para transmitir datos a suficiente velocidadSin impacto en rendimiento
Las aplicaciones pueden recuperarse bien de caídas mientras están en estado consistente, pero difícilmente lo harán si las operaciones de I/O se han realizado fuera de secuencia.¿DFS, DFS-R o Robocopy?. Buen intento, pero mejor no, gracias.
CSVs y Multi-Site Clusters
Por lo general los CSVs no pueden utilizarse en configuraciones Multi-Site
En ambos sites, el CSV se utilizaría en lectura-escrituraLa replicación suele ser por LUN y unidireccionalLas LUNs replicadas suelen estar ocultas o en solo lectura en el site destino
Hay fabricantes que resuelven el problema haciendo que la replicación del almacenamiento sea transparente al host
Ej. NetApp MetroCluster
NetApp Data Protection/Business Continuity Products
Cost
Capacidad
Backup Incremental a nivel de
bloque
Replicación Asincrona
LAN/WANClustering
Operación
ContínuaReplicación
Síncrona
Recuperación de Aplicaciones
Backup
Herramientas de Backup
Herramientas propias del
almacenamiento
Clusters Síncronos
Recuperación localRecuperación remota Recuperación remota– Bajo RTO
Dis
poni
bilid
ad
Herramientas de Backup
Herramientas de Backup
Replicación Software
Herramientas propias del
almacenamientoHerramientas propias del
almacenamiento
Herramientas propias del
almacenamiento
Replicación Software
Herramientas de Backup
ReplicaciónDouble-Take
http://www.doubletake.com/english/products/double-take-virtualization/Pages/Double-Take-for-Hyper-V.aspx http://www.doubletake.com/Documents/Hyper-V/DBTK_MSFT_HyperV_Solution_Sheet_GC-Product-Overview-0607.pdf
NetApp SnapMirror & MetroClusterhttp://www.netapp.com/us/products/protection-software/snapmirror.htmlhttp://www.netapp.com/us/products/protection-software/metrocluster.html
HP Continuous Accesshttp://h18006.www1.hp.com/products/storage/software/conaccesseva/index.htmlhttp://h18006.www1.hp.com/products/storage/software/continuousaccess/index.html
EMC SRDFhttp://www.emc.com/products/detail/software/srdf.htm
Hitachi HDS TrueCopyhttp://www.hds.com/solutions/applications/microsoft/hyper-v.html http://www.hds.com/assets/pdf/synchronous-data-replication-solutionsbrief.pdf http://www.hds.com/assets/pdf/asynchronous-long-distance-data-replication-sb.pdf
NEC ExpressClusterhttp://www.nec.com/global/prod/expresscluster/
DEMOMulti-Site Cluster con HP Continuous Access
Alta Disponibilidad en entornos virtualizados Clusteres Virtuales (Guest Clustering)
DEMOCómo crear el almacenamiento compartido por iSCSI para un Cluster Virtual
Alta Disponibilidad en entornos virtualizados Dimensionamiento y configuración fina
Clusters vs. Stand aloneLa HA tiene un precio
Un nodo de cluster siempre está peor aprovechado que un stand-aloneLos requerimientos de hardware e infraestructura son mayores.La solución es más compleja de diseñar, implementar y mantener
¿Realmente necesito un cluster?Criticidad de las VMs albergadasUso de otro tipo de estrategias de HA adicionales
Exchange CCR, DB Mirroring, NLB, Pools de VMs, etc.
Las VMs todavía se pueden migrar entre hosts stand-alone, con unos tiempos de parada muy aceptables (minutos)
Dimensionamiento y configuración finaFactores a tener en cuenta
Número máximo de nodos en fallo que se pueden soportar según el número de nodos y el modelo de quorum.Para más de dos nodos, un voto adicional basado en disco o file share solo tiene sentido para un número par de nodos.Los nodos pasivos son útiles.
Aceleran los failoversDebemos planificar su “desperdicio de hardware equivalente” en cualquier caso, repartiéndola entre los activosA mayor número de nodos, más podemos relajar la proporción Activos/Pasivos
La memoria NO es el único factor a tener en cuenta a la hora de cargar nodos con VMs
La CPU puede ser determinanteHay que tener muy en cuenta el I/O de red y almacenamiento
Planificar detalladamente las listas de possible owners y preferred owners para cada grupo de cluster asociado a cada VM
DEMOAlgunos números
Ver: http://blogs.technet.com/davidcervigon/archive/2009/05/29/herramienta-de-cosecha-propia-para-dimensionar-failover-clusters-beta.aspx
© 2009 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries.
The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this
presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS, IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION.