nuevas tecnologias del almacenamiento de informaciòn
Post on 10-May-2015
10.009 Views
Preview:
TRANSCRIPT
INTRODUCCION
Los equipos informáticos, los grandes servidores de redes, y por supuesto, las propias aplicaciones, son cada vez mayores y más voraces consumidores de almacenamiento masivo.
Los sistemas tradicionales, e incluso los propios discos magnéticos o discos duros, a pesar de su rápida evolución e incremento de capacidad y velocidad, se hacen insuficientes para las misiones que de ellos requerimos.
Podemos recordar grandes sistemas de cinta, de pocos KB de capacidad, y compararlos con los dispositivos actuales, e incluso menores dimensiones, pero con capacidades de varios TB.
Del mismo modo, aquellos grandes discos o cartuchos removibles de pocos MB, compiten ahora con unidades de tan sólo 3,5" y capacidades de hasta 4 GB., e incluso con dispositivos de 1,8" y varios cientos de MB.
Por supuesto, el otro gran problema de las aplicaciones, dada la ingente cantidad de datos, es el tiempo de acceso a los mismos, que ha de permitir el proceso de la información de un modo tal que sea "útil" para el usuario.
La seguridad de los datos es el último eslabón de este entramado, ya que si todos esos datos no son protegidos adecuadamente, cualquier fallo en el sistema provoca graves pérdidas económicas e incluso daños irreparables.
Por ello, y para cubrir todos estos objetivos, la tecnología de los dispositivos de almacenamiento ha evolucionado en los últimos años de un modo realmente espectacular, dando paso al desarrollo de nuevos productos, cuyos límites y aplicaciones son aún poco conocidos.
NUEVAS TECNOLOGIAS DEL ALMACENAMIENTO DE INFORMACION
Los sistemas de almacenamiento se han convertido en un aspecto singular y complejo de la
informática que puede enfocarse desde distintos puntos de vista. Podríamos definirlos como el
hardware donde se guardan datos.
Las tecnologías actuales de los dispositivos de almacenamiento son dos: la magnética y la
óptica. La primera se emplea desde hace años, tanto en el campo digital como en el analógico.
Entre los más conocidos se encuentran los discos flexibles y duros; sin embargo, existen otros,
por ejemplo los zip, los magneto-ópticos, las cintas para back-up, el SuperDisk, el SyQuest y el
Jaz. La tecnología óptica de almacenamiento a partir del uso del láser es más reciente .
Por ello, y para cubrir todos estos objetivos, la tecnología de los dispositivos de
almacenamiento ha evolucionado en los últimos años de un modo realmente espectacular,
dando paso al desarrollo de nuevos productos, cuyos límites y aplicaciones son aún poco
conocidos.
Básicamente, podemos dividir estos productos en 5 grandes grupos, claramente diferenciados.
Dispositivos RAID:
En 1987 surge el concepto de RAID o Redundant Arrays of Inexpensive Disks (matrices
redundantes de discos económicos), que soluciona, por un lado, el problema del
almacenamiento y del tiempo de acceso, y por otro la seguridad de los datos, así como los
tiempos de parada del sistema.
Básicamente se fundamentan en el concepto de dividir la información en bloques o segmentos,
cada uno almacenado en unidades de disco separadas, y con determinadas medidas de
redundancia de los datos, lo que implica un menor riesgo de pérdida de información en caso de
fallo, además de un menor tiempo de acceso a la información, ya que se comportan como
unidades diferentes suministrando información en paralelo a un "bus" más ancho.
Los sistemas RAID pueden estar basados en hardware o en software. La ventaja de los
primeros es su independencia de la plataforma o sistema operativo, ya que son vistos por éste
como un gran disco duro más, y además son mucho más rápidos, entre otras ventajas. Los
sistemas RAID software no son implementaciones adecuadas en la mayoría de los casos, y
cada vez son menos empleados.
Evidentemente, hay varias formas de llevar a cabo las funciones de un RAID, y es lo que se ha
dado en llamar niveles RAID. Actualmente se reconocen básicamente 6 niveles:
RAID 0: Los datos se fraccionan en bloques entre 2 y 16 KB, y se escriben en matrices de 2
o más discos. Los bloques de datos, o segmentos, se escriben secuencialmente, mediante
un sistema de "interleaving", es decir, el primer bloque en el primer disco, el 2º bloque en el
segundo disco, y así sucesivamente. Este sistema esta pensado para situaciones en las que
se requiere alta velocidad, pero no seguridad, ya que el fallo de cualquiera de los discos
implica la pérdida de los datos y la parada del sistema.
Ventajas: Proporciona el mejor tiempo de acceso, por ejemplo para aplicaciones gráficas.
Inconvenientes: No ofrece protección de los datos.
RAID 1: Cada segmento es almacenado en dos discos, por lo que si uno falla, la integridad
de los datos es total. En algunos sistemas, incluso cada conjunto de discos es manejado por
una controladora diferente, a modo de duplicado completo. Enfatiza la seguridad frente al
tiempo de acceso.
Ventajas: Proporciona un buen tiempo de acceso para pequeños bloques de datos y el
mayor grado de seguridad de los datos.
Inconvenientes: Se duplica el coste, al duplicar todos o casi todos los elementos.
RAID 2: Similar al nivel 0, pero con la peculiaridad de añadir redundancia (bits de paridad o
códigos de corrección de errores) y de segmentar los datos en bytes o incluso bits en lugar
de bloques. Al final de la matriz, en varios discos independientes de los de datos, se
almacena la información que permite la recuperación de los errores.
Ventajas: Proporciona un tiempo de acceso razonable y seguridad relativa.
Inconvenientes: El coste es elevado, pues requiere varios discos extra.
RAID 3: Se almacena 1 bit en cada disco, y un bit de paridad por cada byte en un disco
adicional.
Ventajas: Proporciona gran velocidad para grandes cantidades de información.
Inconvenientes: No es adecuado para pequeños bloques de datos.
RAID 4: Es similar al nivel 0, pero con corrección de errores.
Ventajas: Buen tiempo de acceso.
Inconvenientes: No es adecuado para grandes bloques de datos.
RAID 5: Es el más generalizado por su equilibrio de resultados. Se distribuyen los bloques
de datos entre todos los discos, mezclados con los datos de corrección de errores. Ello evita
la necesidad de acceder a todos los discos para una sola operación, y por tanto permite
realizar varias lecturas y escrituras simultáneas.
Ventajas: Proporciona un buen tiempo de acceso y gran seguridad de los datos a un precio
razonable.
Inconvenientes: No es aconsejable para grandes bloques de información.
La mayoría de los sistemas de redundancia de los RAID, conllevan la pérdida de alrededor de
un 20% de la capacidad de los discos en el almacenamiento de los datos de paridad.
Algo muy importante en los sistemas RAID es el uso de redundancia física, es decir,
equipamiento extra que permite, en caso de fallo de algún elemento del RAID, su "recambio"
automático, lo que evita la parada del sistema.
Por lo general, todos los RAID incorporan fuentes de alimentación redundantes, discos
redundantes e incluso controladoras redundantes.
Pero lo más interesante es la forma en que dichos repuestos entran en funcionamiento, ya que
para evitar su desgaste, es altamente recomendable que en condiciones normales no estén
activos (sin alimentación), para que no sufran ningún desgaste, pues de lo contrario no serían
útiles en caso de fallo de otra unidad, por su posibilidad de fallo al existir un "desgaste" por
tiempo de uso.
Cuando la unidad de repuesto no esta en el sistema, sino que ha de ser "insertada" o
conectada por el usuario (sin necesidad de apagar el RAID), se denomina "hot plug" (inserción
en caliente).
Cuando un disco de repuesto se mantiene en funcionamiento (alimentado), se denomina "hot
spare" (reposición en caliente). Con la única ventaja de una mayor velocidad de su entrada en
funcionamiento y de la reconstrucción de los datos en caso de que otra unidad falle.
Las unidades "hot fix" (reparación en caliente), también denominadas "cold/warm spare", son
las que están insertadas en el sistema, pero se mantienen desconectadas hasta el momento en
que otra unidad falla, entrando automáticamente en funcionamiento por medio de la gestión
inteligente de la controladora RAID.
Algunos RAID integran simultáneamente varias de estas técnicas, por ejemplo "hot spare" para
unidades de reserva y "hot plug" para sustituir las unidades averiadas.
Es importante tener en cuenta que, tras el fallo de una unidad de disco, el sistema ha de
reconstruir los datos de la unidad que ha fallado en la que la ha de sustituir, lo que conlleva la
lectura de los otros discos, así como de los datos de paridad, con el consiguiente período de
"ocupación" del RAID. Algunos sistemas permiten que esto se haga automáticamente y sin
detener el funcionamiento del RAID, aunque lógicamente el acceso a los datos será relativo,
pues éstos pueden estar en el disco dañado.
Otra gran ventaja de la tecnología RAID es la posibilidad de conectar un sistema de este tipo a
varios "hosts" simultáneamente, al existir la posibilidad de integrar en el sistema varias
controladoras SCSI.
Algunos sistemas RAID incorporan varios bancos de discos, denominados "ranks", lo que
permite simultanear varios niveles RAID (1 por cada banco), logrando optimizar las
prestaciones del sistema y adecuándolas al máximo en función de los tipos de datos que se
han de almacenar en cada banco.
La mayoría de los sistemas RAID incorporan memoria caché de lectura, lo que permite
incrementar hasta en 300 veces los tiempos de acceso.
Dispositivos y librerías ópticas:
El almacenamiento óptico ha evolucionado en los últimos años con la reducción de los tamaños
de las unidades y de sus precios. Sin embargo, su punto débil sigue siendo el tiempo medio de
acceso, que por lo general no es menor de 35 ms., comparado con los discos duros o sistemas
RAID, que llegan hasta los 6-7 ms.
Actualmente existen unidades magneto-ópticas de 3.5" de hasta 128 MB., y unidades de 5.25"
de 650 KB., 1 GB., 1.3 GB. y hasta 1.5 GB.
El mayor problema es la incompatibilidad existente entre algunos fabricantes e incluso entre
dispositivos ya que, por ejemplo, la mayoría de las unidades de 1 GB., no son capaces de leer
el formato más antiguo, de 650 KB. Esto ha sido superado con las unidades de 1.3 GB.
Hay unidades de tipo WORM (una sola escritura, múltiples lecturas), que poco a poco están
siendo reemplazadas, por las nuevas unidades magneto-ópticas que, al tener una capacidad
"multifunción", les permite trabajar con cartuchos tipo WORM.
La gran ventaja de estas unidades, frente a los discos duros, es el bajo coste por megabyte,
dado el precio de los cartuchos. Por ello, su uso óptimo es el de grandes librerías o archivos,
especialmente de bibliotecas de imágenes, archivo documental, etc.
Para ello se han diseñado las librerías o jukebox, con capacidades de almacenamiento desde
6,5 GB hasta 300 GB., en función del tipo de cartucho y del número de los mismos.
Estos dispositivos son verdaderos autómatas, que se encargan de seleccionar el cartucho
requerido e insertarlo en la unidad magneto-óptica, y retirarlo de la misma cuando se requiere
otro cartucho diferente.
Algunos incluso integran varias unidades magneto-ópticas, lo que permite reducir los tiempos
de acceso, ya que por lo general, el tiempo de cambio de un cartucho suele ser de menos de
10 segundos.
Para el acceso a la información de los jukebox, se crean sistemas de ficheros virtuales (VFS o
Virtual File System), por los cuales, el usuario accede al jukebox como si se tratase de un gran
disco duro, de capacidad igual a la de la suma de las capacidades de todos los cartuchos (dos
caras por cada uno) insertados en el propio jukebox.
Otra forma de uso de los jukebox se denomina HSM o "Hierarchical Storage Management
System", que podemos traducir como sistema de gestión de archivo automatizado, que
automáticamente gestiona el sistema de ficheros almacenados en discos duros, de modo que
los ficheros menos utilizados son almacenados en el jukebox, dejando el espacio libre para
otros ficheros que son requeridos con mayor frecuencia. Si los ficheros del jukebox son
requeridos de nuevo, vuelven a ser traspasados al disco duro.
Por último están apareciendo dispositivos tipo jukebox que integran una interfaz Ethernet en
lugar de SCSI, y un sistema de manejo de los ficheros tipo NFS, lo que permite su integración
en la red como si se tratara de un servidor de ficheros más, con las ventajas evidentes de evitar
el sofisticado software requerido para el manejo de los jukebox SCSI.
Ya existen también librerías de CD-ROM, y aunque su uso no esta muy extendido, podemos
esperar un gran desarrollo de este tipo de dispositivos, en un tiempo muy breve.
Por supuesto tampoco podemos olvidar los nuevos dispositivos "floptical", que permiten,
mediante la combinación de tecnologías ópticas y magnéticas, almacenar hasta 21 MB en
disquetes de 3.5", del formato que hasta ahora sólo había sido capaz de almacenar hasta 2.88
MB.
Unidades y librerías de cinta:
Evidentemente, los dispositivos por excelencia para el archivo de la información, y
especialmente para su conservación como medida de seguridad (copia de los datos existentes
en otros tipos de dispositivos), siguen siendo las unidades magnéticas o de cinta. La razón
fundamental, su precio, el menor de entre todos los dispositivos de almacenamiento actuales.
Desde los conocidos sistemas de bobina abierta como las unidades de 9 pistas (1/2") con
capacidades de hasta 220 MB., se ha evolucionado pasando por:
Unidades QIC (1/4"), tradicionales cartuchos con capacidades desde 60 MB hasta 4 GB. y
velocidades de transferencia de hasta 5 Megabytes por segundo.
Unidades DAT de 4 mm., con capacidades de hasta 16 GB. y velocidad de transferencia de
hasta 1,5 MB/seg., preparadas para realizar a gran velocidad la búsqueda de los datos.
Unidades de cinta de 8 mm., de hasta 25 GB., y velocidad de transferencia de hasta 500
Kbytes por segundo.
Pero donde se ha producido una mayor evolución, al igual que en el caso de los dispositivos
magneto-ópticos, ha sido en los jukebox de cintas, también denominados librerías de cintas o
"stackers".
Existen librerías de cintas de 4 y 8 mm., cuyo funcionamiento es sumamente parecido, con
capacidades de 8, 16, 32 y hasta 40 cintas, llegando, en algunos casos, a cientos de cintas.
Se trata de sofisticadas robóticas, de grandes prestaciones, que incorporan incluso varios
canales SCSI para el acceso simultáneo de varios hosts, que suelen utilizarse con sistemas
HSM, para el archivo y migración automatizada de ficheros.
Con estos mecanismos, se logran capacidades de almacenamiento y backup de hasta 4 o 5
Terabytes.
Algunos de estos dispositivos permiten incluso realizar duplicados automáticos de cintas, sin
necesidad de transferir los datos al host.
Los sistemas de almacenamiento: una tecnología en constante cambio
La tecnología de almacenamiento actual engloba todo tipo de soportes. Tenemos, por ejemplo,
sistemas WORM, bibliotecas de cintas y bibliotecas virtuales. En los últimos años, los sistemas
SAN y NAS han demostrado su excelente fiabilidad. Veamos en qué se diferencian estos dos
sistemas:
Las unidades SAN (Storage Area Network) pueden ser armarios enormes; algunos
pueden tener 240 discos duros. Estos grandes sistemas con más de 50 terabytes de
capacidad hacen más que sólo activar cientos de discos duros. Son almacenes de
datos de una potencia increíble que emplean utilidades de software muy versátiles para
gestionar múltiples arrays, soportar diversas configuraciones de arquitectura de
almacenamiento y proporcionar una monitorización constante del sistema.
Las unidades NAS (Network Attached Storage) son unidades independientes que
cuentan con sistemas operativos y de archivos propios y gestionan los discos duros
que llevan conectados. Son unidades de diversa capacidad para ajustarse a las
necesidades de cada propietario y funcionan como servidores de archivos.
Desde hace bastante tiempo, el almacenamiento a gran escala no ha estado al alcance de la
pequeña empresa. Los sistemas de discos duros SAN Serial ATA (SATA) se están convirtiendo
en una manera rentable de disfrutar de gran capacidad de almacenamiento. Estas unidades
array también se están incorporando a los sistemas de copia de seguridad en cintas virtuales,
es decir, en arrays RAID que se presentan como máquinas de cintas, eliminando
completamente los soportes en cinta.
Otras tecnologías de almacenamiento, como iSCSI, DAS (Direct Attached Storage), Near-Line
Storage (datos adjuntos en soportes extraíbles) y CAS (Content Attached Storage), también
proporcionan disponibilidad. Los arquitectos del almacenamiento saben que una copia de
seguridad no basta. En los entornos actuales altamente informatizados, las copias de seguridad
acumulativas diarias o semanales completas pueden quedar obsoletas en cuestión de horas o
incluso minutos después de ser creadas. En entornos de grandes almacenes de datos, ni
siquiera se tiene en cuenta hacer copias de seguridad de datos en continuo cambio. La única
salida para estos enormes sistemas es contar con sistemas espejo de almacenamiento:
servidores literalmente idénticos con exactamente la misma capacidad.
¿Cómo decidir qué sistema es el indicado?
Es necesario realizar un análisis detallado del entorno operativo. Muchos, tanto usuarios como
administradores, le dirán que el mejor entorno es el que no se estropea. La cruda realidad es
que, pese a la aplicación de planes y políticas de reducción de riesgos, cada día suceden
desastres y se pierden datos.
Al estudiar sus necesidades de almacenamiento y las de sus clientes, hágase estas preguntas:
¿Cuánto se tarda en recuperar los datos?
¿Cuál es máximo de tiempo que su cliente puede esperar hasta volver a acceder a sus
datos? Dicho de otro modo, ¿cuánto puede aguantar su cliente sin sus datos? Ello le
ayudará a fijar los requisitos de rendimiento del equipo.
Calidad de los datos recuperados.
¿Es necesario restaurar los datos originales o basta con disponer de datos antiguos de
copias de seguridad? Aquí interviene el programa de copia de seguridad empleado. Si
los datos de su sistema de almacenamiento o del de su cliente cambian con frecuencia,
los datos originales son los más valiosos.
¿Cuántos datos archiva usted o su cliente?
Restaurar grandes cantidades de datos a través de una red puede tardar bastante
tiempo. En configuraciones DAS (Direct Attached Storage), el tiempo de restauración
dependerá del equipo y del rendimiento de E/S del hardware.
Programas exclusivos de protección de datos
Los fabricantes de sistemas de almacenaje buscan maneras exclusivas de procesar grandes
cantidades de datos y proporcionar al mismo tiempo redundancia en casos de desastre.
Algunas grandes unidades SAN incorporan una complicada organización en bloques, creando
en esencia un sistema de archivos de bajo nivel desde la perspectiva RAID. Otras unidades
SAN incorporan un registro interno de transacciones en bloques, de modo que el procesador de
control de la SAN pueda rastrear en ellas y escribir en cada disco por separado. Con este
registro de transacciones, la unidad SAN puede recuperarse en caso de caídas de tensión o
paradas inesperadas
Algunos científicos informáticos especializados en sistemas de almacenamiento proponen
añadir inteligencia a la controladora del array RAID para hacerla consciente de los sistemas de
archivos. Esta tecnología proporcionaría mayor capacidad de recuperación en casos de
desastre, teniendo por meta la consecución de arrays de almacenamiento que se "curan" solos.
Contar con una reserva heterogénea de almacenamiento de información a donde pueden
acceder numerosos ordenadores sin depender de un sistema de archivos de un tipo específico
sería otra idea por el estilo. En organizaciones donde existen diversas plataformas de hardware
y sistemas, un sistema de archivos transparente proporcionaría acceso a los datos
independientemente del sistema empleado para escribirlos.
Otros científicos informáticos abordan la cuestión de la redundancia de los arrays de
almacenamiento con un enfoque muy distinto. Pese a que el concepto RAID se aplica a un
número enorme de sistemas, los científicos e ingenieros informáticos buscan nuevas maneras
de proteger los datos cuando los sistemas fallan. Los objetivos que impulsan el desarrollo de
este tipo de RAID son la redundancia y la protección de los datos sin sacrificar el rendimiento.
Cómo evitar las averías de los sistemas de almacenamiento
Existen muchas maneras de reducir o eliminar el impacto de las averías de los sistemas de
almacenamiento. Tal vez no pueda evitar que suceda un desastre, pero sí puede minimizar los
problemas en el servicio a sus clientes.
Se puede agregar redundancia a los sistemas de almacenamiento primarios de muchas
maneras. Algunas de ellas pueden ser bastante costosas y estar sólo al alcance de las grandes
empresas. Una de estas opciones es contar con sistemas de almacenamiento duplicados o
servidores idénticos, también conocidos como mirrors o espejos. Además, los elaborados
procesos de copia de seguridad o "instantáneas" de sistemas de archivos que siempre cuentan
con un punto de referencia sobre el que restaurar proporcionan otro nivel de protección de
datos.
La experiencia demuestra que cuando ocurre un desastre con los datos de una organización, a
menudo convergen o se desencadenan varios fallos. Por eso, confiar en un solo protocolo de
restauración es un enfoque corto de miras. Para organizar el almacenamiento con éxito es
necesario contar con varios niveles y opciones de restauración.
A la hora de intentar recuperar un sistema, algunas decisiones pueden corromper los datos
para siempre. He aquí algunas normas de mitigación de riesgos que los encargados de
administrar el almacenamiento pueden adoptar para minimizar la pérdida de datos cuando
sucede un desastre:
Poner un sistema de almacenamiento offline - No vuelva a poner un array o disco
online por la fuerza. Cuando una controladora desactiva un disco o array, lo hace por
un motivo claro. Obligar a un array a volver a ponerse online puede exponer el volumen
a una corrupción del sistema de archivos.
Reconstruir un disco estropeado - A la hora de reconstruir una unidad de disco
estropeada es importante dejar a la controladora que termine el proceso. Si durante el
proceso falla un segundo disco o se pone offline, déjelo y busque los servicios de un
profesional en recuperación de datos. Si durante una reconstrucción se sustituye un
segundo disco estropeado cambiarán los datos de las demás unidades de disco.
Arquitectura del sistema de almacenamiento - Planifique con detalle la configuración
del sistema de almacenamiento. Hemos visto muchos casos de múltiples
configuraciones en un solo array de almacenamiento. Por ejemplo, tres arrays RAID 5
(con seis discos cada uno) se fraccionan a una configuración RAID 0 y posteriormente
se vinculan. Adopte una configuración sencilla de su sistema de almacenamiento y
documente cada aspecto del mismo.
Durante un corte de luz - Si el problema escala hasta el punto de ser necesaria
asistencia técnica del OEM, pregunte siempre si la integridad de los datos corre peligro
o si los datos van a quedar afectados de alguna manera. Si el técnico le dice puede
haber riesgos para los datos, déjelo y busque los servicios de un profesional en
recuperación de datos.
Líderes en recuperaciones de sistemas de almacenamiento
Una recuperación de un volumen de datos que implementa una configuración RAID empieza
con un técnico superior evaluando cada disco y analizando las estructuras de datos para
determinar el mejor método de realizar la recuperación. No existe una configuración estándar
de estos sistemas; cada OEM implementa sus RAID con distintas configuraciones, por lo que
cada trabajo es único y desafiante. El paso final es verificar si el sistema de archivos señala los
datos correctamente, validando la información y los datos que contiene.
Estos tipos de recuperación son tremendamente desafiantes. Ver cómo se recupera uno de
estos sistemas después de varias horas de esfuerzo es algo alucinante. Muchas veces con
estas recuperaciones se consigue restaurar y guardar archivos originales sin que el cliente
deba manipular software o hardware.
El sector de los sistemas de almacenamiento desarrolla constantemente nuevas tecnologías
para descubrir mejores maneras de conservar los datos y mantener la continuidad de las
empresas.
top related