disco duro y sistema raid

DISCO DURO

1. HISTORIA

El primer disco duro lo inventó la

compañía IBM a principios de 1956 por

encargo de las Fuerzas Aéreas de

Estados Unidos. Se le llamó RAMAC

(Método de acceso aleatorio de

contabilidad y control) 305, estaba

compuesto por un grupo de 50 discos de

aluminio, cada uno de 61 cm de diámetro,

que giraban a 3.600 revoluciones por minuto y que estaban recubiertos de una

fina capa magnética. Podía almacenar hasta 5 millones de caracteres (5

megabytes), Más grande que un frigorífico actual, este disco duro trabajaba

todavía con válvulas de vacío y requería una consola separada para su manejo.

La tecnología inicial aplicada a los discos duros era relativamente simple.

Consistía en recubrir con material magnético un disco de metal que era

formateado en pistas concéntricas, que luego eran divididas en sectores. El

cabezal magnético codificaba información al magnetizar diminutas secciones del

disco duro, empleando un código binario de «ceros» y «unos». Los bits o dígitos

binarios así grabados pueden permanecer intactos durante años. Originalmente,

cada bit tenía una disposición horizontal en la superficie magnética del disco,

pero luego se descubrió cómo registrar la información de una manera más

compacta.

En 1962, IBM introdujo un nuevo modelo, el 1301, con una capacidad de 28 MB

y una velocidad de transferencia y una densidad de área 10 veces mayor que el

RAMAC 305. La distancia entre los cabezales y la superficie del disco había

descendido desde 20,32 µm a 6,35 µm.

A partir del año 1962, muchos fabricantes comenzaron a vender discos duros

como el 1301.

En 1965, IBM lanzó el modelo 2310, cuya notable característica era ser un

elemento de almacenamiento desmontable (el primer disco flexible).

El 2314, lanzado en 1966, tenía cabezales de lectura de ferrita (óxido de hierro).

https://es.wikipedia.org/wiki/V%C3%A1lvula_termoi%C3%B3nica

Universidad nacional de Trujillo Sede Valle Jequetepeque

1

En 1973, IBM lanzó el Winchester 3340, un disco duro cuyo cabezal de lectura

estaba separado de la superficie a través de una fina capa de aire de tan sólo

0,43 µm de espesor. Mejoró su capacidad en comparación con aquella del

RAMAC, como también su tamaño y peso, lo cual hizo que este disco se

convirtiera el nuevo estándar de los dispositivos de almacenamiento de acceso

directo. Al disco duro de 30 MB de capacidad se le dio el apodo de 30-30, y así

se convirtió en el "Winchester" (como el famoso rifle 30-30).

El primer disco duro de 5,25", desarrollado por la compañía Seagate, se lanzó

en 1980.

2. Definición:

Llamado también disco fijo, disco rígido o unidad de disco duro (en inglés

hard disk, hard drive o hard disk drive abreviado con frecuencia HD o HDD).

Su función es almacenar información de forma permanente en un equipo

informático. Aquí se guarda el sistema operativo (Windows) y todas las

aplicaciones (office, corel, photoshop, etc.) necesarias para que trabaje la

computadora; y también, la información procesada por la computadora

(documentos, gráficos, correos, etc).

3. Tipos

Se clasifican según su interfaz:

3.1. IDE (Integrated Device Electronics) / PATA (Parallel Advanced

Technology Attachment)

Se divide en dos, uno llamado máster y otro llamado esclavo que

posee un solo controlador que conecta al bus ISA. Controlan los

dispositivos de almacenamiento masivo de datos, como los discos

duros. Son planos, anchos y alargados.

Para conectarlos, se utilizan un 40 o 80% del cable de alambre de la

cinta que se conecta a la placa base del interior del PC. A medida que

la tecnología PATA se implementó, se transfiere información y datos

con más velocidad.


2

3.2. SATA (Serial ATA) (Serial Advance Technology Attachment

Drive)

Utiliza un bus de serie para la transmisión de datos. Más rápidos y

eficientes que los IDE. En comparación con un disco PATA, las

conexiones en los SATA son totalmente diferentes. Eso va para la

conexión de datos, así como el conector de alimentación de energía;

además que físicamente es mucho más pequeño y cómodo que

permite la conexión en caliente. Además, utilizan menos energía

también, que es un requisito importante para la mayoría de los

ordenadores y sistemas operativos modernos.

3.4. SCSI (Small Computer System Interface)

Son interfaces preparadas para discos duros de gran capacidad de

almacenamiento y velocidad de rotación.

Es muy común encontrar un disco duro SCSI en un servidor en lugar

de una PC de escritorio. Sus mayores velocidades de datos y

capacidades de corrección de errores los hacen perfectos para usar

como parte de un conjunto de discos. Aunque el tipo SCSI se

considera más fiable, pero también tienden a desgastarse más rápido

debido a la alta velocidad que los discos giran.

Este tipo de discos duros de gran capacidad de almacenamiento

pueden trabajar asíncronamente con respecto al microprocesador, lo

cual los hace veloces.

3.5. SSD (Solid State Drives)

El SSD se deshace del almacenamiento magnético para darnos un

almacenamiento sólido, sin partes movibles. Los SSD y nuestra típica

memoria USB comparten muchas similitudes, pues los chips de

almacenamiento que utilizan son los mismos o muy similares: la

diferencia está en la forma del disco (2.5” o 3.5” para poder ser

utilizados en dispositivos portátiles), y en la capacidad.


3

3.6. SAS (Serial Attached SCSI Drive)

Interfaz de transferencia de datos en serie, sucesor del SCSI paralelo,

aunque sigue utilizando comandos SCSI para interaccionar con los

dispositivos SAS. La principal diferencia con su predecesor es que

utiliza transferencia serial de datos, aumentado la velocidad a 1,5 - 3

o 6 Gbps. y permite la conexión y desconexión en caliente.

Una de las principales características es que aumenta la velocidad de

transferencia al aumentar el número de dispositivos conectados, es

decir, puede gestionar una tasa de transferencia constante para cada

dispositivo conectado, además de terminar con la limitación de 16

dispositivos existente en SCSI, es por ello que se vaticina que la

tecnología SAS irá reemplazando a su predecesora SCSI.

Por último, el conector es el mismo que en la interfaz SATA y permite

utilizar estos discos duros, para aplicaciones con menos necesidad de

velocidad, ahorrando costes. Por lo tanto, las unidades SATA pueden

ser utilizadas por controladoras SAS pero no a la inversa, una

controladora SATA no reconoce discos SAS. Los SAS son

especialmente utilizados en servidores que necesitan gran

rendimiento.

4. Factores de Forma

El más temprano "factor de forma" de los discos duros, heredó sus

dimensiones de las disqueteras. Pueden ser montados en los mismos chasis

y así los discos duros con factor de forma, pasaron a llamarse coloquialmente

tipos FDD "floppy-disk drives" (en inglés).

La compatibilidad del "factor de forma" continua siendo de 3½ pulgadas (8,89

cm) incluso después de haber sacado otros tipos de disquetes con unas

dimensiones más pequeñas.

4.1. Disco 8”: 241,3×117,5×362 mm (9,5×4,624×14,25 pulgadas)

En 1979, Shugart Associates sacó el primer factor de forma compatible

con los disco duros, SA1000, teniendo las mismas dimensiones y

siendo compatible con la interfaz de 8 pulgadas de las disqueteras.


4

Había dos versiones disponibles, la de la misma altura y la de la mitad

(58,7mm).

4.2. Disco 5,25” o 5 ¼”: 146,1×41,4×203 mm (5,75×1,63×8 pulgadas)

Se introdujo en 1976 con las primeras disqueteras. En 1980 salió el

primero disco duro de 5 ¼” (modelo ST-506 de Seagate Technologies)

de 5 MB de capacidad. Éste es dos veces tan alto como el factor de 8

pulgadas, que comúnmente se usa hoy; por ejemplo: 41,4 mm (1,64

pulgadas).

4.3. Disco de 3 ½” o 3,5”: 101,6×25,4×146 mm (4×1×5.75 pulgadas):

Sony los introdujo en 1981 en las disqueteras. Estos discos fueron

incorporados en sus equipos por grandes compañías como IBM, Apple

y HP, lo que le dio popularidad y se convirtió en el nuevo estándar.

Este factor de forma es el primero usado por los discos duros de

Rodine que tienen el mismo tamaño que las disqueteras de 3½, 41,4

mm de altura. Hoy ha sido en gran parte remplazado por la línea "slim"

de 25,4mm (1 pulgada), o "low-profile" que es usado en la mayoría de

los discos duros.

4.4. Disco de 2 ½” o 2,5”: 69,85×9,5-15×100 mm (2,75×0,374-

0,59×3,945 pulgadas)

Este factor de forma se introdujo por PrairieTek en 1988 y no se

corresponde con el tamaño de las lectoras de disquete. Este es

frecuentemente usado por los discos duros de los equipos móviles

(portátiles, reproductores de música, etc...) y en 2008 fue reemplazado

por unidades de 3,5 pulgadas de la clase multiplataforma. Hoy en día

la dominante de este factor de forma son las unidades para portátiles

de 9,5 mm, pero las unidades de mayor capacidad tienen una altura

de 12,5 mm.


5

4.5. Disco de 1.8” 54×8×71 mm

Fue introducido por Integral Peripherals en 1991, pero tuvo problemas

de aceptación. Algunas compañías siguen fabricando estos discos que

pueden alcanzar los 60 GB.

Este factor de forma se introdujo por Integral Peripherals en 1993 y se

involucró con ATA-7 LIF con las dimensiones indicadas y su uso se

incrementa en reproductores de audio digital y su subnotebook. La

variante original posee de 2GB a 5GB y cabe en una ranura de

expansión de tarjeta de ordenador personal. Son usados normalmente

en iPods y discos duros basados en MP3.

4.6. Disco de 1”: 42,8×5×36,4 mm

Durante 1998 IMB introdujo los discos de 1” llamados MicroDrive. Las

versiones actuales del MicroDrive alcanzan los 4 GB. En 2004 Toshiba

introdujo el disco más pequeño hasta ahora, de 0.85”. No está

diseñado para PCs.

Este factor de forma se introdujo en 1999 por IBM y Microdrive, apto

para los slots tipo 2 de compact flash, Samsung llama al mismo factor

como 1,3 pulgadas.

4.7. 0,85”: 24×5×32 mm

Toshiba anunció este factor de forma el 8 de enero de 2004 para

usarse en móviles y aplicaciones similares, incluyendo SD/MMC slot

compatible con disco duro optimizado para vídeo y almacenamiento

para micromóviles de 4G. Toshiba actualmente vende versiones de

4GB (MK4001MTD) y 8GB (MK8003MTD) 5 [3] y tienen el Record

Guinness del disco duro más pequeño.


6

5. características técnicas

5.1. Capacidad

En el mercado actual encontramos discos con capacidades desde 80

GB hasta 700 GB. En discos externos ya se ha alcanzado la barrera

de los 1000 GB (1 terabyte).

5.2. Velocidad de rotación de los discos

Es la velocidad, en revoluciones por minuto (RPM), a la que giran los

discos internos. Cuanto mayor es la a velocidad, a mayor velocidad se

escriben o leen los datos en el disco. Actualmente, la velocidad

estándar es de 7.200 RPM y en la gama alta empiezan a salir los de

15.000 RPM.

5.3. Tiempo de acceso o de búsqueda

El tiempo de búsqueda es el tiempo que demora la cabeza lectora en

llegar a los datos. Se mide el milisegundo (ms), y cuanto menor sea,

más rápido será el disco.

Actualmente, el tiempo medio de acceso toma valores entre 12 y 8 ms

en los discos ID y de 5 a 8 ms en los discos SCSI.

5.4. Tamaño del buffer interno

Todos los discos duros incluyen una memoria <<buffer>> o

<<caché>> que optimiza la transferencia de datos entre un medio

<<lento>> (los discos y las cabezas) y un medios <<rápido>> (la

interface electrónica o controladora de disco). Normalmente es una

memoria SDRAM que puede variar entre 2 MB y 8 MB.

5.5. Velocidad de transferencia de datos

Es la velocidad a la que puede transferir la información a la

computadora una vez la aguja está situada en la pista y sector

correctos. La tasa de transferencia de datos se refiere a la

transferencia entre la controladora de disco (IDE) y el buffer del disco,


7

y no a la tasa real de lectura o escritura de datos que depende de la

velocidad entre el buffer y las cabezas de lectura/escritura.

Tabla 1: Transferencia de datos de un disco duro según la interfaz

Interface

Tasa de transferencia

Máxima

Conectores

Modo DMA 16/6 MB/s 40 pines / 40 hilos

Ultra DMA/33 o

Ultra ATA 33

33 MB/s 40 pines / 40 hilos

Ultra DMA/66

Ultra ATA 66


Ultra DMA/ 100

Ultra ATA100


Ultra DMA/66

Ultra ATA 133

133 MB/s 40 pines /80 hilos

Para los discos ATA/66/100/133, se utiliza un cable especial de 80

hilos, pero los conectores siguen teniendo 40 agujeros. La necesidad

de cambiar el tipo de cable es consecuencia directa de las altas

velocidad que deseen alcanzarse, algo para lo cual los cables IDE

normales no están pensados. Sobre el aspecto de la compatibilidad

<<hacia atrás >>, los discos duros ATA/66/100/133 son 100%

problemas en modo ATA/33, solo que no podrán superar los 33,3

MB/s.

5.6. Dimensiones y peso

Las dimensiones estándar son de 3 ½” (8.89 centímetros) de ancho x

1” (2.54 centímetros) de alto en promedio. El largo generalmente no

importa, pero es importante que las dimensiones concuerden con las

de case. El peso depende del fabricante y oscila entre 450 a 600

gramos.


8

5.7. Marcas

Hay una gran variedad de marcas como: Quantum, Samsung, IBM,

Western Digital, Fujitsu, Seagate, Maxtor, Conner, JTS.

5.8. Latencia

Una vez que el actuador a desplazado las cabezas hasta el cilindro

adecuado, la unidad tiene que esperar hasta que el sector deseado

pase bajo la cabeza. La latencia es el tiempo(en milisegundos)

necesarios para que gire el disco y el sector alcance la posición

correcta. Cuanto mayor sea la velocidad de los discos, menor sera la

latencia.

Por ejemplo: un disco duro que gira a 7200 RPM tendría una latencia

mas desfavorable de 8.3 ms (60/7200 = 0.0083) y una latencia media

de 4.2 ms (la mitad del valor anterior.

5.9. Caché de pista

Es una memoria tipo Flash dentro del disco duro.

5.10. Interfaz

Medio de comunicación entre el disco duro y la computadora. Puede

ser IDE/ATA, SCSI, SATA, USB, Firewire, Serial Attached SCSI

5.11. Landz

Zona sobre las que aparcan las cabezas una vez se apaga la

computadora


9

6. Estructura de un disco duro

Los discos duros están compuestos de una estructura física y de una

estructura lógica:

6.1. Estructura física:

a. Platos

Están elaborados de compuestos de vidrio, cerámica o aluminio,

pulidos y revestidos por ambos lados con una capa muy delgada

de una aleación metálica. Los discos están unidos a un eje y un

motor que los hace guiar a una velocidad constante entre las 3600

y 7200 RPM.

Convencionalmente los discos duros están compuestos por varios

platos, es decir varios discos de material magnético montados

sobre un eje central. Estos discos normalmente tienen dos caras

que pueden usarse para el almacenamiento de datos, y para

almacenar información de control. Actualmente los discos duros

son de 3 ½”.

b. Tarjeta Lógica

Es la tarjeta ubicada sobre los platos que contienen la electrónica

que controla al eje de la unidad y a los sistemas del actuador de la

cabeza. En los discos duros IDE, la tarjeta lógica incluye al

controlador del mismo, mientras que los discos SCSI la tarjeta

incluye el controlador y el circuito adaptador del bus.

La mayoría de fallas ocurren en la tarjeta lógica por lo que es

posible repara un disco duro reemplazando su tarjeta lógica. En

todo caso, se puede recuperar los datos de un disco duro que tiene

la tarjeta lógica malograda, con el reemplazo momentáneo de esta.


10

c. Cabeza de Lectura/Escritura

Es la parte de la unidad de disco que escribe y lee los datos del

disco. Su funcionamiento consiste en una bobina de hilo que se

acciona según el campo magnético que detecte sobre el soporte

magnético, produciendo una pequeña corriente que es detectado y

amplificado por la electrónica de la unidad de disco.

Generalmente los discos duros tienen una cabeza de

lectura/escritura para la superficie de cada plato, lo que significa

que a cada plato tiene dos cabezas, una para la cara superior y

otra para la car inferior.

Cada cabeza se conecta en un solo mecanismo móvil (un brazo

actuador), por lo cual todas las cabezas se mueven en conjunto a

través de los platos.

d. Eje o motor del disco duro:

Es la parte del disco duro que actúa como soporte, sobre el cual

están montados y giran los platos del disco.

Tradicionalmente los motores han usado rodamiento con bolitas en

su diseño. Pero debido al aumento de la densidad de los discos

éstas se están quedando obsoletas.

Existe un nuevo modelo de rodamiento llamado “fluido dinámico”

que usa un líquido lubricante muy viscoso para el contacto entre la

bobina y los demás componentes.

e. Actuador

Es el mecanismo que mueve las cabezas de lectura/escritura

radialmente a través de la superficie de los platos de la unidad de

disco y las coloca con total precisión del cilindro deseado.

Hay dos variantes de actuadores de cabeza:

Actuadores de motor de paso.

Actuadores de bobina de voz.


11

f. Controladora

Manda más corriente a través del electro magneto para mover las

cabezas cerca del borde del disco. En caso de una pérdida de

poder, un resorte mueve la cabeza nuevamente hacia el centro del

disco sobre una zona donde no se guardan datos.


12

6.2. Estructura lógica:

a. Master boot record (mbr)

Es conocido también como registro de arranque. Es el primer sector

("sector cero") del disco duro. Es usado para almacenar una tabla

de particiones y, en ocasiones, se usa sólo para identificar un

dispositivo de disco individual.

b. Particiones

La partición del disco duro es absolutamente opcional. Cualquier

computador personal funcionará con normalidad aunque el disco

duro no sea particionado (aunque algunos sistemas operativos,

como Linux, requieren la partición, por lo cual la realizan por sí

mismos al ser instalados).

El principal inconveniente que presenta utilizar en el disco duro una

única partición (la unidad “C”), es que todos los procesos de

creación, modificación y sustitución de documentos, y la formación

y destrucción de archivos temporarios, se realiza en la misma

unidad en que se encuentran los programas permanentes; y por lo

tanto, toda la unidad se ve afectada por la fragmentación.

La fragmentación

Es un efecto que se produce en el espacio de grabación del disco

duro, por causa de la frecuente destrucción y borrado, o

regrabación con modificaciones, de los archivos que produce el

usuario. El sistema operativo recurre a ocupar los espacios

intersticiales dejados por los archivos borrados, para ubicar los

nuevos registros; aunque sea subdividiendo éstos en varios

tramos.

La ventaja principal de disponer de un disco duro particionado,

consiste en que facilita la clasificación del material de software

contenido en el computador y evitar que la fragmentación afecte

unidades de gran capacidad.


13

Existen dos tipos de particiones.

Partición Primaria. Es en la cual se instala el sistema

operativo, desde la cual permite arrancar el ordenador. Para

que el sistema la reconozca como primaria ésta debe estar

activada.

Partición Extendida. Es la partición en la cual se crean las

unidades lógicas y cada unidad es tratada como unidad

independiente, se pueden guardar todo tipo de ficheros, pero

el ordenador no la reconoce como arrancable.

c. Electrónica del disco duro:

También llamada Placa o PCB, es la parte del disco duro que se

encarga del manejo de los distintos tipos de componentes del disco

duro así como de verificar su funcionamiento. Es la parte

responsable de la comunicación con el ordenador, en ella se aloja

el bus, y la alimentación.

Esta placa es en sí, un pequeño ordenador compuesto por un

microprocesador, memoria RAM, el micro controladores que

manejan los periféricos, como el control de posición, giro del motor

y bus de comunicación. En otras palabras, posee el mapa de donde

está cada pista y sector del disco duro y le comunica al cabezal

donde tiene que leer o escribir exactamente.

d. Firmware del disco duro:

Es el componente del disco duro de software que configura el disco

duro, y contiene toda la información necesaria para poner el disco

en marcha, comunicarnos con él, protegerlo e identificarse.


14

7. Direccionamiento del disco duro

7.1. Concepto de direccionamiento

7.1.1. Cilindros:

Es el conjunto de varias pistas que están alineadas verticalmente

(una de cada cara). Se puede considerar al par de pistas en lados

opuestos del disco.

Si el HD contiene múltiples discos (sean n), un cilindro incluye

todos los pares de pistas directamente uno encima de otra (2n

pistas).

Los HD normalmente tienen una cabeza a cada lado del disco.

Dado que las cabezas de Lectura/Escritura están alineadas unas

con otras, la controladora puede escribir en todas las pistas del

cilindro sin mover el rotor. Como resultado los HD de múltiples

discos se desempeñan levemente más rápido que los HD de un

solo disco.

7.1.2. Pista

Track. Es la trayectoria circular en forma de anillo, trazada a través

de la superficie del plato de un disco por la cabeza lectura/escritura.

La pista puede manejar gran cantidad de datos por lo que es

necesario dividirla para ser más eficiente el almacenamiento de los

archivos pequeños.


15

Por esta razón, se han seccionado las pistas en una determinada

cantidad de sectores numerados que dependen del disco duro. Un

disco duro puede tener de 380 a 700 sectores por pista.

7.1.3. Sector

Es la unidad básica de almacenamiento de datos sobre discos

duros. Al formatear el disco duro se crean sectores con una

capacidad de 512 Bytes cada uno.

Los sectores se enumeran comenzando por el número uno, las

cabezas y cilindros empiezan a partir del 0.

Antiguamente el número de sectores por pista era fijo, lo cual

desaprovechaba el espacio significativamente, ya que en las pistas

exteriores pueden almacenarse más sectores que en las interiores.

Así, apareció la tecnología ZBR (grabación de bits por zonas) que

aumenta el número de sectores en las pistas exteriores, y usa más

eficientemente el disco duro.


16

7.1.4. Clauster

Es una agrupación de sectores, su tamaño depende de la

capacidad del disco.

7.2. Sistemas de direccionamiento

7.2.1. CHS CILINDRO CABEZA SECTOR

Fue el primer sistema de direccionamiento que se utilizó el cual

asigna una dirección la cual se forma con el número de cilindro,

cabezal y sector en el que se encuentra. Fue utilizado en las

primeras Unidades ATA pero tenían una limitación de 8GB.

7.2.2. LBA DIRECCIONAMIENTO LOGICO DE BLOQUES

Este sistema no se basa en una división del disco mediante

cilindros, cabezas y sectores, sino que a cada bloque (también

llamadas Unidad de asignación) se le asigna un número (n-1, n-

2…, donde n es el número total de bloques), y permite bloques de

512 Bytes y de 1024 Bytes. En este caso, la capacidad máxima de

un disco duro está limitada solo por dos factores, el número real de

bloques que pueda contener, que siempre van a tener el mismo

tamaño físico, y es un límite puramente físico que depende

exclusivamente del disco, y el número de bits que pueda utilizar

para comunicar el número del bloque, dependiendo en este caso

A- Track

B- Geometric Sector

C- Sector

D- Cluster


17

tanto del disco duro como de la placa base. LBA utiliza, en cuanto

a bits; dos tipos de extensiones:

- LBA de 26 bits, con una capacidad máxima de 128 GiB

- LBA de 48 bits,, que es el utilizado actualmente, con una

capacidad máxima de 144.11pebibytes (millones de Gibibytes)


18

SISTEMAS RAID

1. Definición

Las siglas RAID (Redundant Array of Independent -or Inexpensive- Disks,

conjunto redundante de discos independientes), hacen referencia a un

sistema de almacenamiento que utiliza un conjunto de discos duros

independientes organizados para que el sistema operativo los vea como

un solo disco lógico. Almacena los datos de forma redundante. Los RAID

suelen usarse en servidores y normalmente se implementan con unidades

de disco de la misma capacidad.

Los beneficios de RAID respecto a un único disco duro son: mayor

integridad en los datos, mayor tolerancia a fallos, mayor rendimiento y

mayor capacidad

Se mejora el rendimiento ya que permite a varias unidades trabajar en

paralelo. La fiabilidad se aumenta mediante dos técnicas: redundancia

que implica el almacenamiento de los mismos datos en más de una

unidad y la paridad de datos. Esta última consiste en un algoritmo

matemático que genera información de paridad, cuando se produce un

fallo en una unidad se leen los datos correctos que quedan y se comparan

con los datos de paridad almacenados. El uso de paridad es menos

costoso que la redundancia ya que no requiere la utilización de un

conjunto redundante de unidades de disco.

La tecnología RAID surge ante la necesidad que existe hoy en día de tener

un buen sistema de almacenamiento seguro y tolerante a fallos. Asegura

la integridad de los datos ante la avería de uno de los discos, asegurando

un funcionamiento continuo y permitiendo la substitución de una unidad

defectuosa sin necesidad de detener los procesos que se están

ejecutando.


19

2. RAID basados en Software

Algunas implementaciones

de sistemas RAID basados

solamente en Software

incluyen piezas de Hardware,

que hace que la

implementación se parezca a

u n sistema RAID hardware

tradicional. Sin embargo es importante entender que un RAID Software

utiliza potencia de cálculo de la CPU por lo que se tendrá que compartir

con el sistema operativo y todas las aplicaciones asociadas.

Un sistema RAID Software puede implementarse de varias formas:

- Sistema Software puro.

- Sistema hibrido.

A. Sistema Software puro

En este caso, la aplicación RAID es una aplicación ejecutándose

en el host sin ningún hardware adicional. Este tipo de RAID por

software utiliza unidades de disco duro que se adjuntan a la sistema

informático a través de una interfaz integrada de E / S o un

procesador de menos adaptador de bus de host (HBA). El RAID se

activa tan pronto como sea el sistema operativo se haya cargado

el software del controlador RAID. Tal soluciones de software RAID

puros a menudo vienen integrados en el sistema operativo del

servidor y por lo general son libres de costo adicional para el

usuario. Bajo costo es la principal ventaja de esta solución.

Ventajas

- Coste reducido: Si la funcionalidad RAID está construida

en el sistema operativo el coste es gratuito. El único

coste será el del resto de discos duros.


20

Desventajas

- Sin protección en el arranque (no puede manejar o

proteger los datos en de arranque): fallo de la unidad o

datos corruptos durante el arranque y antes de que el

software RAID se convertirse en clientes potenciales

activos a un sistema que no funciona.

- Aumento de la carga en el servidor: Sistema el

rendimiento se ve afectado por la aplicación de RAID. Los

más unidades involucradas y el más complejo es el RAID

sistema (por ejemplo, involucrando a la paridad en un

RAID 5), más impacto en el rendimiento general. Esta

solución es mejor adecuado para simples RAID 0, 1, 10

escenarios.

- Migración del sistema operativo: funcionalidad RAID

puede estar limitada al Sistema Operativo actual.

- Vulnerable a los virus: Debido a que el RAID está

funcionando como una aplicación en el sistema

informático, virus y otro software dañino podría afectar la

funcionalidad RAID.

- Problemas de integridad de datos debido a fallos del

sistema: Software o problemas de hardware en el servidor

pueden afectar los datos consistencia e integridad.

B. Sistema hibrido

Asistida por hardware RAID por software

Si bien esto es aún RAID por software, el hardware de asistencia

ayuda a superar algunas de las debilidades de RAID por software

puro. Tal soluciones por lo general vienen con hardware adicional

(por ejemplo, un HBA con un BIOS RAID o simplemente un BIOS

RAID integrado en el placa madre).

El BIOS adicional hace que el RAID funcionalidad disponible

cuando el sistema está encendido, proporcionando redundancia


21

durante el arranque que reduce el impacto de medio errores en

RAID que de otro modo podrían dar lugar a la corrupción de datos

o un sistema inoperable. Además, la mayoría de estas soluciones

proporcionar un software de configuración del BIOS que está

disponible en el arranque del sistema.

Esto permite una fácil instalación y mantenimiento de la matriz

RAID sin la necesidad de instalar o arrancar un sistema operativo

desde el disco duro o CD ROM. Además, el software RAID asistida

por hardware normalmente viene con una variedad de

controladores para el operativo más popular sistemas, y por lo

tanto, es más independiente del sistema operativo que pura

RAID por software.

Beneficios

- Costo moderado: Sólo un HBA (tarjeta plug-in) o un

memoria flash adicional para el BIOS abajo en el se

necesita placa base; También puede incluir un hardware

Acelerador XOR si el controlador soporta RAID 5.

- Protegido en el arranque: Ningún efecto negativo en la

disponibilidad de datos cuando la unidad de arranque

tiene errores medianas o no por completo.

Ventajas

- La carga adicional de rendimiento en el servidor.

Sistemas el rendimiento se ve afectado por la aplicación

de RAID. Los más unidades involucradas y el más

complejo es el RAID sistema (por ejemplo, involucrando a

la paridad en un RAID 5), más impacto en el rendimiento

general. Esta solución es mejor adecuado para simples

RAID 0, 1, 10 escenarios.

- Migración del sistema operativo Limited: funcionalidad

RAID sigue siendo dependiente del sistema operativo

como el conductor se ejecuta en la parte superior de el

sistema operativo. Sin embargo, varios controladores

para una variedad de sistemas operativos no permitir la


22

migración de la matriz para otros sistemas operativos.

Esto podría estar limitado por la disponibilidad de un

controlador RAID para muy nuevos sistemas operativos

(por ejemplo, las nuevas versiones de un sistema

operativo podrían necesitar un nuevos RAID controlador -

controladores RAID son más complejas que programas

controlador HBA normales, y por lo tanto, podría tomar

más tiempo para desarrollarlos)

- Vulnerable a los virus: Debido RAID está funcionando

como un aplicación en el sistema informático, virus y otras

software dañino podría afectar la funcionalidad RAID

- Problemas de integridad de datos debido a fallos del

sistema: Software o problemas de hardware en el servidor

pueden afectar los datos consistencia e integridad.

3. RAID basados en Hardware

Una solución de hardware RAID tiene su propio procesador y la memoria

de ejecutar la aplicación RAID. En esta implementación, el RAID del

sistema es un sistema de equipos pequeños independiente dedicada a la

aplicación de RAID, la descarga de esta tarea desde el sistema host

Hardware RAID se puede encontrar como una parte integral de la solución

(por ejemplo, integrado en la placa base) o como una tarjeta adicional. Si

el hardware necesario ya está integrado en la solución de sistema, luego

de hardware RAID podría llegar a ser una actualización de software para

un sistema existente. Así como el software RAID, RAID de hardware

podría no ser identificado como tal a primera vista.

La forma más sencilla de identificar si una solución es software o

RAID de hardware es leer las especificaciones técnicas. Si la solución

incluye un microprocesador (generalmente llamada de E / S del

procesador'), entonces es una solución de hardware RAID. Si no hay

procesador, es una solución de software RAID.

Esto es importante para su selección por el sistema impactos del software

RAID vs. RAID de hardware implementación. Estos impactos incluyen:


23

- Utilización de la CPU y el rendimiento cuando otras

aplicaciones están corriendo

- Escalabilidad de las unidades de disco que se pueden agregar

a un sistema

- Facilidad de recuperación después de una pérdida de datos

- Capacidad para datos avanzados de gestión / supervisión

- Capacidad de gestión de unidades de disco consistentemente

a través de diferentes sistemas operativos

- Posibilidad de añadir una opción de respaldo de batería que

permiten activar y escribir el almacenamiento en caché en el

controlador para mejorar la escritura y el rendimiento del

sistema

4. Ventajas del RAID

La tecnología RAID proporciona tolerancia a fallos, mejora el rendimiento

del sistema y aumenta la productividad.

Tolerancia a fallos: Un RAID protege contra la pérdida de datos y

proporciona recuperación de datos en tiempo real con acceso

interrumpido en caso de que falle un disco.

Mejora del Rendimiento/ Velocidad: Un RAID consta de dos o más

discos duros que ante el sistema principal funcionan como un único

dispositivo. Los datos se desglosan en fragmentos que se escriben en

varias unidades de forma simultánea. Este proceso, denominado

fraccionamiento de datos, incrementa notablemente la capacidad de

almacenamiento y ofrece mejoras significativas de rendimiento. RAID

permite a varias unidades trabajar en paralelo, lo que aumenta el

rendimiento del sistema.

Mayor Fiabilidad: Las soluciones RAID emplean dos técnicas para

aumentar la fiabilidad: la redundancia de datos y la información de

paridad. La redundancia implica el almacenamiento de los mismos


24

datos en más de una unidad. De esta forma, si falla una unidad, todos

los datos quedan disponibles en la otra unidad, de inmediato. Aunque

este planteamiento es muy eficaz, también es muy costoso, ya que

exige el uso de conjuntos de unidades duplicados. El segundo

planteamiento para la protección de los datos consiste en el uso de la

paridad de datos. EL RAID utiliza un algoritmo matemático para

generar información de paridad. Cuando se produce un fallo en una

unidad se leen los datos correctos que quedan y se comparan con los

datos de paridad almacenados por la matriz. El uso de la paridad para

obtener fiabilidad de los datos es menos costoso que la redundancia,

ya que no requiere el uso de un conjunto redundante de unidades de

disco.

Alta Disponibilidad: El RAID aumenta el tiempo de funcionamiento y

la disponibilidad del sistema. Para evitar los tiempos de inactividad,

debe ser posible acceder a los datos en cualquier momento. La

disponibilidad de los datos depende de dos aspectos: la integridad de

los datos y tolerancia a fallos. La integridad de los datos se refiere a

la capacidad para obtener los datos adecuados en cualquier

momento. La mayoría de las soluciones RAID ofrecen reparación

dinámica de sectores, que repara sobre la marcha los sectores

defectuosos debidos a errores de software. La tolerancia a fallos, el

segundo aspecto de la disponibilidad, es la capacidad para mantener

los datos disponibles en caso de que se produzcan uno o varios fallos

en el sistema.

5. Niveles de raid

Cada nivel RAID ofrece una combinación específica de tolerancia a fallos

(redundancia), rendimiento y coste, diseñadas para satisfacer las

diferentes necesidades de almacenamiento. La mayoría de los niveles

RAID pueden satisfacer solamente uno o dos de estos tres criterios.

Los niveles de RAID más usados son: RAID 0 (conjunto dividido), RAID1

(conjunto en espejo) y RAID5 (conjunto dividido con paridad distribuida).


25

4.1. Niveles RAID Puros o Estándar

4.1.1. RAID 0 (disk stripping)

Es el modo RAID más rápido. Se necesitan al menos 2

unidades, RAID 0

distribuye los datos en

cada disco. Las

capacidades

disponibles de cada

disco se añaden

juntas, de modo que

se monta un solo

volumen en el

ordenador.

Este nivel mejora el rendimiento, pero no aporta tolerancia

a fallos. En caso de avería en cualquiera de los

componentes de “array” el sistema fallará en su totalidad.

VENTAJAS DESVENTAJAS

Proporciona un alto rendimiento.

No tiene costo adicional.

Toda la capacidad del disco se

emplea.

No es verdaderamente un disco

RAID ya que no tiene integridad

de datos.

se dispone de información de

paridad y por tanto no ofrece

funcionalidad de tolerancia a

fallos.

Por el sistema de trabajo que

utiliza, el fallo de uno de los discos

significa la pérdida de todo el

sistema.

Tenemos un incremento en el

consumo del equipo.

Si bien es cierto que puede llegar a

aumentar algo el rendimiento de los

discos.


26

Procedimiento para cálculo de la

capacidad RAID 0

En un sistema RAID 0, todos los discos

deben tener la misma capacidad.

La capacidad de almacenamiento en una

configuración RAID de nivel 0 se calcula

multiplicando el número de unidades por la

capacidad del disco, o C = n*d, donde:

C=capacidad disponible

n = número de discos

d = capacidad de disco

Por ejemplo, en una matriz RAID 0 con

cuatro unidades de 1000 GB de capacidad

cada una, la capacidad total de la matriz

sería de 4000 GB: C = (4*1000)

4.1.2. RAID 1 (DISK MIRRORING)

Consiste en asociar a cada disco primario del RAID un

segundo disco ESPEJO, en el

que se duplica la información.

Si el disco primario falla el

espejo continúa trabajando.

Una vez sustituido el disco

averiado, los datos se

reconstruyen al 100%.

Para alcanzar un máximo

rendimiento se recomienda el

uso de controladoras de disco duplicadas, de esta forma

será posible leer de los dos discos al mismo tiempo

incrementando la tasa de transferencia de lectura al doble

de la generada por un disco individual sin alterar la ratio de

escritura.


27


Mayor rendimiento en las lecturas

de datos respecto a un disco

convencional.

Protección de la información en

caso de fallos del disco y/o de la

controladora (en caso de tener

instalada una controladora

duplicada).

Ineficiencia debido a las tareas de

escritura en el disco espejo. Se

“desperdicia” el 50% de la capacidad de

almacenamiento del sistema haciendo

que el coste por megabyte “útil” sea

mayor.

Procedimiento para el cálculo de la

capacidad de RAID 1

En un sistema RAID 1, todos los discos



configuración RAID de nivel 1 se calcula

multiplicando el número de unidades por la

capacidad del disco y dividiendo por 2, o

C = n*d/2 donde:

C = capacidad disponible



Por ejemplo, en una matriz RAID 1 con

cuatro unidades de 1000 GB de capacidad

cada una, la capacidad total de la matriz

sería de 2000 GB: C = (4*1000)/2


28

4.1.3. Raid 2

Este nivel no presenta

ninguna ventaja

relevante sobre RAID 3

y en la actualidad

resulta ser el único nivel

RAID de la

especificación original

que no se utiliza.

Funciona con “striping” de datos a nivel de bit en todos los

discos, dedicando algunos de estos a almacenar

información de verificación y corrección de errores (error

checking and correcting, ECC). Los discos son

sincronizados por la controladora para funcionar al unísono,

generando tasas de trasferencias extremadamente

altas.


Buena protección de la

información en caso de fallos del

disco. La tasa de transferencia

de datos puede llegar a ser

extremadamente alta.

Elevado coste. Según el tipo de

configuración requiere un gran número

de discos. La controladora resulta ser

muy específica, compleja y costosa.


29

4.1.4. Raid 3

Es un nivel raramente

utilizado.

Opera con “striping” de

datos a nivel byte y dedica

un disco del “array” para

almacenar la información

de paridad que permitirá reconstruir la información en caso

de fallos.

Toda la información se escribe en paralelo entre los discos

del “array” mejorando el rendimiento del sistema gracias al

incremento en la tasa de transferencia de datos que esta

funcionalidad conlleva. Una matriz RAID 3 tolera la avería

de un único disco sin pérdida de datos. Si un disco físico

falla, los datos del disco averiado pueden reconstruirse en

un disco de recambio.


Elevada tasa de transferencia de

datos tanto de lectura como de

escritura con alta disponibilidad

del “array”.

Un disco de paridad dedicado puede

convertirse en un cuello de botella

porque cada cambio en el grupo RAID

requiere un cambio en la información de

paridad. No ofrece solución al fallo

simultáneo de dos discos.


30

Raid 3 + spare:

En RAID 3+repuesto, un disco de la matriz se deja vacío.

Si un disco de la matriz falla, los datos del disco averiado se

reconstruyen automáticamente en el disco de "repuesto" vacío.

Procedimiento de cálculo de la capacidad RAID 3


configuración RAID de nivel 3 se calcula restando

uno al número de unidades y multiplicando por la

capacidad del disco, o C = (n-1)*d

donde:




Por ejemplo, en una matriz RAID 3 con cuatro

unidades de 1000 GB de capacidad cada una, la

capacidad total de la matriz sería de 3.000 GB:

C = (4-1)*1000.


31

4.1.5. Raid 4

Opera con “striping” de

datos a nivel bloque con

un disco de paridad

dedicado (similar a RAID 3

excepto que divide a nivel

de bloque en lugar de a

nivel de bytes). Ante el fallo de uno de los discos del “array”,

podremos, a partir de la información de paridad, reconstruir

en un disco de reserva los datos de la unidad averiada.

RAID 4 puede atender varias peticiones simultáneas de

lectura, siempre que la controladora lo soporte, y también de

escritura, pero en este último caso al residir toda la

Procedimiento de cálculo de la capacidad RAID

3+ Spare

En un sistema RAID 3+repuesto, todos los discos



configuración RAID 3+repuesto se calcula restando

dos al número de unidades y multiplicando por la


donde:




Por ejemplo, en una matriz RAID 3+repuesto con

cuatro unidades de 1000 GB de capacidad cada

una, la capacidad total de la matriz sería de 2000

GB: C = (4-2)*1000.


32

información de paridad en un único disco, éste se convertiría

en un cuello de botella para el sistema.


Alta disponibilidad del

“array” con elevada tasa

de transferencia de datos.

La controladora requerida es compleja y

por tanto costa. Un disco de paridad

dedicado puede convertirse en un cuello

de botella en escritura.

4.1.5. Raid 5

Por su bajo coste RAID 5

es una de las

implementaciones más

populares. Utiliza

“striping” de datos a nivel

de bloque distribuyendo la

información de paridad entre todos los discos que conforman

el “array”. Esta combinación proporciona un excelente

rendimiento y buena tolerancia a fallos.

La diferencia entre RAID 3 y un RAID 5 es que una

configuración RAID 3 ofrecerá mejor rendimiento a

expensas de una capacidad total ligeramente menor. Los

datos se distribuyen en bandas entre todos los discos y en

cada banda se escribe un bloqueo de paridad (P) para cada

bloque de datos. Si un disco físico falla, los datos del disco

averiado pueden reconstruirse en un disco de recambio. Los

datos no se pierden en caso de avería de un solo disco, pero

si falla un segundo disco antes de que se reconstruyan los

datos en una unidad de repuesto, se perderán todos los

datos de la matriz.


33


Proporciona un buen rendimiento

con mínima pérdida de capacidad

de almacenamiento. Aporta un nivel

de redundancia suficiente para ser

considerado tolerante a fallos.

Menores prestaciones que en RAID

No ofrece solución al fallo simultáneo

en dos discos.

Cuando las aplicaciones requieren

muchas escrituras de tamaño inferior

a la división de datos establecida

(stripe), el rendimiento ofrecido por

RAID 5 no es el óptimo.

Procedimiento de cálculo de la capacidad RAID 5

En un sistema RAID 5, todos los discos deben tener

la misma capacidad.


configuración RAID de nivel 5 se calcula restando

uno al número de unidades y multiplicando por la


donde:

C = capacidad disponible n = número

de discos


Por ejemplo, en una matriz RAID 5 con cuatro

unidades de 1000 GB de capacidad cada una, la

capacidad total de la matriz sería de 3.000 GB:C = (4-

1)*1000.


34

RAID 5 + Spare

RAID 5+repuesto, es una matriz RAID 5 en la que uno de los discos

se usa como repuesto para reconstruir el sistema en cuanto falle un

disco. Técnicamente un disco de reserva no forma parte del “array”

hasta que uno de los discos falla y se reconstruye la información sobre

él. Se necesitan al menos cuatro discos.

Si un disco físico falla, los datos permanecen disponibles porque se

leen desde los bloques de paridad. Los datos del disco averiado se

reconstruyen en el disco de repuesto de emergencia. Al reemplazar

un disco averiado, éste se convierte en el nuevo disco de repuesto de

emergencia. Los datos no se pierden en caso de avería de un solo

disco, pero si falla un segundo disco antes de que el sistema pueda

reconstruir los datos en la unidad de repuesto, se perderán todos los

datos de la matriz.

Procedimiento de cálculo de la capacidad RAID

5+repuesto

En un sistema RAID 5+repuesto, todos los discos



configuración RAID 5+repuesto se calcula restando

dos al número de unidades y multiplicando por la

capacidad del disco, o C = (n-2)*d donde:




Por ejemplo, en una matriz RAID 5+repuesto con

cuatro unidades de 1000 GB de capacidad cada una,

la capacidad total de la matriz sería de 2000 GB: C =

(4-2)*1000


35

4.1.6. Raid 6

Dado su coste, existen

pocas

implementaciones

comerciales. Funciona

con “striping” de datos

a nivel de bloque con

doble paridad distribuida entre todos los discos y en una

posición diferente para cada división (stripe), proporcionando

protección ante fallos tanto por averías en discos como en la

reconstrucción de discos.

Si un disco físico falla, los datos del disco averiado pueden

reconstruirse en un disco de recambio. Este modo RAID puede

soportar hasta dos averías de disco sin pérdida de datos.

RAID 6 proporciona una reconstrucción más rápida

de los datos de un disco averiado.


Utiliza el equivalente a dos unidades

de disco para funciones de paridad

por lo que el coste por megabyte

“útil” es mayor. Mayor coste que

otros niveles RAID.

Tolerancia a fallos extremadamente

alta. Permite el fallo de hasta dos

discos.


36

4.1.7. RAID 53:

RAID 53 es una

implementación de un

arreglo en bandas

(RAID Nivel 0) cuyos

segmentos están en

arreglos de RAID 3.

Este tipo ofrece un conjunto de bandas en el cual cada banda

es un conjunto de discos RAID-3. Esto propor ciona mejor

rendimiento que el RAID-3, pero a un costo mucho mayor.


Alto costo de implementación.

Todos los spindles de los discos deben de

estar sincronizados, lo que limita la

selección de platinas de disco.

La generación de bandas en bytes resulta

en una utilización pobre de la capacidad

formateada.

Misma tolerancia a fallas que RAID 3, así

como la sobrecarga.

Alta tasa de transferencia de datos, gracias a

sus segmentos RAID 3.

Altos niveles de Entrada/Salida para

solicitudes pequeñas, gracias a las bandas

en RAID 0.

4.2. NIVELES RAID ANIDADOS O HÍBRIDOS

Muchas controladoras permiten combinar niveles RAID, es decir, que

un RAID pueda usarse como elemento básico de otro en lugar de

discos físicos. La nomenclatura de los RAID anidados es normalmente

el resultado de la unión de los números correspondientes a los niveles

RAID usados. Por ejemplo, RAID 01 es el resultado de combinar RAID

0 con RAID 1 (en este caso se suele utilizar la nomenclatura RAID 0+1

para evitar confusiones con RAID 1). Conceptualmente consiste en


37

múltiples “arrays” de nivel 0 con un nivel 1 encima que agrupa dichos

niveles 0 (ver imagen más abajo).

Como puede deducirse anidar niveles RAID tiene por objetivo

combinar un determinado nivel RAID que proporcione redundancia

con otro que aumente el rendimiento del sistema, y la prioridad que le

demos a dichas funcionalidades determinará cuál de los dos será el

de mayor nivel.

Los niveles RAID anidados más conocidos son:

RAID 01 (0+1): Un espejo de divisiones (“Stripes”).

RAID 10: Una división de espejos.

RAID 30: Una división de niveles RAID con paridad

dedicada.

RAID 50: Una división de niveles RAID con paridad

distribuida.

RAID 60: Una división de niveles RAID con doble paridad

distribuida.

RAID 100: Una división de una división de espejos.

RAID 101: Un Espejo de espejos

A continuación, se explican el funcionamiento de los dos primeros:

4.2.1. Raid 01:

Primero se crean dos RAID 0 y luego, sobre los anteriores, se crea

un RAID 1 para dotar al “array” de funcionalidad espejo.

La ventaja de un RAID 0+1 es que cuando un disco duro falla, los

datos perdidos pueden ser copiados del otro conjunto de nivel 0.

Variantes de este nivel anidado con mayor tolerancia a fallos son

RAID 0+1+5 y RAID 0+1+6.


38

4.2.2. Raid 10

Primero se crea un espejo RAID 1 y luego, sobre los anteriores, se

establece un RAID 0. El resultado es un “array” dotado de redundancia

con una mejora de rendimiento al no precisar escritura de paridad.

Para que no se pierdan datos cada RAID 1 deberá mantener al menos

uno de sus discos sin fallos.

4.2.3. Raid 30:

Es una combinación de un RAID 3 y un RAID 0. El RAID 30

proporciona tasas de transferencia elevadas combinadas con una alta

fiabilidad a cambio de un coste de implementación muy alto. La mejor

forma de construir un RAID 30 es combinar dos conjuntos RAID 3 con

los datos divididos en ambos conjuntos. El RAID 30 trocea los datos

en bloques más pequeños y los almacena en cada conjunto RAID 3,

que a su vez lo divide en trozos aún menores, calcula la paridad

aplicando un XOR a cada uno y los escriben en todos los discos del

conjunto salvo en uno, donde se almacena la información de paridad.

El tamaño de cada bloque se decide en el momento de construir el

RAID.


39

4.2.4. Raid 50

Combina la división a nivel de bloques de un RAID 0 con la paridad

distribuida de un RAID 5, siendo pues un conjunto RAID 0 dividido de

elementos RAID 5.

El RAID 50 mejora el rendimiento del RAID 5, especialmente en

escritura, y proporciona mejor tolerancia a fallos que un nivel RAID

único. Este nivel se recomienda para aplicaciones que necesitan gran

tolerancia a fallos, capacidad y rendimiento de búsqueda aleatoria.

4.2.5. Raid 60

RAID 60 se corresponde con RAID 6 combinado con RAID 0. Se trata

de una tecnología que almacena sus datos en varios discos al mismo

tiempo y evita la pérdida física de sus datos, lo que permite el tiempo

más que suficiente para intervenir de manera preventiva y sin

interrumpir el servicio.


40

4.2.6. Raid 100

A veces llamado también RAID 10+0, es una división de conjuntos

RAID 10. El RAID 100 es un ejemplo de RAID cuadriculado, un RAID

en el que conjuntos divididos son a su vez divididos conjuntamente de

nuevo.

Todos los discos menos unos podrían fallar en cada RAID 1 sin perder

datos. Sin embargo, el disco restante de un RAID 1 se convierte así

en un punto único de fallo para el conjunto degradado. A menudo el

nivel superior de división se hace por software.

4.2.7. Raid 101

Los principales beneficios de un RAID 100 (y de los RAIDS

cuadriculados en general) sobre un único nivel RAID son mejor

rendimiento para lecturas aleatorias y la mitigación de los puntos

calientes de riesgo en el conjunto. Por estas razones, el RAID 100 es

a menudo la mejor elección para bases de datos muy grandes, donde

el conjunto software subyacente limita la cantidad de discos físicos

permitidos en cada conjunto estándar. Implementar niveles RAID

anidados permite eliminar virtualmente el límite de unidades físicas en

un único volumen lógico.

Es un reflejo de dos RAID 10. Se utiliza en la llamada Network RAID

que aceptan algunas redes de datos. Es un sistema de alta

disponibilidad por red, lo que permite la replicación de datos entre


41

nodos a nivel de RAID, con lo cual se simplifica ampliamente la gestión

de replicación de redes. El RAID 10+1, tratándose de espejos de

RAID10 que tienen una gran velocidad de acceso, hace que el

rendimiento sea muy aceptable.


42

4.3. COMPARACION DE LOS PRINCIPLAES NIVELES RAID

N = Cantidad de dispositivos en el grupo de almacenamiento

r = % de error estimado por cada dispositivo del grupo de almacenamiento.

Nivel Tasa de Fallas

(fail rate)

Posibles Aplicaciones

Raid 0 1-(1-r)N Almacenamiento de archivos grandes

que no requieren redundancia en tiempo

real.

Raid 1 rN Bases de datos y archivos de bajo

contenido dinámico (poca capacidad)

Raid 4 N(N-1)r2 Bases de datos, servidores de archivos,

correo electrónico, contenido.

Raid 5 N(N-1)r2 Base de datos, servidores de archivos,

correo electrónico, contenido.

Raid 6 N(N-1)(n-2)r3 Base de datos, servidores de archivos,

correo electrónico, contenido (mayor

tolerancia a fallas que RAID 5)


43

Nivel Tipo Dispositi

vos

Redundan

cia

Capacidad Rendimient

o

(lectura)

Rendimient

o

(escritura)

Raid 0 Striping

(block level)

N>1 0 1 N N

Raid 1 Mirroring N>2 N-1 1/N

N 1

Raid 4 Striping

(block level)

Parity(dedicated)

N>2 1 1-1/N N-1 N-1

Raid 5 Striping

(block level)

Parity(distributed)

N>2 1 1-1/N N-1 N-1

Raid 6 Striping

(block level)

Double

Parity(distributed)

N>3 2 1-2/N N-2 N-2

5. QUE NIVEL RAID UTILIZAR

El nivel RAID determina la tolerancia a fallos proporcionada por el sistema, el

rendimiento en cuanto a tasa de transferencia de datos, y por último la forma de

distribución de datos entre los discos que conforman el “array”.

El nivel adecuado de RAID a utilizar depende de básicamente de dos factores:

Las aplicaciones que vayamos a utilizar.

La inversión que estemos dispuestos a realizar.

Cada aplicación presenta unos requerimientos concretos en cuanto a

rendimiento y tolerancia a fallos. En función de la importancia que tenga cada

uno de estos podremos determinar el nivel RAID más idóneo.

Sea cual sea nuestra situación de forma generalista podemos decir que:


44

RAID 0: Presenta la más alta tasa de transferencia, pero sin tolerancia a

fallos. Resulta especialmente apropiado para aplicaciones que requieran

operaciones secuenciales con ficheros de gran tamaño donde el

rendimiento sea más importante que la seguridad de los datos (p.ej.

servidores de BBDD, vídeo, imágenes, CAD/CAM, …).

RAID 1: Resulta más lento que un disco individual si bien aporta

redundancia total. Está diseñado para entornos donde el rendimiento de

lectura o la disponibilidad de la información han de ser altos, y donde la

recuperación de datos no es asumible o resulta muy costosa. RAID 1 es

una excelente elección cuando la seguridad es más importante que la

velocidad. (p.ej. aplicaciones financieras o de gestión, …).

RAID 2: Es adecuado para aplicaciones que demanden una altísima tasa

de transferencia de datos, no siendo la opción idónea para aquellas que

precisen una elevada tasa de I/O (no existen implementaciones

comerciales de este nivel de RAID).

RAID 3: Es útil para las personas que necesitan rendimiento y un acceso

constante a sus datos, como editores de vídeo. No se recomienda RAID

3 para uso intensivo con archivos no secuenciales porque el

rendimiento det lectura aleatoria se ve obstaculizado por la paridad

de discos. RAID 3 Especialmente indicado para sistemas mono-usuario y

aplicaciones que requieran transferencia de archivos de datos de un gran

tamaño (vídeo, imágenes, data warehouse). En la actualidad raramente

se utiliza.

RAID 4: Idóneo para almacenar fichero de gran tamaño (p.ej. aplicaciones

gráficas). RAID 5: Es útil para el archivo y para las personas que necesitan

rendimiento y un acceso constante a sus datos, siendo recomendable

para entornos de procesamiento de transacciones donde el nivel de

entrada/salida y de lectura/escritura resultan intensos (p.ej. video

vigilancia, servidor de aplicaciones y/o archivo para empresas).


45

RAID 6: Diseñado para entornos donde la disponibilidad de la información

es extremadamente crítica y prevalece sobre cualquier otro aspecto. Es

decir, es útil para personas que necesitan auténtica seguridad con menos

énfasis en el rendimiento. Es similar a RAID 5 pero con mayor nivel de

tolerancia a fallos (p.ej. cualquier aplicación de las denominadas “de

misión crítica”).

RAID 10: Pensado para entornos que requieran alto rendimiento y

tolerancia a fallos (p.ej. servidores de bases de datos).

RAID 50: Presenta una mayor tolerancia a fallos que RAID 5 a la vez que

mantiene la tasa de transferencia de éste (p.ej. aplicaciones “de misión

crítica” con alto requerimiento y tolerancia a fallos).

RAID 60: Aporta un rendimiento de RAID 6 pero con mayor tolerancia a

fallos. En términos de rendimiento global resulta ligeramente inferior a

RAID 50 siendo este hecho despreciable cuando lo prioritario es la

seguridad y protección de los datos (p.ej. cualquier aplicación que

requiera máxima tolerancia a fallos).

6. VENTAJAS DE LA ARQUITECTURA RAID

Un disco duro se caracteriza entre otros parámetros por su MTBF (Mean Time

Between Failure o tiempo medio entre fallos) cuya importancia no sólo radica en

su valor sino también en su significado. EL MTBF nos avisa que sean cuales

sean los discos que utilicemos éstos pueden eventualmente dejar de funcionar,

ocasionando pérdidas de datos o imposibilitando el acceso a la información por

parte de los usuarios.

Además de resolver el problema citado anteriormente, un sistema de

almacenamiento basado en arquitectura RAID ofrece cuatro ventajas principales:

Mayor fiabilidad que los discos individuales por tratarse de una

arquitectura tolerante a fallos con soporte de elementos redundantes.

Mayor rendimiento y tasa de transferencia de datos que los discos

individuales como resultado de las operaciones de lecturas/escritura

simultánea realizada sobre múltiple disco en paralelo.


46

Mayor capacidad de almacenamiento que los discos individuales. Un

“array” de disco RAID puede verse como un disco lógico formado por la

suma de los discos individuales que lo conforman, por lo que, en la

mayoría de las configuraciones, la capacidad total será superior.

Mayor integridad. Ante un error en los datos almacenados en alguno de

los discos del “array” (corrupción de datos, error de grabación,) la

información de paridad generada por los sistemas RAID permitirá

reconstruir los datos perdidos manteniendo así la integridad de la

información.

Considerando las ventajas anteriormente expuestas resulta sencillo deducir los

dos grandes beneficios que conducen a la implementación de una arquitectura

RAID; mejora el tiempo de funcionamiento sin fallo (uptime) del sistema de

almacenamiento y mejora del rendimiento de las aplicaciones. El primero se basa

en funcionalidades de tolerancia a fallos que permiten reconstruir los datos de

un disco dañado sobre otro que opera en modo reserva, sin que ello suponga

interrumpir el servicio de acceso a la información para los usuarios. Por su parte

la mejora en el rendimiento de algunas aplicaciones (pero no necesariamente en

todas) se fundamenta en la capacidad de lectura simultánea de datos en varios

discos, lo que supone un incremento de la tasa de transferencia del sistema. Las

aplicaciones que trabajan con grandes archivos (vídeo, imágenes, backups,

base de datos multiusuarios,) se verán beneficiadas por esta característica.

disco duro y sistema raid

Documents