disco duro y sistema raid
DESCRIPTION
Disco duroTRANSCRIPT
DISCO DURO
1. HISTORIA
El primer disco duro lo inventó la
compañía IBM a principios de 1956 por
encargo de las Fuerzas Aéreas de
Estados Unidos. Se le llamó RAMAC
(Método de acceso aleatorio de
contabilidad y control) 305, estaba
compuesto por un grupo de 50 discos de
aluminio, cada uno de 61 cm de diámetro,
que giraban a 3.600 revoluciones por minuto y que estaban recubiertos de una
fina capa magnética. Podía almacenar hasta 5 millones de caracteres (5
megabytes), Más grande que un frigorífico actual, este disco duro trabajaba
todavía con válvulas de vacío y requería una consola separada para su manejo.
La tecnología inicial aplicada a los discos duros era relativamente simple.
Consistía en recubrir con material magnético un disco de metal que era
formateado en pistas concéntricas, que luego eran divididas en sectores. El
cabezal magnético codificaba información al magnetizar diminutas secciones del
disco duro, empleando un código binario de «ceros» y «unos». Los bits o dígitos
binarios así grabados pueden permanecer intactos durante años. Originalmente,
cada bit tenía una disposición horizontal en la superficie magnética del disco,
pero luego se descubrió cómo registrar la información de una manera más
compacta.
En 1962, IBM introdujo un nuevo modelo, el 1301, con una capacidad de 28 MB
y una velocidad de transferencia y una densidad de área 10 veces mayor que el
RAMAC 305. La distancia entre los cabezales y la superficie del disco había
descendido desde 20,32 µm a 6,35 µm.
A partir del año 1962, muchos fabricantes comenzaron a vender discos duros
como el 1301.
En 1965, IBM lanzó el modelo 2310, cuya notable característica era ser un
elemento de almacenamiento desmontable (el primer disco flexible).
El 2314, lanzado en 1966, tenía cabezales de lectura de ferrita (óxido de hierro).
Universidad nacional de Trujillo Sede Valle Jequetepeque
1
En 1973, IBM lanzó el Winchester 3340, un disco duro cuyo cabezal de lectura
estaba separado de la superficie a través de una fina capa de aire de tan sólo
0,43 µm de espesor. Mejoró su capacidad en comparación con aquella del
RAMAC, como también su tamaño y peso, lo cual hizo que este disco se
convirtiera el nuevo estándar de los dispositivos de almacenamiento de acceso
directo. Al disco duro de 30 MB de capacidad se le dio el apodo de 30-30, y así
se convirtió en el "Winchester" (como el famoso rifle 30-30).
El primer disco duro de 5,25", desarrollado por la compañía Seagate, se lanzó
en 1980.
2. Definición:
Llamado también disco fijo, disco rígido o unidad de disco duro (en inglés
hard disk, hard drive o hard disk drive abreviado con frecuencia HD o HDD).
Su función es almacenar información de forma permanente en un equipo
informático. Aquí se guarda el sistema operativo (Windows) y todas las
aplicaciones (office, corel, photoshop, etc.) necesarias para que trabaje la
computadora; y también, la información procesada por la computadora
(documentos, gráficos, correos, etc).
3. Tipos
Se clasifican según su interfaz:
3.1. IDE (Integrated Device Electronics) / PATA (Parallel Advanced
Technology Attachment)
Se divide en dos, uno llamado máster y otro llamado esclavo que
posee un solo controlador que conecta al bus ISA. Controlan los
dispositivos de almacenamiento masivo de datos, como los discos
duros. Son planos, anchos y alargados.
Para conectarlos, se utilizan un 40 o 80% del cable de alambre de la
cinta que se conecta a la placa base del interior del PC. A medida que
la tecnología PATA se implementó, se transfiere información y datos
con más velocidad.
Universidad nacional de Trujillo Sede Valle Jequetepeque
2
3.2. SATA (Serial ATA) (Serial Advance Technology Attachment
Drive)
Utiliza un bus de serie para la transmisión de datos. Más rápidos y
eficientes que los IDE. En comparación con un disco PATA, las
conexiones en los SATA son totalmente diferentes. Eso va para la
conexión de datos, así como el conector de alimentación de energía;
además que físicamente es mucho más pequeño y cómodo que
permite la conexión en caliente. Además, utilizan menos energía
también, que es un requisito importante para la mayoría de los
ordenadores y sistemas operativos modernos.
3.4. SCSI (Small Computer System Interface)
Son interfaces preparadas para discos duros de gran capacidad de
almacenamiento y velocidad de rotación.
Es muy común encontrar un disco duro SCSI en un servidor en lugar
de una PC de escritorio. Sus mayores velocidades de datos y
capacidades de corrección de errores los hacen perfectos para usar
como parte de un conjunto de discos. Aunque el tipo SCSI se
considera más fiable, pero también tienden a desgastarse más rápido
debido a la alta velocidad que los discos giran.
Este tipo de discos duros de gran capacidad de almacenamiento
pueden trabajar asíncronamente con respecto al microprocesador, lo
cual los hace veloces.
3.5. SSD (Solid State Drives)
El SSD se deshace del almacenamiento magnético para darnos un
almacenamiento sólido, sin partes movibles. Los SSD y nuestra típica
memoria USB comparten muchas similitudes, pues los chips de
almacenamiento que utilizan son los mismos o muy similares: la
diferencia está en la forma del disco (2.5” o 3.5” para poder ser
utilizados en dispositivos portátiles), y en la capacidad.
Universidad nacional de Trujillo Sede Valle Jequetepeque
3
3.6. SAS (Serial Attached SCSI Drive)
Interfaz de transferencia de datos en serie, sucesor del SCSI paralelo,
aunque sigue utilizando comandos SCSI para interaccionar con los
dispositivos SAS. La principal diferencia con su predecesor es que
utiliza transferencia serial de datos, aumentado la velocidad a 1,5 - 3
o 6 Gbps. y permite la conexión y desconexión en caliente.
Una de las principales características es que aumenta la velocidad de
transferencia al aumentar el número de dispositivos conectados, es
decir, puede gestionar una tasa de transferencia constante para cada
dispositivo conectado, además de terminar con la limitación de 16
dispositivos existente en SCSI, es por ello que se vaticina que la
tecnología SAS irá reemplazando a su predecesora SCSI.
Por último, el conector es el mismo que en la interfaz SATA y permite
utilizar estos discos duros, para aplicaciones con menos necesidad de
velocidad, ahorrando costes. Por lo tanto, las unidades SATA pueden
ser utilizadas por controladoras SAS pero no a la inversa, una
controladora SATA no reconoce discos SAS. Los SAS son
especialmente utilizados en servidores que necesitan gran
rendimiento.
4. Factores de Forma
El más temprano "factor de forma" de los discos duros, heredó sus
dimensiones de las disqueteras. Pueden ser montados en los mismos chasis
y así los discos duros con factor de forma, pasaron a llamarse coloquialmente
tipos FDD "floppy-disk drives" (en inglés).
La compatibilidad del "factor de forma" continua siendo de 3½ pulgadas (8,89
cm) incluso después de haber sacado otros tipos de disquetes con unas
dimensiones más pequeñas.
4.1. Disco 8”: 241,3×117,5×362 mm (9,5×4,624×14,25 pulgadas)
En 1979, Shugart Associates sacó el primer factor de forma compatible
con los disco duros, SA1000, teniendo las mismas dimensiones y
siendo compatible con la interfaz de 8 pulgadas de las disqueteras.
Universidad nacional de Trujillo Sede Valle Jequetepeque
4
Había dos versiones disponibles, la de la misma altura y la de la mitad
(58,7mm).
4.2. Disco 5,25” o 5 ¼”: 146,1×41,4×203 mm (5,75×1,63×8 pulgadas)
Se introdujo en 1976 con las primeras disqueteras. En 1980 salió el
primero disco duro de 5 ¼” (modelo ST-506 de Seagate Technologies)
de 5 MB de capacidad. Éste es dos veces tan alto como el factor de 8
pulgadas, que comúnmente se usa hoy; por ejemplo: 41,4 mm (1,64
pulgadas).
4.3. Disco de 3 ½” o 3,5”: 101,6×25,4×146 mm (4×1×5.75 pulgadas):
Sony los introdujo en 1981 en las disqueteras. Estos discos fueron
incorporados en sus equipos por grandes compañías como IBM, Apple
y HP, lo que le dio popularidad y se convirtió en el nuevo estándar.
Este factor de forma es el primero usado por los discos duros de
Rodine que tienen el mismo tamaño que las disqueteras de 3½, 41,4
mm de altura. Hoy ha sido en gran parte remplazado por la línea "slim"
de 25,4mm (1 pulgada), o "low-profile" que es usado en la mayoría de
los discos duros.
4.4. Disco de 2 ½” o 2,5”: 69,85×9,5-15×100 mm (2,75×0,374-
0,59×3,945 pulgadas)
Este factor de forma se introdujo por PrairieTek en 1988 y no se
corresponde con el tamaño de las lectoras de disquete. Este es
frecuentemente usado por los discos duros de los equipos móviles
(portátiles, reproductores de música, etc...) y en 2008 fue reemplazado
por unidades de 3,5 pulgadas de la clase multiplataforma. Hoy en día
la dominante de este factor de forma son las unidades para portátiles
de 9,5 mm, pero las unidades de mayor capacidad tienen una altura
de 12,5 mm.
Universidad nacional de Trujillo Sede Valle Jequetepeque
5
4.5. Disco de 1.8” 54×8×71 mm
Fue introducido por Integral Peripherals en 1991, pero tuvo problemas
de aceptación. Algunas compañías siguen fabricando estos discos que
pueden alcanzar los 60 GB.
Este factor de forma se introdujo por Integral Peripherals en 1993 y se
involucró con ATA-7 LIF con las dimensiones indicadas y su uso se
incrementa en reproductores de audio digital y su subnotebook. La
variante original posee de 2GB a 5GB y cabe en una ranura de
expansión de tarjeta de ordenador personal. Son usados normalmente
en iPods y discos duros basados en MP3.
4.6. Disco de 1”: 42,8×5×36,4 mm
Durante 1998 IMB introdujo los discos de 1” llamados MicroDrive. Las
versiones actuales del MicroDrive alcanzan los 4 GB. En 2004 Toshiba
introdujo el disco más pequeño hasta ahora, de 0.85”. No está
diseñado para PCs.
Este factor de forma se introdujo en 1999 por IBM y Microdrive, apto
para los slots tipo 2 de compact flash, Samsung llama al mismo factor
como 1,3 pulgadas.
4.7. 0,85”: 24×5×32 mm
Toshiba anunció este factor de forma el 8 de enero de 2004 para
usarse en móviles y aplicaciones similares, incluyendo SD/MMC slot
compatible con disco duro optimizado para vídeo y almacenamiento
para micromóviles de 4G. Toshiba actualmente vende versiones de
4GB (MK4001MTD) y 8GB (MK8003MTD) 5 [3] y tienen el Record
Guinness del disco duro más pequeño.
Universidad nacional de Trujillo Sede Valle Jequetepeque
6
5. características técnicas
5.1. Capacidad
En el mercado actual encontramos discos con capacidades desde 80
GB hasta 700 GB. En discos externos ya se ha alcanzado la barrera
de los 1000 GB (1 terabyte).
5.2. Velocidad de rotación de los discos
Es la velocidad, en revoluciones por minuto (RPM), a la que giran los
discos internos. Cuanto mayor es la a velocidad, a mayor velocidad se
escriben o leen los datos en el disco. Actualmente, la velocidad
estándar es de 7.200 RPM y en la gama alta empiezan a salir los de
15.000 RPM.
5.3. Tiempo de acceso o de búsqueda
El tiempo de búsqueda es el tiempo que demora la cabeza lectora en
llegar a los datos. Se mide el milisegundo (ms), y cuanto menor sea,
más rápido será el disco.
Actualmente, el tiempo medio de acceso toma valores entre 12 y 8 ms
en los discos ID y de 5 a 8 ms en los discos SCSI.
5.4. Tamaño del buffer interno
Todos los discos duros incluyen una memoria <<buffer>> o
<<caché>> que optimiza la transferencia de datos entre un medio
<<lento>> (los discos y las cabezas) y un medios <<rápido>> (la
interface electrónica o controladora de disco). Normalmente es una
memoria SDRAM que puede variar entre 2 MB y 8 MB.
5.5. Velocidad de transferencia de datos
Es la velocidad a la que puede transferir la información a la
computadora una vez la aguja está situada en la pista y sector
correctos. La tasa de transferencia de datos se refiere a la
transferencia entre la controladora de disco (IDE) y el buffer del disco,
Universidad nacional de Trujillo Sede Valle Jequetepeque
7
y no a la tasa real de lectura o escritura de datos que depende de la
velocidad entre el buffer y las cabezas de lectura/escritura.
Tabla 1: Transferencia de datos de un disco duro según la interfaz
Interface
Tasa de transferencia
Máxima
Conectores
Modo DMA 16/6 MB/s 40 pines / 40 hilos
Ultra DMA/33 o
Ultra ATA 33
33 MB/s 40 pines / 40 hilos
Ultra DMA/66
Ultra ATA 66
66 MB/s 40 pines / 80 hilos
Ultra DMA/ 100
Ultra ATA100
100 MB/s 40 pines / 80 hilos
Ultra DMA/66
Ultra ATA 133
133 MB/s 40 pines /80 hilos
Para los discos ATA/66/100/133, se utiliza un cable especial de 80
hilos, pero los conectores siguen teniendo 40 agujeros. La necesidad
de cambiar el tipo de cable es consecuencia directa de las altas
velocidad que deseen alcanzarse, algo para lo cual los cables IDE
normales no están pensados. Sobre el aspecto de la compatibilidad
<<hacia atrás >>, los discos duros ATA/66/100/133 son 100%
problemas en modo ATA/33, solo que no podrán superar los 33,3
MB/s.
5.6. Dimensiones y peso
Las dimensiones estándar son de 3 ½” (8.89 centímetros) de ancho x
1” (2.54 centímetros) de alto en promedio. El largo generalmente no
importa, pero es importante que las dimensiones concuerden con las
de case. El peso depende del fabricante y oscila entre 450 a 600
gramos.
Universidad nacional de Trujillo Sede Valle Jequetepeque
8
5.7. Marcas
Hay una gran variedad de marcas como: Quantum, Samsung, IBM,
Western Digital, Fujitsu, Seagate, Maxtor, Conner, JTS.
5.8. Latencia
Una vez que el actuador a desplazado las cabezas hasta el cilindro
adecuado, la unidad tiene que esperar hasta que el sector deseado
pase bajo la cabeza. La latencia es el tiempo(en milisegundos)
necesarios para que gire el disco y el sector alcance la posición
correcta. Cuanto mayor sea la velocidad de los discos, menor sera la
latencia.
Por ejemplo: un disco duro que gira a 7200 RPM tendría una latencia
mas desfavorable de 8.3 ms (60/7200 = 0.0083) y una latencia media
de 4.2 ms (la mitad del valor anterior.
5.9. Caché de pista
Es una memoria tipo Flash dentro del disco duro.
5.10. Interfaz
Medio de comunicación entre el disco duro y la computadora. Puede
ser IDE/ATA, SCSI, SATA, USB, Firewire, Serial Attached SCSI
5.11. Landz
Zona sobre las que aparcan las cabezas una vez se apaga la
computadora
Universidad nacional de Trujillo Sede Valle Jequetepeque
9
6. Estructura de un disco duro
Los discos duros están compuestos de una estructura física y de una
estructura lógica:
6.1. Estructura física:
a. Platos
Están elaborados de compuestos de vidrio, cerámica o aluminio,
pulidos y revestidos por ambos lados con una capa muy delgada
de una aleación metálica. Los discos están unidos a un eje y un
motor que los hace guiar a una velocidad constante entre las 3600
y 7200 RPM.
Convencionalmente los discos duros están compuestos por varios
platos, es decir varios discos de material magnético montados
sobre un eje central. Estos discos normalmente tienen dos caras
que pueden usarse para el almacenamiento de datos, y para
almacenar información de control. Actualmente los discos duros
son de 3 ½”.
b. Tarjeta Lógica
Es la tarjeta ubicada sobre los platos que contienen la electrónica
que controla al eje de la unidad y a los sistemas del actuador de la
cabeza. En los discos duros IDE, la tarjeta lógica incluye al
controlador del mismo, mientras que los discos SCSI la tarjeta
incluye el controlador y el circuito adaptador del bus.
La mayoría de fallas ocurren en la tarjeta lógica por lo que es
posible repara un disco duro reemplazando su tarjeta lógica. En
todo caso, se puede recuperar los datos de un disco duro que tiene
la tarjeta lógica malograda, con el reemplazo momentáneo de esta.
Universidad nacional de Trujillo Sede Valle Jequetepeque
10
c. Cabeza de Lectura/Escritura
Es la parte de la unidad de disco que escribe y lee los datos del
disco. Su funcionamiento consiste en una bobina de hilo que se
acciona según el campo magnético que detecte sobre el soporte
magnético, produciendo una pequeña corriente que es detectado y
amplificado por la electrónica de la unidad de disco.
Generalmente los discos duros tienen una cabeza de
lectura/escritura para la superficie de cada plato, lo que significa
que a cada plato tiene dos cabezas, una para la cara superior y
otra para la car inferior.
Cada cabeza se conecta en un solo mecanismo móvil (un brazo
actuador), por lo cual todas las cabezas se mueven en conjunto a
través de los platos.
d. Eje o motor del disco duro:
Es la parte del disco duro que actúa como soporte, sobre el cual
están montados y giran los platos del disco.
Tradicionalmente los motores han usado rodamiento con bolitas en
su diseño. Pero debido al aumento de la densidad de los discos
éstas se están quedando obsoletas.
Existe un nuevo modelo de rodamiento llamado “fluido dinámico”
que usa un líquido lubricante muy viscoso para el contacto entre la
bobina y los demás componentes.
e. Actuador
Es el mecanismo que mueve las cabezas de lectura/escritura
radialmente a través de la superficie de los platos de la unidad de
disco y las coloca con total precisión del cilindro deseado.
Hay dos variantes de actuadores de cabeza:
Actuadores de motor de paso.
Actuadores de bobina de voz.
Universidad nacional de Trujillo Sede Valle Jequetepeque
11
f. Controladora
Manda más corriente a través del electro magneto para mover las
cabezas cerca del borde del disco. En caso de una pérdida de
poder, un resorte mueve la cabeza nuevamente hacia el centro del
disco sobre una zona donde no se guardan datos.
Universidad nacional de Trujillo Sede Valle Jequetepeque
12
6.2. Estructura lógica:
a. Master boot record (mbr)
Es conocido también como registro de arranque. Es el primer sector
("sector cero") del disco duro. Es usado para almacenar una tabla
de particiones y, en ocasiones, se usa sólo para identificar un
dispositivo de disco individual.
b. Particiones
La partición del disco duro es absolutamente opcional. Cualquier
computador personal funcionará con normalidad aunque el disco
duro no sea particionado (aunque algunos sistemas operativos,
como Linux, requieren la partición, por lo cual la realizan por sí
mismos al ser instalados).
El principal inconveniente que presenta utilizar en el disco duro una
única partición (la unidad “C”), es que todos los procesos de
creación, modificación y sustitución de documentos, y la formación
y destrucción de archivos temporarios, se realiza en la misma
unidad en que se encuentran los programas permanentes; y por lo
tanto, toda la unidad se ve afectada por la fragmentación.
La fragmentación
Es un efecto que se produce en el espacio de grabación del disco
duro, por causa de la frecuente destrucción y borrado, o
regrabación con modificaciones, de los archivos que produce el
usuario. El sistema operativo recurre a ocupar los espacios
intersticiales dejados por los archivos borrados, para ubicar los
nuevos registros; aunque sea subdividiendo éstos en varios
tramos.
La ventaja principal de disponer de un disco duro particionado,
consiste en que facilita la clasificación del material de software
contenido en el computador y evitar que la fragmentación afecte
unidades de gran capacidad.
Universidad nacional de Trujillo Sede Valle Jequetepeque
13
Existen dos tipos de particiones.
Partición Primaria. Es en la cual se instala el sistema
operativo, desde la cual permite arrancar el ordenador. Para
que el sistema la reconozca como primaria ésta debe estar
activada.
Partición Extendida. Es la partición en la cual se crean las
unidades lógicas y cada unidad es tratada como unidad
independiente, se pueden guardar todo tipo de ficheros, pero
el ordenador no la reconoce como arrancable.
c. Electrónica del disco duro:
También llamada Placa o PCB, es la parte del disco duro que se
encarga del manejo de los distintos tipos de componentes del disco
duro así como de verificar su funcionamiento. Es la parte
responsable de la comunicación con el ordenador, en ella se aloja
el bus, y la alimentación.
Esta placa es en sí, un pequeño ordenador compuesto por un
microprocesador, memoria RAM, el micro controladores que
manejan los periféricos, como el control de posición, giro del motor
y bus de comunicación. En otras palabras, posee el mapa de donde
está cada pista y sector del disco duro y le comunica al cabezal
donde tiene que leer o escribir exactamente.
d. Firmware del disco duro:
Es el componente del disco duro de software que configura el disco
duro, y contiene toda la información necesaria para poner el disco
en marcha, comunicarnos con él, protegerlo e identificarse.
Universidad nacional de Trujillo Sede Valle Jequetepeque
14
7. Direccionamiento del disco duro
7.1. Concepto de direccionamiento
7.1.1. Cilindros:
Es el conjunto de varias pistas que están alineadas verticalmente
(una de cada cara). Se puede considerar al par de pistas en lados
opuestos del disco.
Si el HD contiene múltiples discos (sean n), un cilindro incluye
todos los pares de pistas directamente uno encima de otra (2n
pistas).
Los HD normalmente tienen una cabeza a cada lado del disco.
Dado que las cabezas de Lectura/Escritura están alineadas unas
con otras, la controladora puede escribir en todas las pistas del
cilindro sin mover el rotor. Como resultado los HD de múltiples
discos se desempeñan levemente más rápido que los HD de un
solo disco.
7.1.2. Pista
Track. Es la trayectoria circular en forma de anillo, trazada a través
de la superficie del plato de un disco por la cabeza lectura/escritura.
La pista puede manejar gran cantidad de datos por lo que es
necesario dividirla para ser más eficiente el almacenamiento de los
archivos pequeños.
Universidad nacional de Trujillo Sede Valle Jequetepeque
15
Por esta razón, se han seccionado las pistas en una determinada
cantidad de sectores numerados que dependen del disco duro. Un
disco duro puede tener de 380 a 700 sectores por pista.
7.1.3. Sector
Es la unidad básica de almacenamiento de datos sobre discos
duros. Al formatear el disco duro se crean sectores con una
capacidad de 512 Bytes cada uno.
Los sectores se enumeran comenzando por el número uno, las
cabezas y cilindros empiezan a partir del 0.
Antiguamente el número de sectores por pista era fijo, lo cual
desaprovechaba el espacio significativamente, ya que en las pistas
exteriores pueden almacenarse más sectores que en las interiores.
Así, apareció la tecnología ZBR (grabación de bits por zonas) que
aumenta el número de sectores en las pistas exteriores, y usa más
eficientemente el disco duro.
Universidad nacional de Trujillo Sede Valle Jequetepeque
16
7.1.4. Clauster
Es una agrupación de sectores, su tamaño depende de la
capacidad del disco.
7.2. Sistemas de direccionamiento
7.2.1. CHS CILINDRO CABEZA SECTOR
Fue el primer sistema de direccionamiento que se utilizó el cual
asigna una dirección la cual se forma con el número de cilindro,
cabezal y sector en el que se encuentra. Fue utilizado en las
primeras Unidades ATA pero tenían una limitación de 8GB.
7.2.2. LBA DIRECCIONAMIENTO LOGICO DE BLOQUES
Este sistema no se basa en una división del disco mediante
cilindros, cabezas y sectores, sino que a cada bloque (también
llamadas Unidad de asignación) se le asigna un número (n-1, n-
2…, donde n es el número total de bloques), y permite bloques de
512 Bytes y de 1024 Bytes. En este caso, la capacidad máxima de
un disco duro está limitada solo por dos factores, el número real de
bloques que pueda contener, que siempre van a tener el mismo
tamaño físico, y es un límite puramente físico que depende
exclusivamente del disco, y el número de bits que pueda utilizar
para comunicar el número del bloque, dependiendo en este caso
A- Track
B- Geometric Sector
C- Sector
D- Cluster
Universidad nacional de Trujillo Sede Valle Jequetepeque
17
tanto del disco duro como de la placa base. LBA utiliza, en cuanto
a bits; dos tipos de extensiones:
- LBA de 26 bits, con una capacidad máxima de 128 GiB
- LBA de 48 bits,, que es el utilizado actualmente, con una
capacidad máxima de 144.11pebibytes (millones de Gibibytes)
Universidad nacional de Trujillo Sede Valle Jequetepeque
18
SISTEMAS RAID
1. Definición
Las siglas RAID (Redundant Array of Independent -or Inexpensive- Disks,
conjunto redundante de discos independientes), hacen referencia a un
sistema de almacenamiento que utiliza un conjunto de discos duros
independientes organizados para que el sistema operativo los vea como
un solo disco lógico. Almacena los datos de forma redundante. Los RAID
suelen usarse en servidores y normalmente se implementan con unidades
de disco de la misma capacidad.
Los beneficios de RAID respecto a un único disco duro son: mayor
integridad en los datos, mayor tolerancia a fallos, mayor rendimiento y
mayor capacidad
Se mejora el rendimiento ya que permite a varias unidades trabajar en
paralelo. La fiabilidad se aumenta mediante dos técnicas: redundancia
que implica el almacenamiento de los mismos datos en más de una
unidad y la paridad de datos. Esta última consiste en un algoritmo
matemático que genera información de paridad, cuando se produce un
fallo en una unidad se leen los datos correctos que quedan y se comparan
con los datos de paridad almacenados. El uso de paridad es menos
costoso que la redundancia ya que no requiere la utilización de un
conjunto redundante de unidades de disco.
La tecnología RAID surge ante la necesidad que existe hoy en día de tener
un buen sistema de almacenamiento seguro y tolerante a fallos. Asegura
la integridad de los datos ante la avería de uno de los discos, asegurando
un funcionamiento continuo y permitiendo la substitución de una unidad
defectuosa sin necesidad de detener los procesos que se están
ejecutando.
Universidad nacional de Trujillo Sede Valle Jequetepeque
19
2. RAID basados en Software
Algunas implementaciones
de sistemas RAID basados
solamente en Software
incluyen piezas de Hardware,
que hace que la
implementación se parezca a
u n sistema RAID hardware
tradicional. Sin embargo es importante entender que un RAID Software
utiliza potencia de cálculo de la CPU por lo que se tendrá que compartir
con el sistema operativo y todas las aplicaciones asociadas.
Un sistema RAID Software puede implementarse de varias formas:
- Sistema Software puro.
- Sistema hibrido.
A. Sistema Software puro
En este caso, la aplicación RAID es una aplicación ejecutándose
en el host sin ningún hardware adicional. Este tipo de RAID por
software utiliza unidades de disco duro que se adjuntan a la sistema
informático a través de una interfaz integrada de E / S o un
procesador de menos adaptador de bus de host (HBA). El RAID se
activa tan pronto como sea el sistema operativo se haya cargado
el software del controlador RAID. Tal soluciones de software RAID
puros a menudo vienen integrados en el sistema operativo del
servidor y por lo general son libres de costo adicional para el
usuario. Bajo costo es la principal ventaja de esta solución.
Ventajas
- Coste reducido: Si la funcionalidad RAID está construida
en el sistema operativo el coste es gratuito. El único
coste será el del resto de discos duros.
Universidad nacional de Trujillo Sede Valle Jequetepeque
20
Desventajas
- Sin protección en el arranque (no puede manejar o
proteger los datos en de arranque): fallo de la unidad o
datos corruptos durante el arranque y antes de que el
software RAID se convertirse en clientes potenciales
activos a un sistema que no funciona.
- Aumento de la carga en el servidor: Sistema el
rendimiento se ve afectado por la aplicación de RAID. Los
más unidades involucradas y el más complejo es el RAID
sistema (por ejemplo, involucrando a la paridad en un
RAID 5), más impacto en el rendimiento general. Esta
solución es mejor adecuado para simples RAID 0, 1, 10
escenarios.
- Migración del sistema operativo: funcionalidad RAID
puede estar limitada al Sistema Operativo actual.
- Vulnerable a los virus: Debido a que el RAID está
funcionando como una aplicación en el sistema
informático, virus y otro software dañino podría afectar la
funcionalidad RAID.
- Problemas de integridad de datos debido a fallos del
sistema: Software o problemas de hardware en el servidor
pueden afectar los datos consistencia e integridad.
B. Sistema hibrido
Asistida por hardware RAID por software
Si bien esto es aún RAID por software, el hardware de asistencia
ayuda a superar algunas de las debilidades de RAID por software
puro. Tal soluciones por lo general vienen con hardware adicional
(por ejemplo, un HBA con un BIOS RAID o simplemente un BIOS
RAID integrado en el placa madre).
El BIOS adicional hace que el RAID funcionalidad disponible
cuando el sistema está encendido, proporcionando redundancia
Universidad nacional de Trujillo Sede Valle Jequetepeque
21
durante el arranque que reduce el impacto de medio errores en
RAID que de otro modo podrían dar lugar a la corrupción de datos
o un sistema inoperable. Además, la mayoría de estas soluciones
proporcionar un software de configuración del BIOS que está
disponible en el arranque del sistema.
Esto permite una fácil instalación y mantenimiento de la matriz
RAID sin la necesidad de instalar o arrancar un sistema operativo
desde el disco duro o CD ROM. Además, el software RAID asistida
por hardware normalmente viene con una variedad de
controladores para el operativo más popular sistemas, y por lo
tanto, es más independiente del sistema operativo que pura
RAID por software.
Beneficios
- Costo moderado: Sólo un HBA (tarjeta plug-in) o un
memoria flash adicional para el BIOS abajo en el se
necesita placa base; También puede incluir un hardware
Acelerador XOR si el controlador soporta RAID 5.
- Protegido en el arranque: Ningún efecto negativo en la
disponibilidad de datos cuando la unidad de arranque
tiene errores medianas o no por completo.
Ventajas
- La carga adicional de rendimiento en el servidor.
Sistemas el rendimiento se ve afectado por la aplicación
de RAID. Los más unidades involucradas y el más
complejo es el RAID sistema (por ejemplo, involucrando a
la paridad en un RAID 5), más impacto en el rendimiento
general. Esta solución es mejor adecuado para simples
RAID 0, 1, 10 escenarios.
- Migración del sistema operativo Limited: funcionalidad
RAID sigue siendo dependiente del sistema operativo
como el conductor se ejecuta en la parte superior de el
sistema operativo. Sin embargo, varios controladores
para una variedad de sistemas operativos no permitir la
Universidad nacional de Trujillo Sede Valle Jequetepeque
22
migración de la matriz para otros sistemas operativos.
Esto podría estar limitado por la disponibilidad de un
controlador RAID para muy nuevos sistemas operativos
(por ejemplo, las nuevas versiones de un sistema
operativo podrían necesitar un nuevos RAID controlador -
controladores RAID son más complejas que programas
controlador HBA normales, y por lo tanto, podría tomar
más tiempo para desarrollarlos)
- Vulnerable a los virus: Debido RAID está funcionando
como un aplicación en el sistema informático, virus y otras
software dañino podría afectar la funcionalidad RAID
- Problemas de integridad de datos debido a fallos del
sistema: Software o problemas de hardware en el servidor
pueden afectar los datos consistencia e integridad.
3. RAID basados en Hardware
Una solución de hardware RAID tiene su propio procesador y la memoria
de ejecutar la aplicación RAID. En esta implementación, el RAID del
sistema es un sistema de equipos pequeños independiente dedicada a la
aplicación de RAID, la descarga de esta tarea desde el sistema host
Hardware RAID se puede encontrar como una parte integral de la solución
(por ejemplo, integrado en la placa base) o como una tarjeta adicional. Si
el hardware necesario ya está integrado en la solución de sistema, luego
de hardware RAID podría llegar a ser una actualización de software para
un sistema existente. Así como el software RAID, RAID de hardware
podría no ser identificado como tal a primera vista.
La forma más sencilla de identificar si una solución es software o
RAID de hardware es leer las especificaciones técnicas. Si la solución
incluye un microprocesador (generalmente llamada de E / S del
procesador'), entonces es una solución de hardware RAID. Si no hay
procesador, es una solución de software RAID.
Esto es importante para su selección por el sistema impactos del software
RAID vs. RAID de hardware implementación. Estos impactos incluyen:
Universidad nacional de Trujillo Sede Valle Jequetepeque
23
- Utilización de la CPU y el rendimiento cuando otras
aplicaciones están corriendo
- Escalabilidad de las unidades de disco que se pueden agregar
a un sistema
- Facilidad de recuperación después de una pérdida de datos
- Capacidad para datos avanzados de gestión / supervisión
- Capacidad de gestión de unidades de disco consistentemente
a través de diferentes sistemas operativos
- Posibilidad de añadir una opción de respaldo de batería que
permiten activar y escribir el almacenamiento en caché en el
controlador para mejorar la escritura y el rendimiento del
sistema
4. Ventajas del RAID
La tecnología RAID proporciona tolerancia a fallos, mejora el rendimiento
del sistema y aumenta la productividad.
Tolerancia a fallos: Un RAID protege contra la pérdida de datos y
proporciona recuperación de datos en tiempo real con acceso
interrumpido en caso de que falle un disco.
Mejora del Rendimiento/ Velocidad: Un RAID consta de dos o más
discos duros que ante el sistema principal funcionan como un único
dispositivo. Los datos se desglosan en fragmentos que se escriben en
varias unidades de forma simultánea. Este proceso, denominado
fraccionamiento de datos, incrementa notablemente la capacidad de
almacenamiento y ofrece mejoras significativas de rendimiento. RAID
permite a varias unidades trabajar en paralelo, lo que aumenta el
rendimiento del sistema.
Mayor Fiabilidad: Las soluciones RAID emplean dos técnicas para
aumentar la fiabilidad: la redundancia de datos y la información de
paridad. La redundancia implica el almacenamiento de los mismos
Universidad nacional de Trujillo Sede Valle Jequetepeque
24
datos en más de una unidad. De esta forma, si falla una unidad, todos
los datos quedan disponibles en la otra unidad, de inmediato. Aunque
este planteamiento es muy eficaz, también es muy costoso, ya que
exige el uso de conjuntos de unidades duplicados. El segundo
planteamiento para la protección de los datos consiste en el uso de la
paridad de datos. EL RAID utiliza un algoritmo matemático para
generar información de paridad. Cuando se produce un fallo en una
unidad se leen los datos correctos que quedan y se comparan con los
datos de paridad almacenados por la matriz. El uso de la paridad para
obtener fiabilidad de los datos es menos costoso que la redundancia,
ya que no requiere el uso de un conjunto redundante de unidades de
disco.
Alta Disponibilidad: El RAID aumenta el tiempo de funcionamiento y
la disponibilidad del sistema. Para evitar los tiempos de inactividad,
debe ser posible acceder a los datos en cualquier momento. La
disponibilidad de los datos depende de dos aspectos: la integridad de
los datos y tolerancia a fallos. La integridad de los datos se refiere a
la capacidad para obtener los datos adecuados en cualquier
momento. La mayoría de las soluciones RAID ofrecen reparación
dinámica de sectores, que repara sobre la marcha los sectores
defectuosos debidos a errores de software. La tolerancia a fallos, el
segundo aspecto de la disponibilidad, es la capacidad para mantener
los datos disponibles en caso de que se produzcan uno o varios fallos
en el sistema.
5. Niveles de raid
Cada nivel RAID ofrece una combinación específica de tolerancia a fallos
(redundancia), rendimiento y coste, diseñadas para satisfacer las
diferentes necesidades de almacenamiento. La mayoría de los niveles
RAID pueden satisfacer solamente uno o dos de estos tres criterios.
Los niveles de RAID más usados son: RAID 0 (conjunto dividido), RAID1
(conjunto en espejo) y RAID5 (conjunto dividido con paridad distribuida).
Universidad nacional de Trujillo Sede Valle Jequetepeque
25
4.1. Niveles RAID Puros o Estándar
4.1.1. RAID 0 (disk stripping)
Es el modo RAID más rápido. Se necesitan al menos 2
unidades, RAID 0
distribuye los datos en
cada disco. Las
capacidades
disponibles de cada
disco se añaden
juntas, de modo que
se monta un solo
volumen en el
ordenador.
Este nivel mejora el rendimiento, pero no aporta tolerancia
a fallos. En caso de avería en cualquiera de los
componentes de “array” el sistema fallará en su totalidad.
VENTAJAS DESVENTAJAS
Proporciona un alto rendimiento.
No tiene costo adicional.
Toda la capacidad del disco se
emplea.
No es verdaderamente un disco
RAID ya que no tiene integridad
de datos.
se dispone de información de
paridad y por tanto no ofrece
funcionalidad de tolerancia a
fallos.
Por el sistema de trabajo que
utiliza, el fallo de uno de los discos
significa la pérdida de todo el
sistema.
Tenemos un incremento en el
consumo del equipo.
Si bien es cierto que puede llegar a
aumentar algo el rendimiento de los
discos.
Universidad nacional de Trujillo Sede Valle Jequetepeque
26
Procedimiento para cálculo de la
capacidad RAID 0
En un sistema RAID 0, todos los discos
deben tener la misma capacidad.
La capacidad de almacenamiento en una
configuración RAID de nivel 0 se calcula
multiplicando el número de unidades por la
capacidad del disco, o C = n*d, donde:
C=capacidad disponible
n = número de discos
d = capacidad de disco
Por ejemplo, en una matriz RAID 0 con
cuatro unidades de 1000 GB de capacidad
cada una, la capacidad total de la matriz
sería de 4000 GB: C = (4*1000)
4.1.2. RAID 1 (DISK MIRRORING)
Consiste en asociar a cada disco primario del RAID un
segundo disco ESPEJO, en el
que se duplica la información.
Si el disco primario falla el
espejo continúa trabajando.
Una vez sustituido el disco
averiado, los datos se
reconstruyen al 100%.
Para alcanzar un máximo
rendimiento se recomienda el
uso de controladoras de disco duplicadas, de esta forma
será posible leer de los dos discos al mismo tiempo
incrementando la tasa de transferencia de lectura al doble
de la generada por un disco individual sin alterar la ratio de
escritura.
Universidad nacional de Trujillo Sede Valle Jequetepeque
27
VENTAJAS DESVENTAJAS
Mayor rendimiento en las lecturas
de datos respecto a un disco
convencional.
Protección de la información en
caso de fallos del disco y/o de la
controladora (en caso de tener
instalada una controladora
duplicada).
Ineficiencia debido a las tareas de
escritura en el disco espejo. Se
“desperdicia” el 50% de la capacidad de
almacenamiento del sistema haciendo
que el coste por megabyte “útil” sea
mayor.
Procedimiento para el cálculo de la
capacidad de RAID 1
En un sistema RAID 1, todos los discos
deben tener la misma capacidad.
La capacidad de almacenamiento en una
configuración RAID de nivel 1 se calcula
multiplicando el número de unidades por la
capacidad del disco y dividiendo por 2, o
C = n*d/2 donde:
C = capacidad disponible
n = número de discos
d = capacidad de disco
Por ejemplo, en una matriz RAID 1 con
cuatro unidades de 1000 GB de capacidad
cada una, la capacidad total de la matriz
sería de 2000 GB: C = (4*1000)/2
Universidad nacional de Trujillo Sede Valle Jequetepeque
28
4.1.3. Raid 2
Este nivel no presenta
ninguna ventaja
relevante sobre RAID 3
y en la actualidad
resulta ser el único nivel
RAID de la
especificación original
que no se utiliza.
Funciona con “striping” de datos a nivel de bit en todos los
discos, dedicando algunos de estos a almacenar
información de verificación y corrección de errores (error
checking and correcting, ECC). Los discos son
sincronizados por la controladora para funcionar al unísono,
generando tasas de trasferencias extremadamente
altas.
VENTAJAS DESVENTAJAS
Buena protección de la
información en caso de fallos del
disco. La tasa de transferencia
de datos puede llegar a ser
extremadamente alta.
Elevado coste. Según el tipo de
configuración requiere un gran número
de discos. La controladora resulta ser
muy específica, compleja y costosa.
Universidad nacional de Trujillo Sede Valle Jequetepeque
29
4.1.4. Raid 3
Es un nivel raramente
utilizado.
Opera con “striping” de
datos a nivel byte y dedica
un disco del “array” para
almacenar la información
de paridad que permitirá reconstruir la información en caso
de fallos.
Toda la información se escribe en paralelo entre los discos
del “array” mejorando el rendimiento del sistema gracias al
incremento en la tasa de transferencia de datos que esta
funcionalidad conlleva. Una matriz RAID 3 tolera la avería
de un único disco sin pérdida de datos. Si un disco físico
falla, los datos del disco averiado pueden reconstruirse en
un disco de recambio.
VENTAJAS DESVENTAJAS
Elevada tasa de transferencia de
datos tanto de lectura como de
escritura con alta disponibilidad
del “array”.
Un disco de paridad dedicado puede
convertirse en un cuello de botella
porque cada cambio en el grupo RAID
requiere un cambio en la información de
paridad. No ofrece solución al fallo
simultáneo de dos discos.
Universidad nacional de Trujillo Sede Valle Jequetepeque
30
Raid 3 + spare:
En RAID 3+repuesto, un disco de la matriz se deja vacío.
Si un disco de la matriz falla, los datos del disco averiado se
reconstruyen automáticamente en el disco de "repuesto" vacío.
Procedimiento de cálculo de la capacidad RAID 3
La capacidad de almacenamiento en una
configuración RAID de nivel 3 se calcula restando
uno al número de unidades y multiplicando por la
capacidad del disco, o C = (n-1)*d
donde:
C = capacidad disponible
n = número de discos
d = capacidad de disco
Por ejemplo, en una matriz RAID 3 con cuatro
unidades de 1000 GB de capacidad cada una, la
capacidad total de la matriz sería de 3.000 GB:
C = (4-1)*1000.
Universidad nacional de Trujillo Sede Valle Jequetepeque
31
4.1.5. Raid 4
Opera con “striping” de
datos a nivel bloque con
un disco de paridad
dedicado (similar a RAID 3
excepto que divide a nivel
de bloque en lugar de a
nivel de bytes). Ante el fallo de uno de los discos del “array”,
podremos, a partir de la información de paridad, reconstruir
en un disco de reserva los datos de la unidad averiada.
RAID 4 puede atender varias peticiones simultáneas de
lectura, siempre que la controladora lo soporte, y también de
escritura, pero en este último caso al residir toda la
Procedimiento de cálculo de la capacidad RAID
3+ Spare
En un sistema RAID 3+repuesto, todos los discos
deben tener la misma capacidad.
La capacidad de almacenamiento en una
configuración RAID 3+repuesto se calcula restando
dos al número de unidades y multiplicando por la
capacidad del disco, o C = (n-2)*d
donde:
C = capacidad disponible
n = número de discos
d = capacidad de disco
Por ejemplo, en una matriz RAID 3+repuesto con
cuatro unidades de 1000 GB de capacidad cada
una, la capacidad total de la matriz sería de 2000
GB: C = (4-2)*1000.
Universidad nacional de Trujillo Sede Valle Jequetepeque
32
información de paridad en un único disco, éste se convertiría
en un cuello de botella para el sistema.
VENTAJAS DESVENTAJAS
Alta disponibilidad del
“array” con elevada tasa
de transferencia de datos.
La controladora requerida es compleja y
por tanto costa. Un disco de paridad
dedicado puede convertirse en un cuello
de botella en escritura.
4.1.5. Raid 5
Por su bajo coste RAID 5
es una de las
implementaciones más
populares. Utiliza
“striping” de datos a nivel
de bloque distribuyendo la
información de paridad entre todos los discos que conforman
el “array”. Esta combinación proporciona un excelente
rendimiento y buena tolerancia a fallos.
La diferencia entre RAID 3 y un RAID 5 es que una
configuración RAID 3 ofrecerá mejor rendimiento a
expensas de una capacidad total ligeramente menor. Los
datos se distribuyen en bandas entre todos los discos y en
cada banda se escribe un bloqueo de paridad (P) para cada
bloque de datos. Si un disco físico falla, los datos del disco
averiado pueden reconstruirse en un disco de recambio. Los
datos no se pierden en caso de avería de un solo disco, pero
si falla un segundo disco antes de que se reconstruyan los
datos en una unidad de repuesto, se perderán todos los
datos de la matriz.
Universidad nacional de Trujillo Sede Valle Jequetepeque
33
VENTAJAS DESVENTAJAS
Proporciona un buen rendimiento
con mínima pérdida de capacidad
de almacenamiento. Aporta un nivel
de redundancia suficiente para ser
considerado tolerante a fallos.
Menores prestaciones que en RAID
No ofrece solución al fallo simultáneo
en dos discos.
Cuando las aplicaciones requieren
muchas escrituras de tamaño inferior
a la división de datos establecida
(stripe), el rendimiento ofrecido por
RAID 5 no es el óptimo.
Procedimiento de cálculo de la capacidad RAID 5
En un sistema RAID 5, todos los discos deben tener
la misma capacidad.
La capacidad de almacenamiento en una
configuración RAID de nivel 5 se calcula restando
uno al número de unidades y multiplicando por la
capacidad del disco, o C = (n-1)*d
donde:
C = capacidad disponible n = número
de discos
d = capacidad de disco
Por ejemplo, en una matriz RAID 5 con cuatro
unidades de 1000 GB de capacidad cada una, la
capacidad total de la matriz sería de 3.000 GB:C = (4-
1)*1000.
Universidad nacional de Trujillo Sede Valle Jequetepeque
34
RAID 5 + Spare
RAID 5+repuesto, es una matriz RAID 5 en la que uno de los discos
se usa como repuesto para reconstruir el sistema en cuanto falle un
disco. Técnicamente un disco de reserva no forma parte del “array”
hasta que uno de los discos falla y se reconstruye la información sobre
él. Se necesitan al menos cuatro discos.
Si un disco físico falla, los datos permanecen disponibles porque se
leen desde los bloques de paridad. Los datos del disco averiado se
reconstruyen en el disco de repuesto de emergencia. Al reemplazar
un disco averiado, éste se convierte en el nuevo disco de repuesto de
emergencia. Los datos no se pierden en caso de avería de un solo
disco, pero si falla un segundo disco antes de que el sistema pueda
reconstruir los datos en la unidad de repuesto, se perderán todos los
datos de la matriz.
Procedimiento de cálculo de la capacidad RAID
5+repuesto
En un sistema RAID 5+repuesto, todos los discos
deben tener la misma capacidad.
La capacidad de almacenamiento en una
configuración RAID 5+repuesto se calcula restando
dos al número de unidades y multiplicando por la
capacidad del disco, o C = (n-2)*d donde:
C = capacidad disponible
n = número de discos
d = capacidad de disco
Por ejemplo, en una matriz RAID 5+repuesto con
cuatro unidades de 1000 GB de capacidad cada una,
la capacidad total de la matriz sería de 2000 GB: C =
(4-2)*1000
Universidad nacional de Trujillo Sede Valle Jequetepeque
35
4.1.6. Raid 6
Dado su coste, existen
pocas
implementaciones
comerciales. Funciona
con “striping” de datos
a nivel de bloque con
doble paridad distribuida entre todos los discos y en una
posición diferente para cada división (stripe), proporcionando
protección ante fallos tanto por averías en discos como en la
reconstrucción de discos.
Si un disco físico falla, los datos del disco averiado pueden
reconstruirse en un disco de recambio. Este modo RAID puede
soportar hasta dos averías de disco sin pérdida de datos.
RAID 6 proporciona una reconstrucción más rápida
de los datos de un disco averiado.
VENTAJAS DESVENTAJAS
Utiliza el equivalente a dos unidades
de disco para funciones de paridad
por lo que el coste por megabyte
“útil” es mayor. Mayor coste que
otros niveles RAID.
Tolerancia a fallos extremadamente
alta. Permite el fallo de hasta dos
discos.
Universidad nacional de Trujillo Sede Valle Jequetepeque
36
4.1.7. RAID 53:
RAID 53 es una
implementación de un
arreglo en bandas
(RAID Nivel 0) cuyos
segmentos están en
arreglos de RAID 3.
Este tipo ofrece un conjunto de bandas en el cual cada banda
es un conjunto de discos RAID-3. Esto propor ciona mejor
rendimiento que el RAID-3, pero a un costo mucho mayor.
VENTAJAS DESVENTAJAS
Alto costo de implementación.
Todos los spindles de los discos deben de
estar sincronizados, lo que limita la
selección de platinas de disco.
La generación de bandas en bytes resulta
en una utilización pobre de la capacidad
formateada.
Misma tolerancia a fallas que RAID 3, así
como la sobrecarga.
Alta tasa de transferencia de datos, gracias a
sus segmentos RAID 3.
Altos niveles de Entrada/Salida para
solicitudes pequeñas, gracias a las bandas
en RAID 0.
4.2. NIVELES RAID ANIDADOS O HÍBRIDOS
Muchas controladoras permiten combinar niveles RAID, es decir, que
un RAID pueda usarse como elemento básico de otro en lugar de
discos físicos. La nomenclatura de los RAID anidados es normalmente
el resultado de la unión de los números correspondientes a los niveles
RAID usados. Por ejemplo, RAID 01 es el resultado de combinar RAID
0 con RAID 1 (en este caso se suele utilizar la nomenclatura RAID 0+1
para evitar confusiones con RAID 1). Conceptualmente consiste en
Universidad nacional de Trujillo Sede Valle Jequetepeque
37
múltiples “arrays” de nivel 0 con un nivel 1 encima que agrupa dichos
niveles 0 (ver imagen más abajo).
Como puede deducirse anidar niveles RAID tiene por objetivo
combinar un determinado nivel RAID que proporcione redundancia
con otro que aumente el rendimiento del sistema, y la prioridad que le
demos a dichas funcionalidades determinará cuál de los dos será el
de mayor nivel.
Los niveles RAID anidados más conocidos son:
RAID 01 (0+1): Un espejo de divisiones (“Stripes”).
RAID 10: Una división de espejos.
RAID 30: Una división de niveles RAID con paridad
dedicada.
RAID 50: Una división de niveles RAID con paridad
distribuida.
RAID 60: Una división de niveles RAID con doble paridad
distribuida.
RAID 100: Una división de una división de espejos.
RAID 101: Un Espejo de espejos
A continuación, se explican el funcionamiento de los dos primeros:
4.2.1. Raid 01:
Primero se crean dos RAID 0 y luego, sobre los anteriores, se crea
un RAID 1 para dotar al “array” de funcionalidad espejo.
La ventaja de un RAID 0+1 es que cuando un disco duro falla, los
datos perdidos pueden ser copiados del otro conjunto de nivel 0.
Variantes de este nivel anidado con mayor tolerancia a fallos son
RAID 0+1+5 y RAID 0+1+6.
Universidad nacional de Trujillo Sede Valle Jequetepeque
38
4.2.2. Raid 10
Primero se crea un espejo RAID 1 y luego, sobre los anteriores, se
establece un RAID 0. El resultado es un “array” dotado de redundancia
con una mejora de rendimiento al no precisar escritura de paridad.
Para que no se pierdan datos cada RAID 1 deberá mantener al menos
uno de sus discos sin fallos.
4.2.3. Raid 30:
Es una combinación de un RAID 3 y un RAID 0. El RAID 30
proporciona tasas de transferencia elevadas combinadas con una alta
fiabilidad a cambio de un coste de implementación muy alto. La mejor
forma de construir un RAID 30 es combinar dos conjuntos RAID 3 con
los datos divididos en ambos conjuntos. El RAID 30 trocea los datos
en bloques más pequeños y los almacena en cada conjunto RAID 3,
que a su vez lo divide en trozos aún menores, calcula la paridad
aplicando un XOR a cada uno y los escriben en todos los discos del
conjunto salvo en uno, donde se almacena la información de paridad.
El tamaño de cada bloque se decide en el momento de construir el
RAID.
Universidad nacional de Trujillo Sede Valle Jequetepeque
39
4.2.4. Raid 50
Combina la división a nivel de bloques de un RAID 0 con la paridad
distribuida de un RAID 5, siendo pues un conjunto RAID 0 dividido de
elementos RAID 5.
El RAID 50 mejora el rendimiento del RAID 5, especialmente en
escritura, y proporciona mejor tolerancia a fallos que un nivel RAID
único. Este nivel se recomienda para aplicaciones que necesitan gran
tolerancia a fallos, capacidad y rendimiento de búsqueda aleatoria.
4.2.5. Raid 60
RAID 60 se corresponde con RAID 6 combinado con RAID 0. Se trata
de una tecnología que almacena sus datos en varios discos al mismo
tiempo y evita la pérdida física de sus datos, lo que permite el tiempo
más que suficiente para intervenir de manera preventiva y sin
interrumpir el servicio.
Universidad nacional de Trujillo Sede Valle Jequetepeque
40
4.2.6. Raid 100
A veces llamado también RAID 10+0, es una división de conjuntos
RAID 10. El RAID 100 es un ejemplo de RAID cuadriculado, un RAID
en el que conjuntos divididos son a su vez divididos conjuntamente de
nuevo.
Todos los discos menos unos podrían fallar en cada RAID 1 sin perder
datos. Sin embargo, el disco restante de un RAID 1 se convierte así
en un punto único de fallo para el conjunto degradado. A menudo el
nivel superior de división se hace por software.
4.2.7. Raid 101
Los principales beneficios de un RAID 100 (y de los RAIDS
cuadriculados en general) sobre un único nivel RAID son mejor
rendimiento para lecturas aleatorias y la mitigación de los puntos
calientes de riesgo en el conjunto. Por estas razones, el RAID 100 es
a menudo la mejor elección para bases de datos muy grandes, donde
el conjunto software subyacente limita la cantidad de discos físicos
permitidos en cada conjunto estándar. Implementar niveles RAID
anidados permite eliminar virtualmente el límite de unidades físicas en
un único volumen lógico.
Es un reflejo de dos RAID 10. Se utiliza en la llamada Network RAID
que aceptan algunas redes de datos. Es un sistema de alta
disponibilidad por red, lo que permite la replicación de datos entre
Universidad nacional de Trujillo Sede Valle Jequetepeque
41
nodos a nivel de RAID, con lo cual se simplifica ampliamente la gestión
de replicación de redes. El RAID 10+1, tratándose de espejos de
RAID10 que tienen una gran velocidad de acceso, hace que el
rendimiento sea muy aceptable.
Universidad nacional de Trujillo Sede Valle Jequetepeque
42
4.3. COMPARACION DE LOS PRINCIPLAES NIVELES RAID
N = Cantidad de dispositivos en el grupo de almacenamiento
r = % de error estimado por cada dispositivo del grupo de almacenamiento.
Nivel Tasa de Fallas
(fail rate)
Posibles Aplicaciones
Raid 0 1-(1-r)N Almacenamiento de archivos grandes
que no requieren redundancia en tiempo
real.
Raid 1 rN Bases de datos y archivos de bajo
contenido dinámico (poca capacidad)
Raid 4 N(N-1)r2 Bases de datos, servidores de archivos,
correo electrónico, contenido.
Raid 5 N(N-1)r2 Base de datos, servidores de archivos,
correo electrónico, contenido.
Raid 6 N(N-1)(n-2)r3 Base de datos, servidores de archivos,
correo electrónico, contenido (mayor
tolerancia a fallas que RAID 5)
Universidad nacional de Trujillo Sede Valle Jequetepeque
43
Nivel Tipo Dispositi
vos
Redundan
cia
Capacidad Rendimient
o
(lectura)
Rendimient
o
(escritura)
Raid 0 Striping
(block level)
N>1 0 1 N N
Raid 1 Mirroring N>2 N-1 1/N
N 1
Raid 4 Striping
(block level)
Parity(dedicated)
N>2 1 1-1/N N-1 N-1
Raid 5 Striping
(block level)
Parity(distributed)
N>2 1 1-1/N N-1 N-1
Raid 6 Striping
(block level)
Double
Parity(distributed)
N>3 2 1-2/N N-2 N-2
5. QUE NIVEL RAID UTILIZAR
El nivel RAID determina la tolerancia a fallos proporcionada por el sistema, el
rendimiento en cuanto a tasa de transferencia de datos, y por último la forma de
distribución de datos entre los discos que conforman el “array”.
El nivel adecuado de RAID a utilizar depende de básicamente de dos factores:
Las aplicaciones que vayamos a utilizar.
La inversión que estemos dispuestos a realizar.
Cada aplicación presenta unos requerimientos concretos en cuanto a
rendimiento y tolerancia a fallos. En función de la importancia que tenga cada
uno de estos podremos determinar el nivel RAID más idóneo.
Sea cual sea nuestra situación de forma generalista podemos decir que:
Universidad nacional de Trujillo Sede Valle Jequetepeque
44
RAID 0: Presenta la más alta tasa de transferencia, pero sin tolerancia a
fallos. Resulta especialmente apropiado para aplicaciones que requieran
operaciones secuenciales con ficheros de gran tamaño donde el
rendimiento sea más importante que la seguridad de los datos (p.ej.
servidores de BBDD, vídeo, imágenes, CAD/CAM, …).
RAID 1: Resulta más lento que un disco individual si bien aporta
redundancia total. Está diseñado para entornos donde el rendimiento de
lectura o la disponibilidad de la información han de ser altos, y donde la
recuperación de datos no es asumible o resulta muy costosa. RAID 1 es
una excelente elección cuando la seguridad es más importante que la
velocidad. (p.ej. aplicaciones financieras o de gestión, …).
RAID 2: Es adecuado para aplicaciones que demanden una altísima tasa
de transferencia de datos, no siendo la opción idónea para aquellas que
precisen una elevada tasa de I/O (no existen implementaciones
comerciales de este nivel de RAID).
RAID 3: Es útil para las personas que necesitan rendimiento y un acceso
constante a sus datos, como editores de vídeo. No se recomienda RAID
3 para uso intensivo con archivos no secuenciales porque el
rendimiento det lectura aleatoria se ve obstaculizado por la paridad
de discos. RAID 3 Especialmente indicado para sistemas mono-usuario y
aplicaciones que requieran transferencia de archivos de datos de un gran
tamaño (vídeo, imágenes, data warehouse). En la actualidad raramente
se utiliza.
RAID 4: Idóneo para almacenar fichero de gran tamaño (p.ej. aplicaciones
gráficas). RAID 5: Es útil para el archivo y para las personas que necesitan
rendimiento y un acceso constante a sus datos, siendo recomendable
para entornos de procesamiento de transacciones donde el nivel de
entrada/salida y de lectura/escritura resultan intensos (p.ej. video
vigilancia, servidor de aplicaciones y/o archivo para empresas).
Universidad nacional de Trujillo Sede Valle Jequetepeque
45
RAID 6: Diseñado para entornos donde la disponibilidad de la información
es extremadamente crítica y prevalece sobre cualquier otro aspecto. Es
decir, es útil para personas que necesitan auténtica seguridad con menos
énfasis en el rendimiento. Es similar a RAID 5 pero con mayor nivel de
tolerancia a fallos (p.ej. cualquier aplicación de las denominadas “de
misión crítica”).
RAID 10: Pensado para entornos que requieran alto rendimiento y
tolerancia a fallos (p.ej. servidores de bases de datos).
RAID 50: Presenta una mayor tolerancia a fallos que RAID 5 a la vez que
mantiene la tasa de transferencia de éste (p.ej. aplicaciones “de misión
crítica” con alto requerimiento y tolerancia a fallos).
RAID 60: Aporta un rendimiento de RAID 6 pero con mayor tolerancia a
fallos. En términos de rendimiento global resulta ligeramente inferior a
RAID 50 siendo este hecho despreciable cuando lo prioritario es la
seguridad y protección de los datos (p.ej. cualquier aplicación que
requiera máxima tolerancia a fallos).
6. VENTAJAS DE LA ARQUITECTURA RAID
Un disco duro se caracteriza entre otros parámetros por su MTBF (Mean Time
Between Failure o tiempo medio entre fallos) cuya importancia no sólo radica en
su valor sino también en su significado. EL MTBF nos avisa que sean cuales
sean los discos que utilicemos éstos pueden eventualmente dejar de funcionar,
ocasionando pérdidas de datos o imposibilitando el acceso a la información por
parte de los usuarios.
Además de resolver el problema citado anteriormente, un sistema de
almacenamiento basado en arquitectura RAID ofrece cuatro ventajas principales:
Mayor fiabilidad que los discos individuales por tratarse de una
arquitectura tolerante a fallos con soporte de elementos redundantes.
Mayor rendimiento y tasa de transferencia de datos que los discos
individuales como resultado de las operaciones de lecturas/escritura
simultánea realizada sobre múltiple disco en paralelo.
Universidad nacional de Trujillo Sede Valle Jequetepeque
46
Mayor capacidad de almacenamiento que los discos individuales. Un
“array” de disco RAID puede verse como un disco lógico formado por la
suma de los discos individuales que lo conforman, por lo que, en la
mayoría de las configuraciones, la capacidad total será superior.
Mayor integridad. Ante un error en los datos almacenados en alguno de
los discos del “array” (corrupción de datos, error de grabación,) la
información de paridad generada por los sistemas RAID permitirá
reconstruir los datos perdidos manteniendo así la integridad de la
información.
Considerando las ventajas anteriormente expuestas resulta sencillo deducir los
dos grandes beneficios que conducen a la implementación de una arquitectura
RAID; mejora el tiempo de funcionamiento sin fallo (uptime) del sistema de
almacenamiento y mejora del rendimiento de las aplicaciones. El primero se basa
en funcionalidades de tolerancia a fallos que permiten reconstruir los datos de
un disco dañado sobre otro que opera en modo reserva, sin que ello suponga
interrumpir el servicio de acceso a la información para los usuarios. Por su parte
la mejora en el rendimiento de algunas aplicaciones (pero no necesariamente en
todas) se fundamenta en la capacidad de lectura simultánea de datos en varios
discos, lo que supone un incremento de la tasa de transferencia del sistema. Las
aplicaciones que trabajan con grandes archivos (vídeo, imágenes, backups,
base de datos multiusuarios,) se verán beneficiadas por esta característica.