jueves, 28 de abril de 2011

Discos RAID

En primer lugar vamos a definir que es un disco raid y como funciona

Qué es RAID:

RAID es la sigla para Redundant Array of Independent Disks. Su definición en español sería "Matriz
Redundante de Discos Independientes". Se trata de una tecnología que combina varios discos rígidos
(HD) para formar una única unidad lógica, donde los mismos datos son almacenados en todos los
discos (redundancia). En otras palabras, es un conjunto de discos rígidos que funcionan como si
fueran uno solo. Eso permite tener una tolerancia alta contra fallas, pues si un disco tiene problemas,
los demás continúan funcionando, teniendo el usuario los datos a su disposición como si nada pasara.
Para conformar el RAID, es preciso utilizar por lo menos 2 discos rígidos. El sistema operativo, en este
caso, mezclará los discos como una única unidad lógica. Cuando se graban datos, los mismos se
reparten entre los discos del RAID (dependiendo del nivel). Con eso, además de garantizar la
disponibilidad de los datos en caso de fallo de un disco, es posible también equilibrar el acceso a la
información, de forma que no haya "cuellos de botella".

http://publiespe.espe.edu.ec/articulos/sistemas/raid/raid.htm

¿Por qué es útil RAID en servidores?

Debido a que estos discos están hechos para soportar operaciones críticas, donde no se pueden
perder datos o que ocurran fallas en servicios on-line. Para empresas o profesionales, la pérdida de
información puede significar grandes perjuicios. La tecnología RAID, ya consolidada y usada hace
algunos años, es una forma muy eficiente de proteger información y, en el caso de empresas,
garantizar la permanencia de su negocio.

¿Cuál es la diferencia de implementar RAID por hardware o por software?

RAID por hardware Ventajas y desventajas
Ventajas:
Más rápido: la tarjeta controladora es la que atiende y hace las operaciones en los discos, no el
sistema operativo. Fácil de configurar: mediante la consola de configuración RAID de la controladora.
En caso de error de un disco, se extrae dicho disco y se inserta uno nuevo. La tarjeta controladora se
encarga del proceso de réplica. 

Desventajas:
Elevado precio.
Añaden un punto de fallo más al sistema: la controladora.
RAID por software Ventajas y desventajas
Ventajas:
Más barato de implementar.
Mucho más flexible: se pueden construir RAID de particiones en lugar de discos completos y agrupar
en un mismo RAID discos conectados en varias controladoras.
Desventajas:
Más lento. Consumirá recursos del procesador para mantener el RAID, especialmente si se trata de un
servidor que realiza muchas operaciones de E/S.

¿Cuál es la función de una controladora RAID?

Los módulos de la controladora RAID proporcionan alto rendimiento, configuración avanzada de discos
virtuales y administración del subsistema de discos tolerante a fallos. Cada módulo de la controladora
RAID contiene 2 GB de caché que se duplica con la caché de las otras controladoras para una alta
disponibilidad y que se protege mediante un mecanismo de descarga de caché alimentado por la
batería. Los módulos de la controladora RAID proporcionan la siguiente ruta de datos y las siguientes
funciones de administración de gabinetes: Supervisión y control de los elementos del entorno del
alojamiento (temperatura, ventiladores, suministros de energía e indicadores LED del alojamiento)
Control del acceso a los discos físicos Comunicación de los atributos y estados de los gabinetes al
servidor host y la estación de administración Cada módulo de la controladora RAID tiene varios
puertos de entrada SCSI para acceder al host. Los puertos proporcionan conexiones de host
redundantes y admiten un entorno de almacenamiento de alta disponibilidad.

Niveles de discos RAID

El RAID 0 (DISK STRIPPING), esta técnica
tiene bandeado paro no tiene redundancia de datos. Ofrece el mejor rendimiento pero no tolerancia a
los fallos. Consiste en dividir la información entre los discos que forman el RAID. La capacidad total del
RAID será por tanto la suma de las capacidades de cada disco. Esta solución no proporciona ningún
tipo de redundancia, por lo que si un disco falla perderemos todos los datos almacenados. Con RAID 0
se consigue un alto rendimiento al trabajar en paralelo con todos los discos del RAID.





El RAID 1 (DISK MIRRORING), consiste en asociar a cada disco primario del RAID un segundo disco
espejo, en el que se duplica la información. Si el disco primario falla el espejo continúa trabajando.
Una vez sustituido el disco averiado, los datos se reconstruyen al 100%. En escritura se pierden
prestaciones, al tener que escribir la misma información simultáneamente en dos discos. Por ello, en
ocasiones, se utiliza la duplicación de controladoras del disco además de la duplicación de los discos.
A este recurso se le denomina DUPLEXING.







El RAID 2, este tipo usa bandeado en todos los discos, con algunos de estos dedicados a almacenar
información de verificación y corrección de errores (error checking and correcting, ECC). No tiene
ninguna ventaja sobre el RAID-3.

El RAID 3, (PARALLEL DATA ACCES), sirve para disponer de redundancia sin tener que recurrir al
mirroring. En el RAID 3 se utilizan X discos de datos y un disco adicional dedicado a la paridad. Los
datos son divididos en bytes y cada byte se escribe en uno de los X discos de datos. Aplicando un
determinado algoritmo se genera el byte de paridad, que se escribe en el disco de paridad. Toda la
información se escribe en los discos de forma paralela. De este modo, la velocidad de transferencia del
RAID equivale a la velocidad de transferencia de un disco multiplicada por X. Sin embargo, solo se
puede gestionar un E/S a la vez. La recuperación de datos se consigue calculando el O exclusivo
(XOR) de la información registrada en los otros discos.






El RAID 4, este tipo usa grandes bandas, lo cual significa que podemos leer registros de cualquier
disco individual. Esto nos permite aprovechar la E/S traslapada para las operaciones de lectura. Dado
que todas las operaciones de escritura tienen que actualizar el disco de paridad, no es posible la
superposición E/S para ellas. El RAID-4 no ofrece ninguna ventaja sobre el RAID-5.

El RAID 5, (INDEPENDENT DATA ACCESS), difiere del RAID 3 en que la información se divide en
bloques en vez de en bytes. Debido a ello las lecturas pueden ser independientes, mejorando por tanto
el número de transacciones E/S que puede gestionar el RAID de forma simultánea. La otra gran
diferencia con el RAID 3 radica en el hecho de que la información de la paridad se reparte entre todos
los discos de forma ROTATORIA, aliviando así el cuello de botella que se forma en operaciones
simultáneas de E/S. Esto ocurre, en concreto, gracias a que solo se debe leer la paridad de un único
disco, como es el caso del RAID 3. Con lo que resuelve las limitaciones de escritura en RAID-4. Así,
todas las operaciones de lectura y escritura pueden superponerse. Este nivel RAID es recomendable
para aplicaciones que trabajen con ficheros pequeños pero con un gran número de transacciones E/S,
como es el caso de las bases de datos relacionales o las aplicaciones de gestión.
Aplicaciones: Servidores de archivos y aplicaciones, Servidores de Base de Datos, Servidores www,
correo, noticias, Servidores de Intranet.





El RAID 6, este tipo es similar al RAID-5, pero incluye un segundo esquema de paridad distribuido por
los distintos discos y por tanto ofrece tolerancia extremadamente alta a los fallos y las caídas de disco.
Hay pocos ejemplos comerciales en la actualidad. Posee un diseño muy complejo, un rendimiento
pobre y se necesitan N+2 discos

El RAID 7, este tipo incluye un sistema operativo incrustado de tiempo real como controlador, haciendo
las operaciones de caché a través de un bus de alta velocidad y otras características de un ordenador
sencillo. Todas las transferencias son asincronas. Y las E/S están centralizadas por la caché. Se
necesita un disco de paridad exclusivo. El agente SNMP permite su administración remota. Un
vendedor ofrece este sistema.
Aplicaciones: Sistemas de Tiempo Real (Industriales).


El RAID 10, este tipo ofrece un conjunto de bandas en el que cada banda es un grupo de discos RAID-
1. Esto proporciona mejor rendimiento que el RAID-1, pero a un costo mucho mayor.
Aplicaciones: Servidores de Bases de Datos con alto rendimiento y tolerancia a fallos.

El RAID 53, este tipo ofrece un conjunto de bandas en el cual cada banda es un conjunto de discos
RAID-3. Esto proporciona mejor rendimiento que el RAID-3, pero a un costo mucho mayor.
El RAID 0+1 (STRIPPING + MIRRORING), consiste en la duplicación de los datos en diferentes
conjuntos de discos, para un posterior stripping dentro de cada uno de dichos conjuntos. Este nivel
está indicado para aplicaciones que necesiten altas prestaciones y un alto nivel de seguridad.
Aplicaciones: Aplicaciones de Imagen, Servidores de archivos generales

Fuente:
http://www.serman.com/recuperacion_de_datos/raid.php

Conclusiones:
Podemos concluir entonces con esta entrada que los discos RAID son una solución como su nombre lo indica para grandes y medianas empresas ya que con ellos vamos a tener tolerancia a a cualquier tipo de fallos, esto quiere decir que habra muy pocas probabilidadaes que los servidores de dicha empresa queda offline gracias a que el sistemas de redundancia nos va a permitir que en caso de que falle uno de los volumenes la informacion que hay contenida en ellos no soportara perdidas ya que inmediatamente sera soportada por los demas discos esto es muy importante ya que en caso de perdida de datos en la empresa sin tener implementada esta solucion seria nefasto para los intereses de la misma por cuanto aqui estan contenidos todos los activos de la empresa en cuanto a informacion se refiere.





No hay comentarios:

Publicar un comentario

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Grants For Single Moms