Configuración de unidad recomendada para un server Web

¿Cuál es la configuration típica de la unidad del server web? Normalmente tendré una unidad para el sistema operativo y una unidad de datos. La unidad de datos suele ser un RAID 5, pero no puedo recordar lo que solía recomendar para la unidad del sistema operativo. ¿RAID 1 es ideal para eso?

7 Solutions collect form web for “Configuración de unidad recomendada para un server Web”

Trabajo para una gran empresa de alojamiento, y lo más común que veo en mi segmento de empresa (no necesariamente que recomiendo, pero lo que veo), suponiendo que el server es independiente / utilizando el almacenamiento local, es una matriz RAID 1 OS, y una matriz de datos RAID5.

Ahora, a medida que los discos duros se hacen más grandes, RAID 5 se vuelve less ideal, ya que su probabilidad de golpear un URE durante una reconstrucción de una sola unidad es bastante alta.

Pero dado que pareces estar preguntando específicamente sobre la unidad del sistema operativo, sí, el RAID 1 es estándar y suele ser suficiente, a less que vayas a ejecutar otras aplicaciones fuera de esa unidad.

Opero un Datacenter y soy el CTO para una operación de alojamiento de buen tamaño. PRESTAMOS FUERTE A NOSOTROS NUNCA USAR RAID 5.

UTILICE UNA BUENA SAN DONDE SEA POSIBLE


RAID5 utiliza SOLO UNA unidad de paridad por raya y muchas matrices RAID5 son 5 (si sus counts son diferentes, ajusta los cálculos apropiadamente) unidades (4 datos y 1 paridad aunque no es una sola unidad que mantiene toda la paridad como en RAID 3 & 4, pero sigue leyendo).

RAID 5 ES DESPERDICIONAL, PERO TAMBIÉN ES RAID 10 y 1: Si tiene 10 unidades o 20GB cada una para 200GB RAID5 utilizará un 20% para la paridad (asumiendo que lo configura como dos matrices de 5 unidades) para que tenga 160 GB de almacenamiento.

Ahora, ya que RAID10, al igual que mirroring (RAID1), utiliza 1 (o más) unidad de espejo para cada unidad primaria que está utilizando el 50% de networkingundancia para get el mismo 160GB de almacenamiento que necesitará 8 pares o unidades de 16 – 20GB, que es por qué RAID5 es tan popular. Esta introducción es sólo para poner las cosas en perspectiva.

RAID5 es físicamente un set de bandas como RAID0 pero con recuperación de datos incluidos. RAID5 reserva un bloque de disco de cada bloque de bandas para los datos de paridad. El bloque de paridad contiene un código de corrección de errores que puede corregir cualquier error en el bloque RAID5, en efecto se utiliza en combinación con los bloques de datos restantes para recrear cualquier bloque faltante que falte porque ha fallado una unidad. La innovación de RAID5 sobre RAID3 y RAID4 es que la paridad se distribuye sobre una base de round robin para que pueda haber una lectura independiente de los diferentes bloques de las varias unidades. Esta es la razón por la que RAID5 se hizo más popular que RAID3 y RAID4, que debe leer de forma simbólica el mismo bloque de todas las unidades juntas. Por lo tanto, si Drive2 falla los bloques 1,2,4,5,6 y 7 son bloques de datos en esta unidad y los bloques 3 y 8 son bloques de paridad en esta unidad. Esto significa que la paridad en Drive5 se utilizará para recrear el bloque de datos de Disk2 si se solicita el bloque 1 antes de que una nueva unidad sustituya a Drive2 o durante la reconstrucción de la nueva sustitución de Drive2. Del mismo modo, la paridad en Drive1 se utilizará para reparar el bloque 2 y la paridad en Drive3 reparará el bloque4, etc. Para el bloque 2 todos los datos estarán seguros en las unidades restantes, pero durante la reconstrucción del reemploop de Drive2 se calculará un nuevo bloque de paridad a partir de los datos del bloque 2 y se escribirá en el Drive 2.

RAID 5 READ-WRITE-PENALTY: Ahora, cuando se lee un bloque de disco de la matriz, el software / firmware RAID calcula qué bloque RAID contiene el bloque de disco, qué unidad está bloqueada y qué unidad contiene el bloque de paridad para ese RAID bloquea y lee SÓLO la unidad de datos. Devuelve el bloque de datos. Si posteriormente modifica el bloque de datos, recalcula la paridad restando el bloque antiguo y añadiendo la nueva versión, luego en dos operaciones separadas escribe el bloque de datos seguido por el nuevo bloque de paridad. Para ello, primero debe leer el bloque de paridad de cualquier unidad que contenga la paridad para ese bloque de rayas y releer los datos no modificados para el bloque actualizado de la unidad original. Esta lectura-lectura-escritura-escritura se conoce como la pena de escritura RAID5 ya que estas dos escrituras son secuenciales y síncronas la llamada al sistema de escritura no puede volver hasta la lectura y ambas escrituras completas, por security, por lo que la escritura a RAID5 es hasta 50% que RAID0 para una matriz de la misma capacidad. (Algunos RAID5 de software evitan volver a leer manteniendo una copy sin modificar del bloque original en memory).

RAID10 es una de las combinaciones de RAID1 (mirroring) y RAID0 (striping) que son posibles. Solía ​​haber confusión acerca de lo que significaban RAID01 o RAID10 y los diferentes vendedores RAID los definían de manera diferente. Hace aproximadamente cinco años, propuse el siguiente lenguaje estándar que parece haber tomado fuerza. Cuando N pares reflejados son rayados juntos esto se llama RAID10 porque el reflection (RAID1) se aplica antes de rayar (RAID0). La otra opción es crear dos sets de rayas y reflejarlos uno a otro, esto se conoce como RAID01 (porque el RAID0 se aplica primero). En un sistema RAID01 o RAID10 cada bloque de disco se duplica por completo en el espejo de su unidad. En cuanto a los resultados, tanto RAID01 como RAID10 son funcionalmente equivalentes. La diferencia entra en la recuperación donde RAID01 sufre de algunos de los mismos problemas que describiré afectando a RAID5 mientras RAID10 no.

Ahora si una unidad en la matriz RAID5 muere, se elimina o se interrumpe, los datos se devuelven leyendo los bloques de las unidades restantes y calculando los datos perdidos usando la paridad, asumiendo que la unidad difunta no es la unidad de bloque de paridad para ese RAID bloquear. Tenga en count que se necesitan 4 lecturas físicas para replace el bloque de disco faltante (para una matriz de 5 unidades) por cuatro de cada cinco bloques de disco, lo que conduce a una degradación del performance del 64% hasta que se detecta el problema y se puede asignar una nueva unidad para comenzar recuperación. El performance se degrada aún más durante la recuperación porque se está activamente accediendo a todas las unidades para rebuild la unidad de reemploop (consulte a continuación).

Si una unidad en la matriz RAID10 muere, los datos se devuelven desde su unidad de espejo en una sola lectura con sólo menor (6.25% en promedio para una matriz de 4 pares en su set) networkingucción de performance cuando se necesitan dos bloques no contiguos del par dañado (ya que los dos bloques no se pueden leer en paralelo desde ambas unidades) y ninguna en caso contrario.

Uno comienza a darse count de lo que está pasando y por qué no me gusta RAID5, pero, como dicen en la noche de la noche info-comerciales, hay más.

Lo que está mal, además de un poco de performance No sé que me estoy perdiendo?

OK, por lo que nos lleva a la última pregunta del día que es: ¿Cuál es el problema con RAID5? Recupera un disco duro fallido? Así que las escrituras son más lentas, no hago suficiente escribir para preocuparme por ello y la caching ayuda mucho también, ¡tengo MUCHOS caching! El problema es que a pesar de la fiabilidad mejorada de las unidades modernas y de los códigos mejorados de corrección de errores en la mayoría de las unidades, e incluso a pesar de los 8 bytes adicionales de corrección de errores que EMC pone en cada bloque de disco de unidad Clariion (si tienes la suerte de usar sistemas EMC ), es más que un poco posible que una unidad se convertirá en escamosa y comenzar a devolver la basura. Esto se conoce como falla parcial del medio. Ahora los controlleres SCSI reservan varios cientos de bloques de disco para ser reasignados para replace los sectores de desvanecimiento con los que no se usan, pero si la unidad está funcionando estos no durarán mucho y se agotarán y SCSI NO reportará errores corregibles al sistema operativo. Por lo tanto, no sabrá que la unidad se está volviendo inestable hasta que es demasiado tarde y no hay más sectores de sustitución y la unidad empieza a devolver la basura. [Observe que las unidades IDE / ATA recientemente populares (TMK) no incluyen la reasignación del sector defectuoso en su hardware para que se devuelva la basura mucho más pronto.] Cuando una unidad devuelve la basura, ya que RAID5 no evalúa la paridad al leer (RAID3 y RAID4 hacer BTW y ambos funcionan mejor para las bases de datos que RAID5 para arrancar) cuando se escribe la parrilla de la basura del sector de basura se calculará y su integridad RAID5 se pierde! Del mismo modo si una unidad falla y una de las unidades restantes es escamosa el reemploop será reconstruido con basura también propagar el problema a dos bloques en lugar de sólo uno.

¿Necesitar más? Durante la recuperación, el performance de lectura de una matriz RAID5 se degrada en un 80%. Algunas matrices avanzadas le permiten configurar la preference más hacia la recuperación o hacia el performance. Sin embargo, al hacerlo boostá el time de recuperación y boostá la probabilidad de perder una segunda unidad en la matriz antes de que se complete la recuperación, lo que resulta en una pérdida de datos catastrófica. RAID10 por otro lado sólo se recuperará una unidad de 4 o más pares con el performance sólo de lecturas de la recuperación par degradado haciendo que el performance golpeó a la matriz en general, sólo alnetworkingedor del 20%! Además no hay time de cálculo de paridad utilizado durante la recuperación, es una copy de datos recta.

¿Qué pasa con esa cosa sobre perder una segunda unidad? Bueno, con RAID10 no hay peligro a less que el espejo que se está recuperando también falla y que es 80% o less less probable que cualquier otra unidad en una matriz RAID5 fallará! Y puesto que la mayoría de los fallos múltiples de la impulsión son causados ​​por defectos de fabricación no detectados usted puede hacer incluso esta posibilidad vanishingly pequeña cerciorándose de reflejar cada impulsión con uno del número de la porción del fabricante diferente. ("Oh", dices, "este schenario no parece probable!" Pooh, perdimos 50 unidades durante dos semanas cuando un lote de 200 unidades de IBM comenzó a fallar.La IBM descubrió que el único lote de unidades tendría sus rodamientos de husillo congelación después de tantas horas de operación.Afortunadamente debido en parte a RAID10 y en parte a un esfuerzo hercúleo de DG Techs y nuestra propia gente durante 2 semanas ningún dato se perdió.Sin embargo, un sistema de files RAID5 fue una pérdida total después de una segunda unidad falló Afortunadamente todo estaba en cinta.

¿Conclusión? Por security y performance favorecen primero RAID10, RAID3 segundo, RAID4 tercero y RAID5 último! El motivo original de las especificaciones de RAID2-5 era que el alto costo de los discos hacía RAID1, reflejando, no era práctico. ¡Ese ya no es el caso! Las unidades son precios de los productos básicos, incluso los más grandes impulsiones más rápidas son más baratos en dólares absolutos que las unidades eran entonces y el costo por MB es una pequeña fracción de lo que era. ¿Tiene RAID5 algún sentido? Obviamente no lo creo.

Para poner las cosas en perspectiva: Si una unidad cuesta $ 1000US (y la mayoría son mucho less costosos que eso), a continuación, el cambio de una matriz RAID10 de 4 pares a una matriz RAID5 de 5 unidades ahorrará 3 unidades o $ 3000US. ¿Cuál es el costo de las horas extras, el desgaste de los técnicos, DBAs, gerentes y clientes, incluso de un susto de recuperación? ¿Cuál es el costo de un performance networkingucido y posiblemente una networkingucción de la satisfacción del cliente? Finalmente, ¿cuál es el costo del negocio perdido si los datos son irrecuperables?

Copiado desde el website de BAARF – pero vale la pena anotarlo con security.

Utilice RAID 10 siempre que sea posible – pase en el disco extra.

Asumiendo que las aplicaciones no se ejecutan desde él y es sólo alojamiento de los files del sistema operativo, un RAID 1 debe ser perfectamente adecuado.

Si está ejecutando aplicaciones adicionales en el volumen del sistema operativo, tendrá que tener en count la carga.

Para nuestros serveres ejecutamos el SO en C: (RAID 1), Aplicaciones en D: (RAID 1) y Logs / Data en E: (RAID 1). Si hay algo que necesita tener networkingudencia entonces va a una unidad de SAN.

Si la velocidad y la confiabilidad son importantes, RAID0 + 1 debe dar el mejor performance (sin paridad para calcular) con hasta dos supervivencia de falla de unidad. Pero no todos los controlleres lo soportan.

¡Depende! Si se trata de un website simple y estático, entonces un par de discos RAID 1 deberían estar bien, ya que presumiblemente el contenido del disco terminaría en caching en la RAM de todos modos.

Si se trata de un complejo de database impulsado por el website, entonces todavía tengo un par de RAID 1 para el sistema operativo (que es lo que realmente le preguntamos), pero tienen una configuration de disco diferente para los datos (base).

Una configuration típica de almacenamiento de serveres web en mi organización se ve así.

Sistema Operativo = Raid 1
Registros = Raid 1 o Raid 10
Data = Raid 5 o Raid 10 (El tipo de matriz aquí todo depende de los requisitos de performance.)

Espero que eso ayude.

  • Cualquier forma de acelerar mi website en otros países?
  • Cómo configurar un server web para ejecutar inline ruby?
  • Cambio de puerto de nginx
  • Cómo solucionar el error Apache2 "(32) Broken pipe: core_output_filter: escribir datos en la networking"
  • Fresh Ubuntu 16.04 La configuration de Nginx sirve files antiguos estáticos
  • Apache usando la versión incorrecta de PHP
  • Apache VirtualHost: Mover de un sitio a "server único, 2 sitios"
  • nginx y site.erb: tag como usuarios internos para dos dominios diferentes y dos sets diferentes de IPs
  • ¿Cómo distingue el server web entre los diferentes nombres DNS?
  • ¿Diferencia entre las directivas AddType y AddHandler de Apache?
  • Configuración de networking para varios invitados de vbox que sirven a través de un IP público
  • Permitir SFTP a una sola carpeta que no esté en el directory principal
  • Apache no responde mientras el server está en línea
  • El linux y los temas del servidor de Windows, como ubuntu, centos, apache, nginx, debian y consejos de red.