¿Cómo administrar un orden global de inicio de VM en todo el centro de datos?

Suponga que tiene una infraestructura VMware completamente virtualizada: ESXi, vCenter, vMotion, HA, DRS, todo el paquete.

En su interior, usted tiene un montón de máquinas virtuales, que en cualquier momento puede residir en un host u otro (que es todo el punto de la agrupación, ¿no?).

Experimenta una pérdida de energía y, de una u otra manera, logra cerrar con gracia todas las máquinas virtuales y todos los hosts; No vamos a profundizar en esto por ahora, vamos a suponer que su software de UPS puede manejarlo. O, por lo menos, supongamos que el apagado no fue tan elegante, pero todo es capaz de volver a subir una vez que la energía se restaura.

La energía vuelve, y sus anfitriones reinician.

Su entorno es bastante complejo y tiene dependencias naturales entre las máquinas virtuales: los controladores de dominio deben comenzar primero, un servidor de aplicaciones no puede iniciarse a menos que su servidor de back-end DB ya esté funcionando y así sucesivamente.

Todos sabemos (o deberíamos saber) cómo configurar el arranque automático de máquinas virtuales y cómo especificar un pedido de inicio y un retraso de VM en un único host ESX / i.

¿Pero cómo hacer esto a través de un datacenter entero?

¿Hay alguna manera de decir a vSphere "iniciar estas máquinas virtuales en este orden global, independientemente del host físico en el que se estén ejecutando"?

Puntos de bonificación: si vCenter se está ejecutando en una máquina virtual, ¿cómo cambia esto las cosas?

Parece que no hay una manera limpia de gestionar completamente un arranque en frío de una infraestructura virtual una vez que HA está configurado en los hosts individuales. Habilitar HA y DRS parece desactivar las opciones de inicio y apagado de máquina virtual en los servidores host. Sin embargo, cualquier conjunto de pedidos antes de que el host se mueva al clúster parece que se pega. Si el número de hosts es pequeño o manejable, es posible establecer la prioridad de inicio en el cliente vSphere conectándose a los hosts individualmente. Ponga sus reglas allí. Esto realmente funciona en la situación que usted describe.

Introduzca aquí la descripción de la imagen

El almacenamiento es lo primero!

Una vez que el almacenaje compartido está para arriba, trabajo en los anfitriones … He tenido interrupciones parciales donde vCenter virtualizó también. Lo que hago en este caso se establece el arranque automático y opciones de pedidos para los sistemas más críticos; Normalmente un controlador de dominio y DNS / DHCP. Recuerde que es poco probable que vCenter esté disponible en el escenario de arranque en frío. Si puedo meterlo, entonces lo haré … de lo contrario se inicia manualmente.

A partir de ahí, me aseguro de que las reglas HA y DRS estén intactas. Normalmente, tengo reglas de desaffinidad establecidas para servidores de terminal, servidores de aplicaciones y controladores de dominio. Una vez que vCenter aparece, la mayor parte de esto se soluciona.

Tuve un rayo hace unas semanas que tomó parte de mi sala de servidores, incluyendo la hoja de conmutación que contiene la red de almacenamiento. VMWare HA trajo todo de vuelta una vez que los puertos del switch de almacenamiento fueron reubicados y reprogramados.

Por lo tanto, este tipo de problema cae bajo una emergencia real o un esfuerzo manual. No esperaría un inicio sin intervención del entorno del sistema en el escenario que describa.

Editar:

Hace dos semanas, tuve un apagón que disparó un UPS. Dos hosts, VC y un dispositivo SAN / NAS. Todo volvió por sí solo y no tuve que intervenir (yo estaba en realidad en un avión y recibí los mensajes al aterrizar).

Puede configurar una vApp para ayudar con el orden de inicio y cierre.

Para tomar prestado de este hilo de vApp :

Si su clúster experimenta un fallo catastrófico, tiene un par de opciones para asegurar que la VM reinicie la prioridad. Me gusta crear vApps para esto, y arrastrar / soltar las VM en cuestión en este vApp. Digamos que desea que su servidor de base de datos para iniciar antes de su servidor web, por lo que arrastrar los dos en su nuevo vApp. Puede hacer clic con el botón derecho del ratón en la pestaña vApp -> Editar configuración -> Iniciar pedido -> verá Grupo 1 y Grupo 2. En la parte inferior de la ventana, observe que "Todas las entidades del mismo grupo se inician antes Para pasar al siguiente grupo, el apagado se hace en orden inverso ". Bueno, puedes mover tus servidores a los grupos usando las flechas al lado de la caja (las rodeé en la imagen adjunta). Por último, VMware le da la posibilidad de dictar si las VM del Grupo 2 (y Grupo 3 y Grupo 4, etc.) deben comenzar después de un número de segundos (OR) establecido si desea que el siguiente Grupo se inicie después de VMware Tools Servicio) ha comenzado.

Configuración de la orden de inicio de vApp