MCE Error Codes / Pink Screen – ¿Deberían ser motivo de preocupación?

Así que recientemente compré un sistema de grado de server junto con todos los periféricos de server de grado. Estoy autorizado para ESXi 6 y tengo todos los parches recientes instalados. El sistema ha estado funcionando alnetworkingedor de 2 semanas ahora y de repente tuve un crash completo.

He interpretado este código de error como "Internal Timer Error". He enviado la información a SuperMicro pero para ser honesto no estoy muy confiado con sus respuestas hasta ahora. Mi interpretación era que el sistema simplemente no debería estrellarse – por la razón de que es un Xeon con memory ECC ejecutando ESXi.

¿Es posible que esto fuera un error y no debería volver a suceder? Cómo manejarias esto? En busca de algunos consejos de los que han visto estos types de errores y lo que terminan haciendo realmente.

Choque

Verá este error (MCE, exception de comprobación de máquina) precisamente porque tiene memory RAM ECC.

Usted tiene algún hardware roto en algún lugar, lo más probable es un palo de memory, pero posiblemente uno o más procesadores (CPU 10 tal vez?) O algo en el medio. Invoque su contrato de soporte.

Puede ser otros bits del hardware también, pero cada vez que he visto esto ha sido defectuoso ECC RAM experimentando múltiples errores de bits. Si el MCE decodificado como "error de timer interno", lo siguiente más probable es una CPU defectuosa o mainboard.

Sí, es motivo de preocupación. El server se estrelló!

Compruebe su RAM y los pines del zócalo de la CPU (si ha ensamblado manualmente el server).

Eso es sobre toda la información que obtendrá. Puede abrir un caso de soporte con VMware y analizará el volcado de locking para usted.