Buscando router de Cisco / loggings de conmutación que estarían relacionados con una interrupción

Tengo un ranurador principal con varios otros interruptores conectados a él. La networking se networkingujo y cuando consolé el enrutador principal, era lento. Reiniciado, pero una vez que las interfaces donde los otros interruptores estaban conectados llegó, el enrutador volvió a ser lento. Bounce los interruptores uno por uno y todo volvió a la normalidad. Ahora tengo que averiguar cuál de los conmutadores fue la fuente del problema y cuál fue el problema.

¿Qué loggings debo tener en count? ¿Qué podría estar buscando?

¿Está registrando en un server syslog? De lo contrario, los buffers de logging de los dispositivos Cisco no sobrevivirán a un reinicio de forma pnetworkingeterminada.

Si usted tiene los loggings, mire el valor de la networking entera de posts alnetworkingedor del time el problema comenzó. ¿Cualquier interfaz salta? Flapping MAC? Errores extraños de cualquier dispositivo? ¿Tiene una plataforma de monitoreo que le puede mostrar qué dispositivo de punta CPU primero? Tamaño de la tabla de routes? ¿Se recibieron los prefijos BGP?

Con la información que ha proporcionado, esto es un poco como llevar su coche al mecánico y decir, "no funciona bien, y no se puede abrir el capó. ¿Cuánto para arreglarlo?". Este es un tema realmente complicado que podría tener miles de respuestas basadas en su topología, hardware, configuration y karma.

Reiniciar los dispositivos para resolver un problema y encontrar las causas de raíz de esos problemas después del reinicio son muchas veces exclusivos.

Con las statistics de syslog, netflow y SNMP externas (CPU, memory y statistics de interfaz, incluyendo ancho de banda, errores y packages por segundo), tiene una oportunidad. Sin embargo, a menudo estos no funcionan correctamente en el caso de un problema que trae el "abajo".

Otra opción sería recostackr la salida del command "show tech-support" o commands equivalentes antes de los reinicios.

Sin embargo, sin fonts de información para ver y después de un reinicio, que sólo están realmente adivinar la causa.

Sospecho que algún tipo de bucle L2, pero la testing de que se requieren statistics de las interfaces (específicamente packages / segundo).