Centos corriendo Hudson congela, lo que registra a comprobar para averiguar por qué?

Primera instancia, tenía un Centos 5.4 (64-bit), un montón de resources, instalado Hudson ( http://wiki.hudson-ci.org/display/HUDSON/Meet+Hudson ) y todo era honkey-dorey. Varios días o semanas después (no recuerdo cual), todo el server se congelaría aleatoriamente, requiriendo un duro reinicio. No había nada que correr sobre él, aparte de los resources necesarios para Hudson.

Nuevo concierto: recién instalado Centos 5.5 (64-bit). Dentro de un mes o así, la congelación ha comenzado otra vez. No hay razón aparente.

Tenemos serveres idénticos funcionando por todas partes, sirviendo de todo, desde Tomcat a Jboss a cosas básicas de Apache, todo sin congelarse o estrellarse.

Parece que Hudson es el problema – simplemente no podemos averiguar lo que hace de forma diferente a las configuraciones típicas.

Así que 2 preguntas:

  1. ¿Algún experto de Hudson por ahí quiere sonar?
  2. Solución de problemas: ¿Cuáles son los loggings adecuados para ver? ¿Dónde podemos encontrar una input que dice "X causó el sistema de locking", etc?

La mejor manera que he encontrado es mantener algún tipo de logging en vivo a través de una networking o connection en serie. A veces, el kernel puede imprimir un post crítico a un shell que ha iniciado session, aunque no puede savelo en un file, por lo que puede ser útil tener una shell remota abierta. También puede queuer -f ciertos files de logging, o mejor aún, cat / proc / kmsg y ver posts de kernel en vivo enviados a través de ssh. Otra opción más confiable es configurar un serial port físico como la console. Tengo todos mis serveres de apoyo a una console serie y puede registrar el arranque en su set con un emulador de terminal serie como HyperTerminal, o mejor, PuTTY en un serial port. La adición de la opción de arranque console = ttyS0 enviará todos los posts del kernel a COM1, lo que requiere mucho less para trabajar en lugar de mantener una connection de networking. La mayoría de las placas base todavía tienen generalmente una cabecera en la tarjeta para COM1 incluso si no tienen el conectador.