Cómo determinar qué command se ejecuta en un service de Nagios?

Estoy intentando depurar porqué un service de Nagios está fallando; AFAIK, empezó a fallar repentinamente, sin que se hiciera ningún cambio que estemos conscientes. Estoy tratando de encontrar una forma de principio para ir de service a "command que se ejecuta, que falla" para depurar eso.

El service se llama "NTP"; en mi /etc/nagios3/conf.d , tengo,

 define service { use service-passive-critical hostgroup_name web-internal service_description NTP } 

No check_command ningún check_command . Mirando entonces a serivce-passive-critical ,

 define service { name service-passive-critical use service-passive notification_interval 1 ; always re-send alerts, PagerDuty will dedup contact_groups contact-group-24x7 freshness_threshold 900 ; treat service as stale if no updates for 15 min check_command return-critical ; alert CRITICAL if service is stale } 

Un check_command ! Pero cerca como puedo decir, que siempre debe volver CRÍTICO, como su nombre lo sugiere. Mi service está fallando con UNKNOWN, y el post "no puede crear connection de socket". Los loggings,

 [1439835980] PASSIVE SERVICE CHECK: my-thing.example.com;NTP;3;can't create socket connection 

Para mayor completitud, service-passive :

 # passive services define service { use foo-service name service-passive active_checks_enabled 0 passive_checks_enabled 1 parallelize_check 1 obsess_over_service 0 check_freshness 1 freshness_threshold 900 ; treat service as stale if no updates for 15 min check_command return-unknown ; alert UNKNOWN if service is stale } 

 # for all our services we attach a graph link define service { name foo-service use generic-service action_url /nagiosgraph/cgi-bin/show.cgi?host=$HOSTNAME$&service=$SERVICEDESC$ register 0 } 

Ahora, mi suposition de sentido común es que esto termina ejecutando check_ntp ; esto da salida el error "no puedo crear socket connection" que veo dependiendo de los arguments que lo paso (por lo que sería tan agradable saber lo que Nagios está haciendo aquí …); Todavía no tengo ni idea de por qué comenzó a fallar de repente.

Además, ¿hay una manera de saber si esto se está ejecutando localmente, en el propio host de Nagios, o remotamente, a través de NRPE?

One Solution collect form web for “Cómo determinar qué command se ejecuta en un service de Nagios?”

Este es un service pasivo , ¿verdad? Si no ha cambiado la configuration, entonces su NAGIOS nunca ha ejecutado ningún command en absoluto para este service en particular – fue el logging de datos que se alimentan desde fuera, a través de (por ejemplo) NSCA.

De hecho, sospecho que sigue siendo: el sistema externo está alimentando un hostname, un service, un código de estado ( 3 ), y un post de error ( can't create socket connection ).

El uso de un command stub activo que devuelve por ejemplo CRITICAL es habitual con tales services, ya que funciona junto con la verificación de frescura para hacer que el service pase CRITICAL si no se recibe ningún dato del remitente externo durante un período determinado (aquí 900s). Esto evita que los services PASSIVE fallen en silencio cuando el remitente se apaga, lo cual es una buena práctica.

  • nagios automation en gran escala
  • check_smtp no funciona cuando está progtwigdo
  • Tablero Nagios simple
  • ¿Puede nagios check_mk ser usado para enviar el contenido de un file de text a un grupo de usuarios y si es así, cómo?
  • ¿Qué es un process sólido para diseñar un sistema de monitoreo?
  • ¿Hay algún complemento o herramienta nagios para ver los informes de performance de una manera genial?
  • NAGIOS: ¿Cómo desactivar la verificación del tóner cuando la impresora de networking está inactiva?
  • ¿Es posible utilizar DNX para Nagios con sólo ciertos controles
  • ¿El mejor plugin de nagios para SMART?
  • Restablecer contraseña de administrador de Nagios LogServer
  • Nagios plugin check_hwinfo no funciona
  • "No se recibieron datos del host" Nagios Alarma sólo en los controles de service de Windows
  • Nagios y otro software de monitoreo de networking
  • El linux y los temas del servidor de Windows, como ubuntu, centos, apache, nginx, debian y consejos de red.