Cómo calcular la disponibilidad de SLA

Imagine que tenemos un service de API con un 99,9% de disponibilidad.

Así que esta API puede bajar sólo 1m 26.4s día.

Entonces, ¿cómo puedo medir si una API está abajo? OMI, necesito una tasa de muestreo, en el contrato SLA también?

¿Alguien puede darme un ejemplo?

Necesita monitorearlo.

Al principio, usted necesita decir cómo se define el time de inactividad para su api. ¿Está definido como cliente no se puede conectar, se define como no hay methods que funcione, se define como al less un método no funciona?

El siguiente paso es escribir un script de monitoreo personalizado o configurar una solución de monitoreo común (depende del paso 1) y dejar que este monitoree su api.

La tasa de muestreo depende de sus resources, pero más a menudo es mejor. Tengo cheques múltiples en el range de 10s / cheque a 2min / cheque.

Por supuesto usted debe supervisar su api de diversas networkinges apenas para eliminar problema con una networking o con una sonda. Así que tendrás que decir 3 VM a través de Internet con la secuencia de commands de supervisión, estas VMs periódicamente comprobar su API y el estado de informe a algo, lo que va a medir su SLA, le avisará en caso de interrupción y así sucesivamente.

Ver: newrelic, pagerduty, thousandeyes, zabbix, nagios