Heartbeat: Alertando hosts e endpoints down

Uma vez o Heartbeat checando periodicamente URLs, endpoints e portas TCP de serviços, ele irá escrever o resultado das checagens no índice heartbeat. O único critério que podemos usar para detectar falhas e disparar alertas é o campo monitor.status.

O monitor.status pode conter um dos dois valores: up ou down. A rule a seguir dispara um alerta quando um monitor do Heartbeat estiver down:

name: Synthetics Opsgenie
type: frequency
index: heartbeat*
num_events: 2
timeframe:
  minutes: 11
realert:
  hours: 1
realert_key: "heartbeat_opsgenie"
query_key: monitor.id
filter:
- term:
    monitor.status: "down"
resolve_alert: true
alert:
- "opsgenie"
opsgenie:
opsgenie_subject: "[Elastic Observability] Monitor failed for location {0} on '{1}'"
opsgenie_subject_args:
- monitor.name
- url.full
opsgenie_priority: "P1"
opsgenie_alias: "{monitor[id]}"
opsgenie_addr: https://api.opsgenie.com/v2/alerts
opsgenie_key: ${OPSGENIE_API_KEY}

Last updated