Heartbeat: Alertando hosts e endpoints down
Uma vez o Heartbeat checando periodicamente URLs, endpoints e portas TCP de serviços, ele irá escrever o resultado das checagens no índice heartbeat
. O único critério que podemos usar para detectar falhas e disparar alertas é o campo monitor.status
.
O monitor.status
pode conter um dos dois valores: up
ou down
. A rule a seguir dispara um alerta quando um monitor do Heartbeat estiver down
:
name: Synthetics Opsgenie
type: frequency
index: heartbeat*
num_events: 2
timeframe:
minutes: 11
realert:
hours: 1
realert_key: "heartbeat_opsgenie"
query_key: monitor.id
filter:
- term:
monitor.status: "down"
resolve_alert: true
alert:
- "opsgenie"
opsgenie:
opsgenie_subject: "[Elastic Observability] Monitor failed for location {0} on '{1}'"
opsgenie_subject_args:
- monitor.name
- url.full
opsgenie_priority: "P1"
opsgenie_alias: "{monitor[id]}"
opsgenie_addr: https://api.opsgenie.com/v2/alerts
opsgenie_key: ${OPSGENIE_API_KEY}
Last updated