Metrictbeat: Detectando e alertando problemas em instâncias
Monitorar o uso de disco de máquinas virtuais é uma das medidas mais elementares.
Caso o metricbeat esteja instalado nessas máquinas virtuais e com o módulo filesystem
ativado, uma das métricas coletadas será a system.filesystem.used.pct
. Essa métrica fornece a porcentagem de uso do disco.
Por exemplo, se o uso de disco estiver em 76%, a cada 30 segundos o metricbeat irá gravar no índice dele a métrica system.filesystem.used.pct
com o valor 0.76
.
A seguinte rule de exemplo se baseia na avaliação desta métrica. Se o uso estiver em 80% ou superior um alerta será disparado:
name: Disk usage
type: any
index: metricbeat*
query_key:
- host.hostname
- fields.account
filter:
- query:
query_string:
query: "system.filesystem.used.pct: [0.80 TO 1.0]"
realert:
hours: 4
alert_text: |
------------- ALERT -------------
O volume desta instância deverá estar abaixo de 80%
Host: {0}
Timestamp: {1}
Account: {2}
alert_text_args: ["host.hostname","@timestamp", "fields.account"]
alert:
- "opsgenie"
opsgenie_subject: "[Elastic Observability] Disk Usage in >80% on {2} ({0})"
opsgenie_subject_args:
- fields.account
- system.filesystem.used.pct
- host.hostname
opsgenie_priority: "P1"
opsgenie_alias: "{host[hostname]}"
opsgenie_addr: https://api.opsgenie.com/v2/alerts
opsgenie_key: ${OPSGENIE_API_KEY}
PreviousHeartbeat: Alertando hosts e endpoints downNextMetrictbeat: Detectando e alertando problemas em apps no Kubernetes
Last updated