Metrictbeat: Detectando e alertando problemas em instâncias

Monitorar o uso de disco de máquinas virtuais é uma das medidas mais elementares.

Caso o metricbeat esteja instalado nessas máquinas virtuais e com o módulo filesystem ativado, uma das métricas coletadas será a system.filesystem.used.pct. Essa métrica fornece a porcentagem de uso do disco.

Por exemplo, se o uso de disco estiver em 76%, a cada 30 segundos o metricbeat irá gravar no índice dele a métrica system.filesystem.used.pct com o valor 0.76.

A seguinte rule de exemplo se baseia na avaliação desta métrica. Se o uso estiver em 80% ou superior um alerta será disparado:

name: Disk usage
type: any
index: metricbeat*
query_key:
- host.hostname
- fields.account
filter:
- query:
    query_string:
      query: "system.filesystem.used.pct: [0.80 TO 1.0]"
realert:
  hours: 4
alert_text: |
  -------------  ALERT -------------
  O volume desta instância deverá estar abaixo de 80%
   Host: {0}
   Timestamp: {1}
   Account: {2}

alert_text_args: ["host.hostname","@timestamp", "fields.account"]

alert:
- "opsgenie"
opsgenie_subject: "[Elastic Observability] Disk Usage in >80% on {2} ({0})"
opsgenie_subject_args:
- fields.account
- system.filesystem.used.pct
- host.hostname
opsgenie_priority: "P1"
opsgenie_alias: "{host[hostname]}"
opsgenie_addr: https://api.opsgenie.com/v2/alerts
opsgenie_key: ${OPSGENIE_API_KEY}

Last updated