Datadogで特定のプロセス数を監視(プロセス数がXX個以下、△△個以上だったらアラート出す)したい場合、Datadogの設定画面からの操作ではなく、まず各サーバに配布するDatadog Agentの設定ファイルに対象のプロセスとその閾値を設定してあげる必要がある。
対象プロセスとその閾値は、「/etc/dd-agent/conf.d/process.yaml」で設定できる。
以下、その設定例
- name: ssh
# 監視するプロセス名
search_string: ['ssh', 'sshd']
# tags:
# - env:staging
# - cluster:big-data
# 監視するプロセス数
thresholds:
# critical if no sshd or more than 8 sshd are running
# エラーとして通知する最低プロセス数・最大プロセス数
critical: [1, 7]
# warning if 1, 2, 6, 7 sshd processes are running
# 警告として通知する最低プロセス数・最大プロセス数
warning: [3, 5]
# ok if 3, 4, 5 processes are running
あとは、datadog-agentを再起動してDatadog管理画面からモニタリングの設定をするなどしてあげると良いだろう。