1時間以内に障害が復旧した場合は、アラート通知しない設定について
完了一つの受信スロットに複数種類のアラートが届く環境です。(監視対象ホストも複数あります)
1時間以内に障害が復旧した場合は通知せず、1時間経過しても復旧しない場合は通知をしたいです。
1時間毎に監視サーバからアラート通知される環境で、復旧しない場合は、1時間毎に継続的に通知されます。
障害が復旧しない場合は、AlertHubからのメール通知も、継続して行いたいです。
以下メール例の場合の、設定方法案をご教示いただけないでしょうか。
■障害メール
<件名>
障害の発生を検知:hostname
<本文>
障害の発生
検知機器 :hostname
IPアドレス:xxx.xxx.xxx.xxx
検知日 :YYYY.MM.DD
検知時刻 :hh:mm:ss
重要度 :重度の障害
イベント内容:
Unavailable by ICMP ping
現在のステータス:
Down (0)
■復旧メール
<件名>
復旧:hostname
<本文>
復旧
検知機器 :hostname
IPアドレス:xxx.xxx.xxx.xxx
復旧日 :YYYY.MM.DD
復旧時刻 :hh:mm:ss
障害期間 :xm xs
重要度 :重度の障害
イベント内容:
Unavailable by ICMP ping
現在のステータス:
RESOLVED
-
お問い合わせありがとうございます。
障害発生中の間、1時間毎にアラート通知が受信スロットに送られることが前提になりますが、
以下のスコープとランブックを作成することで実現可能です。■ランブックによる深刻度の変化に応じて、メール通知を出すトリガーを発動するスコープを作成する
(【】は指定部分となります)
トリガーは以下の2つを作成する
1.実行条件・条件文を以下の2つにする
条件①「イベントのフィールドを指定値と比較する」
・【深刻度】が【5】と【等しい】値である
条件②「深刻度の増減を判定する」
・深刻度が【増えた】
2.実行条件を「一定時間経過後のイベントフィールドを指定値と比較する」に設定し以下の条件文にする
・【3600】秒経過後、【最新の深刻度】が【5】【と等しい】値である■受信メールの内容に応じて深刻度を設定するランブックを作成する
メール文内の現在のステータスで判断
・Downの場合
イベント「対象スコープを直接指定して、深刻度名を直接指定」を実行し、
深刻度名【(hostnameに記載されたものを指定)】を【5】【にする】
・RESOLVEDの場合
イベント「対象スコープを直接指定して、深刻度名を直接指定」を実行し、
深刻度名【(hostnameに記載されたものを指定)】を【0】【にする】これにより、以下のような動きになります。
・障害未検知の状態で障害通知を受信した時:受信時にAlertHubからメールを通知する。1時間後に復旧していなければ再度通知する
・障害をすでに検知した状態で障害通知を受信した時:受信時は何もしない。1時間後に復旧していなければAlertHubからメール通知する
・障害をすでに検知した状態で復旧通知を受信した時:以降、AlertHubからメール通知は行われない以上、よろしくお願いします。
サインインしてコメントを残してください。
コメント
3件のコメント