Kompiraサーバの障害監視について

コメント

4件のコメント

  • 正式なコメント
    Permanently deleted user

    Kompiraで冗長構成を組んでいて、その上でさらに監視を行うという想定でしょうか?

    特に弊社側で推奨している監視構成は無いのですが、おっしゃるとおり、Kompiraで冗長構成を組んでいる場合はその中でOS上の各プロセス監視が行われておりますので、OSプロセスの監視は不要かと思います。

    常駐ジョブフロープロセスの監視を行えば、ジョブフローが不意に異常終了した場合に気づけるので、有効かと思います。ただ、ジョブフロープロセスが何らかの問題でスタック(待ち状態が続く)した場合、プロセスとしては動作していることになるため、異常には気づけません。

    もし監視対象の常駐ジョブフローに手を加えることが可能でしたら、WatchDogタイマー的な動作を仕込んでおいて、常駐ジョブフロープロセスの中から定期的に特定のオブジェクトのタイムスタンプ更新するようにしておき、監視側ではタイムスタンプが一定期間以上更新されていない場合、ジョブフロープロセスがスタックしたと見なして、アラートを上げる、という手法も考えられます。

    以上、よろしくお願いいたします。

    コメントアクション パーマリンク
  • auto_ope

    ご回答ありがとうございます。上記、冗長構成かつ監視を行う想定です。

    ジョブフロー内での異常処理は別途ログからも拾う想定ではありますが、スタックした場合の異常検知の仕組みについてはご提示いただいた方法もあるとのことで承知いたしました。

    以上、よろしくお願いいたします。

    0
    コメントアクション パーマリンク
  • auto_ope

    追加で確認させてください。

    Kompiraで冗長構成を組んでいる場合、障害が発生した際には、本番系/待機系がフェイルオーバーで自動的に切り替わるかと思います。

    上記切り替わった際に、何かしらの監視によりその事実に気づくことは可能でしょうか。

    切り替え後、片系(本番系)のみで動作している事実に気づけないことを懸念しております。

    0
    コメントアクション パーマリンク
  • Permanently deleted user

    一番簡単な方法としては、Kompiraのスタートアップジョブフローを使うものがあります。

    Kompiraデーモン起動時に自動起動されるスタートアップジョブフローを登録し、
    その中から、メール送信やSNMP Trap送信のコマンドを実行することで、通知する。
    簡単な方法ですが、通常起動とフェールオーバによる起動の区別はつかないので、その点に関しては注意が必要です。

    スタートアップジョブフローにつきましては、オンラインマニュアルの
    2.7.5「スタートアップジョブフロー」をご参照ください。

    0
    コメントアクション パーマリンク

サインインしてコメントを残してください。