フェールオーバー後の障害系でのkompirad起動失敗について

コメント

3件のコメント

  • 正式なコメント
    Ichiro Takahashi

    フィックスポイントの高橋です。

    その後kompira02を復帰させるために、kompiradを起動しようとしたところ、下記エラーにより失敗しております。

    まず、Kompira の冗長構成は ACT/SBY 構成であり、kompirad などいくつかのサービスは ACT 側だけで動作することになっていますので、スタンバイとして復帰させる側のサーバで kompirad を起動させることは行いません。(スタンバイ系で動作するのは rabbitmq-server と postgresql のみです)

    # systemctl start kompirad

    また、Kompira の冗長構成をセットアップしたあとは、Kompira の各サービスは Pacemaker 配下でその起動を含めて管理される構成になりますので、個別のサービスを systemctl コマンド等で制御することは基本的にはありません。

    kompira01 側は正常にアクティブ系として動作しているように見受けられます。フェイルオーバーが発生したあとのスタンバイ系では、アクティブに昇格したサーバとデータベースを同期するために /opt/kompira/bin/sync_master.sh を実行していただく必要がございますが、こちらは実行いただいておりますでしょうか?

    フェイルオーバー時の管理については、オンラインマニュアルの「1.9.5. フェイルオーバー時の動作とフェイルバック」に簡単な説明がございますので、よろしければ参考になさってみてください。

    まず、こちらで回答させていただいたように、復旧させたいスタンバイ側で sync_master.sh を実行したかご確認いただき、未実施であれば実行して復旧するか確認してみていただけますでしょうか。

     

    コメントアクション パーマリンク
  • auto_ope

    ご回答ありがとうございます。

    kompiradは待機系では起動しないとのこと、承知しました。

    また sync_master.sh を実行後、冗長構成に復帰できることを確認いたしました。

    追加で一点質問ですが、AWSのIAMアカウントやインスタンス情報をフェイルオーバー用に入れていますが、どういった障害の場合にAWS側からインスタンスの起動・停止が実行されますでしょうか。

    以上、よろしくお願いいたします。

    0
    コメントアクション パーマリンク
  • Permanently deleted user

    追加で一点質問ですが、AWSのIAMアカウントやインスタンス情報をフェイルオーバー用に入れていますが、どういった障害の場合にAWS側からインスタンスの起動・停止が実行されますでしょうか。

    こちらは、AWSでの冗長構成の構築ガイドライン の「3.1.3. IAMユーザの権限準備」のことでしょうか?

    だとすると、冗長構成が何らかの障害によって、いわゆるスプリットブレインになった場合に、STONITHという機構を用いて、どちらか片方の系を停止させるために使用しております。

    0
    コメントアクション パーマリンク

サインインしてコメントを残してください。