冗長構成時におけるスナップショットの取得について

コメント

4件のコメント

  • 正式なコメント
    Ichiro Takahashi

    フィックスポイントの高橋です。

    統一された手順などはございませんが、私が VM 環境上で冗長構成の Kompira のスナップショットを取る際には以下のようにしております。

    • 両系が正常に動作していることを確認します。
    • スタンバイ系のクラスタを停止 (pcs cluster stop) させて、シャットダウン (poweroff) します。
    • アクティブ系が片系で正常に動作していることを確認します。
    • シャットダウンしたスタンバイ系のスナップショットを取得します。
    • アクティブ系のクラスタを停止 (pcs cluster stop --force) させて、シャットダウン (poweroff) します。
    • シャットダウンしたアクティブ系のスナップショットを取得します。

    この状態から再起動(またはスナップショットの復元)を行なう場合は、(スナップショットされた時点の)アクティブ系を先に1台だけ起動させます。それが片系で正常に動作しているのを確認してから、スタンバイ系を起動させて、両系が正常に動作することを確認します。

    参考になさってみてください。

    コメントアクション Permalink
  • uno

    ご回答いただきありがとうございます。

    復元手順において、追加で一点質問がございます。

    1号機がシャットダウン、2号機のみがアクティブ系として稼働している時に、
    1号機を下記状態のスナップショットから復元しても問題ないでしょうか?

    1号機スナップショット時:アクティブ系
    2号機スナップショット時:スタンバイ系

    0
    コメントアクション Permalink
  • Ichiro Takahashi

    下記手順での復元についてですが、復元後に問題が生じる可能性があるので「非推奨」とさせていただけますでしょうか。

    > 1号機がシャットダウン、2号機のみがアクティブ系として稼働している時に、
    > 1号機を下記状態のスナップショットから復元しても問題ないでしょうか?
    > 1号機スナップショット時:アクティブ系
    > 2号機スナップショット時:スタンバイ系

    弊社内で 1.6.2.post7 (CentOS7.7) の冗長構成で、上記の手順を再現させてみたところ基本的には正常に動作しています。ただし、その後に1号機にフェイルオーバさせた場合に、リモートコマンド実行を伴うようなジョブフローを実行させると、Kompira サーバの内部での連携処理で部分的に遅延があるような現象が見られました。数十秒ほどの遅延ののちに、リモートコマンド実行とジョブフロー自体も成功はしていて、その後は遅延なく実行できるように見受けられます。

    こちらの現象について、簡単な実験では多少の遅延はあるもののその後成功しているため、致命的な問題とはならないかもしれません。もちろん各お客様環境での実際のご利用状況によっては、さらに別の状況に陥る可能性もありますので、(禁止というほどではありませんが)「非推奨」という回答となります。

    今後、こちらの現象については調査して対策できるか検討したいと思います。

    0
    コメントアクション Permalink
  • uno

    自分が挙げた手順が非推奨である旨承知しました。

    上記で挙げた状態となってしまった場合は、両系をシャットダウンさせた後に両機ともスナップショットから復元させる対応をしようと思います。

    迅速にご回答いただきありがとうございました。
    本件クローズしていただいて構いません。

    0
    コメントアクション Permalink

サインインしてコメントを残してください。