冗長構成時におけるスナップショットの取得について
冗長構成時におけるスナップショットの作成手順や注意点等はございますでしょうか?
(片系ずつどちらもスタンバイの状態で取得しないといけないなど)
また、1号機と2号機ともにスナップショットから復元しなければならない場合の
復元手順についてもご教示いただけると幸いです。
-
正式なコメント
フィックスポイントの高橋です。
統一された手順などはございませんが、私が VM 環境上で冗長構成の Kompira のスナップショットを取る際には以下のようにしております。
- 両系が正常に動作していることを確認します。
- スタンバイ系のクラスタを停止 (pcs cluster stop) させて、シャットダウン (poweroff) します。
- アクティブ系が片系で正常に動作していることを確認します。
- シャットダウンしたスタンバイ系のスナップショットを取得します。
- アクティブ系のクラスタを停止 (pcs cluster stop --force) させて、シャットダウン (poweroff) します。
- シャットダウンしたアクティブ系のスナップショットを取得します。
この状態から再起動(またはスナップショットの復元)を行なう場合は、(スナップショットされた時点の)アクティブ系を先に1台だけ起動させます。それが片系で正常に動作しているのを確認してから、スタンバイ系を起動させて、両系が正常に動作することを確認します。
参考になさってみてください。
コメントアクション -
下記手順での復元についてですが、復元後に問題が生じる可能性があるので「非推奨」とさせていただけますでしょうか。
> 1号機がシャットダウン、2号機のみがアクティブ系として稼働している時に、
> 1号機を下記状態のスナップショットから復元しても問題ないでしょうか?
> 1号機スナップショット時:アクティブ系
> 2号機スナップショット時:スタンバイ系弊社内で 1.6.2.post7 (CentOS7.7) の冗長構成で、上記の手順を再現させてみたところ基本的には正常に動作しています。ただし、その後に1号機にフェイルオーバさせた場合に、リモートコマンド実行を伴うようなジョブフローを実行させると、Kompira サーバの内部での連携処理で部分的に遅延があるような現象が見られました。数十秒ほどの遅延ののちに、リモートコマンド実行とジョブフロー自体も成功はしていて、その後は遅延なく実行できるように見受けられます。
こちらの現象について、簡単な実験では多少の遅延はあるもののその後成功しているため、致命的な問題とはならないかもしれません。もちろん各お客様環境での実際のご利用状況によっては、さらに別の状況に陥る可能性もありますので、(禁止というほどではありませんが)「非推奨」という回答となります。
今後、こちらの現象については調査して対策できるか検討したいと思います。
サインインしてコメントを残してください。
コメント
4件のコメント