vSphere Replication:中小企業向け、SRMに代わる「安価で高性能」なDRソリューション

VMware tutorial - IT technology blog
VMware tutorial - IT technology blog

なぜSRMではなくvSphere Replicationを選ぶのか?

私のように8〜10台のESXiホストクラスターを管理しているエンジニアにとって、最大の課題は常に災害復旧(Disaster Recovery – DR)です。データセンター(DC)で障害が発生した際、いかに迅速にシステムを復旧させるか? VMware Site Recovery Manager (SRM) は業界標準のソリューションですが、年間数千ドルのライセンス費用は中規模企業にとって非常に高いハードルとなります。vSphere HA と DRSと組み合わせることで、より強固な可用性基盤を構築できます。

本番環境で6ヶ月間運用してみた結果、vSphere Replication (VR) は極めて実用的な選択肢であると確信しました。これは vSphere Essentials Plus 以上のエディションに標準で含まれています。VRは、5分から24時間の間隔で2つのサイト間の仮想マシン(VM)同期をサポートしています。特に、両拠点で同一の、あるいは高価なストレージ(Storage)システムを導入する必要がないのが大きなメリットです。

VRのメカニズムはハイパーバイザー層で動作します。そのため、下位層が SAN、NAS、ローカルディスクのいずれであるかを問いません。ネットワーク経由で2つの vCenter が相互に通信できれば、すぐに展開可能です。

vSphere Replication アプライアンスの展開プロセス

まず、Broadcom(旧VMware)のポータルから VR アプライアンスの OVF ファイルをダウンロードします。既存の vCenter のバージョンと VR のバージョンが一致しているか、相互運用性マトリックス(Interoperability Matrix)を必ず確認してください。VCSA 8.0 のインストールと集中管理について事前に把握しておくと、ペアリング作業がスムーズになります。

ステップ 1: アプライアンスのデプロイ

メインサイトの vCenter でクラスターを右クリックし、Deploy OVF Template を選択します。プロセスは通常の VM 作成と似ていますが、以下の3つの設定値は絶対に変更しないでください:

  • IP Address: 固定IPを設定する必要があります。DHCPを使用すると、アプライアンスのIPが変更された際に同期接続が切断されてしまいます。
  • Password: ポート 5480 の管理ページで使用する管理者アカウント用です。
  • リソース: デフォルトの 2 vCPU/4GB RAM 構成で、最大2000台の VM を管理可能です(バージョン 8.0 の場合)。小規模なシステムであれば、これで十分です。

ステップ 2: 2つのサイトの接続(ペアリング)

両拠点でアプライアンスを構築後、vSphere Client にアクセスし、Site Recovery -> Open Site Recovery に移動します。New Site Pair を選択して、サイトAとサイトBの vCenter を接続します。

# ペアリング前にファイアウォールのポートを開放することを忘れないでください
# ポート 8043: VR管理用
# ポート 31031, 44046: レプリケーションデータの転送用
telnet <Remote_VR_IP> 8043

ステータスが「Connected」となり、緑色のチェックマークが表示されれば、サイト間の接続は成功です。

仮想マシンのレプリケーション詳細設定

実際には、すべての VM を5分おきに同期する必要はありません。私は通常、以下のように分類しています:

  1. 保護対象の VM を右クリック -> Site Recovery -> Configure Replication を選択。
  2. Target Site: 接続済みのバックアップサイトを指定します。
  3. Replication Settings:
    • RPO (Recovery Point Objective): 重要なデータベースについては15分に設定します。ファイルサーバーや静的Webサイトの場合は、帯域幅を節約するために1時間〜4時間が妥当です。
    • Point in Time (PIT) Instances: これは非常に価値のある機能です。過去の「時点」を(最大24個まで)保存できます。メインの VM がランサムウェアに感染した場合でも、感染前のクリーンな状態に遡ることができます。
  4. Network Compression: 拠点間の WAN 回線が細い場合は、この機能を有効にしてください。転送データ量を30〜50%削減できます。

ちょっとしたコツ: 数TB規模の重い VM の場合、最初からネットワーク経由で同期するのは避けるべきです。Seed 機能を利用しましょう。外付けハードディスクなどで vmdk ファイルをあらかじめバックアップサイトにコピーしておき、VR の設定時にそのファイルを指定することで、変更分(差分データ)のみを同期させることができます。VMwareバックアップ&リストアの総合ガイドも合わせて参照すると、DR戦略全体の設計に役立ちます。

PowerCLI によるシステム監視

各 VM を手動でクリックして確認する代わりに、PowerCLI スクリプトを使用して毎朝自動的にレポートを送信するようにしています。これにより、気づかないうちに同期エラーが発生している VM がないかを確認できます。

# vCenterに接続
Connect-VIServer -Server vcenter.yourdomain.com

# レプリケーションステータスの確認
Get-VDXReplication | Select-Object Name, State, LastSyncTime, RPOStatus | Format-Table

# 切断
Disconnect-VIServer -Confirm:$false

運用における「実体験から学んだ」注意点

何度かの DR 演習を経て、3つの重要な教訓を得ました:

  • IP競合の処理: バックアップサイトで VM を起動しても、古い IP を保持したままになります。サイト間でネットワークセグメントが異なる場合は、IP Customization セクションで自動 IP 変更を設定する必要があります。これを怠ると、VM は起動してもサービスにアクセスできない状態になります。
  • スナップショットの整理: VR は長時間残っているスナップショットがある VM を嫌います。レプリケーションを有効にする前にスナップショットをコミットし、不快な「Generic Error」を回避しましょう。
  • 帯域幅: 書き込み速度が 10MB/s のデータベース VM は、非常に大きな帯域を必要とします。RPO を短く設定しすぎる前に、データの変更レート(Change Rate)を慎重に計算してください。

結論として、vSphere Replication はバックアップの完全な代替にはなりませんが、非常に信頼性の高い最終防衛ラインとなります。SRM に多額の予算を割けない企業にとって、VR はあらゆる災害からシステムを守るための救世主となるでしょう。

Share: