VMwareバックアップ&リストアの秘訣:データ損失という「後の祭り」を避けるために

VMware tutorial - IT technology blog
VMware tutorial - IT technology blog

OVF/OVAで仮想マシンを5分でクイックバックアップ

VMware Workstationでラボを運用していたり、ESXi上のいくつかの仮想マシンを管理しているなら、難しく考える必要はありません。「確実で長持ちする」バックアップを取得する最短の方法は、OVFまたはOVA形式でエクスポートすることです。最大のメリットは出力ファイルが非常にコンパクトに圧縮されることで、チェックサムエラーやファイル不足を心配せずにUSBにコピーしたり、別のサーバーにアップロードしたりできます。

VMware Workstationでは、仮想マシンをシャットダウンして、File > Export to OVFを選択するだけです。ESXi/vCenterの場合は、仮想マシンを右クリックしてExport OVF Templateを選択し、vCenterからエクスポートを行います。

# ovftoolを使用して時間を節約するために自動化する:
ovftool vi://[email protected]/MyVM /local/path/backup/MyVM.ovf

このテクニックは、同僚に仮想マシンを受け渡す必要がある場合や、システムを深くカスタマイズする前にクリーンな「オリジナル」コピーを残しておきたい場合に非常に便利です。

スナップショットはバックアップか?多くのITエンジニアが陥る致命的な勘違い

新人エンジニアによくある悪い習慣として、スナップショットを撮っただけでデータが安全だと安心してしまうことがあります。実際、私は8つのESXiホストクラスターを管理してきましたが、新人に最初に教える教訓は常にこれです:スナップショットは決してバックアップではありません。

想像してみてください。スナップショットを作成すると、VMwareは変更を記録するために-delta.vmdkファイルを作成します。元のファイルはそのまま残ります。もし元のファイルがあるハードディスクが故障したり、誰かが誤ってファイルを削除したりすれば、スナップショットはただのゴミになります。さらに、スナップショットを長時間(72時間以上)放置すると、仮想マシンの動作が目に見えて重くなり、後のファイル統合(Consolidate)はI/Oパフォーマンスの悪夢となります。

忠告:スナップショットは、OSのアップデートや不審なソフトウェアのインストールの直前に、素早く「元に戻す」ためだけに使いましょう。安全を確保したいなら、現在のストレージ外にデータを出す必要があります。

3-2-1ルール:VMwareインフラを守るためのお守り

システム構築において3-2-1ルールを知らないのは非常に危険です。これは私が毎晩安眠するために常に適用している数式です:

  • 3つのコピー: 稼働中の1つ、ローカルリポジトリにある1つ、および別の場所にある1つ。
  • 2種類のメディア: 卵を一つのカゴに盛ってはいけません。バックアップは専用のNAS(Synology DS923+など)と、テープまたは外付けハードディスクに保存しましょう。
  • 1つのオフサイト保管: 万が一オフィスで火災が発生したり、ランサムウェア被害に遭った時の最後の砦です。私は通常、これをクラウド(S3 Object Lock)にアップロードするか、ハードディスクを自宅の金庫に保管します。

プロフェッショナルなバックアップの導入:VeeamかGhettoVCBか?

会社の予算に応じて、以下の2つの道のいずれかを選択できます:

1. Veeam Backup & Replication (企業向けの高級ブランド)

予算があるなら、Veeamを選んでください。CBT (Changed Block Tracking) 技術により、Veeamは「王様」と呼ばれています。2回目以降のバックアップでは、実際に変更されたデータブロックのみをコピーするため、驚くほど高速です。

最も価値のある機能は Instant VM Recovery です。かつて午前2時にドメインコントローラーがブルースクリーンになった際、バックアップファイルから直接再起動するのにわずか2分しかかかりませんでした。午前8時に出社した社員たちは、トラブルがあったことすら気づきませんでした。

2. GhettoVCB (無料版ユーザー向けの強力な武器)

ESXi Free版を使用している場合、VeeamはAPIがロックされているため動作しません。そんな時の救世主が ghettoVCB スクリプトです。ESXiのシェル上で直接動作し、自動的にスナップショットを作成し、vmdkファイルをNASにコピーしてからスナップショットを綺麗に削除します。

これは、私がお客様向けによく最適化する ghettoVCB.conf ファイルの設定例です:

VM_BACKUP_VOLUME=/vmfs/volumes/NFS_BACKUP/backups
DISK_BACKUP_FORMAT=thin
VM_BACKUP_ROTATION_COUNT=3  # 直近の3世代を保持
POWER_VM_DOWN_BEFORE_BACKUP=0 # マシンを停止させずにオンラインバックアップ
EMAIL_LOG=1 # 日次の結果をメールで報告

リストアの手順:火事になってから消火栓を探さない

バックアップをとっても、一度もチェックしなければ意味がありません。私のチームでは3ヶ月ごとに、重要な仮想マシンをいくつかランダムに抽出し、隔離されたネットワーク(Isolated Network)へのリストア「訓練」を行っています。これにより、データベースが破損していないか、OSが正常に起動するかを確認します。

vSphereでリストアする際の注意点:

  1. 上書きミスを防ぐため、稼働中のマシンとは別のホストとデータストアを選択します。
  2. 極めて重要: ネットワーク接続を切断してください。そうしないと、IPの重複によりネットワーク全体が混乱に陥ります。
  3. 内部のサービスが安定していることを確認してから、データの移行を進めます。

「ひやり」とした経験から学んだアドバイス

長年、様々なクラスターを扱ってきた中で、いくつかの重要なポイントをまとめました:

  • 毎朝ログを確認する: 自動化を完全に信じないでください。ある日突然NASがいっぱいになったり、スクリプトがエラーを起こしたりしているのに気づかないと、悲惨な結果を招きます。
  • ネットワーク回線に投資する: データが数TBに及ぶ場合は、10Gbps SFP+ネットワークを使用してください。時代遅れの100Mbpsや1Gbpsでバックアップをとると、待ち時間だけで一日が終わってしまいます。
  • 心を込めて命名する: 仮想マシンの名前に New_VM_2 のような名前を付けないでください。SRV-APP-01 のような標準に従って命名することで、緊急時にどれを最優先で救出すべきかすぐに判断できます。

適切なバックアップ戦略を構築するのは最初は手間がかかるかもしれませんが、それはあなたのキャリアにとって最も安い保険です。GhettoVCBの設定やVeeam’の最適化で困ったことがあれば、コメントを残してください。全力でサポートします。

Share: