パッチ適用の悩みから解放:実戦で学ぶ vSphere Lifecycle Manager (vLCM) 活用術

VMware tutorial - IT technology blog
VMware tutorial - IT technology blog

「パッチ適用日」の恐怖と vLCM の誕生

システム管理者の皆さんにとって、32台の ESXi ホストに夜通しパッチを当てる作業は馴染み深い光景でしょう。1台ずつメンテナンスモードにし、ドライバの競合が起きないよう祈る時間は、まさに苦行です。従来の vSphere Update Manager (VUM) による手法は、運任せな部分がありました。あるホストは正常に動いても、別のホストではネットワークカードのドライバが不足し、クラスタ全体が不安定になることも珍しくありません。

vLCM を本番環境に導入して半年、これは完全なパラダイムシフトだと感じています。以前 Proxmox のラボ環境で apt update を実行していたような手軽さを、エンタープライズ級の品質で実現してくれます。「何をインストールすべきか」から「ホストはどうあるべきか」へと、思考を転換させるのです。このイメージベース(Image-based)のアプローチは、大規模システムの救世主と言えます。

単にパッチを当てるのではなく、vLCM では「Desired State(期待される状態)」を定義できます。クラスタ内のすべてのサーバーは、ESXi のバージョンからドライバ、さらにはハードウェアのファームウェアに至るまで、100% 同一であることが強制されます。

vLCM をスムーズに導入するための要件

焦ってボタンを押してはいけません。私が数晩の徹夜を経て学んだ、導入前に確認すべきポイントを挙げます:

  • vCenter Server: バージョン 7.0 以降が必要ですが、最も安定している 8.0 の使用をお勧めします。
  • ESXi ホスト: バージョン 7.0 以降が必須です。それ以前のバージョンではイメージベースのモデルをサポートしていません。
  • ハードウェア管理: ファームウェアまで管理したい場合は、Vendor Support Management(Dell OpenManage や HPE OneView など)を追加でインストールしてください。
  • クラスタリソース: 仮想マシン (VM) が自動的に退避できるよう、DRS が有効で「完全に自動化(Fully Automated)」モードになっていることを確認してください。

vLCM の詳細設定:イメージベースへの移行

従来のクラスタは、ベースライン(Baseline)方式で運用されていることが多いでしょう。vLCM を使用するには、イメージ形式への変換が必要です。正直に言うと、これは「片道切符」です。一度イメージベースに移行すると、ベースライン方式には戻せないので注意してください。

ステップ 1: クラスタのマスターイメージを設定する

  1. vSphere Client にログインし、アップグレード対象のクラスタを選択します。
  2. [更新] (Updates) > [イメージ] (Image) タブに移動します。
  3. [イメージのセットアップ] (Setup Image) を選択し、対象の ESXi バージョン(例:ESXi 8.0 Update 2)を選択します。
  4. ベンダー アドオン (Vendor Add-on): ここが重要なポイントです。例えば Dell PowerEdge R740 を使用している場合は、適切な Dell Customization を選択してください。システムがメーカー標準のドライバを自動的に収集します。
  5. [検証] (Validate) をクリックします。現在のハードウェアとイメージの間に不整合がないかチェックする非常に重要なステップです。

ステップ 2: コンプライアンス チェック (Compliance Check)

vLCM は各ホストをマスターイメージと比較します. UI 上で何度もクリックする代わりに、私は PowerCLI を使って、どのホストが同期ズレ(Out of Sync)を起こしているか素早く確認しています:

# vCenter に接続
Connect-VIServer -Server vcenter.yourdomain.com

# クラスタのコンプライアンス状態を確認
$myCluster = Get-Cluster -Name "Production-Cluster"
Get-Compliance -Entity $myCluster | Select-Object Entity, Status, LastResultTime

自動更新の実行 (Remediation)

ここが vLCM の本領発揮です。[すべて修正] (Remediate All) をクリックすると、すべてがプログラムされたマシンのように進行します:

  1. vLCM がホストを選択し、メンテナンスモードを有効にします。
  2. DRS が数分以内にすべての VM を他のホストへ移動させます。
  3. システムがイメージをインストールし、ドライバを更新して自動的に再起動します。
  4. ホストがオンラインになり「正常 (Healthy)」と報告されると、vLCM は次のホストへ進みます。

ヒント: いきなり「修正 (Remediate)」を実行せず、まず [すべてステージング] (Stage All) を使用してください。この機能はインストールパッケージをあらかじめキャッシュにダウンロードします。これにより、ダウンロード待ちの時間が短縮され、各ホストのダウンタイムを 45 分から 15〜20 分程度に抑えることができます。

監視とトラブルシューティングの実際

実行中は [イベント] (Events) タブを注視してください。よくある失敗は、個人用 PC から VM に ISO ファイルがマウントされたままになっており、ホストがメンテナンスモードで止まってしまうケースです。プロセスが途中で中断されないよう、すべての ISO 接続を解除しておきましょう。

10〜20台のホストの更新が完了した後、結果を確認するには次のスクリプトが役立ちます:

# 照合のために ESXi のバージョンとビルド番号を一覧表示
Get-Cluster -Name "Production-Cluster" | Get-VMHost | Select-Object Name, Version, Build | Format-Table -AutoSize

HCL チェック機能:管理者の「命綱」

私が vLCM で特に気に入っているのは、HCL (Hardware Compatibility List) を直接チェックできる機能です。インストールしようとしているドライバがそのサーバーモデルと互換性がない場合、vLCM は即座に警告を出します。この機能のおかげで、以前古いネットワークドライバを誤ってインストールしそうになった際、あわや「紫画面 (PSOD)」という事態を回避できました。

結論

vLCM の導入は単なるソフトウェアの更新ではなく、インフラ全体の標準化を意味します。クラスタの拡張も非常に楽になります。新しいホストをクラスタに追加するだけで、vLCM が自動的にクラスタのマスターイメージに従うよう強制してくれます。初期設定でベンダーアドオンの選定に少し手間はかかりますが、本番環境にもたらされる安定性は、それに見合う十分な価値があります。

Share: