Cấu hình RDM VMware: Khi nào nên cho máy ảo “vượt rào” truy cập ổ cứng vật lý?

VMware tutorial - IT technology blog
VMware tutorial - IT technology blog

Quick Start: Map ổ RDM trong 5 phút

Tưởng tượng bạn đang ở phòng Server lúc 2 giờ sáng. SQL Server liên tục báo lỗi I/O timeout. Bạn cần map gấp một LUN từ SAN vào máy ảo (VM) mà không muốn qua lớp VMFS. Đây là quy trình chuẩn để xử lý nhanh.

1. Truy tìm mã NAA ID

Đừng mất thời gian tìm trong giao diện vSphere vì hàng tá ổ đĩa trông sẽ giống hệt nhau. Hãy SSH vào host ESXi và dùng lệnh sau để liệt kê chính xác các thiết bị:

esxcli storage core device list | grep -A 1 "Display Name:"

Bạn sẽ nhận được một chuỗi dài bắt đầu bằng naa.600.... Hãy copy mã này. Đây chính là “chứng minh thư” của ổ đĩa bạn cần dùng.

2. Tạo file Pointer (Con trỏ)

RDM thực chất là một file .vmdk đóng vai trò làm “người dẫn đường”. Nó không chứa dữ liệu mà chỉ chuyển tiếp lệnh I/O tới ổ đĩa vật lý. Hãy di chuyển vào thư mục chứa VM và chạy lệnh:

# Sử dụng Physical Mode (Pass-through hoàn toàn)
vmkfstools -z /vmfs/devices/disks/naa.600123456789... /vmfs/volumes/Datastore_Data/SQL_VM/rdm_disk_01.vmdk

3. Gắn ổ đĩa vào máy ảo

  1. Chuột phải vào VM, chọn Edit Settings.
  2. Tại mục Add New Device, chọn Existing Hard Disk.
  3. Trỏ thẳng tới file rdm_disk_01.vmdk vừa tạo ở bước trên.

Vậy là xong. Hệ điều hành trong máy ảo giờ đây sẽ nhận diện ổ đĩa như một thiết bị SCSI vật lý gắn trực tiếp.


Giải mã: Tại sao phải dùng RDM thay vì VMFS?

Trong thực tế quản lý cụm 8 host ESXi, mình luôn ưu tiên file VMDK truyền thống vì sự linh hoạt. Tuy nhiên, RDM là quân bài tẩy trong ba trường hợp cụ thể sau.

Ứng dụng đòi hỏi quyền kiểm soát sâu

Một số phần mềm quản lý kho lưu trữ hoặc Backup cần giao tiếp trực tiếp với controller của SAN qua các lệnh SCSI đặc thù. Lớp VMFS thường chặn các lệnh này để bảo vệ hệ thống. RDM (Physical Mode) sẽ mở toang cánh cửa để các lệnh này đi qua không rào cản.

Xây dựng Cluster (WSFC)

Nếu bạn đang dựng Windows Server Failover Cluster giữa các VM nằm trên các host khác nhau, bạn cần ổ đĩa Quorum hoặc Shared Storage. Để hỗ trợ SCSI-3 Persistent Reservations, RDM gần như là lựa chọn bắt buộc.

Quản lý dữ liệu khổng lồ

Với các Database lên tới 20-30TB, việc format VMFS rồi tạo file VMDK đôi khi khiến quản trị viên lo lắng về thời gian scan metadata. RDM giúp tách biệt hoàn toàn dữ liệu này khỏi hệ thống file của VMware.


Physical Mode (pRDM) vs Virtual Mode (vRDM)

Sự nhầm lẫn ở đây thường dẫn đến việc Snapshot bị lỗi hoặc vMotion thất bại.

  • Physical Mode (-z): Hiệu suất cao nhất. ESXi gần như không can thiệp vào lệnh SCSI. Lưu ý: Bạn không thể Snapshot máy ảo ở chế độ này.
  • Virtual Mode (-r): ESXi vẫn ảo hóa một phần. Chế độ này cho phép Snapshot và Clone máy ảo trong khi vẫn ánh xạ tới ổ vật lý.

Tối ưu I/O: Đừng để RDM chạy như rùa

RDM không phải là thuốc tiên. Nếu cấu hình sai đường truyền, tốc độ vẫn sẽ rất tệ. Sự khác biệt giữa RDM và VMFS 6 hiện nay chỉ khoảng 1-3% về mặt CPU overhead.

Hãy kiểm tra Path Selection Policy (PSP). Nếu bạn dùng SAN của Dell Unity hay NetApp, hãy chuyển sang Round Robin để tận dụng tối đa băng thông các card HBA:

# Chuyển đổi sang Round Robin để tối ưu đường truyền
esxcli storage nmp device set --device naa.600... --psp VMW_PSP_RR

Kinh nghiệm thực chiến

Mình từng xử lý một ca Database bị nghẽn cổ chai nghiêm trọng. Khi chuyển sang RDM, độ trễ (Disk Latency) giảm từ 50ms xuống còn 5ms. Bí mật không nằm ở việc RDM nhanh hơn, mà vì máy ảo đó được sở hữu một LUN riêng biệt trên SAN. Nó không còn phải tranh chấp hàng đợi (Queue Depth) với 20 máy ảo khác trên cùng một Datastore.

Những lưu ý sống còn:

  1. vMotion: Bạn vẫn có thể di chuyển máy ảo sang host khác. Điều kiện là host đích phải được map cùng một LUN với NAA ID y hệt.
  2. Cẩn thận khi Storage vMotion: Nếu không để ý, VMware có thể tự chuyển file RDM thành file VMDK thông thường trong quá trình di chuyển dữ liệu.
  3. Mở rộng dung lượng: Khi tăng size LUN trên Storage, bạn phải Rescan Storage trên ESXi. Đôi khi bạn cần khởi động lại VM để hệ điều hành nhận diện phần dung lượng mới.

Chốt lại: Đừng lạm dụng RDM. Chỉ dùng nó khi bạn thực sự cần bypass lớp VMFS hoặc làm Cluster. Với 90% nhu cầu còn lại, VMFS vẫn là lựa chọn tốt nhất nhờ khả năng quản lý linh hoạt.

Share: