vSAN: Giải pháp “cứu cánh” cho bài toán Shared Storage đắt đỏ
Trước đây, để chạy các tính năng cao cấp như vMotion, HA hay DRS, bạn bắt buộc phải sắm tủ đĩa chuyên dụng (SAN/NAS) từ Dell EMC hoặc HP. Những hệ thống này thường tiêu tốn hàng tỷ đồng. Việc quản lý cáp quang FC phức tạp cũng là rào cản lớn với các quản trị viên hệ thống.
VMware vSAN ra đời để thay đổi cuộc chơi này bằng công nghệ Software-Defined Storage (SDS). Thay vì mua tủ đĩa rời, bạn tận dụng ngay ổ cứng (SSD, HDD) cắm trực tiếp vào máy chủ ESXi. vSAN sẽ gộp tất cả chúng thành một phân vùng lưu trữ duy nhất cho toàn bộ máy ảo. Thực tế triển khai cho thấy vSAN giúp giảm tới 40% chi phí CAPEX. Việc mở rộng cũng cực kỳ linh hoạt: chỉ cần cắm thêm ổ đĩa hoặc thêm Host là dung lượng tăng lên ngay lập tức.
Điều kiện cần: Đừng để “Purple Screen” ghé thăm
Đừng vội bật vSAN nếu hệ thống chưa đạt chuẩn. Sai sót ở bước này rất dễ dẫn đến mất dữ liệu hoặc treo hệ thống (PSOD):
- Số lượng Host: Tối thiểu 3 Host ESXi để đảm bảo an toàn dữ liệu. Dù mô hình 2 Host + 1 Witness vẫn chạy được, nhưng 3 Host mới là cấu hình chuẩn để hệ thống tự phục hồi tốt nhất.
- Ổ đĩa: Mỗi Host cần ít nhất một ổ SSD làm Cache Tier (khuyên dùng loại NVMe hoặc SAS SSD có DWPD > 3) và tối thiểu một ổ làm Capacity Tier.
- Băng thông mạng: Tối thiểu 1Gbps, nhưng mình khuyến nghị 10Gbps. Với mạng 10Gbps, hãy cấu hình Jumbo Frames (MTU 9000) để tối ưu tốc độ đồng bộ.
- Controller: Card RAID phải hỗ trợ chế độ Pass-through (JBOD). Nếu không có, bạn phải cấu hình RAID 0 cho từng ổ đĩa đơn lẻ, nhưng cách này không được khuyến khích.
Các bước cấu hình vSAN trên vCenter
Bước 1: Thiết lập VMkernel Networking
Dữ liệu vSAN trao đổi liên tục giữa các Host. Nếu dùng chung mạng Management mà không tách VLAN, hiệu năng sẽ bị nghẽn cổ chai nghiêm trọng.
- Vào vCenter, chọn Host ESXi -> Configure -> Networking -> VMkernel adapters.
- Nhấn Add Networking -> VMkernel Network Adapter.
- Chọn Switch hiện có. Tại mục Enabled services, hãy tích chọn vSAN.
Hãy lặp lại thao tác này trên tất cả các Host trong Cluster để đảm bảo thông suốt.
Bước 2: Kích hoạt vSAN Cluster
Sau khi chuẩn bị hạ tầng mạng, chúng ta sẽ kích hoạt tính năng lưu trữ tập trung.
- Chuột phải vào Cluster -> Configure -> vSAN -> Services.
- Chọn Configure và xác định kiểu cấu hình (thường là Single Site Cluster).
- vSAN sẽ tự động quét các ổ đĩa trống trên toàn bộ các Host để chuẩn bị cho bước Claiming.
Bước 3: Phân vai trò ổ đĩa (Disk Claiming)
Đây là giai đoạn quyết định tốc độ đọc/ghi của hệ thống. Bạn cần chỉ định rõ vai trò cho từng loại ổ cứng.
- Cache Tier: Chọn ổ SSD có tốc độ cao nhất và độ bền tốt nhất.
- Capacity Tier: Chọn các ổ còn lại để lưu trữ dữ liệu máy ảo.
Nếu muốn kiểm tra nhanh danh sách ổ đĩa khả dụng qua PowerCLI, bạn có thể dùng đoạn script sau:
# Kết nối vCenter
Connect-VIServer -Server 192.168.1.10
# Liệt kê ổ đĩa local chưa sử dụng
Get-VMHost | Get-VMHostDisk | Where-Object {$_.IsLocal -and $_.ExtensionData.RuntimeName -notlike "*mpx*"}
Giám sát hệ thống với Skyline Health
Cấu hình xong không có nghĩa là xong việc. Hãy truy cập mục vSAN Skyline Health ngay lập tức. Công cụ này sẽ cảnh báo nếu firmware card RAID bị cũ, MTU không đồng nhất hoặc ổ cứng có dấu hiệu sắp hỏng. Đừng bao giờ bỏ qua các cảnh báo đỏ tại đây.
Tối ưu Storage Policy
vSAN cho phép quản lý linh hoạt ở mức máy ảo. Bạn có thể thiết lập máy ảo Database chạy RAID 1 (Mirroring) để an toàn tuyệt đối, trong khi máy ảo Test chạy RAID 0 để tiết kiệm dung lượng. Hãy điều chỉnh thông số Failures to tolerate (FTT) trong phần VM Storage Policies. Với Cluster 3 Host, FTT=1 là cấu hình chuẩn mực nhất.
Kinh nghiệm thực chiến: 3 sai lầm dễ gây “sập” Cluster
Dưới đây là những bài học xương máu mình đã rút ra sau nhiều dự án:
- Dùng ổ SSD Consumer: Tuyệt đối không dùng ổ Samsung EVO hay các dòng SSD phổ thông cho Cache Tier. Cường độ ghi của vSAN sẽ khiến các ổ này “ra đi” chỉ sau vài tháng. Hãy đầu tư ổ Enterprise.
- Lệch thời gian (NTP): vSAN cực kỳ nhạy cảm với độ trễ thời gian. Nếu thời gian giữa các Host lệch quá 60 giây, Cluster sẽ bị phân mảnh (Network Partition).
- Quên Unicast/Multicast: Từ bản vSAN 6.6 trở đi đã dùng Unicast. Tuy nhiên, nếu bạn bảo trì các hệ thống cũ, hãy đảm bảo Switch vật lý đã bật IGMP Snooping để hỗ trợ Multicast.
Để kiểm tra trạng thái nhanh từ dòng lệnh, hãy SSH vào ESXi và gõ:
esxcli vsan cluster get
Nếu kết quả trả về trạng thái “Master” hoặc “Agent” và Local Node State là “Normal”, chúc mừng bạn đã cấu hình thành công.
Xây dựng vSAN không quá khó nếu bạn nắm vững quy tắc về phần cứng và hạ tầng mạng. Một khi đã vận hành ổn định, vSAN sẽ mang lại sự linh hoạt mà các hệ thống SAN truyền thống khó lòng theo kịp.

