Kinh nghiệm triển khai oVirt: Giải pháp quản lý KVM thay thế VMware vSphere cho doanh nghiệp

Virtualization tutorial - IT technology blog
Virtualization tutorial - IT technology blog

Chuyện “di cư” từ VMware sang oVirt: Tại sao lại là lúc này?

Kể từ khi Broadcom thâu tóm VMware và siết chặt chính sách cấp phép, giới sysadmin Việt Nam bắt đầu rục rịch tìm phương án dự phòng. Nhiều anh em chọn Proxmox VE — bản thân mình cũng đang chạy một cụm homelab với 12 VM để vọc vạch. Tuy nhiên, khi đưa lên môi trường production lớn với hàng trăm node, yêu cầu khắt khe về tính sẵn sàng cao (HA) và quản lý lưu trữ tập trung, oVirt mới thực sự là cái tên đủ tầm để thay thế vSphere.

Về bản chất, oVirt là dự án gốc (upstream) của Red Hat Virtualization (RHV). Nếu đã quen thuộc với hệ sinh thái RHEL, CentOS hay AlmaLinux, bạn sẽ thấy oVirt cực kỳ gần gũi. Sau hơn 6 tháng trực tiếp vận hành oVirt để thay thế dàn server VMware cũ, mình thấy nó xử lý bài toán quản lý tập trung cho KVM rất mượt mà, quan trọng nhất là tiết kiệm được hàng nghìn USD chi phí license mỗi năm.

Chuẩn bị hạ tầng: Đừng tiết kiệm phần cứng

Để oVirt chạy ổn định, bạn cần đầu tư tài nguyên xứng đáng. Khác với KVM đơn lẻ, bộ não quản lý oVirt Engine khá “ngốn” tài nguyên. Dưới đây là cấu hình thực tế mình khuyến nghị cho một node vừa chạy Engine vừa chạy VM (Hosted Engine):

  • CPU: Tối thiểu 8 cores (Phải hỗ trợ ảo hóa phần cứng VT-x hoặc AMD-V).
  • RAM: 16GB trở lên. Thực tế, riêng Engine đã chiếm cứng 4GB để đảm bảo dashboard không bị lag.
  • Disk: 100GB cho OS, bắt buộc dùng SSD hoặc NVMe để tránh nghẽn I/O khi khởi động nhiều VM cùng lúc.
  • Network: Ít nhất 2 cổng 1Gbps. Nếu dùng Storage qua mạng (NFS/iSCSI), hãy ưu tiên card 10Gbps.
  • OS: AlmaLinux 8 hoặc CentOS Stream 8 là những nền tảng ổn định nhất cho oVirt 4.5 hiện nay.

Một lưu ý sống còn: Bạn phải cấu hình FQDN (Fully Qualified Domain Name) chuẩn xác. oVirt cực kỳ nhạy cảm với việc phân giải tên miền. Chỉ cần gõ sai một ký tự trong file /etc/hosts, script cài đặt có thể treo ngay ở mức 80%.

Triển khai oVirt Engine theo dạng “Hosted Engine”

Thay vì cài Engine trên một máy vật lý riêng, mình khuyên anh em nên dùng dạng “Hosted Engine”. Cách này giúp Engine chạy ngay trong một VM đặc biệt trên các node ảo hóa, vừa tiết kiệm server, vừa có khả năng tự phục hồi (Self-Hosted HA) nếu node chính gặp sự cố.

Bắt đầu bằng việc thêm repo và cài đặt gói setup:

# Thêm repository oVirt 4.5
sudo dnf install -y https://resources.ovirt.org/pub/yum-repo/ovirt-release45.rpm

# Cập nhật hệ thống lên bản mới nhất
sudo dnf update -y

# Cài đặt công cụ triển khai
sudo dnf install -y ovirt-hosted-engine-setup

Sau đó, hãy chạy lệnh deploy. Đây là lúc bạn cần tập trung cao độ để trả lời các câu hỏi cấu hình:

sudo hosted-engine --deploy

Quá trình này sẽ tự động tải image, tạo VM và cấu hình toàn bộ hệ thống. Bạn cần chuẩn bị sẵn một IP tĩnh riêng cho Engine. Với môi trường production, hãy ưu tiên dùng NFS hoặc iSCSI làm Storage để kích hoạt tính năng Live Migration sau này.

Cấu hình Storage và Networking: Những điểm cần lưu ý

1. Quản lý lưu trữ (Storage)

Trong oVirt, Storage Domain là nơi lưu giữ đĩa ảo và file ISO. Một kinh nghiệm thực tế là bạn nên tách biệt Storage dành cho Data (Disk VM) và ISO. Nếu dùng NFS, hãy nhớ cấp quyền ghi cho user vdsm (UID 36) trên server lưu trữ. Nếu thiếu bước này, oVirt sẽ báo lỗi mount ổ đĩa ngay lập tức.

2. Quản lý mạng (Networking)

oVirt sử dụng Linux Bridge để điều phối traffic. Bạn có thể phân tách các Logical Network như: Management (quản lý), Migration (di chuyển VM), và VM Network (traffic ứng dụng). Nếu hệ thống chạy VLAN, bạn chỉ cần gắn thẻ VLAN ID trong Dashboard rồi kéo-thả vào card mạng vật lý. Cách làm trực quan này nhanh hơn nhiều so với việc ngồi gõ lệnh ip link thủ công trên từng máy.

Đánh giá sau 6 tháng “thực chiến”

Sau nửa năm vận hành hệ thống ERP nội bộ trên oVirt, mình rút ra được 3 giá trị lớn nhất:

  • Khả năng giám sát: Dashboard tích hợp sẵn Grafana cho cái nhìn tổng thể về hiệu năng Cluster. Biểu đồ lịch sử giúp mình dễ dàng phát hiện các VM đang “ngốn” quá nhiều tài nguyên vào giờ cao điểm.
  • Live Migration mượt mà: Khi cần bảo trì phần cứng Node 1, mình chỉ việc chuyển sang chế độ Maintenance. oVirt sẽ tự đẩy toàn bộ VM sang Node 2. Với mạng 10Gbps, độ trễ gần như bằng không, người dùng không hề nhận ra sự gián đoạn.
  • Cơ chế HA tin cậy: Có lần một thanh RAM bị lỗi làm Node 1 sập nguồn đột ngột. Engine đã phát hiện chỉ trong vài giây và tự động khởi động lại 5 VM quan trọng trên Node 2. Hãy nhớ cấu hình Power Management (Fencing) để tránh tình trạng “split-brain” (hai máy cùng tranh giành quyền kiểm soát data).

Để kiểm tra sâu hơn, bạn có thể dùng công cụ Cockpit ở cổng 9090:

# Truy cập dashboard quản lý host
https://your-host-ip:9090

Nhìn chung, oVirt không dành cho những ai thích sự đơn giản như VirtualBox. Nó có độ dốc học tập (learning curve) cao hơn do được thiết kế cho quy mô Data Center. Nhưng khi đã làm chủ được nó, bạn sẽ có một hạ tầng ảo hóa mạnh mẽ, ổn định và hoàn toàn miễn phí, đủ sức gánh vác những tác vụ nặng nhất của doanh nghiệp.

Share: