Tuyệt chiêu Backup và Restore VMware: Đừng để ‘mất bò mới lo làm chuồng’

VMware tutorial - IT technology blog
VMware tutorial - IT technology blog

Backup nhanh máy ảo trong 5 phút với OVF/OVA

Nếu bạn đang chạy lab trên VMware Workstation hoặc quản lý vài con máy ảo lẻ tẻ trên ESXi, đừng làm phức tạp hóa vấn đề. Cách nhanh nhất để có một bản backup “ăn chắc mặc bền” là export chúng ra định dạng OVF hoặc OVA. Điểm cộng lớn nhất là file xuất ra được nén cực gọn, giúp bạn copy qua USB hoặc đẩy lên server khác mà không lo lỗi checksum hay thiếu file đi kèm.

Trên VMware Workstation, bạn chỉ cần tắt máy ảo, vào File > Export to OVF là xong. Với ESXi/vCenter, bạn chuột phải vào máy ảo và chọn Export OVF Template.

# Tự động hóa bằng ovftool để tiết kiệm thời gian:
ovftool vi://[email protected]/MyVM /local/path/backup/MyVM.ovf

Mẹo này cực kỳ hữu dụng khi bạn cần bàn giao máy ảo cho đồng nghiệp hoặc muốn lưu lại một bản “gốc” sạch sẽ trước khi vọc vạch sâu vào hệ thống.

Snapshot có phải là Backup? Sai lầm khiến nhiều dân IT “bay màu”

Nhiều bạn mới vào nghề thường có thói quen tai hại: Cứ bấm Snapshot là rung đùi tự tin dữ liệu đã an toàn. Thực tế, mình từng quản lý cluster 8 host ESXi và bài học đầu tiên mình dạy lính mới luôn là: Snapshot tuyệt đối KHÔNG phải là backup.

Hãy tưởng tượng, khi bạn snapshot, VMware tạo ra một file -delta.vmdk để ghi lại những thay đổi mới. File gốc vẫn nằm đó. Nếu ổ cứng chứa file gốc bị “tèo” hoặc ai đó lỡ tay xóa file, cái snapshot của bạn sẽ trở thành rác vụn. Chưa kể, nếu bạn để snapshot quá lâu (trên 72 giờ), máy ảo sẽ bắt đầu chạy ì ạch thấy rõ và việc gộp file (Consolidate) sau này sẽ là một cơn ác mộng về hiệu suất I/O.

Lời khuyên chân thành: Chỉ dùng Snapshot để “quay xe” nhanh khi chuẩn bị update OS hoặc cài phần mềm lạ. Muốn an toàn, bạn buộc phải đưa dữ liệu ra khỏi storage hiện tại.

Quy tắc 3-2-1: Tấm bùa hộ mệnh cho hạ tầng VMware

Làm hệ thống mà không biết quy tắc 3-2-1 thì thực sự quá mạo hiểm. Đây là công thức mình luôn áp dụng để ngủ ngon mỗi đêm:

  • 3 bản copy: Một bản đang chạy, một bản backup tại chỗ (Local Repo) và một bản lưu ở nơi khác.
  • 2 loại phương tiện: Đừng bỏ hết trứng vào một giỏ. Hãy lưu backup trên một con NAS chuyên dụng (như Synology DS923+) và một bản trên Tape hoặc ổ cứng rời.
  • 1 bản offsite: Bản này là cứu cánh cuối cùng nếu chẳng may văn phòng bị hỏa hoạn hoặc dính Ransomware. Mình thường đẩy bản này lên Cloud (S3 Object Lock) hoặc mang ổ cứng về nhà cất tủ.

Triển khai Backup chuyên nghiệp: Chọn Veeam hay GhettoVCB?

Tùy vào túi tiền của công ty mà bạn có thể chọn một trong hai con đường sau:

1. Veeam Backup & Replication (Hàng hiệu cho doanh nghiệp)

Nếu công ty chịu chi ngân sách, hãy chọn Veeam. Nó là “vua” nhờ công nghệ CBT (Changed Block Tracking). Ở lần backup thứ hai, Veeam chỉ copy đúng những block dữ liệu thực sự thay đổi nên tốc độ nhanh đến kinh ngạc.

Tính năng đáng đồng tiền bát gạo nhất là Instant VM Recovery. Có lần con Domain Controller của mình bị màn hình xanh lúc 2 giờ sáng. Mình chỉ mất đúng 2 phút để khởi chạy lại nó trực tiếp từ file backup. Cả công ty vào làm lúc 8 giờ sáng mà không hề hay biết có sự cố vừa xảy ra.

2. GhettoVCB (Vũ khí hạng nặng cho anh em dùng bản Free)

Với anh em dùng ESXi Free, Veeam sẽ bị khóa API không chạy được. Lúc này, script ghettoVCB là cứu cánh số 1. Nó chạy trực tiếp trên shell của ESXi, tự động snapshot, copy file vmdk ra NAS rồi xóa snapshot gọn gàng.

Đây là file cấu hình ghettoVCB.conf mình thường tối ưu cho khách hàng:

VM_BACKUP_VOLUME=/vmfs/volumes/NFS_BACKUP/backups
DISK_BACKUP_FORMAT=thin
VM_BACKUP_ROTATION_COUNT=3  # Giữ lại 3 bản gần nhất
POWER_VM_DOWN_BEFORE_BACKUP=0 # Backup nóng không cần tắt máy
EMAIL_LOG=1 # Báo cáo kết quả qua mail hàng ngày

Quy trình Restore: Đừng để đến lúc cháy nhà mới tìm vòi nước

Backup xong mà không bao giờ kiểm tra thì cũng bằng thừa. Cứ mỗi 3 tháng, team mình lại “diễn tập” restore ngẫu nhiên vài máy ảo quan trọng vào một mạng cô lập (Isolated Network). Việc này để đảm bảo database không bị corrupt và hệ điều hành vẫn khởi động ngon lành.

Khi restore trên vSphere, bạn cần lưu ý:

  1. Chọn Host và Datastore đích khác với máy đang chạy để tránh ghi đè nhầm.
  2. Cực kỳ quan trọng: Ngắt kết nối Network trước khi bật máy ảo vừa restore. Nếu không, IP trùng nhau sẽ khiến cả hệ thống mạng loạn cào cào.
  3. Kiểm tra dịch vụ bên trong ổn định rồi mới tiến hành chuyển vùng dữ liệu.

Vài dòng tâm sự rút ra từ những lần “thót tim”

Sau nhiều năm lăn lộn với đủ loại cluster, mình rút ra mấy điểm mấu chốt này:

  • Soi log mỗi sáng: Đừng tin hoàn toàn vào sự tự động. Một ngày đẹp trời NAS đầy hoặc script lỗi mà bạn không biết thì hậu quả sẽ rất thảm khốc.
  • Đầu tư đường truyền: Nếu dữ liệu lên tới vài TB, hãy dùng mạng 10Gbps SFP+. Backup qua mạng 100Mbps hay 1Gbps lỗi thời sẽ khiến bạn mất cả ngày trời chờ đợi.
  • Đặt tên có tâm: Đừng đặt tên máy ảo kiểu New_VM_2. Hãy đặt theo chuẩn SRV-APP-01 để khi cần cứu nạn, bạn biết ngay đâu là ưu tiên hàng đầu.

Xây dựng chiến lược backup chuẩn chỉnh có thể tốn công lúc đầu nhưng nó là cái bảo hiểm rẻ nhất cho sự nghiệp của bạn. Anh em có gặp khó khăn khi cấu hình GhettoVCB hay tối ưu Veeam thì cứ để lại bình luận, mình sẽ hỗ trợ hết mình.

Share: