Từ Những Chiếc Dell Micro Bám Bụi Đến Cụm Máy Chủ Độ Sẵn Sàng Cao
Vào mùa đông năm ngoái, cuối cùng tôi cũng quyết định dọn dẹp “nghĩa địa công nghệ” ở góc văn phòng. Đó là một đống phần cứng bị lãng quên: hai chiếc Dell Optiplex 7050 Micro từ một đợt thanh lý văn phòng năm 2017 và một chiếc laptop Lenovo T470 bị vỡ màn hình. Với nhiều người, nó trông chẳng khác gì rác thải điện tử.
Nhưng với tôi, đó là một cụm máy chủ độ sẵn sàng cao (High-Availability Cluster) đang chờ được xây dựng. Việc chuyển từ một đống Raspberry Pi lộn xộn sang một nền tảng ảo hóa tập trung là quyết định sáng suốt nhất cho mạng nội bộ của tôi. Sử dụng phần cứng cũ không chỉ là tiết kiệm; đó còn là cách làm chủ quản lý tài nguyên và tận dụng tối đa hiệu năng trên từng watt điện.
Chuyển sang một hypervisor thực thụ đã thay đổi hoàn toàn quan điểm của tôi về CNTT gia đình. Việc chuyển mình từ một “kỹ thuật viên” chuyên sửa lỗi sang một “kiến trúc sư” xây dựng các hệ thống có khả năng phục hồi đòi hỏi sự am hiểu sâu sắc về lớp phần cứng bên dưới. Tôi đã chọn Proxmox Virtual Environment (VE) cho dự án này. Nó được xây dựng trên Debian, không có các hạn chế phần cứng nhân tạo như trên ESXi, và xử lý mượt mà cả Linux Container (LXC) lẫn máy ảo (VM) đầy đủ.
Kiểm Tra Phần Cứng: Yếu Tố Nào Thực Sự Tạo Nên Khác Biệt?
Mong muốn tận dụng mọi mảnh linh kiện cũ là rất lớn, nhưng sau 6 tháng vận hành 24/7, tôi học được rằng cần phải có sự chọn lọc. Một số thành phần có thì tốt, trong khi những thành phần khác là điều kiện tiên quyết để hệ thống ổn định. Đây là cách tôi sàng lọc đống đồ cũ của mình trước khi nhấn nút nguồn lần đầu tiên.
CPU: Không Chỉ Là Tốc Độ Xung Nhịp
Bạn không cần một con quái vật 64 nhân. Chip i5-6500T của tôi chỉ có 4 nhân, nhưng chúng vẫn gánh được 20 container mà không hề hấn gì. Yếu tố quyết định thực sự nằm ở tập lệnh (instruction set).
Tôi đã đảm bảo **Intel VT-x** được kích hoạt trong BIOS—không có nó thì không thể triển khai ảo hóa. Tôi cũng kiểm tra hỗ trợ **AES-NI**. Tính năng nhỏ này giúp tăng tốc mã hóa, điều mà tôi nhận thấy ngay lập tức khi chạy VPN WireGuard và sao lưu dữ liệu mã hóa. Nếu không có AES-NI, CPU của bạn sẽ bị đẩy lên 100% chỉ vì việc di chuyển tệp qua kết nối bảo mật.
RAM: Nơi Duy Nhất Đáng Để “Vung Tiền”
Bộ nhớ là nơi bạn sẽ gặp giới hạn đầu tiên. Mặc dù bản thân Proxmox chỉ tiêu tốn khoảng 1GB RAM, nhưng mỗi VM bạn tạo ra sẽ chiếm dụng một phần riêng. Tôi đã chi khoảng 45 USD trên eBay để nâng cấp mỗi chiếc Optiplex lên 32GB DDR4. Nếu bạn định dùng hệ thống tệp ZFS, hãy nhớ quy tắc “ARC”: ZFS rất thích lưu đệm (cache) dữ liệu vào RAM. Tôi tuân theo quy tắc cơ bản: 1GB RAM cho mỗi 1TB lưu trữ để giữ cho tốc độ đọc/ghi đĩa (disk I/O) luôn mượt mà.
Lưu Trữ: Tại Sao Ổ Cứng HDD Cũ Là Một Gánh Nặng
Đừng bao giờ chạy hệ điều hành Proxmox hoặc đĩa ảo của các VM đang hoạt động trên ổ cứng cơ học. Chỉ số IOPS (Input/Output Operations Per Second) thấp trên ổ cứng laptop 5400RPM sẽ khiến giao diện web chậm chạp như thể bạn đang ở năm 1998. Tôi đã mua các ổ SSD SATA 512GB giá rẻ để làm ổ khởi động và lưu dữ liệu thường xuyên (hot data). Tôi giữ lại các ổ HDD 1TB cũ thuần túy để lưu trữ dữ liệu ít dùng (cold storage)—như file ISO, template và bản sao lưu hàng tuần—nơi dung lượng quan trọng hơn tốc độ.
Cẩm Nang Cài Đặt
Cài đặt Proxmox VE hầu như chỉ là “next-next-finish”, nhưng phần cứng cũ thường có những đặc thù riêng. Tôi dùng BalenaEtcher để flash file ISO. Một bước quan trọng: Tôi phải tắt **Secure Boot** trong BIOS của Dell và chuyển sang **chế độ UEFI**. Các kernel Linux cũ đôi khi xung đột với chữ ký Secure Boot độc quyền trên các thiết bị phổ thông.
Trong quá trình cài đặt, tôi đã gán một IP tĩnh nằm ngoài dải DHCP của router. Cấu hình của tôi trông như sau:
- Địa chỉ IP: 192.168.1.50
- Gateway: 192.168.1.1
- DNS: 1.1.1.1 (sau này chuyển sang Pi-hole nội bộ của tôi)
Sau khi hoàn tất, bảng điều khiển sẽ nằm ở địa chỉ https://192.168.1.50:8006. Đừng hoảng hốt trước cảnh báo chứng chỉ SSL; đó chỉ là trình duyệt đang phàn nàn về chứng chỉ tự ký (self-signed certificate) mà thôi.
Sau Khi Cài Đặt: Tinh Chỉnh Để Ổn Định
Mặc định, Proxmox sẽ tìm kiếm kho lưu trữ Enterprise (doanh nghiệp) yêu cầu khóa trả phí. Với HomeLab, bạn nên chuyển sang kho lưu trữ “No-Subscription” để nhận các bản cập nhật bảo mật.
Cập Nhật Kho Lưu Trữ
Tôi truy cập vào terminal của Proxmox và chỉnh sửa tệp nguồn:
nano /etc/apt/sources.list.d/pve-enterprise.list
Tôi vô hiệu hóa dòng enterprise bằng dấu # và sau đó thêm kho lưu trữ cộng đồng vào danh sách chính:
echo "deb http://download.proxmox.com/debian/pve bookworm pve-no-subscription" >> /etc/apt/sources.list
Chỉ cần chạy lệnh apt update && apt dist-upgrade -y, và hệ thống đã được cập nhật đầy đủ các bản vá.
LXC so với VM: Hiệu Quả Là Trên Hết
Thành công lớn nhất về phần cứng của tôi là ưu tiên LXC (Linux Containers) thay vì các VM đầy đủ. Trong khi một máy ảo Ubuntu Server có thể “nuốt” 1.2GB RAM chỉ để chạy không, một container LXC chạy cùng dịch vụ Nginx thường chỉ tiêu tốn từ 64MB đến 128MB. Tôi đã chuyển cơ sở dữ liệu, Docker host và web proxy vào các LXC. Điều này cho phép tôi dành các VM “nặng đô” cho Home Assistant và máy ảo Windows thử nghiệm—những thứ đòi hỏi kernel riêng biệt.
Đánh Giá Sau 6 Tháng
Duy trì một HomeLab là một cuộc chạy marathon, không phải là chạy nước rút. Sau nửa năm, cụm máy chủ đã vượt qua được ba lần mất điện và một lần hỏng SSD. Đây là cách tôi luôn chủ động kiểm soát tình hình.
Theo Dõi Nhiệt Độ Và Độ Mòn Ổ Cứng
Các PC dạng nhỏ (SFF) thường chạy khá nóng khi được đặt trong tủ kín. Tôi sử dụng lm-sensors để theo dõi nhiệt độ chip. Các con i5 của tôi thường ở mức 42°C khi nghỉ và đạt đỉnh 70°C khi tải nặng. Để kiểm tra sức khỏe SSD, tôi chạy kiểm tra S.M.A.R.T. hàng tuần:
smartctl -a /dev/sda | grep -i percentage
Vì Proxmox ghi log khá nhiều, việc theo dõi chỉ số *Percentage Used* trên ổ NVMe/SSD là rất quan trọng để dự đoán khi nào ổ cứng có thể hỏng.
Làm Chủ Kỹ Thuật Over-provisioning
Proxmox cực kỳ xuất sắc trong việc “over-provisioning” (cấp phát vượt mức) tài nguyên CPU. Hiện tại tôi có 24 CPU ảo được phân bổ trên toàn cụm, mặc dù tôi chỉ có 12 nhân vật lý. Vì các dịch vụ gia đình như bảng điều khiển Plex hay máy chủ tệp thường ở trạng thái nghỉ 90% thời gian, hypervisor sẽ lập lịch công việc một cách hoàn hảo. Tôi chỉ bắt đầu lo lắng nếu chỉ số **IO Delay** trên bảng điều khiển chạm mức 10%. IO Delay cao là dấu hiệu cho thấy ổ SSD cũ của bạn đang vật lộn để bắt kịp các yêu cầu ghi dữ liệu, báo hiệu đã đến lúc cần nâng cấp.
Thử nghiệm này đã chứng minh rằng “cũ” chỉ là một khái niệm mang tính tương đối. Chiếc PC bám bụi trong nhà kho của bạn hoàn toàn có thể vượt xa các instance đám mây “gói miễn phí” hiện nay, giúp bạn toàn quyền kiểm soát dữ liệu của mình mà không tốn phí thuê bao hàng tháng.

