Thủ phạm âm thầm: Điện năng tiêu thụ khi không tải
Các hệ thống HomeLab thường có xu hướng phát triển ngoài tầm kiểm soát. Những gì bắt đầu chỉ là một chiếc Raspberry Pi khiêm tốn thường biến thành một dàn máy chủ doanh nghiệp, các switch 10GbE ồn ào và những chiếc NUC cấu hình cao cần quản lý tài sản HomeLab chuyên nghiệp. Mặc dù phần cứng rất thú vị, nhưng hóa đơn tiền điện đầu tiên sau khi thêm một máy chủ Xeon chạy hai socket có thể là một cú sốc lớn. Ở nhiều khu vực, một máy chủ tiêu thụ 150W liên tục 24/7 sẽ làm tăng thêm hơn 200 USD vào hóa đơn tiền điện hàng năm của bạn.
Các bản phân phối Linux tiêu chuẩn thường ưu tiên hiệu năng hơn là hiệu quả sử dụng điện. Ở trạng thái mặc định, chúng để “đèn sáng” ở mọi phòng, giữ cho các bộ điều khiển SATA, làn PCIe và cổng USB ở trạng thái năng lượng cao ngay cả khi chúng không làm gì cả. Bằng cách tinh chỉnh các trạng thái phần cứng này, bạn thường có thể cắt giảm lượng điện tiêu thụ khi không tải từ 20% đến 50% mà không làm giảm dù chỉ một phần nghìn giây khả năng phản hồi của dịch vụ.
Tôi đã rút ra bài học này một cách xương máu với chiếc Dell PowerEdge R720. Ban đầu, nó tiêu thụ 140W khi không tải. Sau khi áp dụng các tối ưu hóa dưới đây, tôi đã giảm con số đó xuống còn 95W. Sự chênh lệch 45W đó tương đương với việc tiết kiệm gần 400 kWh mỗi năm—đủ để mua một chiếc ổ cứng mới sau mỗi 18 tháng, hãy ghi chú lại quy trình này vào Wiki HomeLab chuyên nghiệp của bạn.
Bước 1: Cài đặt bộ công cụ
Chúng ta sẽ dựa vào hai công cụ chính: Powertop và TLP. Powertop đóng vai trò là đôi mắt chẩn đoán, trong khi TLP đóng vai trò là động cơ tự động thực thi các quy tắc tiết kiệm điện trong nền. Những công cụ này hiệu quả trên mọi thiết bị, từ máy chủ rack đồ sộ đến Lenovo Tiny hay Intel NUC.
Nếu bạn đang chạy Ubuntu, Debian hoặc Proxmox, hãy cài đặt chúng bằng lệnh sau:
sudo apt update
sudo apt install powertop tlp tlp-rdw -y
Powertop là một tiện ích do Intel phát triển giúp trực quan hóa nơi năng lượng của bạn đang tiêu hao. TLP, mặc dù ban đầu được thiết kế for laptop, nhưng lại cung cấp khung làm việc tốt nhất để quản lý các trạng thái năng lượng của phần cứng trên máy chủ Linux.
Bước 2: Xác định lãng phí với Powertop
Trước khi thực hiện các thay đổi, bạn cần một mốc cơ sở. Khởi chạy Powertop với quyền root:
sudo powertop
Điều hướng đến phần Tunables bằng phím Tab. Bạn có thể sẽ thấy một danh sách các mục được gắn thẻ “Bad”. Đây không phải là lỗi phần cứng. Nó chỉ đơn giản có nghĩa là kernel đang chạy các thành phần đó (như bộ điều khiển âm thanh hoặc PCIe ASPM) ở mức năng lượng tối đa.
Tối ưu hóa tức thì
Bạn có thể lập tức chuyển mọi mục “Bad” thành “Good” chỉ với một cờ lệnh:
sudo powertop --auto-tune
Thay đổi này chỉ có hiệu lực tạm thời và sẽ biến mất sau khi khởi động lại. Để duy trì vĩnh viễn, hãy tạo một dịch vụ systemd chạy khi khởi động:
sudo nano /etc/systemd/system/powertop.service
Dán cấu hình này vào tệp:
[Unit]
Description=Tinh chỉnh Powertop
[Service]
Type=oneshot
ExecStart=/usr/sbin/powertop --auto-tune
[Install]
WantedBy=multi-user.target
Kích hoạt dịch vụ để nó tự động chạy:
sudo systemctl enable powertop.service
sudo systemctl start powertop.service
Bước 3: Tinh chỉnh sâu hơn với TLP
TLP cung cấp khả năng kiểm soát chi tiết hơn Powertop, đặc biệt là đối với việc điều chỉnh tần số CPU và quản lý ổ đĩa. Mở tệp cấu hình tại /etc/tlp.conf để bắt đầu tinh chỉnh.
Đối với máy chủ HomeLab, các cài đặt sau mang lại sự cân bằng tốt nhất giữa tiết kiệm điện và độ ổn định:
# Ép CPU sử dụng chế độ tiết kiệm điện (powersave)
CPU_SCALING_GOVERNOR_ON_AC=powersave
# Giảm thiểu mức sử dụng năng lượng cho các tác vụ nền
CPU_ENERGY_PERF_POLICY_ON_AC=power
# Bật quản lý điện năng liên kết SATA (tiết kiệm ~1-2W mỗi ổ đĩa)
SATA_LINKPWR_ON_AC=med_power_with_dipm
# Bật quản lý điện năng trạng thái hoạt động PCIe (PCIe ASPM)
PCIE_ASPM_ON_AC=powersave
Áp dụng các cài đặt mới ngay lập tức:
sudo tlp start
Một lưu ý nhỏ: Nếu bạn đang chạy NAS với ZFS hoặc card RAID doanh nghiệp, hãy cẩn thận với việc quản lý điện năng SATA quá mức. Một số ổ đĩa cấp doanh nghiệp (như các đơn vị SAS cũ) có thể bị treo hoặc gây ra hiện tượng tăng độ trễ khi thức dậy từ trạng thái năng lượng thấp.
Bước 4: Lập lịch và Tự động hóa
Cách hiệu quả nhất để tiết kiệm điện là tắt phần cứng mà bạn không sử dụng. Nếu máy chủ backup của bạn chỉ chạy vào ban đêm hoặc phòng thí nghiệm media của bạn không hoạt động trong giờ làm việc, hãy tự động hóa thời gian nghỉ.
Hẹn giờ tắt máy
Nếu khu Lab của bạn không có ai sử dụng từ 1 giờ sáng đến 7 giờ sáng, hãy dùng cron job để tắt máy. Chỉnh sửa crontab của bạn:
sudo crontab -e
Thêm dòng này để kích hoạt lệnh tắt máy vào mỗi đêm lúc 1 giờ sáng:
00 01 * * * /sbin/shutdown -h now
Đánh thức với Wake-on-LAN (WOL)
Hầu hết các bo mạch chủ hiện đại đều hỗ trợ “Power On By RTC” trong BIOS, cho phép bạn thiết lập thời gian thức dậy cố định hàng ngày. Nếu bạn cần linh hoạt hơn, hãy sử dụng Wake-on-LAN để kích hoạt khởi động từ một thiết bị khác. Đầu tiên, kiểm tra xem card mạng của bạn có hỗ trợ không:
sudo apt install ethtool
sudo ethtool eth0 | grep "Wake-on"
Nếu bạn thấy Supports Wake-on: g, bạn đã sẵn sàng. Kích hoạt nó bằng lệnh:
sudo ethtool -s eth0 wol g
Đo lường kết quả
Đừng đoán—hãy xác minh. Sử dụng tlp-stat -s để xác nhận các chính sách của bạn đang hoạt động. Tuy nhiên, các công cụ phần mềm không thể tính toán được tổn thất hiệu suất bên trong Bộ nguồn (PSU) của bạn. Để biết con số thực tế từ ổ cắm, hãy sử dụng Network UPS Tools (NUT) hoặc ổ cắm thông minh có tính năng theo dõi năng lượng như Shelly 1PM hoặc Kasa KP115.
Kiểm tra Package C-States trong Powertop. Nếu CPU của bạn không bao giờ đạt đến trạng thái C6 hoặc C7, có khả năng một tiến trình nền hoặc một thiết bị PCIe cấu hình sai đang giữ hệ thống ở trạng thái “thức”. Mục tiêu của bạn là tối đa hóa tỷ lệ thời gian nằm ở trạng thái C-state cao nhất có thể trong thời gian không tải.
Bằng cách kết hợp tính năng tự động tinh chỉnh của Powertop với các quy tắc phần cứng của TLP, bạn có thể giảm đáng kể Tổng chi phí sở hữu (TCO) cho Lab của mình. Những khoản tiết kiệm nhỏ đó sẽ tích lũy lại, giúp bạn có thêm ngân sách cho những thứ thực sự quan trọng: nhiều dung lượng lưu trữ hơn và mạng nhanh hơn.

